20
Investigaciones Geográficas, Boletín del Instituto de Geografía, UNAM Núm. 51, 2003, pp. 53-72 Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión Jean François Mas* José Reyes Díaz-Gallegos* Azucena Pérez Vega* Recibido: 7 de mayo de 2003 Aceptado en versión final: 11 de febrero de 2003 Resumen. Antes de ser utilizados para tomar decisiones, los mapas temáticos, las bases de datos cartográficos y las imágenes clasificadas, deben ser evaluados para conocer su confiabilidad. Este artículo presenta una revisión de la literatura especializada sobre el proceso de evaluación de la confiabilidad temática y puede ser utilizado como guía práctica para llevar a cabo este tipo de evaluaciones. Palabras claves: Evaluación de la confiabilidad, cartografía, clasificación de imágenes, SIG. Assessment of the thematic reliability of maps and classified images: a review Abstract. Before their use as a decision-making tool, thematic maps, geographical databases and classified images should be assessed for accuracy. This paper presents a review of the specialized literature on thematic accuracy assessment, which can be used as a practical guide for carrying out this type of assessments. Key words: Reliability assessment, cartography, image classification, GIS INTRODUCCIÓN Uno de los insumos más importantes para definir políticas de aprovechamiento y de conservación de los recursos naturales son los mapas temáticos, tales como los mapas de uso del suelo y vegetación y de suelos, entre otros. Estos mapas se presentan en formato impreso o integrados en un sistema de información geográfica (SIG). Durante las tres últimas décadas, se incrementó notable- mente el uso de imágenes de satélite para generar este tipo de información (Millington y Alexander, 2000). En muchos casos se aceptaba que los mapas temáticos eran confiables y no se cuestionaba la calidad de su información. Por ejemplo, las principales bases de datos cartográficas del país no se someten a una evaluación de su confiabilidad. Sin embargo, toda base de datos geográfica presenta un grado de incertidumbre que depende, princi- palmente, de la calidad de los insumos y de la metodología adoptada para su elabora- ción. Se pueden producir varios errores en las diferentes etapas del proceso de elabora- ción de un mapa: a) la corrección geométrica de las imágenes; b) el análisis de las imá- genes, que depende de la experiencia del intérprete, de la calidad de los insumos utili- zados (fotografías aéreas, imágenes de sa- télite, observaciones de campo, entre otros) y del sistema clasificatorio; c) la captura (digitalización por ejemplo), y d) la represen- tación de los datos en el mapa. Generalmente se considera que existen dos tipos de error en los mapas o en las imágenes clasificadas (Chrisman, 1989; Goodchild et al, 1992; Janssen y Van der Wel, 1994; Pontius, 2000 y 2002; Carmel et al., 2000); los errores temáticos, que se refieren a errores de atributo (etiqueta), y los errores geométricos (de posición) en la deli- mitación de los polígonos o la ubicación de *Instituto de Geografía-UNAM, Sede Morelia, Aquiles Serdán 382, Colonia Centro Histórico, CP 58000, Morelia, Michoacán. E-mail: [email protected]

2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Embed Size (px)

Citation preview

Page 1: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Investigaciones Geográficas, Boletín del Instituto de Geografía, UNAMNúm. 51, 2003, pp. 53-72

Evaluación de la confiabilidad temática de mapas o deimágenes clasificadas: una revisión

Jean François Mas*José Reyes Díaz-Gallegos*Azucena Pérez Vega*

Recibido: 7 de mayo de 2003Aceptado en versión final: 11 de febrero de 2003

Resumen. Antes de ser utilizados para tomar decisiones, los mapas temáticos, las bases de datos cartográficos y lasimágenes clasificadas, deben ser evaluados para conocer su confiabilidad. Este artículo presenta una revisión de laliteratura especializada sobre el proceso de evaluación de la confiabilidad temática y puede ser utilizado como guíapráctica para llevar a cabo este tipo de evaluaciones.

Palabras claves: Evaluación de la confiabilidad, cartografía, clasificación de imágenes, SIG.

Assessment of the thematic reliability of maps andclassified images: a review

Abstract. Before their use as a decision-making tool, thematic maps, geographical databases and classified imagesshould be assessed for accuracy. This paper presents a review of the specialized literature on thematic accuracyassessment, which can be used as a practical guide for carrying out this type of assessments.

Key words: Reliability assessment, cartography, image classification, GIS

INTRODUCCIÓN

Uno de los insumos más importantes paradefinir políticas de aprovechamiento y deconservación de los recursos naturales sonlos mapas temáticos, tales como los mapasde uso del suelo y vegetación y de suelos,entre otros. Estos mapas se presentan enformato impreso o integrados en un sistemade información geográfica (SIG). Durante lastres últimas décadas, se incrementó notable-mente el uso de imágenes de satélite paragenerar este tipo de información (Millington yAlexander, 2000).

En muchos casos se aceptaba que losmapas temáticos eran confiables y no secuestionaba la calidad de su información.Por ejemplo, las principales bases de datoscartográficas del país no se someten a unaevaluación de su confiabilidad. Sin embargo,toda base de datos geográfica presenta ungrado de incertidumbre que depende, princi-

palmente, de la calidad de los insumos y dela metodología adoptada para su elabora-ción. Se pueden producir varios errores enlas diferentes etapas del proceso de elabora-ción de un mapa: a) la corrección geométricade las imágenes; b) el análisis de las imá-genes, que depende de la experiencia delintérprete, de la calidad de los insumos utili-zados (fotografías aéreas, imágenes de sa-télite, observaciones de campo, entre otros)y del sistema clasificatorio; c) la captura(digitalización por ejemplo), y d) la represen-tación de los datos en el mapa.

Generalmente se considera que existendos tipos de error en los mapas o en lasimágenes clasificadas (Chrisman, 1989;Goodchild et al, 1992; Janssen y Van derWel, 1994; Pontius, 2000 y 2002; Carmel etal., 2000); los errores temáticos, que serefieren a errores de atributo (etiqueta), y loserrores geométricos (de posición) en la deli-mitación de los polígonos o la ubicación de

*Instituto de Geografía-UNAM, Sede Morelia, Aquiles Serdán 382, Colonia Centro Histórico, CP 58000, Morelia,Michoacán. E-mail: [email protected]

Page 2: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

los pixeles. Estos dos tipos de error estánestrechamente ligados y es difícil separarlos(Chrtsman, 1989). Aspinall y Pearson (1995)distinguen un tercer componente de errorpotencial en los mapas temáticos, el cual seatribuye a la heterogeneidad dentro de unpolígono.

La evaluación de la confiabilidad de los ma-pas y de las bases digitales geográficas esun tema que está cobrando mucho interés;en gran medida, por el rápido desarrollo yaplicación de los SIG. Cuantificar la con-fiabilidad de un producto cartográfico, permi-te a los usuarios del mapa valorar su ajustecon la realidad y, así, asumir el riesgo detomar decisiones con base en esta infor-mación cartográfica; además, ayuda tambiéna conocer y modelar el error que resulte delcruce de varias capas con cierto grado deerror en un SIG (Burrough, 1994; Goodchildet al., 1992; Luneta et al., 1991, Walsh et al.,1987).

La evaluación de la confiabilidad temáticaconsiste en comparar la información delmapa con información de referencia considerada muy confiable. Generalmente se ba-sa en un muestreo de sitios de verificación,cuya clasificación se obtiene a partir de ob-servaciones de campo o del análisis de imá-genes más detalladas (con mejor resolu-ción), que aquellas utilizadas para generar elmapa. Por ejemplo, se utilizan fotografíasaéreas para verificar mapas generados apartir de imágenes de satélite de alta resolu-ción como Landsat o SPOT (Peralta-Higueraef al., 2001; Mas et al., 2001; Vogelmann etal., 2001).

La confrontación entre las clases cartogra-fiadas y las clases determinadas en las foto-grafías aéreas o en el campo para los sitiosde verificación se basa en el supuesto deque la información de referencia es alta-mente confiable y representa "la verdad"; porlo que esta confrontación permite evaluar laconfiabilidad del mapa y conocer las con-

fusiones que presenta (Congalton y Green,1993). El proceso de evaluación de la confia-bilidad temática se divide en tres etapas(Stehman y Czaplewski,1998).

a) El diseño del muestreo que consiste en laselección de las unidades de muestreo.

b) La evaluación del sitio de verificación, quepermite obtener la clase correspondiente acada unidad de muestreo.

c) El análisis de los datos, que consiste ge-neralmente en la elaboración de una matrizde confusión y et cálculo de índices de con-fiabilidad.

Existe un gran número de publicaciones so-bre la evaluación de la confiabilidad demapas temáticos o de imágenes clasificadasen revistas especializadas en percepciónremota y sistemas de información geográfi-ca, muchas veces expresando opinionescontradictorias. En este artículo se hace unarevisión de esta literatura para proporcionar,a los lectores y especialistas en cartografía,un panorama sintético de la aplicación eimportancia de la evaluación de la confia-bilidad de mapas, que pueda servirles deguía práctica para llevar a cabo este tipode análisis. La primera parte del artículo seorganiza con base en las tres etapas dela evaluación descritas por Stehman yCzaplewski (1998); a) diseño del muestreo,

b) evaluación de los sitios de verificación yc) análisis de los datos. Luego, se discutenalgunos aspectos operativos de la evalua-ción. Se puede encontrar material adicionalsobre este tema a través de Internet, en ladirección http://indy2.igeograf.unam.mx/dote/confiabilidad.htm.

DISEÑO DEL MUESTREO

El diseño de muestreo contempla la determi-nación del tipo de unidades de muestreo, delmétodo de selección de las mismas, asícomo del número de unidades de muestreo

54 Investigaciones Geográficas, Boletín 51, 2003

Page 3: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

necesarias (tamaño de muestra).

Las unidades de muestreo

La unidad de muestreo permite relacionar lalocalización de la información del mapa y delterreno. Puede ser un punto, un píxel, ungrupo de píxeles, un polígono del mapa ouna unidad de superficie con formas pre-determinadas, por ejemplo, un cuadro o uncírculo de una hectárea. No existe un con-senso definitivo sobre la unidad de muestreomás adecuada (Chuvieco, 1996); su eleccióndepende en mucho de los objetivos dela evaluación, del proceso de mapeo, de laestructura del paisaje y de las categorías quemás le interesan al usuario. Si la unidad demuestreo es un punto, se compara la cla-sificación del mapa con relación a este puntocon la misma localización en el terreno; en lapráctica, lo que se evalúa es una superficiealrededor del punto. Janssen y Van der Wel(1994) recomiendan el uso de pixeles indi-viduales como unidades de muestreo para

las clasificaciones digitales píxel a píxel.

En el caso de mapas en formato vectorial, eluso de los polígonos como unidades demuestreo permite una correspondencia di-recta entre éstas y el mapa. Sin embargo,al modificar el mapa (actualización o agrega-ción de clases de un sistema clasificatorio je-rárquico) esta correspondencia desaparece.

En el caso de unidades de superficie prede-terminadas, la superficie que debe cubrir elsitio de muestreo es también delicada dedeterminar, un sitio de verificación grandepuede incluir varias porciones de polígonosen el mapa y varios tipos de cubierta en elterreno o en la imagen de referencia, lo quegenera ambigüedades al confrontar la infor-mación del sitio de verificación con la delmapa. Al contrario, un sitio de verificaciónpequeño puede coincidir con una unidad delpaisaje no representada en el mapa por sermás pequeña que el mínimo cartografiabledel mismo (Figura 1).

Figura 1. Unidades de muestreo puntual de diferentes superficies y formas.

Investigaciones Geográficas, Boletín 51, 2003 55

Page 4: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

Durante el análisis de la unidad de muestreo,se sugiere tener en cuenta su entorno.

El método de muestreo

Sirve para seleccionar una pequeña muestradel área cartografiada, de tal forma que searepresentativa de la totalidad del mapa. Enun diseño de muestreo probabilista, todas lasunidades de muestreo presentes en el mapatienen una probabilidad conocida superior acero de ser seleccionadas, a esta probabili-dad de selección se le denomina probabi-lidad de inclusión. Asimismo, durante la se-lección de las unidades de muestreo nose deben descartar sitios que presenten cier-tas características; como por ejemplo, estarlocalizados en regiones con poca accesibili-dad o en terrenos privados. Las técnicas demuestreo más empleadas en el procesode evaluación de la conftabilidad temáticason: aleatorio simple, aleatorio estratificado,sistemático, sistemático no alineado y porconglomerados (Figura 2).

Aleatorio simple. Los sitios de verificación seeligen de tal forma, que todos tienen la mis-ma probabilidad de ser seleccionados. Elproblema con este tipo de muestreo es quelas categorías del mapa que presentan unasuperficie reducida son muy poco represen-tadas o inclusive ausente de la muestra. Estaselección genera sitios de muestreo disper-sos en todo el territorio, lo que implica asumirlos costos de traslado (Congalton, 1988b,Fitzpatrick-Lins, 1981).

Aleatorio estratificado. La muestra se realizadividiendo a la población en estratos, conbase en una variable auxiliar (altitud, regiónecológica, división administrativa, facilidadde acceso, clase en el mapa, entre otros), loque permite tener cierto control sobre la dis-tribución de los sitios de muestreo y obtenerinformación sobre subconjuntos de la pobla-ción.

Sistemático. La muestra se distribuye a inter-

valos regulares a partir de un punto selec-cionado de manera aleatoria, pero puede ori-ginar algún error cuando existe algún patrónperiódico en el área estudiada (Chuviéco,1996).

Sistemático no alineado. La muestra se dis-tribuye de manera regular, pero con un ciertogrado de libertad y permite representar todoel territorio.

Por conglomerados. Se selecciona un sitioaleatoriamente y se toman varias muestrasvecinas de acuerdo con un esquema pre-deteminado. Por ejemplo, se seleccionanotros dos sitios, siguiendo una forma de La cierta distancia del sitio seleccionado alea-toriamente (Figura 2).

Los muéstreos aleatorio simple, sistemático,sistemático no alineado y por conglomeradosson probabilistas y resultan en probabili-dades de inclusión, iguales para todas lasunidades de muestreo. Los muéstreos estra-tificados, como el estratificado aleatorio, conun número igual de unidades de muestreopor estrato, conduce a probabilidades deinclusión diferentes según el estrato. Eso noconstituye ningún problema en el análisis delos resultados, siempre y cuando estas pro-babilidades de inclusión sean conocidas yutilizadas para ponderar las observacionesderivadas de cada estrato (Stehman, 2000).Estudios comparativos de estos diferentesesquemas de muestreo pueden encontrarseen Congalton (1988b); Fítzpatrick-Lins (1981)y Stehman (1992 y 1999).

Existen numerosos ejemplos de diseños ses-gados que no se pueden considerar comoestadísticamente robustos, debido a que lamuestra no es representativa del conjuntodel mapa. Por ejemplo, la selección de sitiosde verificación ubicados en el centro de lospolígonos de los mapas conduce a una eva-luación optimista de la confiabilidad del ma-pa, ya que los errores son más frecuentesen las zonas de transición entre diferentes

56 Investigaciones Geográficas, Boletín 51, 2003

Page 5: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confíabilidad temática de mapas o de imágenes clasificadas: una revisión

Figura 2. Esquemas de muestreo probabilistas más aplicados en la evaluación de la confíabilidadde mapas temáticos (modificado de Chuvieco, 1996).

57Investigaciones Geográficas, Boletín 51, 2003

1. Muestreo aleatorio2. Aleatorio estratificado3. Sistemático4. Sistemático no alineado5. Por conglomerados

Page 6: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

tipos de cobertura (límites entre polígonos;Hammond y Verbyla, 1996). De la mismamanera, la selección de sitios de muestreo,ubicados cerca de carreteras para facilitar elacceso durante la verificación de campo,tiende a seleccionar sitios de verificación lo-calizados en regiones mejor conocidas {porejemplo, por los foto-intérpretes y, en conse-cuencia, mejor interpretadas) y por lo regularcorresponde a tipos de vegetación más per-turbados. Otro ejemplo de evaluación sesga-da, es la utilización de los campos de en-trenamiento o de pixeles correlacionados conestos campos para evaluar la confiabilidadde clasificaciones digitales (Friedl et al.,2000; Stehman y Czaplewski, 1998).

El tamaño de la muestra

El tamaño de la muestra se refiere al númerode sitios de verificación utilizados para esti-mar la confiabilidad del mapa. Entre másgrande sea el tamaño de la muestra,más precisa será la evaluación; sin embargo,por razones de costo y tiempo, es con-veniente determinar el tamaño de muestramínimo, para alcanzar los objetivos de laevaluación.

Congalton (1988b) sugiere muestrear unasuperficie aproximada al 1% de la superficiecartografiada. En otra publicación (1991), elmismo autor recomienda verificar por lomenos 50 sitios por categoría, y de 75a 100 si el área en estudio es superior a400 000 ha o si hay más de 12 categorías.

La confiabilidad pues la proporción de sitiosde verificación correctamente identificadosen el mapa. En estadística tradicional la desviación estándar de la estimación de unaproporción depende del tamaño de la mues-tra, del tamaño de la población estudiada yde la proporción (Cochran, 1980; Wonnacotty Wonnacott, 1991; Stehman, 2001; ecua-ción 1).

donde CTP es la desviación estándar de la es-timación de la confiabilidad, N es el tamañode la población, n es el tamaño de la mues-tra (número de unidades de muestreo) y p lacontabilidad de la muestra.

En la Figura 3 se representa el tamaño de lamuestra n en función del tamaño de la po-blación N con base en la ecuación (1) para elcaso en el cual la confabilidad p es de 0.5(la mitad de los sitios de verificación estácorrectamente identificada en el mapa) y ladesviación estándar es de 0.05 (es decirse evalúa la confiabilidad del mapa con unerror razonablemente pequeño). Se puedeobservar que el tamaño de muestra nece-sario aumenta con el tamaño de la poblacióny alcanza un máximo de 100 para una pobla-ción de 10 000 aproximadamente. Las po-blaciones superiores a 10 000 no necesitanun tamaño de muestra más importante paraalcanzar una estimación de la confiabilidadcon una desviación estándar inferior o igual a0.05.

En la evaluación de la confiabilidad demapas o de imágenes de satélite clasificadasse manejan, generalmente, poblaciones muygrandes; por ejemplo, un mapa escala1:250 000 del INEGI, cubre una superficiede más de 20 000 km2 y contiene, por lo tan-to, más de 2 000 000 de unidades de mues-treo de 100 x 100 m. Una imagen de satéliteLandsat TM tiene decenas de millones depixeles. Como se mostró en la Figura 3, laspoblaciones grandes no necesitan un tama-ño de muestra más grande para obtener unaevaluación de la confiabilidad precisa. Enconsecuencia, no es necesario que el tama-ño de la muestra sea un porcentaje de lapoblación total como lo proponen Congalton(1988b) y Stehman (1997).

Investigaciones Geográficas, Boletín 51, 200358

Page 7: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

La aproximación normal permite determinarque tanto la confiabilidad p medida en lamuestra permite una estimación precisade la confiabilidad del mapa P. Con baseen esta aproximación, se puede emplear laecuación siguiente, derivada de la ecuación(1), para relacionar la confiabilidad p, la pre-cisión con la cual p estima la confiabilidaddel mapa (medio-intervalo de confianza *)y el tamaño de la muestra y de la población(Cochran, 1980; Wannacott y Wannacott,1991).

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

0.05 (en otras palabras, la probabilidad deque el valor real de la confiabilidad del mapaP esté fuera del intervalo de confianza es de5%), n es el número de unidades de mues-treo y N el tamaño de la población.

Para fines prácticos, cuando N es grande,una primera aproximación de * y de n escomo sigue (Cochran, 1980; Fitzpatrick-Lins,1981;DicksyLo, 1990):

Figura 3. Tamaño de muestra necesario para alcanzar un error estándar de 0.05 en función del tamañode la población (tomado de Stehman, 2001). El tamaño de la población está representado en escalalogarítmica log10(N).

59Investigaciones Geográficas, Boletín 51, 2003

Page 8: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

Como se puede observar en la ecuación(3b), el intervalo de confianza del estimadode la confiabilidad depende de:

o El número de unidades de muestreo.Entre más grande sea el tamaño dela muestra, más pequeño es el inter-valo de confianza; por lo tanto, másprecisa es la estimación de la con-fiabilidad; por ejemplo, con 50 unida-des de muestreo, una confiabilidadde 80% (p=0.8) presenta un mediointervalo de confianza * de 11%, esdecir que, en realidad, la confiabili-dad puede variar entre 69 y 91%,pero con 250 unidades de muestreoel intervalo de confianza se reducea ±5%.

o La confiabilidad. Con el mismo nú-mero de unidades de muestreo, laconfiabilidad se estima con menosprecisión si se acerca a 50%. Porejemplo, con 100 unidades de mues-treo, una confiabilidad de 50% tieneun intervalo de confianza de ± 9.8%y una de 90%, ± 5.9%.

La tabla presentada a continuación indica eltamaño de muestra necesario para dife-rentes valores de confiabilidad y precisión dela evaluación.

Tabla 1. Tamaño de la muestra por clase enfunción de p y d

p

*

2.5%

5.0%

10.0%

90%

553

138

35

80%

983

246

61

70%

1291

323

81

60%

1475

369

92

50%

1537

384

96

P : confiabilidad estimada de la clase* : medio intervalo de confianza

Para los muéstreos aleatorios estratificadoscon un número de unidades igual y pequeño

en cada estrato, la ecuación (3a) no aplicacuando se calcula el intervalo para todala población, reagrupando los estratos(Stehman, 2000). La autocorrelación espa-cial, que se puede definir por el hecho deque el error no se distribuye de manerahomogénea en el mapa, pero que tiende aagregarse, también afecta las estimacionesdel intervalo de confianza de la confiabilidad(pero no influye en la confiabilidad). El tipode muestreo más afectado es por conglo-merados, los muéstreos sistemáticos y alea-torios estratificados son los menos sensibles.En este tipo de muéstreos se utilizan las mis-mas ecuaciones para el cálculo de la confia-bilidad y la precisión de la estimación, perose debe tomar en cuenta que el intervalo deconfianza es en realidad más grande que elcalculado (Stehman, 2000).

LA EVALUACIÓN DE LOS SITIOS DEVERIFICACIÓN

Este paso consiste en la caracterización delsitio de verificación para asociarlo a una ovarias clases de la leyenda del mapa que seevalúa. En la práctica, la evaluación de launidad de muestreo, en particular si es unpunto o un pixel, se lleva a cabo con base enel análisis de una cierta área alrededor delmismo.

Comúnmente, esta evaluación conduce aasociar el sitio de verificación a una solacategoría de la leyenda del mapa. Sinembargo, no es siempre posible ni conve-niente limitarse a una clase única para carac-terizar el sitio de verificación, porque esteejercicio puede ser muy subjetivo (Hord yBrooner, 1976). Esta subjetividad se debe aque el sitio puede localizarse en una zonade transición progresiva entre dos tipos devegetación (por ejemplo, un bosque de pinoy un bosque de pino-encino) o en un áreafragmentada donde se encuentran variasclases. Puede también corresponder a unestadio de transición temporal entre tipos devegetación (por ejemplo, la vegetación se-

60 Investigaciones Geográficas, Boletín 51, 2003

Page 9: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

cundaria, particularmente en los trópicos).Otra fuente de ambigüedad son los erroresen la localización del sitio de verificación enel mapa (Khorram et al., 2000).

Todas estas fuentes de errores llevan gene-ralmente a subestimar la confiabilidad delmapa y varios autores han propuesto diver-sos mecanismos para aminorarlos. Khorramet al. (2000) caracterizan el sitio de verifica-ción con una clase principal y una adicional.En la confrontación entre el mapa y la in-formación de referencia; en caso de quela clase principal no corresponda con elmapa se da una "segunda oportunidad" conla clase adicional. Otros autores caracterizande manera cuantitativa el sitio de verifica-ción, tanto en el mapa como en la infor-mación de referencia, utilizando las propor-ciones de la superficie representada porcada clase de cubierta.

Woodcock y Gopal (2000) utilizan un enfo-que difuso para calificar los sitios de verifica-ción. En este enfoque, la pertenencia de unelemento a una clase se expresa a través deun grado de pertenencia, que es una varía-ble que toma cualquier valor entre 0 y 1 paraexpresar la pertenencia parcial a diferentesconjuntos. Por ejemplo, en el caso de doscategorías basadas en la cubierta de la copade los árboles (vegetación "abierta" si lacubierta es entre 10 y 40%; vegetación"cerrada" cuando la cubierta de las copas essuperior a 40%), un sitio de verificación, con40% de cubierta, presenta 0.5 de pertenen-cia en ambas categorías (cerrada y abierta).En el enfoque booleano, el intérprete tendríaque clasificarlo en una de las dos categorías.Woodcock y Gopal (2000) desarrollaron unmétodo de caracterización del sitio de verifi-cación basado en una escala lingüística queasocia cada sitio con una categoría a travésde una calificación que expresa la adecua-ción de la clase con el sitio, como por ejem-plo, "esta categoría define perfectamente loque se observa en la fotografía", "estacategoría no es la más adecuada para definir

lo que se observa en la fotografía, pero esaceptable", "esta categoría no define correc-tamente la fotografía" o bien "esta categoríano puede aplicarse a lo que se observa enla fotografía". Cada expresión se asocia conun grado de pertenencia. Estos autores pro-ponen un método para el cálculo de índicesde confiabilidad utilizando este enfoquedifuso (Gopal y Woodcock, 1994; Gopal etal., 1999).

ANÁLISIS DE LOS DATOS

El análisis de los datos de confiabilidad sehace generalmente a través de una matrizde confusión, que permite confrontar la in-formación de los sitios de verificación conaquella de la base cartográfica que se pre-tende evaluar. En la matriz de confusión, lasfilas representan generalmente las clases dereferencia y las columnas las clases delmapa. La diagonal de la matriz expresa elnúmero de sitios de verificación para loscuales hay concordancia entre el mapa ylos datos de referencia, mientras los margi-nales indican errores de asignación.

La proporción de puntos correctamente asig-nados (diagonal) expresa la confiabilidad delmapa. Se distinguen dos tipos de error se-gún si la lectura de la matriz se hace conbase en las líneas o en las columnas. Elerror de comisión representa la proporciónde sitios de verificación cartografía da en unacierta clase, pero que en realidad pertenecea otra categoría. El error de omisión se refiere a la proporción de sitios de verificacióncorrespondiente a una categoría que fue car-tografiada en otra (Aronoff, 1982; Chuvieco,1996).

Congalton (1991) sugiere llevar a cabo unanormalización o estandarización de la matrizde confusión. Ésta se realiza llevando a caboun ajuste iterativo para que las columnas ylas filas de la matriz sumen 1 y argumentaque esta normalización permite ajustar losvalores de la matriz tomando en cuenta las

Investigaciones Geográficas, Boletín 51, 2003 61

Page 10: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

filas y las columnas. Este proceso modificalos valores de la diagonal y permite calcularun valor de confiabilidad global normalizadoque representa mejor la calidad del mapa,porque incorpora información de los elemen-tos fuera de la diagonal. Según Congalton, lanormalización de la matriz permite una com-paración más objetiva entre matrices deriva-das de diferentes procesos de evaluación.Sin embargo, Stehman (1997) está en desa-cuerdo con esta normalización, porque nopermite obtener estimaciones consistentes.Se entiende por consistencia que la estima-ción de algún parámetro con base en unamuestra se vuelve exactamente igual al valordel parámetro en la población cuando lamuestra es igual a la población (n = N).Stehman (1997) demuestra que las estima-ciones de confiabilidad derivadas de unamatriz normalizada no son consistentes conlas derivadas de una matriz basada en todala población y recomienda no usar matricesnormalizadas.

Con base en la matriz de confusión, sedesarrollaron varios índices de confiabilidad(Stehman y Czaplewski, 1998) que se des-criben a continuación:

Si el diseño de muestreo es aleatorio simple,la confiabilidad global {proporción de los si-tios de verificación correctamente clasifica-dos en la base cartográfica) se obtienedividiendo los elementos de la diagonal conel número total de sitios de verificación. Estevalor representa la probabilidad para cual-quier sitio en el mapa de ser correctamenteclasificado. En el caso de muestreo aleatorioestratificado, el número de sitios por cate-goría ya no es proporcional a la superficiecubierta por cada categoría y el valor ob-tenido no se puede interpretar de estamanera. Por ello se tienen que hacerlas correcciones necesarias con base en lasprobabilidades de inclusión del muestreo(Card, 1982).

Existen también índices que dan cuenta de

la confiabilidad de cada una de las clasesde la leyenda como: a) la confiabilidad delusuario, que puede interpretarse como laprobabilidad que un sitio clasificado como Ay aleatoriamente seleccionado sea realmenteA en el terreno, y b) la confiabilidad del pro-ductor, que es la proporción de sitios de veri-ficación de la clase A que están represen-tados en el mapa o en la base de datoscomo tal (Janssen y van der Wel, 1994). Losvalores de confiabilidad del usuario y delproductor están relacionadas respectiva-mente con los errores de comisión y omisión.Aronoff (1982) define el riesgo del productorcomo el hecho de rechazar un mapa acep-table y el riesgo del usuario, aceptar un ma-pa no confiable.

La confiabilidad promedio es el promedio delos valores de confianza de cada categoría.Es, por lo tanto, un índice de confiabilidadque da el mismo peso a todas las categoríasindependientemente de la superficie quecubren.

A continuación se presenta un mapa parael cual se verificaron en campo 15 sitiosde verificación seleccionados con base enun muestreo aleatorio (Figura 4). La com-paración entre los mapas y la informaciónde campo permitió elaborar la matriz deconfusión y calcular los índices de confia-bilidad (Tabla 2), en este ejemplo, la con-fiabilidad global es de 67% (10 sitios co-rrectamente identificados de un total de 15).

Los índices de confiabilidad descritos ante-riormente no toman en cuenta los elementosfuera de la diagonal de la matriz (Rosenfieldy Fitzpatrick-Lins, 1986). Por esta razón, segeneralizó el uso del coeficiente de Kappa,que utiliza las sumas marginales de la matrizy da cuenta de la contribución del azar en laconfiabilidad del mapa. Para los cálculos quese describen a continuación, es convenienteexpresar los valores de la matriz en pro-porción del número total de sitios (Tabla 3).

62 Investigaciones Geográficas, Boletín 51, 2003

Page 11: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Tabla 2. Matriz de confusión derivada de la figura 4

Ref.

A

B

C

D

Error Com. %

Conf. us.

A

2

1

0

0

33.3

66.7

B

2

2

0

0

50.0

50.0

Mapa

C

0

0

2

0

0.0

100.0

D

0

0

2

4

33.3

66.7

Error Omis.

50.0

33.3

50.0

0.0

Conf. prod.

50.0

66.7

50.0

100.0

Error Omis.: error de omisión, Error Com.: error de comisión, Conf. prod. confia-bilidad del productor, Conf. us.: confiabilidad del usuario.

Investigaciones Geográficas, Boletín 51, 2003 63

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

Page 12: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

Tabla 3. Matriz de confusión expresada en proporción. Las mismas anotacionesse utilizan en las ecuaciones a continuación

müar al cálculo de la confiabilidad del usuarioy del productor.

El coeficiente de Kappa para la categoría(fila) /se calcula según;

donde K es el índice de Kappa, Po la pro-porción de área correctamente clasificada(confiabilidad global) y Pc la confiabilidad re-sultante del azar.

Po se obtiene sumando los elementos de ladiagonal:

En la Tabla 4 se presentan la matriz expre-sada en proporción y los valores de estosíndices de confiabilidad calculados a partirde la matriz presentada en la Tabla 2.

La suma de la diagonal que expresa laconfiabilidad global del mapa (proporción desitios correctamente clasificados) es igual a0.67 (67%). Para calcular el valor del coefi-

El coeficiente de Kappa se puede calcularpara cada categoría, con base en las filas oen las columnas de la matriz, de manera si-

64 Investigaciones Geográficas, Boletín 51, 2003

Pc se calcula sumando el producto de lassumas marginales :

El coeficiente de Kappa para la categoría(columna); se obtiene según:

Page 13: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

cíente de Kappa, se evalúa primero la apor-tación del azar Pc que es igual a la suma delos productos de las sumas marginales de lamatriz. Para la matriz de la tabla 4, Pc = 0.2 *0.27 + 0.27 * 0.20 + 0.13 * 0.27 + 0.4 * 0.27= 0.25 y el coeficiente de Kappa K - (0.67-0.25)/(1-0.25) = 0.56.

Un coeficiente de Kappa de 0.56 significaque la clasificación es 56% mejor que la con-fiabilidad esperada, asignando aleatoria-mente una categoría de cobertura a los polí-gonos (Dicks y Lo, 1990). Muchos autores noestán de acuerdo con la manera de estimarla contribución del azar y existen algunasvariantes en el cálculo del índice deKappa, que utilizan otras formas de evaluarla(Foody, 1992; Ma y Redmond, 1995;Stehman, 1997). El coeficiente de Kappa esválido para un muestreo aleatorio simple(Congalton, 1988b). Stehman (1996) pro-pone un método para calcular el valor deKappa y su varianza para los muestreosaleatorios estratificados. El índice de Kapparesta la contribución teórica del azar a laconfiabilidad y da un resultado siempre infe-rior o igual a la confiabilidad global. Sin em-bargo, para el usuario de un mapa no

importa que cierta proporción del mapa estécorrecta debido al azar (Turk, 1979). Portanto, no es lógico restar la contribucióndel azar a la calidad del mapa, por lo cualStehman (1997) considera que el índice deKappa no es un buen índice de la calidadde un mapa y es más apropiado cuando sepretende evaluar diferentes métodos declasificación.

Todos los índices descritos anteriormente,menos los derivados del enfoque difuso,consideran de la misma manera todos loserrores. Sin embargo, ciertos errores sonmás perjudiciales que otros según el objetivode esfuerzo cartográfico; por ejemplo, si seutiliza un mapa de uso del suelo y vege-tación para calcular la superficie boscosade una región, la confusión entre bosque deencino y bosque mesófilo es menos graveque entre bosque de encino y pastizal. Si elobjetivo es cartografiar el hábitat de un orga-nismo que se circunscribe al bosque mesófi-lo, este mismo error se vuelve más crítico.Naesset (1996) desarrolla índices que tomanen cuenta la gravedad del error en el cálculode los índices de confiabilidad.

Tabla 4. Matriz de confusión expresada en proporción derivada de la Tabla 2

Ref.ABCDTotalConf. us.oKappa

MapaA0.130.070.000.000-200.670.55

B0.130.130.000.000.270.500.32

C0.000.000.130.000.131.001.00

D0.000.000.130.270.400.670.55

Total0.270.200.270.27

Conf. prod.0.500.670.501.00

Kappa0.380.580.381.00

Conf. prod.: confiabilidad del productor; Conf. us.: confiabilidad del usuario.

Investigaciones Geográficas, Boletín 51, 2003 65

Page 14: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

DISCUSIÓN

Se presentaron los métodos para llevar acabo la evaluación de la confiabilidad de ma-pas o de imágenes clasificadas. A continua-ción se discuten algunos aspectos prácticosde estas evaluaciones, como la conciliaciónde los requisitos estadísticos y considera-ciones logísticas, así como el problema de laveracidad de los datos de referencia. Porúltimo, se aborda el caso de la evaluación demapas de cambio.

Algunos mecanismos para reducir costos

En la evaluación de la confiabilidad carto-gráfica, un problema crucial es la conciliaciónde los requisitos estadísticos, que permitenuna evaluación objetiva y científicamente de-fendible con las consideraciones logísticasque toman en cuenta los problemas de costoy de acceso para recolectar la informaciónde los sitios de verificación. Existen diferen-tes mecanismos que permiten aminorar losproblemas prácticos relacionados con el nú-mero y la selección de los sitios de verifica-ción sin perder rigor estadístico.

La estratificación consiste en repartir elesfuerzo de muestreo con base en estratosgeográficos como regiones ecológicas o enti-dades administrativas, entre otros. Permitedistribuir el esfuerzo de muestreo, con proba-bilidades de muestreo más bajas, por ejem-plo, en regiones menos accesibles. La estra-tificación con base en las categorías delmapa permite garantizar que no se sobre-muestreen las categorías con mayor exten-sión a expensas de las de menor superficie(Card, 1982; Figura 5).

La evaluación de la confiabilidad se puedellevar a cabo para una parte del área carto-grafiada con base en la hipótesis de queésta es representativa del conjunto del ma-pa. Por ejemplo, el mapa de uso del suelo yvegetación de un estado de la República sepodría evaluar únicamente en algunos muni-cipios que representan la variedad de tiposde vegetación que se pueden encontrar en elestado y los resultados se generalizan paratoda la entidad. Sin embargo, es necesarioestar seguro que otros parámetros no in-fluyeron en la calidad del mapa para estosmunicipios y que realmente los resultadosobtenidos son extrapolares a todo el esta-

Figura 5. Muestreo aleatorio simple (ocho sitios al azar) y aleatorio estratificado (cuatro sitios al azar porcategoría). Este último permite una mejor repartición de los sitios de verificación entre las diferentescategorías del mapa.

66 Investigaciones Geográficas, Boletín 51, 2003

Page 15: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

67Investigaciones Geográficas, Boletín 51, 2003

do. Otro ejemplo de evaluación basada en elsupuesto anterior es la utilización de líneasde vuelo de fotografías aéreas o de video-grafía que cruzan el área cartografiada yconforman una cobertura parcial de estaúltima, como fue el caso del Inventario Fo-restal Nacional 2000 (Peralta-Higuera et al.,2001; Mas et al., 2001; Figura 6). En todorigor, la evaluación de la confiabilidad que sederiva de estas fotografías es únicamenteválida para el área cubierta por las líneas devuelo. Sin embargo, estas líneas de vuelocubren el territorio nacional de manera ho-mogénea y sistemática, por lo que se puedeformular la hipótesis de que no existe sesgo,esto es, que la porción del territorio quecorresponde a las líneas de vuelo es repre-sentativa del conjunto del territorio y, portanto, los resultados obtenidos son tambiénválidos para la parte no cubierta por las fotosaéreas (Mas et al., 2002).

Con el fin de reducir el número de sitios deverificación, se puede manejar una precisiónvariable según el interés que el usuariotenga para las diferentes categorías. Porejemplo, la evaluación de un mapa de usodel suelo y vegetación para un usuario fo-restal se debe llevar a cabo con un esfuerzo

de muestreo más importante en las clasesforestales, lo que permite una precisión ma-yor y un esfuerzo menor en las demás cate-gorías, resultando en una precisión menor enla estimación de la confiabilidad de estascategorías.

Con el fin de utilizar el número de sitios demuestreo mínimo para obtener la precisióndeseada, se puede utilizar un método iterati-vo (Sánchez-Colón, comunicación personal).En una primera etapa se determina elnúmero de sitios de muestreo para tenerun nivel de confianza aceptable (por ejemplo* < 10%) con un nivel de confiabilidad alto(80 o 90%). Para las clases que presentanun nivel de confiabilidad bajo, el intervalo deconfianza será muy grande y se analizaránsitios adicionales para reducir este intervalo.Por ejemplo, se evalúa la confiabilidad de3 clases con 50 unidades de muestreo porclase. Para 2 de ellas se obtiene 96% ± 5.4y 10% ± 8.3 respectivamente, para la tercerase obtiene 48% ± 13.8. Se necesita un es-fuerzo de muestreo adicional para estaúltima clase, con el fin de reducir el intervalode confianza por debajo de 10%. Con 50unidades de muestreo adicionales se obtienefinalmente 56% ± 9.7 (Tabla 5).

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión

Page 16: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Núm. de sitios de verificación

Núm. de aciertos

% aciertos

Medio intervalo de confianza

A

50

48

96

5.4

Clase

6

50

5

10

8.3

C

50

24

48

13.8

C*

100

56

56

9.7

particular de la evaluación de un mapa temá-tico. Existe una gran variedad de métodos dedetección de cambio, que permiten generarinformación sobre los cambios de coberturacon base en el análisis de mapas o de imá-genes de diferentes fechas. Algunos méto-dos permiten solamente generar mapas bi-narios que indican si hubo cambio o no(categorías "cambio" y "no cambio"), otrospermiten caracterizar más precisamente eltipo de cambio e indican la combinación declases para las dos fechas involucradas(por ejemplo, "selva/pastizal" o "zona urbana/zona urbana"; Singh, 1989; Mas, 2000).Generalmente, los mapas de cambio sonmuy sensibles a la calidad geométrica de losinsumos (corrección geométrica de las imá-genes, precisión en la delimitación de lospolígonos; Aspinall y Pearson, 1995; Green yHartley, 2000). Otras características quedeben tomarse en cuenta para la evaluaciónde estos mapas de cambio son: a; el grannúmero de categorías, ya que resultan de lacombinación entre las categorías de lasdiferentes fechas; b) la imposibilidad de reali-zar verificación de campo, por lo menos parala fecha más antigua, y c) el hecho de quelas categorías de cambio representan gene-ralmente una pequeña proporción del áreacartografiada. Debido a esta última caracte-rística, Khorram (1999) recomienda estrate-

El problema de la confiabilidad de losdatos "verdad"

La evaluación de la confiabilidad se hacebajo el supuesto de que los datos dereferencia son totalmente correctos, lo queno resulta cierto en muchos casos, en par-ticular cuando la clase correspondiente a lossitios de verificación se determina con baseen el análisis de fotografías aéreas (Biginget al., 1994; Congalton, 1991). Por ejemplo,Congalton y Green (1993) reportan que en elejercicio de la evaluación de un mapa debosques con base en la interpretación de fo-tografías aéreas, en 41% de los sitios deverificación, la fotointerpretación proporcionóuna clase distinta según el fotointérprete.Además, las verificaciones en campo permi-tieron determinar que en el 20% de los ca-sos, la categoría obtenida por fotointerpre-tación era errónea y el 23% de los sitios nopresentaba el mismo tipo de cobertura,debido al cambio de uso del suelo entre lasfechas de toma de las imágenes que seusaron para la elaboración del mapa y suevaluación.

La evaluación de mapas de cambio

La evaluación de la confiabilidad de mapas ode imágenes de cambio es un caso un poco

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

Tabla 5. Ejemplo numérico del método iterativo Para la clase C, se necesitaron 50 sitios adicionalespara obtener un intervalo de confianza más pequeño (C*)

Investigaciones Geográficas, Boletín 51, 200368

Page 17: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confiabilidad temática de mapas o de imágenes clasifícadas: una revisión

gias y esfuerzos de muestreo diferentes paralas categorías de cambio y de no cambio.

CONCLUSIÓN

Con base en los resultados de la evaluaciónde la confiabilidad, es necesario considerarlas diferentes medidas, que permiten mejorarla información contenida en un mapa temá-tico y los productos que se deriven del mis-mo. En el proceso de evaluación de la con-fiabilidad, las categorías que más se confun-den pueden ser objeto de un esfuerzo adi-cional, con base en un exhaustivo trabajo decampo, por ejemplo, que permita mejorarla calidad de su representatividad en lacartografía. Otra opción más económica queayuda a resolver esta disyuntiva consiste enreagrupar las categorías confundidas en unasola, con el fin de absorber las confusiones.En este caso, se pierde detalle en elmapa, pero se incrementa su confiabilidad(Congalton, 1988a; Janssen y Van der Wel,1994).

La matriz de confusión indica las clases quetienden a ser sub o sobre-representadas enel mapa y, por consecuencia, cuya superficieestá sub o sobre-estimada. Existen diversosmétodos para llevar a cabo correcciones delas estadísticas de superficie con base enel análisis de esta matriz (Hay, 1988; Jupp,1989; Dymond, 1992; Czaplewski y Catts,1992; Card, 1982 y Conese y Maselli, 1992).

Los resultados de la evaluación de la confia-bilidad están reportados de manera muyheterogénea en la literatura. Además, los au-tores utilizan diferentes índices que vuelvenlas comparaciones entre estos estudios aúnmás difíciles. En muchos casos, faltan datosimportantes, como una descripción del dise-ño de muestreo, lo que puede modificar lainterpretación de los resultados. Varios au-tores abogan por una estandarización delmétodo de evaluación de la confiabilidad;otros argumentan que sería perjudicial impo-ner un esquema único de evaluación y de

reporte de los resultados; ya que los objeti-vos de la cartografía y de la evaluación de laconfiabilidad, así como las condiciones parallevarlos a cabo, pueden ser muy distintas(Foody, 2002). Sin embargo, todos concuer-dan en que la evaluación de la confiabilidadno se puede resumir en un solo índice y quees muy importante incorporar en el reporteinformación sobre el muestreo, así como lamatriz "bruta", para que se pueda llevar acabo el cálculo de otros índices que no fue-ron contemplados por los autores (Stehman,1997).

El valor de los datos geográficos depende dela calidad de su sistema de clasificación y suconfiabilidad. Con base en los insumos co-múnmente utilizados para la cartografía (imá-genes de percepción remota) y por la natura-leza misma del objeto de estudio, como porejemplo, la vegetación que presenta una dis-tribución a veces difusa, es difícil obteneruna representación cartográfica totalmentelibre de error o de ambigüedades. Es, portanto, muy importante realizar una evalua-ción de la confiabilidad de estos datos, yaque, de manera cada vez más frecuente sonutilizados como insumo para la evaluaciónde tierras, el ordenamiento territorial, elcálculo de emisión o secuestro de CO2, el di-seño de políticas para la conservación de labiodiversidad, entre otros.

AGRADECIMIENTOS

Se agradece a S. Sánchez-Cotón, a S.Stehman y a dos revisores anónimos por suscomentarios. Este artículo se elaboró en elámbito del proyecto "Desarrollo de unmétodo de evaluación de la confiabilidad demapas de vegetación y uso del suelo,mediante el enfoque difuso (Fuzzy)" apoyadopor el CONACyT (proyecto 38965-T). Elsegundo autor agradece al CONACyT, porotorgarle la beca-crédito de doctorado pe-riodo 2001-2003, con el número de cuenta124650.

Investigaciones Geográficas, Boletín 51, 2003 69

Page 18: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

REFERENCIAS

Aronoff, S. (1982), "Classification accuracy:a user approach", Photogrammetric Engineeringand Remote Sensing, 48(8):1299-1307.

Aspinall, R. y D. M. Pearson (1995),"Describing and managing uncertainty of cate-gorical maps in GIS", Fisher, P. (ed.), Innovationsin GIS 2, Taylor & Francis, London, pp. 71-83.

Biging, G. S., R. Congalton y E. Murphy(1994), "A comparison of photointerpretation andground measurements of forest structure",Fenstermaker, L. (ed), Remote Sensing ThematicAccuracy Assessment: a Compendíum, AmericanSociety for Photogrammetry and Remote Sensing,pp. 148-157.

Burrough, P. A. (1994), "Accuracy and errorGIS", Green, D. R. y D. Rix (eds.), The AGÍ Sour-cebook for Geographic Information Systems 1995,AGÍ, London, pp. 87-91.

Card, H. D. (1982), "Using known map ca-tegory marginal frequencies to improve estimatesof thematic map accuracy", PhotogrammetricEngineering and Remote Sensing, 48 (3):431-439

Carmel, Y., D. J. Dean y H. F. Curtís (2001),"Combining location ancl classification errorsources for estimating multi-temporal datábaseaccuracy", Photogrammetric Engineering and Re-mote Sensing 67(7):865-872.

Chrisman, N R., (1989), "Modeling error inoverlaid categorical maps" trie accuracy of spatialdatabases, Goodchild, M. y Gopal, S. (eds),Chapter 2, Taylor & Francis, London, pp. 21-34.

Chuvieco, E. (1996), Fundamentos de telede-tección espacial, 3ra. ed., Ediciones RIALP,Madrid, España.

Cochran, W. G. (1980), Técnicas de muestreo,CECSA, México.

Conese, C. y F. Maselli (1992), "Use errormatrices to improve área estimates with máximumlikelihood classification procedures", Remote Sen-sing ofthe Environment, 40:113-124.

Congalton, R. G. (1988a), "Using spatial auto-correlation analysis to explore the errors in maps

generated from remotely sensed data", Photo-grammetric Engineering and Remote Sensing, 54(5):587-592.

Congalton, R. G. (1988b), "A comparison ofsampling scheme use in generating error matricesfor assessing the accuracy of maps generatedfrom remotlely sensed data", PhotogrammetricEngineering and Remote Sensing, 54(5):593-600.

Congalton, R. G. (1991), "A review of asse-ssing the accuracy of classifications of remotelysensed data", Remote Sensing of the Environ-ment, 37:35-46.

Congalton, R. G.. y K. Green (1993), "Apractical look at the sources of confusión in errormatrix generation", Photogrammetric Engineeringand Remote Sensing, 59(5):641-644.

Czaplewski, R. y G. Catts (1992), "Calibrationof remotely sensed proportion or área estimatesfor misclassification error", Remote Sensing oftheEnvironment, 39:29.43.

Dicks, S. E. y T. H. C. Lo (1990), "Evaluationof thematic map accuracy in a land-use and land-cover mapping program", Photogrammetric Engi-neering and Remote Sensing, 56(9): 1247-1252.

Dymond, J. R. (1992), "How accurately doimage classifiers estímate área?", InternationalJournal Remote Sensing 13(9):1735-1742.

Fitzpatrick-Lins, K., (1981), "Comparison ofsampling procedures and data analysis for a land-use and land-cover map", Photogrammetric Engi-neering and Remote Sensing, 47:343-351.

Foody, G. M. (1992), "On the compensation forchance agreement in image classification accur-acy assesmenf, Photogrammetric Engineeringand Remote Sensing, 58{ 10): 1459-1460.

Foody, G. (2002), "Status of land cover classi-fication accuracy assessment", Remote Sensingof Environment, 80:185-201.

Friedl, M. A., C. Woodcock, S. Gopal, D.Muchoney, A. H. Strahler y C, Barker-Schaaf(2000), "A note on procedures used for accuracyassessment in land cover maps derived fromAVHRR data", International Journal RemoteSensing, 21(5):1073-1077.

70 Investigaciones Geográficas, Boletín 51, 2003

Page 19: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Evaluación de la confíabilidad temática de mapas o de imágenes clasificadas; una revisión

Goodchild, M. F., S. Gouquing y Y. Shiren(1992), "Development and test of an error modelfor categórica! data", International Journal ofGeographical Information Systems, 6:87-104.

Gopal, S., C. E. Woodcock y A. Strahler(1999), "Fuzzy neural network classification ofglobal land cover from a 1o AVHRR Data Set",Remote Sensing Environment, Elsevier ScienceInc., New York, 67:203-243.

Gopal, S., y C. E. Woodcock (1994), "Accuracyof thematic maps using fuzzy sets I: theoryand methods", Photogrammetric Engineering andRemoteSensing, 58:35-46.

Green, D. R. y S. Hartley (2000), "Integratingphotointerpretation and GIS for vegetationmapping: some issues of error", Alexander, R.y A. C. Millington (eds.), Vegetation Mapping:From Patch to Planet, John Wiley & Sons Ltd.,pp. 103-134.

Hammond, T. O. y D. L Verbyla (1996),"Optimistic bias in classification accuracy assess-ment", International Journal Remote Sensing, 17(6):1261-1266.

Hay, A. M. (1988), "The derivation of globalestimates from a confusión matrix", InternationalJournal Remote Sensing, 9(8):1395-1398.

tU Hord, R. M. y W. Brooner (1976), "Land-usemap accuracy criteria", Photogrammetric Engi-neering and Remote Sensing, 42(5):671-677.

Janssen, L. F. y F. J. van der Wel (1994),"Accuracy assessment of satellite derived land-cover data, a review", Photogrammetric Engi-neering and Remote Sensing, 60(4):419-426.

Jupp, D. (1989), "The stabtüty of global esti-mates from confusión matrices", InternationalJournal Remote Sensing, 10(9):1563-1569.

Khorram, S. (1999), "Accuracy assessment ofremote sensing-derived change detection", Photo-grammetric Engineering and Remote Sensing.Monograph Series.

Khorram, S , J Knight, H. Cakir, H. Yan, ZMao y X. Dai (2000), "Improving estimates of theaccuracy of thematic maps when using aerialphotos as the ground reference source", Procee-

dings of the ASPRS Symposium, Washington,USA.

Luneta, R., R. G. Congalton, L K.Fnstermaker, J. R. Jensen, K. C. McGw y L. R.Tinney (1991), "Remote sensing and geographic¡nformation systems data integration: errorsources and research issues", PhotogrammetricEngineering and Remote Sensing, 57(6): 677-687.

Ma, Z. y R. L Redmond (1995), "Tau coeffi-cients for accuracy assessment of classification ofremote sensing data", Photogrammetric Enginee-ring and Remote Sensing, 61:435-439.

Mas, J. F., (2000), "Une revue des techniqueset méthodes de télédétection du changement",Canadian Journal of Remote Sensing I JournalCanadien de télédétection, vol. 26(4):349-369.

Mas, J. F., J. L. Palacio, A. Velázquez yG. Boceo (2001), "Evaluación de ¡a confiabilidadtemática de bases de datos cartográficas",Memoria Digital CD interactivo, ler. CongresoNacional de Geomática, Guanajuato, 26-28 deseptiembre de 2001, http://indy2.igeograf.unam.mx/dote/publicaciones/evalconf_congreso.htm

Mas, J. F., A. Velázquez, J. L. Palacio-Prieto,G. Boceo, A. Peralta y J. Prado (2002),"Assessing forest resources in México: Wall-to-wall land use/cover mapping", PhotogrammetricEngineering and Remote Sensing 68(10):966-968.h t t p : / / a s p r s . o r g / a s p r s / p u b l i c a t i o n s /pe&rs/2002journal/october/high!ighthtml.

Millington, A.C. y R. W. Alexander (2000),"Vegetation mapping in the last three decades ofthe twentieth century", Millington, A. C y R WAlexander (eds.), Vegetation Mapping, John Wiley& Sons, Chochester, England, pp. 321-331.

Naeseet, E. (1996), "Use of the weightedKappa coefficient in classification error asse-ssment of thematic maps", International JournalGeographical Information Systems 10(5):591-604.

Peralta-Higuera, A., J. L Palacio, G. Boceo, J,F. Mas, A. Velázquez, A. Victoria, R. Bermúdez,U. Martínez y J. Prado (2001), "Nationwide sam-pling of México with airborne digital cameras:an image datábase to valídate the interpretaronof satellite data", American Society for Photo-grammetry and Remote Sensing, 18th Biennal

Investigaciones Geográficas, Boletín 51, 2003 71

Page 20: 2003_Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas

Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega

Workshop on Color Photography & Videographyin Resource Assessment. Amherst, Mass., USA,mayo 16-18, pp. 1-9.

Pontius R.G. (2000), "Quantification errorversus location error in comparison of categoricalmaps", Photogrammethc Engineeríng and RemoteSensing, 66(8)1011-1016.

Pontius R. G. (2002), "Statistical methods topartition of quantity and location during compari-son of categorical maps at múltiple resolutions",Photogrammetric Engineering and Remote Sen-sing, 68(10):1041-1049.

Rosenfield, G. H. y K. Fitzpatrick-Lins (1986),"A coefficient of agreement as a measure ofthematic classification accuracy", Photogramme-thc Engineering and Remote Sensing, 52(2):223-227.

Singh, A. (1989), "Digital change detectiontechniques using remotely-sensed data", Inter-national Journal of Remote Sensing, 10(6):989-1003.

Stehman, S. V. y R. L. Czaplewski (1998),"Design and analysis for thematic map accuracyassessment: fundamental principies", RemoteSensing Environment, 64:331-344.

Stehman, S. V. (1992), "Comparison of syste-matic and random sampling for estimating theaccuracy of maps generated from remotelysensed data", Photogrammetric Engineering andRemote Sensing, 58(9):1342-1350.

Stehman, S. V. (1996), "Estimating the kappacoefficient and its variance under stratified randomsampling", International Journal Remote Sensing,62:401-407.

Stehman, S. V. (1997), "Selecting and inter-preting measures of thematic classification accu-racy", Remote Sensing, Environment, 62:77-89.

Stehman, S. V. (1999), "Basic probabilitysampling designs for thematic map accuracy",International Journal Remote Sensing 20(12):2423-2441.

Stehman, S. V. (2000), "Practical implicationsof design-based sampling inference for thematicmap accuracy assessment", Remote Sensing ofEnvironment, 72:35-45.

Stehman, S. V. (2001), "Statistical rigor andpractical utility in thematic map accuracyassessment", Photogrammetric Engineering andRemote Sensing, 67(6): 727-734.

Turk, G. T. (1979), "GT Índex: a measureof the success of prediction", Remote SensingEnvironment, 8:65-75.

Vogelmann, J. E., S. M. Howard, L Yang, C.R. Larson, B. K. Wylie y N. Van Driel (2001),"Completion of the 1990s National Land CoverData Set for the Conterminous United States fromLandsat Thematic Mapper Data and AncillaryData Sources", Photogrammetric Engineering andRemote Sensing, 67(6): 650-662.

Walsh, J. E., D. R. Lightfoot y D. R. Buttler(1987), "Recognitíon and assessment of errorin geographic informatíon systems", Photo-grammetric Engineering and Remote Sensing, 53(10):1423-1430.

Wonnacott, T. H. y R. J. Wonnacott (1991),Statistiques, Ed. Económica, 4a edición.

Woodcock, C. y S. Gopal (2000), "Accuracyassessment and área estimates using fuzzy sets".International Journal of Geographical InformationScience. 14(2): 153-172.

72 Investigaciones Geográficas, Boletín 51, 2003