12
Formación Geográfica / Curso de IDEs / Manual Bloque 1. Introducción: Información Geográfica, Sistemas de Información Geográfica y Web Semántica Capítulo 2. La Información Geográfica Unidad 1.B.3: Tratamiento de la Información Geográfica Jesús Celada Pérez (Instituto Geográfico Nacional) 1. Introducción. Los procesos a realizar en la elaboración de un proyecto SIG, pueden resumirse en los siguientes: - Análisis de requisitos - Diseño del modelo de datos geográfico - Recopilación y adquisición de datos (espaciales y temáticos) - Carga de datos en el sistema - Tratamiento (Integración y Edición) de datos - Explotación del proyecto - Actualización Figura 1. Fases en la creación de un SIG. En la primera fase, es necesario identificar y analizar cuáles son las necesidades de información que han originado el lanzamiento del proyecto y, más concretamente cuáles son el conjunto de preguntas y consultas que debe responder el sistema. La segunda fase, consistente en la definición y el diseño del modelo, sirve para determinar no sólo el conjunto de datos que hay que introducir en el proyecto, sino también la estructura con la que han de ser almacenados para que se constituyan en información geográfica. A continuación hay que proceder a la adquisición de los datos especificados, tarea que incluye las siguientes actividades: Recopilación y evaluación de los datos existentes. Generación de los datos que, estando especificados en el modelo, no estén disponibles. Una vez obtenidos los datos por cualquiera de los medios posibles se procede a la correspondiente carga en el sistema. El potencial de un SIG se caracteriza por su capacidad multidisciplinar. Para ello, estos sistemas han de ser capaces de soportar datos heterogéneos respecto a los siguientes parámetros: - fuentes y métodos de adquisición, - formatos digitales, - sistema de referencia, - exactitud y, en general, calidad, - estado de actualización y puesta al día. Esta heterogeneidad se soluciona realizando una serie de preprocesos y tratamientos que posibiliten su integración en una única base de datos geográfica para que sea homogénea y continua sobre la zona de estudio del proyecto. Posteriormente, puede que esta base de datos tenga que ser editada para corregir los posibles errores existentes en los datos iniciales, hasta obtener un conjunto final que represente adecuadamente, en función de los objetivos del proyecto, la realidad geográfica. 1

1B3 TratamientoIG DOC

Embed Size (px)

Citation preview

Formación Geográfica / Curso de IDEs / Manual

Bloque 1. Introducción: Información Geográfica, Sistemas de Información Geográfica y Web Semántica Capítulo 2. La Información Geográfica Unidad 1.B.3: Tratamiento de la Información Geográfica Jesús Celada Pérez (Instituto Geográfico Nacional)

1. Introducción.

Los procesos a realizar en la elaboración de un proyecto SIG, pueden resumirse en los siguientes:

- Análisis de requisitos - Diseño del modelo de datos geográfico - Recopilación y adquisición de datos (espaciales y

temáticos) - Carga de datos en el sistema - Tratamiento (Integración y Edición) de datos - Explotación del proyecto - Actualización

Figura 1. Fases en la creación de un SIG.

En la primera fase, es necesario identificar y analizar cuáles son las necesidades de información que han originado el lanzamiento del proyecto y, más concretamente cuáles son el conjunto de preguntas y consultas que debe responder el sistema.

La segunda fase, consistente en la definición y el diseño del modelo, sirve para determinar no sólo el conjunto de datos que hay que introducir en el proyecto, sino también la estructura con la que han de ser almacenados para que se constituyan en información geográfica. A continuación hay que proceder a la adquisición de los datos especificados, tarea que incluye las siguientes actividades:

Recopilación y evaluación de los datos existentes. Generación de los datos que, estando especificados en el modelo, no estén disponibles.

Una vez obtenidos los datos por cualquiera de los medios posibles se procede a la correspondiente carga en el sistema.

El potencial de un SIG se caracteriza por su capacidad multidisciplinar. Para ello, estos sistemas han de ser capaces de soportar datos heterogéneos respecto a los siguientes parámetros:

- fuentes y métodos de adquisición, - formatos digitales, - sistema de referencia, - exactitud y, en general, calidad, - estado de actualización y puesta al día.

Esta heterogeneidad se soluciona realizando una serie de preprocesos y tratamientos que posibiliten su integración en una única base de datos geográfica para que sea homogénea y continua sobre la zona de estudio del proyecto. Posteriormente, puede que esta base de datos tenga que ser editada para corregir los posibles errores existentes en los datos iniciales, hasta obtener un conjunto final que represente adecuadamente, en función de los objetivos del proyecto, la realidad geográfica.

1

Formación Geográfica / Curso de IDEs / Manual

2. Integración.

Por Integración se entiende el proceso de homogeneización y fusión de los diferentes conjuntos de datos que han de formar parte de un determinado proyecto SIG. La heterogeneidad derivada de las distintas fuentes y métodos de captura de la información utilizada en el SIG ha sido tratada en el tema anterior. A continuación se exponen las soluciones planteadas para homogeneizar el resto de parámetros.

• Homogeneización de los formatos digitales. • Homogeneización del Sistema de Referencia. • Homogeneización de la calidad. • Homogeneización de la actualidad de los datos

2.1. Homogeneización de los formatos digitales.

Esta fase consiste en realizar procesos de traducción o conversión de los formatos iniciales de los datos a alguno de los formatos específicos soportados como formato de entrada por el sistema SIG. Los programas traductores utilizados han de conocer el modelo interno de los datos, tanto en el conjunto original de partida como en el transformado. El abanico de formatos digitales capaces de ser importados al SIG ha aumentado considerablemente a medida que el desarrollo de estos sistemas ha ido creciendo. Cualquiera de los software SIG existentes en el mercado es capaz de importar ficheros procedentes de bases de datos locales (Access), bases de datos externas (Oracle), ficheros de texto ASCII, ficheros propietarios de otras marcas, servidor de mapas (WMS), servidores de fenómenos (WFS),…El desarrollo del Open Gis Consortium (OGC) en el año 1994 ha contribuido de manera decisiva en este sentido. Aún así, las conversiones de formato entre ficheros de diferentes programas de SIG se suelen realizar en la mayoría de los casos de modo automático, sin que apenas intervenga el operador. Existen aplicaciones específicas para realizar este tipo de conversiones, como por ejemplo FME, que además permiten concatenar, comparar, filtrar, convertir, editar y crear bases de datos en diversos formatos.

Figura 2. Manipulación de ficheros fuente con FME.

Un ejemplo claro de conversión de formatos digitales lo encontramos en el desarrollo del SIG del Instituto Geográfico Nacional. La información original procede de ficheros CAD, cuyos elementos cartográficos se encuentran clasificados mediante las propiedades que permiten los software CAD: nivel, color, grosor, estilo. Estos cuatro parámetros permiten identificar en el fichero original el tipo de elemento geográfico al que nos estamos refiriendo.

2

Formación Geográfica / Curso de IDEs / Manual

ID_CODIGO NOMBRE NIVEL COLOR GROSOR ESTILO

039604 ABREVADERO 17 151 1 0

021102 ACANTILADO 8 21 0 1

030303 ACEQUIA 10 136 0 7

030304 ACEQUIA_DE_DISTRIBUCION 10 151 4 7

030306 ACEQUIA_DE_DRENAJE 10 181 0 3

030305 ACEQUIA_DE_RIEGO 10 166 2 7

030323 ACEQUIA_SUBTERRANEA 10 226 0 3

018101 ADUANA 4 45 1 0

068601 AEROCLUB 45 210 1 0

065381 AEROCLUB.CIERRE_CONVENCIONAL 44 38 0 0 Tabla 1. Esta tabla pertenece al modelo SIG del IGN. El fichero CAD clasifica por nivel, color, grosor, estilo.

El modelo SIG clasifica por Temas. A diferencia del fichero CAD, el modelo definido para este SIG clasifica estos fenómenos en temas en función de su naturaleza. Cada tema es representado por una tabla en la base de datos. Existen un total de 10 tablas cuya enumeración es la siguiente:

TABLA TEMA TABLA TEMA 01 Líneas Límite 06 Construcciones 02 Altimetría 07 Conducción y Suministros 03 Hidrografía 08 Textos 04 Usos del Suelo 09 Puntos de Control 05 Vías de Comunicación 10 Otros

Tabla 2. Esta tabla pertenece al modelo SIG del IGN. Cada una de ellas almacenará información de los fenómenos relacionados con el tema de la tabla.

Se ha desarrollado una aplicación “traductora” capaz de transformar los datos procedentes de CAD al modelo definido en la base de datos Oracle del SIG. Para ello, esta aplicación realiza los siguientes pasos:

1. rastrea el fichero CAD, 2. identifica el elemento, 3. extrae sus cuatro parámetros gráficos: nivel, color, grosor y estilo, 4. entra en la base de datos del SIG y mediante la tabla 1 identifica el campo ID_CODIGO, 5. los dos primeros dígitos de este campo se corresponden con el tema al que pertenece el elemento

según la tabla 2.

Figura 3. Fichero CAD. Elemento Depuradora. Figura 4. Tabla 03-Hidrografía. Elemento Depuradora.

De esta forma, los datos CAD quedan perfectamente integrados en la base de datos Oracle, fuente de datos del SIG.

3

Formación Geográfica / Curso de IDEs / Manual

2.2. Homogeneización del Sistema de Referencia.

Las nuevas tecnologías han facilitado el acceso a datos originados por productores de información geográfica de otras nacionalidades. También han permitido crear sistemas de localización de uso global en continúa expansión como es el caso de los receptores GPS, destacando su uso en la fase de captura de datos del proyecto SIG. Ambas fuentes de información se encuentran referidas a Sistemas de Referencia Geodésicos distintos entre ellos y diferentes a su vez al sistema empleado en España. La falta de homogeneización de estos Sistemas de Referencia a la hora de combinar datos procedentes de diversas fuentes, especialmente datos internacionales, provoca desplazamientos en la superposición de los fenómenos geográficos derivados de una errónea interpretación geodésica de los datos. Este aspecto juega un papel importante en el desarrollo del proyecto, despreciado en muchos casos y con graves consecuencias en la calidad del sistema. Los parámetros a los que se refiere el Sistema de Referencia son:

- El sistema geodésico de referencia, incluyendo el Datum. - La proyección cartográfica.

Figura 5. Coordenadas Geográficas. Figura 6. Proyección UTM Huso 30.

La homogeneización de estos parámetros está completamente superada en cualquiera de las aplicaciones SIG existentes en el mercado. Todas ellas ofrecen sencillas interfaces para la conversión de un sistema a otro de los empleados en cualquier país del mundo y que se encuentran ya definidos en la propia aplicación. También incluyen la posibilidad de definir otros sistemas especificados por el usuario. La transformación de un sistema geodésico a otro se realiza utilizando una serie de puntos de control cuyas coordenadas sean conocidas en ambos sistemas de referencia. La conversión de la proyección cartográfica es más sencillo, simplemente hay que aplicar las fórmulas matemáticas que cambian una proyección por otra. También la mayoría de los programas SIG incluyen la implementación de los cambios entre las proyecciones más habituales: Lambert, UTM, etc. 2.3. Homogeneización de la Calidad.

Si los conjuntos de datos tienen diferentes calidades métricas o temáticas, se pueden llevar a cabo dos procesos:

- Generalización de los conjuntos de datos más exactos –con errores menores-, para homogeneizar su calidad, métrica o temática, con la de los conjuntos menos exactos.

- Sustitución de los conjuntos de datos de menor calidad por otros nuevos cuya calidad sea la adecuada.

- Almacenar la exactitud como un atributo más, asociado a las entidades de cada uno de los conjuntos de datos. En la mayoría de los casos, la utilización de este método resulta ser la opción más recomendable, dado el coste que suponen los procesos de generalización y/o elaboración de nuevos datos.

4

Formación Geográfica / Curso de IDEs / Manual

La generalización es el proceso por el cual se obtiene un mapa o un fichero de escala menor, de menos detalle, a partir de un mapa o de un fichero de mayor escala, de más detalle. Es un proceso subjetivo, complejo y muy difícil de automatizar, porque es necesario esquematizar la información para suprimir detalles y mantener al mismo tiempo el aspecto general de los datos. En la actualidad el proceso de generalización consta de fases semiautomáticas, supervisadas por el operador y de fases automatizadas que requieren un exhaustivo estudio y diseño para la extracción de los parámetros que automaticen dichos procesos de generalización. La generalización se suele realizar por temas de manera independiente con el consecuente problema a la hora de combinar diferentes temas. Existen diversos algoritmos de generalización buscar algoritmos y diferentes empresas buscar empresas que ofrecen aplicaciones basadas en estos algoritmos. La generalización se encuentra actualmente en fase de investigación.

Figura 7. Ejemplo de Generalización de las curvas de nivel escalas 1:25000 y 1:50000.

2.4. Homogeneización de la actualidad de los datos.

El parámetro tiempo es otro de los factores que diferencian a unos datos de otros. Cada vez más tenido en cuenta su tratamiento ha ido evolucionando de forma paralela a la definición de SIG. En un primer momento aquellos datos anticuados que no se encontraban actualizados con el resto de la información eran desechados. A continuación se procedió a combinar datos aunque el origen temporal de los mismos no fuese el mismo. Los SIG recogen en un campo o atributo la fecha en la que el dato es comprobado y verificado. Conscientes de que no todos los datos pueden estar actualizados en la misma fecha, especialmente los SIG que abarcan grandes extensiones, el usuario del sistema puede filtrar la información y así obtener las zonas recientemente actualizadas o comprobar que zonas son más obsoletas. La actualización de los datos es uno de los pilares básicos que garantiza el éxito del sistema de información geográfica. El desarrollo de herramientas corporativas exclusivas para la actualización de los datos geográficos es otra de las posibilidades disponibles hoy en día. Las casas comerciales facilitan la programación en lenguajes informáticos de los objetos y componentes de sus propios software SIG permitiendo desarrollar aplicaciones concretas para la actualización de los datos.

Figura 8. Aplicación desarrollada por el IGN sobre Geomedia para la actualización de la BCN200.

5

Formación Geográfica / Curso de IDEs / Manual

Los SIG de última generación añaden un componente nuevo, la cuarta dimensión, refiriéndose a la variable tiempo. Estos SIG temporales (SIGT) permiten almacenar la información espacial de diferentes fechas. Así el usuario puede recuperar posiciones geométricas pasadas y estudiar la evolución temporal, además de la espacial, de los diferentes fenómenos. 2.6. Fusión y ajuste de los conjuntos de datos espaciales.

La falta de coincidencia analítica y temática en la representación espacial de elementos geográficos, cuando están registrados en diferentes conjuntos de datos, puede ser consecuencia de los factores siguientes:

- Presencia de errores residuales, derivados de los procesos anteriores de unificación. - Presencia de errores accidentales, que afectan a un conjunto específico de elementos. - Utilización de métodos de adquisición de datos, en los que se han aplicado diversos criterios de interpretación.

Cuando hay que integrar en una sola base de datos la información existente en varios conjuntos no homogéneos, es preciso fusionar dichos conjuntos y, además, detectar y corregir las incoherencias geométricas y temáticas existentes en la representación de los fenómenos geográficos. Se utiliza la palabra conflación (conflation) para referirse no sólo al “procedimiento o método para hacer coincidir las representaciones espaciales (posiciones), que puedan existir en diferentes conjuntos de datos, de un mismo fenómeno o de fenómenos correspondientes”, sino también a otros muchos, algunos de los cuales, en este texto, se consideran englobados en la edición geométrica. Los principales problemas asociados al proceso genérico de conflación, son los siguientes:

1. Fusión y ajuste de aquellos conjuntos de datos relacionados espacialmente por contener información de elementos geográficos situados en: 1.1. Zonas espacialmente -adyacentes: Armonización Horizontal. 1.2. Zonas que se superponen –total o parcialmente- en el espacio: Armonización Vertical. El ajuste implica la detección y corrección de los errores producidos por la falta de coincidencia entre elementos homólogos de los conjuntos de datos fusionados.

2. Ajuste entre elementos pertenecientes al mismo conjunto de datos: Edición geométrica y temática.

La edición se trata en el siguiente apartado, pero conviene concretar los dos puntos del primer problema: la armonización horizontal y la armonización vertical. La armonización horizontal es el proceso que permite detectar y corregir la falta de coincidencia analítica y temática de una serie de fenómenos geográficos, cuya información espacial está distribuida en conjuntos de datos que corresponden a zonas geográficamente adyacentes. Un ejemplo de este problema es el denominado “case” de hojas cartográficas adyacentes. El SIG desarrollado por el Instituto Geográfico Nacional se nutre de la información CAD procedente de la estructura de las hojas del Mapa Topográficas Nacional que cubren la totalidad del territorio. Cada hoja es importada al sistema de forma independiente y los fenómenos geográficos que en ella se encuentran aparecerán en el SIG cortados en los límites definidos por la propia hoja. La armonización horizontal pone de manifiesto la falta de contacto físico (casamiento), y por lo tanto de continuidad, de los elementos que forman parte de hojas adyacentes.

Figura 9. Armonización Horizontal. La carretera SA-334 debe continuar como ZA-315

Figura 10. Armonización Horizontal. Continuidad de la Autovía A-6

6

Formación Geográfica / Curso de IDEs / Manual

La falta de armonización horizontal no solo se manifiesta en la posición geográfica del elemento. También se pueden comprobar problemas de “cases” alfanuméricos, tales como ríos o carreteras cuya denominación cambia erróneamente de una hoja a otra.

Figura 11. Armonización Horizontal. Falta de consistencia alfanumérica.

Ambos problemas son corregidos en las fases de edición geométrica y temática respectivamente, detalladas en el siguiente apartado. La armonización vertical es el proceso que permite detectar y corregir la falta de coincidencia analítica y temática de fenómenos geográficos, cuya información espacial está distribuida en conjuntos de datos que corresponden a la misma zona o ámbito geográfico.

Figura 12. Armonización Vertical. Superposición Imagen SPOT-5 con datos BCN200.

Para corregir los errores geométricos que pueden surgir en este proceso, se han diseñado varios algoritmos, cuya idea fundamental se basa en que las líneas que están “muy próximas”, deberían fusionarse y ser un único elemento. Para realizar este proceso se utilizan, entre otros, criterios de tolerancia lineal o angular, de manera que se fusionarían los segmentos de dichas líneas que verificasen una de estas condiciones:

- la distancia entre los segmentos es menor que un determinado umbral o tolerancia lineal, o bien, - el ángulo relativo entre los segmentos es inferior a un umbral angular.

Los programas de SIG disponen de herramientas específicas, que han sido diseñadas para dar solución a los principales problemas que aparecen en la fase de conflación. A continuación, se citan algunas de las funciones que realizan estas herramientas:

Edge matching (case en bordes). Existen varios métodos para implementar esta función según las situaciones o casuística. En general, su objetivo consiste en determinar qué elementos geométricos (líneas o poligonales), correspondientes a elementos homólogos, deberían estar unidos. En unos casos, la unión se realizará entre pares de extremos –uno a uno-, y en otros, será necesario unir un extremo con otros varios –uno a muchos-.

Boundary Alignment (ajuste de límites). Esta función permite eliminar los errores de tipo “huecos” y “solapes”, que se producen a lo largo de los límites o geometrías comunes a ciertos elementos de los conjuntos de datos fusionados.

Detección y corrección de geometrías que se intersecan y no son coincidentes. Para realizar el proceso de búsqueda, es necesario especificar el valor de una tolerancia lineal, de modo que

7

Formación Geográfica / Curso de IDEs / Manual

sólo se detectan como erróneas aquellas objetos cuyas geometrías se intersecan, y la distancia entre sus puntos es menor de dicho valor.

Figura 13. Boundary Alignment. Figura 14. Intersección no coincidente.

Hay que decir que no existe una clasificación rigurosa de estas funciones, ya que muchos programas implementan, en la misma herramienta y con un mismo nombre, varias de ellas. Respecto a los errores temáticos, éstos pueden ser detectados bien mediante consultas de explotación programadas en el propio SIG a través de los denominados atributos funcionales, bien mediante consultas en lenguajes dirigidos a bases de datos, por ejemplo el lenguaje SQL. Ambas técnicas son capaces de localizar diferencias temáticas, de atributos y de campos de las tablas, entre diferentes bases de datos referidas al mismo espacio o zona geográfica. Aunque la conflación puede realizarse de modo automático, usando las funciones antes citadas, hay que destacar que éstas no suelen ser capaces de resolver el 100% de todos los casos que se presentan. Ante este hecho, se hace inevitable la intervención de un operador que no sólo revise los resultados de la armonización automática, sino que también realice procesos de edición manual para resolver los casos detectados que no se pueden solucionar por procedimientos automáticos, corregir las anomalías no detectadas y arreglar las correcciones erróneas que haya podido realizar el programa. 3. Edición de datos.

La Edición es el proceso que permite la representación correcta, coherente y fidedigna de todos y cada uno de los fenómenos que forman parte de un proyecto SIG. Este proceso consta de tres fases:

Edición geométrica Edición temática Construcción y revisión del modelo de datos

3.1 Edición geométrica de datos

Este proceso tiene por finalidad la correcta representación espacial de los fenómenos, representación que estará condicionada no sólo por su forma y dimensiones, sino también por la exactitud y resolución espacial correspondiente a los datos que las representan.

La edición geométrica consiste en la localización y corrección de los errores existentes en la representación de fenómenos, utilizando métodos diferentes en función del tipo de anomalía o incoherencia geométrica detectada. En términos generales, puede decirse que la edición geométrica consta de dos fases:

- División de líneas en los puntos de intersección. - Detección y corrección de anomalías geométricas.

3.1.1 División de líneas en los puntos de intersección. La división de líneas, que consiste en dividir las líneas en tramos que van desde una intersección hasta la siguiente, no sólo agiliza los procesos utilizados en la detección y corrección de anomalías geométricas, sino que también facilita una organización más adecuada de la información geométrica para el análisis espacial. 3.1.2 Detección y corrección de anomalías geométricas. La causa de los diferentes tipos de anomalías geométricas que se encuentran en los datos de un proyecto SIG, pueden tener su origen en diversos factores, tales como:

- Errores humanos en la interpretación de la realidad geográfica.

8

Formación Geográfica / Curso de IDEs / Manual

- Uso de métodos de trabajo inadecuados. - Deficiencias en los métodos de captura. - Etc.

Figura 15. División de líneas en los puntos de intersección.

Si a los errores así generados, se añaden los que se producen por la integración de conjuntos de datos heterogéneos, se presentaran una serie de anomalías o incoherencias espaciales, cuya corrección se ha de realizar en esta fase de edición geométrica. A continuación, se indican algunos de los errores que se presentan con más frecuencia. Arcos colgantes También llamados extremos libres, se dan cuando se tiene una poligonal (secuencia encadenada de líneas) con al menos un extremo libre es decir, un punto final no coincidente con ningún otro extremo de otra poligonal o de sí misma. Los arcos colgantes pueden tener uno o dos extremos libres.

Figura 16. Arcos colgantes.

La detección de arcos colgantes se basa en la localización de puntos de otros elementos gráficos que tengan las mismas coordenadas que sus respectivos extremos libres. Si no existe ningún punto que cumpla este criterio de coincidencia, el elemento gráfico es un candidato a ser considerado como erróneo. En algunos casos es correcto que existan arcos colgantes (el nacimiento de un río siempre es un arco colgante), y en otro no lo es (una capa de límites municipales no debe tener ningún arco colgante), dependiendo del significado de los datos. Los denominados “overshoot” (sobretrazos) y “undershoot” (subtrazos), representan un tipo particular de arcos colgantes:

- Sobretrazo: Poligonal de longitud mínima con un extremo libre, detectado como erróneo por haber sobrepasado la línea con la que debería coincidir.

- Subtrazo: Poligonal con un sólo extremo libre, detectado como erróneo por no ser coincidente con la línea –o con una de las líneas- existente en sus proximidades, y en la que podría finalizar.

Figura 17. Sobretrazo y Subtrazo.

Para localizar y corregir este tipo de errores, los programas de SIG disponen de un conjunto de funciones que suelen utilizar criterios basados en tolerancias gráficas de tipo lineal. Dado un determinado valor de tolerancia o distancia máxima de búsqueda Dmax, cuando se localice un extremo libre sólo se detectará como error, si en el entorno circular de radio R=Dmax trazado a su alrededor, no se encuentra ningún otro elemento gráfico.

9

Formación Geográfica / Curso de IDEs / Manual

La corrección de errores se puede llevar a cabo de forma automática, semiautomática o manual.

Figura 18. Corrección de arcos colgantes.

Los segmentos de longitud mínima, mínima en función de la resolución del conjunto de datos al que pertenezcan, también pueden considerarse en ocasiones un tipo de arcos colgantes, cuya detección y corrección se realiza según los criterios expuestos. Slivers Los slivers, o astillas son falsos polígonos generados por la superposición de poligonales que debieran ser coincidentes y no lo son. Muchos de ellos se generan en los procesos de conflación antes citados.

Figura 19. Slivers.

Estos polígonos se caracterizan por ser recintos cerrados, generalmente muy alargados, de gran perímetro y superficie mínima.

Los programas de SIG suelen incorporar funciones de localización y corrección, automática o semiautomática, de este tipo de anomalía geométrica. El criterio más utilizado en la detección de slivers, se basa en establecer un valor de tolerancia superficial (T_S). Si la relación entre la superficie y el perímetro al cuadrado de un polígono verifica esta condición: (Superficie)/(Perímetro)2 <= T_S, dicho polígono se considera un sliver.

Bucles Son falsos polígonos que resultan de la autointersección errónea de una poligonal. Hay que tener en cuenta que en algunos casos se dan los bucles en la realidad, como en algunos enlaces de autopista.

Figura 20. Búcles. Figura 21. Líneas duplicadas.

Líneas duplicadas Son errores producidos por la duplicación innecesaria de elementos geométricos con coincidencia espacial exacta.

10

Formación Geográfica / Curso de IDEs / Manual

3.2 Edición temática de datos

Este proceso tiene por finalidad la representación fidedigna de los aspectos semánticos de los fenómenos, de modo que exista concordancia entre la realidad y los atributos almacenados en la base de datos. La edición temática consiste en la localización y corrección de los errores existentes en la identificación y caracterización de entidades, cuando éstos no se corresponden con la realidad. Las causas de este tipo de errores, pueden tener su origen en factores del tipo:

- Errores humanos en la interpretación de la realidad geográfica. - Uso de criterios diferentes en la elaboración de cartografía.

Por ejemplo, los diversos organismos oficiales que publican cartografía temática de un cierto tipo (edafología, geología, etc.), pueden utilizar diferentes clasificaciones estándar o incluso sus propias clasificaciones, lo que da lugar a cartografías no homogéneas.

Un ejemplo de este último caso, se presenta al comparar los mapas de Usos del Suelo a escala 1/50000, elaborados por dos organismos diferentes. La información sobre las unidades de matorral que aparece en cada uno de los documentos, es diferente (los colores diferentes indican tipos de matorral). Las zonas marcadas con un círculo de color rojo, indican donde se han producido discrepancias en la clasificación de este tipo de unidades. En estos casos, se recurre a trabajos de campo o comprobaciones in situ, fotointerpretación, etc., para dar solución al problema planteado. Una de las tareas más difíciles de llevar a cabo sin cometer ningún error, es el chequeo y verificación del nombre de los fenómenos geográficos, labor harto complicada ya que es necesario recoger con finalidad acentos graves, agudos, apóstrofos, ce cedillas, eñes, mayúsculas acentuadas, minúsculas, guiones y toda suerte de caracteres especiales utilizados en el idioma o idiomas de trabajo. Por añadidura, es habitual la situación en la que hay que gestionar nombres propios de ríos, montes, etc. en los distintos idiomas oficiales de un territorio e incluso en variedades dialectales en las que se conoce el nombre de un lugar o fenómeno. El tratamiento temático también incluye la clasificación de los fenómenos geográficos que existen en el mundo real en las clases o tipo de fenómenos que sea necesario considerar en el modelo, por ejemplo: ríos, lagos, embalses, carreteras, caminos, autopistas, fuentes, palomares, etc. En esta labor, el problema es establecer criterios lo más claros, objetivos y homogéneos posible para clasificar los fenómenos, cosa a veces difícil de conseguir debido a la misma naturaleza de la información geográfica, inclasificable muchas veces de por sí. Porque ¿cómo se diferencia una pista forestal de un camino, o de un cortafuegos, o de una senda, o de una cañada? La respuesta a esta pregunta la encontramos en las ontologías geográficas, recogidas en numerosos artículos en plena ebullición investigadora. Una ontología es un exhaustivo y riguroso esquema conceptual dentro de un dominio dado, en esto caso el domino de fenómenos geográficos, con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas. El uso de ontologías permite definir y clasificar fenómenos geográficos sin ningún tipo de ambigüedad aceptados “universalmente”, permitiendo la traslación de fenómenos de una base a otra y facilitando la importación de datos alfanuméricos sobre la información geográfica original procedentes de otras bases. Los programas de SIG suelen incorporar funciones de validación de atributos. Estas funciones permiten realizar algunas comprobaciones tales como:

Verificar que el rango de valores numéricos de un atributo sea el correcto. Verificar que los valores (no numéricos) de un atributo pertenezcan a su dominio, es decir,

al conjunto de todos sus posibles valores (lista de valores). Comprobar que existen unas determinadas relaciones entre los valores de un atributo (>,

<,...).

11

Formación Geográfica / Curso de IDEs / Manual

Existen aplicaciones concretas que verifican en todo momento la integridad de los datos manipulados por el sistema. Estas herramientas server-side, instaladas en el servidor de datos, verifican, chequean y comprueban constantemente determinadas normas topológicas, geométricas y temáticas que han sido previamente definidas por el usuario o bien, generadas automáticamente por la propia aplicación (data mining). En el momento en que alguna de estas normas sea infringida la aplicación alertará al usuario sobre la incorrecta introducción de los datos para su posterior edición.

4. Bibliografía y enlaces

Bibliografía: Aronoff, Stanley (1989). Geographic Information Systems: A Management Perspective. WDL Publications, Ottawa, Canada. Bosque Sendra, J.(1992) Sistemas de Información Geográfica. Ediciones Rialp. ISBN: 84-321-2922-4 Burroughs, P.P., McDonnel, R.A. (1998). Principles of Geographical Information Systems. Oxford University Press. Bernhardsen, T. (1999). Geographic Information Systems: An Introduction. Wiley, New York. García Lázaro, Francisco J. (2001). Sistemas de Información Geográfica, transparencias de la asignatura de la E. T. S. de Ingeniería en Topografía, Geodesia y Cartografía. Goodchild, M.F., Maguire, D. y otros (2001) “Geographic Information Systems and Science”. Editorial Wisley. ISBN:0-471-89275-0 Manual de referencia del programa Modular GIS Environment v.8.0. (1998). Intergraph Corporation. Manual de referencia del programa GeoMedia Professional v.6.00. (2002). Intergraph Corporation. Manual de referencia del programa GeoMedia Object v.6.00. (2002). Intergraph Corporation. Manual de referencia del programa Arc View GIS v.3.2.a. (1999). ESRI. Moreno Regidor, Pilar (2003). Fundamentos de Sistemas de Información Geográfica. E. T. S. de Ingeniería en Topografía, Geodesia y Cartografía. Enlaces: Conflación:

o http://www.digitalcorp.com/whatisconflation.htm o http://www.geo.ed.ac.uk/agidexe/term?535 o http://en.mimi.hu/gis/conflation.html

División de líneas: http://www.geog.ubc.ca/courses/klink/gis.notes/ncgia/ (Acceder a la unidad 32) Arcos colgantes: http://csugis.sfsu.edu/CSU/exer/3edit.htm

12