Datos SIG

Embed Size (px)

Citation preview

  • 8/16/2019 Datos SIG

    1/59

    ALMACENAMI ENTO

     Y ESTRUCTURA DE DATOS

    Lectura 4

  • 8/16/2019 Datos SIG

    2/59

    ASPECTOS PRINCIPALES EN ESTA

    PRESENTACION

    • CUANTIFICACIÓN;

    • ALMACENAMIENTO DIGITAL;

    • DISPOSITIVOS DE ESTRUCTURACIÓN;

    • ESTRUCTURA DE DATOS; Y

    • MODELO DE DATOS.

  • 8/16/2019 Datos SIG

    3/59

    CUANTIFICACIÓN

    • De Información a datos (discretización)• De Datos a estructuras de datos• De Estructuras de datos a modelos de Datos

    ANÁLISIS

    •Comenzamos con el problema de los datos continuos y la

    discretización.•El proceso de discretización es un requisito fundamental enla utilización de datos de SIG.

  • 8/16/2019 Datos SIG

    4/59

    PREGUNTA

    •Que es Discretización?

  • 8/16/2019 Datos SIG

    5/59

    PROBLEMAS CON LA DISCRETIZACION

    •Difícil/imposible determinar donde deben dibujarselos límites.

    •Especialmente con respecto a fenómenos naturales.

    • Entidades construidas por los Humanos como

    edificios, caminos, puentes, diques, y campos dedeportes son más fáciles de definir usando límitesrizados o irregulares.

  • 8/16/2019 Datos SIG

    6/59

    Problemas con la Discretizacion

    ¿ Donde termina la boca del volcanY comienza la montaña?

    ¿Donde termina el pantanoY comienza la marisma ?

    En SIG estamos forzados a dibujar limites

    para cuantificar y discretizar

  • 8/16/2019 Datos SIG

    7/59

    SELECCIÓN

    Después de la discretización es necesario seleccionarlos objetos que serán incluidos en la base de datos.

    • La selección es un paso necesario en la adquisición yalmacenamiento de datos.

    • Incluyendo todos los rasgos requerirán una base dedatos infinitamente grande.

  • 8/16/2019 Datos SIG

    8/59

    EL CONTEXTO

    • El contexto y las metas de análisis

    determinan lo que es incluido o no.• Si usted está analizando la cobertura delsarampión entre pre-escolares, entonces la

    proporción de coníferas frente a los árbolescaducos en el área no le concierne, no esrelevante.

  • 8/16/2019 Datos SIG

    9/59

    DESPUÉS DE LA DI SCRETI ZACI ON Y LA SELECCI ÓN

    •La Georeferenciación nos provee un método para

    codificar los objetos discretos.•Los sistemas de Georeferenciación incluyendirecciones y códigos postales; zonas

    administrativas; grillas y planchas de mapa.• Georeferenciación involucra cuantificación.

  • 8/16/2019 Datos SIG

    10/59

    LA CUANTIFICACIÓN

    • Una vez los datos se seleccionan y georeferencian,es necesario cuantificarlos para usarlos en unacomputadora.

    • La cuantificación usa la representación numérica.

    • Algunas veces, es fácil cuantificar. La anchura de

    una carretera es un caso de cuantificación simple.• Como también determinar el área en kilómetroscuadrados de un lago.

  • 8/16/2019 Datos SIG

    11/59

    CUANTIFICACION

    ¿ Isolíneas unen puntos de igual valor; Puntosintermedios pueden ser aproximados con referenciaa valores conocidos

    GEOREFERENCIACION¿ Direcciones viales son

    usualmente usadas como simplesgeoreferenciaciones. Estasproveen un significado decuantificación a través de lasdirecciones numéricas. Unidadescatastrales todavía necesitan ser

    definidas

  • 8/16/2019 Datos SIG

    12/59

    PUNTOS SOBRE LA CUANTIFICACIÓN

    •  Un sistema de computadora almacena valores discretos o únicos. Éstospueden representar fielmente el continuo de valores que existen en elmundo real.

    •   La naturaleza de los datos es importante, como los diferentes tipos deoperaciones matemáticas que pueden realizarse con los diferentes datos.

    • Los valores numéricos puede definirse con respecto escalas de medidanominal, ordinal, proporcional o de intervalo.

  • 8/16/2019 Datos SIG

    13/59

    CUANTIFICACION SIMPLE CONTRA COMPLEJA

    • La Cuantificación puede ser simple, o requerir de considerableabstracción.

    • Ejemplo 1 (Simple): La altura máxima de una montaña puede ser incluidafácilmente en un SIG.

    • Ejemplo 2 (Complejo) hay muchas opciones para codificar lascaracterísticas de un bosque en un SIG, incluyendo:

    • Códigos numéricos para las categorías del bosque como selva o bosque;

    -El cierre del dosel expresado como un porcentaje;

    • Un código numérico para las especies dominantes de árboles en el bosque.

  • 8/16/2019 Datos SIG

    14/59

  • 8/16/2019 Datos SIG

    15/59

    RESUMENPARA CONVERTIR DATOS A INFORMACION

    1. Seleccionar los Datos.2. Clasificarlos (Establecer las categorías)3. Discretizar4. Georeferenciar

    5. Cuantificar

  • 8/16/2019 Datos SIG

    16/59

    CAMBI ANDO DATOS EN I NFORMACI ON

    Base de Datos

    Selección

    Clasif icaciónDiscretización

    Cuantif icación

    ConversiónEdición YVerificación

    Actualización

    Analisis y

    Modelamiento

  • 8/16/2019 Datos SIG

    17/59

    ESTRUCTURANDO DATOS DIGITALES

    • Una vez una designación numérica ha sidodeterminada, tenemos que entrar los datos en ciertomodo qué es aceptable por la computadora.

    • Es necesario repasar cómo los datos digitales seguardan dentro de una computadora.

  • 8/16/2019 Datos SIG

    18/59

    BITS Y BYTES

    • La unidad básica de almacenamiento es un solo carácterllamado un bit que es corto para un digito binario.

    • Un bit puede tener sólo dos estados: encendido o apagado.

    • Ocho bit constituyen un byte y grupos de bytes hacenpalabras.

  • 8/16/2019 Datos SIG

    19/59

    LOS BYTES

    • Bits son raramente vistos solos en las computadoras. Ellos soncasi siempre agrupados juntos en colecciones de 8-bit, y estascolecciones se llaman bytes.

    El byte de 8-bits es algo que las personas establecieron a

    través del ensayo y error durante los últimos 50 años. Tanaccidental como 12 huevos en una docena.

    • Con 8 bits en un byte, usted puede representar 256 valoresque van de 0 a 255, como es mostrado aquí:

    •0 = 00000000•1 = 00000001•2 = 00000010•254 = 11111110•255 = 11111111

  • 8/16/2019 Datos SIG

    20/59

    LAS PALABRAS

    •El numero de bits que la computadora usa como la unidadbásica para almacenar los datos es el tamaño de la palabra.

    • Por ejemplo, los siguientes tamaños son usados normalmente :

    •16-bits(2-bytes) "computadoras personales" (la generaciónanterior)

    •32-bits (4-bytes) "computadoras personales" (la generación

    actual)•64-bits (8-bytes) formato principal

  • 8/16/2019 Datos SIG

    21/59

    SALVE COMO .TXT

    • El establecimiento de ASCII como una norma revoluciono latransferencia de los datos así como nos permite usar la mismacodificación semántica entre los sistemas.

    • ASCII significa: Código de la Norma Americana para elIntercambio de Información.

    • Este asigna a cada letra y símbolo en el teclado un códigonumérico regularizado.

    • Note que al preparar los archivos para el intercambio, lepedirán a menudo que los guarde como ASCII. O formato de.txt. (texto)

    • La misma cosa.

  • 8/16/2019 Datos SIG

    22/59

    Almacenamiento de los datos

    • Tenga en cuenta que la estructura principal esta basada en la arquitecturade la computadora.

    • Los principios de la estructuración incluyen: series, matrices, listas, pilas,colas y decolas, archivos, juegos, árboles, tablas y redes.

  • 8/16/2019 Datos SIG

    23/59

    ESTRUCTURANDO LOS DISPOSITIVOS

    •La estructuración de los dispositivos son maneras de guardarinformación que directamente conforma y refleja laarquitectura de la computadora.

    •El orden más bajo de estructuración de los dispositivos son laslistas, las pilas, las series, las colas y decolas.

    •Los registros, los juegos, tablas de árbol y redes son losdispositivos de estructuración de orden más alto, y sondependiente de los dispositivos de orden más bajo.

  • 8/16/2019 Datos SIG

    24/59

    Las listas

    • Listas son un nivel ligeramente más bajo de estructurar losdispositivos pero estrechamente relacionado a las series.

    • Una lista o lista lineal es una estructura dinámica de datos(su significado puede encogerse o decrecer dependiendo decuántos artículos incluye).

    • Una lista es solo literalmente una lista y normalmente

    contiene los datos como enteros o como números reales ocadenas de texto en lugar de una mezcla.

    • Sin embargo, ésta no es una regla estricta. Unacaracterística de listas es que ellas están ordenadas.

  • 8/16/2019 Datos SIG

    25/59

    ORDENANDO LAS LISTAS

    • Cada elemento o artículo de los datos está en un orden

    específico o alfabético o numérico u otro.• Las listas puede llevarse a cabo usando las series.

    • En semejante caso, la lista es "sostenida" por el arreglo o la

    serie.

  • 8/16/2019 Datos SIG

    26/59

    PILAS, COLAS, Y DECOLAS

    • Pilas, colas y decolas son todos casos de la lista lineal.

    • Ellas son las estructuras transitorias de datos cuando ellossalen de comisión en cuanto se recuperan los elementos de

    los datos.

    • En una pila, todas las adiciones y eliminaciones estánhechas en un extremo--la cima de la pila. LIFO.

    • En una cola, la entrada está en la cima y la salida está en labase de la lista. FIFO.

    • Las mucho más flexibles decolas permiten inserciones y

    eliminaciones en cualquier extremo.

  • 8/16/2019 Datos SIG

    27/59

    LOS REGISTROS

    • El paso final en la memoria son los registros. Éstas son célulasde memoria construidas en la CPU que contiene datosespecíficos necesitadas por la CPU, particularmente la unidadaritmética y lógica (ALU).

    • En la parte integral de la propia CPU, los registros soncontrolados directamente por el compilador que envía lainformación para procesar en el CPU.

  • 8/16/2019 Datos SIG

    28/59

    LAS RELACIONES DE REGISTROS A LAS LISTAS ETC.

    • Listas y series pueden parecer conceptos esotéricos pero ellos serefieren directamente a la arquitectura de la computadora.

    • Si piensa en los registros de una computadora, listas y seriesdirectamente direccionan posiciones en el registro.

    • Ellas constituyen el mapa base de cómo se guarda la información en lacomputadora.

    • Su terminología debe ser precisa porque el significado de la computadora

    es computacionalmente preciso.• Computadores guardan los artículos de los datos en direcciones literales.

    • El sistema entero tiene una única arquitectura.

  • 8/16/2019 Datos SIG

    29/59

    LAS SERIES

    • Una serie es una estructura que acomoda la fila inherente ynaturaleza de la columna de muchos datos.

    • Esto comprende un bloque de memoria inmediata en lacomputadora en que se guardan los elementos de los datos.

    • Esto puede tener una o muchas dimensiones y lenguajes deprogramación permitirán al usuario dimensionar las series.

    • En BASIC , la sintaxis para el dimensionamiento de una unaserie es: dim array_1(20) qué traduce hacer espacio para unaserie dimensional con 20 elementos.

  • 8/16/2019 Datos SIG

    30/59

  • 8/16/2019 Datos SIG

    31/59

    MATRICES

    • Una matriz es como una serie pero no es necesariamentecompatible con una computadora.

    • Una matriz es una buena manera de imaginar una serie. Unavez que una matriz se pone en código en la computadora, sevuelve una serie. Una matriz típica se ve así:

    556573933498238722591265943567983¿* Cuántas dimensiones tiene esta matriz?

  • 8/16/2019 Datos SIG

    32/59

    DIFERENCIA ENTRE MATRICES Y SERIES

    • Una matriz es una estructura de datos de alto nivel (como unaserie) pero que podría expresarse en el papel.

    • Una serie es, por contraste, una estructura de datos decomputadora.

    • Series especifican cómo la información de la tabla se guarda y accede por la computadora mientras una matriz es justamente una tabla de números.

  • 8/16/2019 Datos SIG

    33/59

    una típica matriz o seriese ve como esto

    una lista lineal (usada para almacenar una seriede columnas )

    SERI ES Y LI STAS

  • 8/16/2019 Datos SIG

    34/59

    REGISTROS (DE UNA BASE DE DATOS)

    • Un registro es un concepto de organización común paraagrupar los rasgos de los datos. Los registros son organizadosen series.

    • Si usted piensa en las filas en las tablas de datos de ArcGIS,cada fila constituye un registro.

    • En la precisa terminología de la computadora, un registro es

    una "sucesión lineal de rasgos variables que tienen unaidentidad colectiva" (Bracken y Webster, 1990, 159).

    • En muchos ambientes computacionales, los registrosconstituyen una construcción en la estructura de los datos.

  • 8/16/2019 Datos SIG

    35/59

    ¿QUE ES UNA BASE DE DATOS?

    • Una base de datos es una colección de datos persistentes quese definen formalmente y se controlan centralmente para suuso en una computadora.

  • 8/16/2019 Datos SIG

    36/59

    LAS VENTAJAS DE GUARDAR LOS DATOS EN UNABASE DE DATOS

    • Hay varias ventajas de usar las bases de datos paraguardar la información:

    • Los datos son fácilmente compartidos.

    • Los datos en una base de datos son permanentes ynormalmente permanecen en una base de datos por periodoslargos

    • Los datos son fácilmente accesibles a través de funcionesde búsqueda, intersección y superposición.

    • Las bases de datos pueden ser usadas fácilmente por la

    computadora.

  • 8/16/2019 Datos SIG

    37/59

  • 8/16/2019 Datos SIG

    38/59

    ESTRUCTURAS DE DATOS SIMPLES

    • Desde los tempranos días de las computadoras, científicos dela informática han desarrollado maneras más sofisticadas deguardar la huella de los 0s y 1s que representan la informaciónen la computadora.

    • La manera más simple de ordenar la información en lacomputadora es ponerla como un archivo enrollado sobre unamesa.

  • 8/16/2019 Datos SIG

    39/59

    ESTRUCTURAS DE DATOS

    • La estructura plana de los datos es solo una lista simple.

    • La indexación de la estructura del archivo de los datos encuentra objetosbasados en sus atributos.

    • La estructura convencional de los datos en los SIG es la relacional, red y jerárquica.

    • La estructura Relacional de datos es organizada por registros que seensamblan en tablas.

    • La estructura Jerárquica de datos esta basada en la estructura de árbolcon relaciones padre-hijo.

    • La estructura de datos son clasificadas según los tipos de registro conapuntadores que vinculan los archivos asociados.

    • Está incrementándose la estructura de datos orientada a Objetos quesurge como una alternativa en los SIG.

  • 8/16/2019 Datos SIG

    40/59

    ESTRUCTURA DE DATOS EN ARCHIVO PLANO (LISTAS SIMPLES)

    •La estructura de datos simple es una lista simple de todos los rasgos.•Cada nuevo registro o dato se inserta al final de la lista en ningún ordenparticular.

    • Fácil agregar datos, pero difícil recuperarlos.

    •Buscar algo en una lista no estructurada es como buscar “una aguja en unpajar” sobre todo cuando la lista es grande.

  • 8/16/2019 Datos SIG

    41/59

    LA ESTRUCTURA DE LOS DATOS PUESTA EN UN ÍNDICE

    • El ordenamiento era difícil usando la estructura de datos en archivo plano( por ejemplo ordenar burbujas)

    • La Indexación d/s permite la búsqueda por los atributos de una entidad en

    lugar de la propia entidad.• El ejemplo, nosotros podríamos buscar todos los distritos del censo quecontienen las poblaciones con alto-ingreso.

    • O buscar los códigos postales con las personas que contienen el atributo

    de propietario.• Los atributos actúan como un índice en un libro; ellos apuntan a la cosareal.

  • 8/16/2019 Datos SIG

    42/59

  • 8/16/2019 Datos SIG

    43/59

  • 8/16/2019 Datos SIG

    44/59

    LAS ESTRUCTURAS DE LOS DATOS JERÁRQUICAS

    Las Estructuras Jerárquicas de datos son un concepto familiar en que ellasacostumbran usar una estructura de tipo árbol-familiar para organizar losdatos.

    • Esto también será familiar a aquéllos quiénes han usado DOS en PCs antesde que apareciera Windows.

    • Hay un directorio raíz, con directorios-subalternos y los archivos dentrode ellos.

    • La estructura jerárquica de datos es básicamente una estructura de árbolcon relaciones padre-hijo.

    • Esta es también la base en la taxonomía biológica con las especies,géneros, familias.

  • 8/16/2019 Datos SIG

    45/59

    EN ÁRBOL

    •Arboles representan relaciones de datos que son jerárquicas.

    • Por ejemplo, si una base de datos guarda datos relacionadoscon género, entonces en la cima o raíz, nosotros podríamostener el género, seguido por los nodos de la especie, seguidos a

    su vez por sub.-especies.

  • 8/16/2019 Datos SIG

    46/59

  • 8/16/2019 Datos SIG

    47/59

    LOS ÁRBOLES EN EL CONCEPTO DE BASE DE DATOS

    • Ejemplo de un árbol: los diferentes niveles de gobierno con el federal en la raíz,

    seguido por el estatal, seguido a su vez por el de los condados y los gobiernosmunicipales.

    • Los eslabones terminales se llaman hojas en tanto los vínculos conectantes sellaman nodos.

    • Cada una de estas estructuras y principios están envueltos en alguna magnitud enel concepto de base de datos.

  • 8/16/2019 Datos SIG

    48/59

    Estructura de Base de Datos Jerárquica; esta ilustración muestra ramales padre-hijobasados en atributos clave.

  • 8/16/2019 Datos SIG

    49/59

    NAVEGANDO JERARQUÍAS

    • El problema con el HDS es que es embarazoso navegarlo dearriba abajo al buscar la información.

  • 8/16/2019 Datos SIG

    50/59

    LOS PROBLEMAS CON LAS JERARQUÍAS

    • Esta rígida estructura la hace menos que perfecta para los SIG.

    • Sus libros de texto ofrecen un ejemplo de cómo el formato no flexible del HDShace a veces difícil de usar.

    • El Director de los Jardines Botánicos Reales en Londres quiso preguntar a la Basede Datos botánica antes de un viaje a México para encontrar todas las plantas queeran nativas de área que él iba a visitar.

  • 8/16/2019 Datos SIG

    51/59

    Pero a pesar de todo, todos los inventarios han sido informatizados usado un HDS,La posición geográfica de las plantas no habían sido incluida en la Base de Datos por

    lo que era imposible seleccionar aquellas originales de México.

    • También es difícil de agregar este nuevo detalle después (es decir actualizarlo).

  • 8/16/2019 Datos SIG

    52/59

    RELACIONES MUCHOS A MUCHOS

    • HDS acostumbra usar relaciones uno a muchos.

    • En SIG, nosotros tenemos a menudo relaciones uno a muchos o muchos a muchos .• Por ejemplo, si tenemos una Base de Datos urbana, un polígono podría tenermuchas localizaciones puntuales (por ejemplo las intersecciones,) con varios tipos detiendas de conveniencia y estaciones de gas asociados con ellas.

    • Pero la misma marca de tiendas de conveniencia y estaciones de gas se localizaráen otros polígonos.

  • 8/16/2019 Datos SIG

    53/59

    LAS ESTRUCTURAS DE DATOS EN RED

    • En una estructura de base de datos en Red, las entidades tienen apuntadoresindicadores que puntean para relacionar entidades.

    • Así cualquier parte de datos puede apuntar a cualquier otra parte de datos en labase de datos.

    • Los apuntadores indican las relaciones entre los datos.

    • Este es un mucho menos rígido sistema que el HDS.

    • Se usa mucho en las bases de datos de transporte dónde las relaciones realmentemas importantes son entre las rutas y los nodos.

  • 8/16/2019 Datos SIG

    54/59

  • 8/16/2019 Datos SIG

    55/59

    DESVENTAJAS CON LAS REDES

    • Un inconveniente, sin embargo, es que el número de apuntadores (yrelaciones) pueden salirse de las manos y pueden requerir demasiado

    espacio para almacenarlas.• Cada relación necesita ser definida explícitamente con el uso de losapuntadores.

    • Estas numerosas relaciones pueden volverse un ‘enredo en la red‘ y

    conducir al sistema a vínculos incorrectos y confusión general.• La estructura de bases de datos en red es solamente apropiada paraciertos tipos de SIG.

  • 8/16/2019 Datos SIG

    56/59

    ESTRUCTURA DE DATOS RELACIONAL

    • Las relaciones entre las tablas de datos están basadas en lasllaves primarias.

    • Muy comunes como bases de datos de SIG

  • 8/16/2019 Datos SIG

    57/59

  • 8/16/2019 Datos SIG

    58/59

  • 8/16/2019 Datos SIG

    59/59

    VENTAJAS DEL SISTEMA RELACIONAL

    • Los sistemas Relacionales son útiles porque:

    (i) Son simples;

    (ii) Muchas bases de datos de contabilidad y otras no-espaciales son relacionales lo que hace fácil transferir talesdatos a los SIG;

    (iii) Hay sistemas bien establecidos de interrogación

    desarrollados para los sistemas manejadores de base de datosrelacionales (RDBMS) llamados SQL lenguaje estructurado deinterrogación.