22
"Trabajo Geoestadística y Sus Aplicaciones" Nombre: Nicolás Escárate Q. Rut: 17.483.941-7

Geoestadistica sistemas acuaticos

Embed Size (px)

Citation preview

Page 1: Geoestadistica sistemas acuaticos

"Trabajo Geoestadística y Sus Aplicaciones"

Nombre: Nicolás Escárate Q.

Rut: 17.483.941-7

Carrera: Ingeniería Química 2180

Fecha de Entrega: 14/10/2011

Page 2: Geoestadistica sistemas acuaticos

Prefacio:

La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadística encaminen sus esfuerzos en el desarrollo de nuevas técnicas apropiadas para el análisis de información enmarcada dentro de este contexto. Como consecuencia de este impulso surgió una nueva rama de la estadística, denominada environmetrics (estadística ambiental). Dentro de esta última, los métodos geoestadísticos juegan un papel preponderante.

Cada día más profesionales con interés en estudios del medio ambiente o la explotación, preservación y monitoreo de recursos naturales efectúan regularmente campañas de muestreo de datos tales como propiedades del suelo, calidad de aguas/aire, volumen de madera, topografía, temperatura, concentración de clorofila etc. Este proceso de adquisición de datos significa la medición de la variable de interés en un número selecto, finito de lugares; estos valores servirán eventualmente de base para inferir el valor de la variable de interés en lugares no visitados durante la campaña de muestreo. Los Métodos geoestadisticos permiten estimar estos nuevos valores, tomando en consideración la estructura espacial de la variable de interés. Aparte del conocimiento de las características de la estructura espacial, métodos geoestadisticos permiten también conocer las escalas en las cuales la información se presenta en los datos. Mediante métodos geoestadisticos es posible la producción de mapas precisos, estadísticamente robustos, de variables de interés ambiental. Tales justificaciones han generado un creciente interés de profesionales vinculados con tales requerimientos.

Historia:

El estudio de fenómenos con correlación espacial, por medio de métodos geoestadísticos, surgió a partir de los años sesenta, especialmente con el propósito de predecir valores de las variables en sitios no muestreados. Como antecedentes suelen citarse trabajos de Sichel (1947; 1949) y Krige (1951). El primero observó la naturaleza asimétrica de la distribución del contenido de oro en las minas surafricanas, la equiparó a una distribución de probabilidad lognormal y desarrolló las fórmulas básicas para esta distribución. Ello permitió una primera estimación de las reservas, pero bajo el supuesto de que las mediciones eran independientes, en clara contradicción con la experiencia de que existen “zonas” más ricas que otras. Una primera aproximación a la solución de este problema fue dada por geólogo G. Krige que propuso una variante del método de medias móviles, el cual puede considerarse como el equivalente al krigeado simple que,como se verá más adelante, es uno de los métodos de estimación lineal en el espacio con mayores cualidades teóricas. La formulación rigurosa y la solución al problema de predicción (estimación en muchos textos geoestadísticos) vinieron de la mano de Matheron (1962) en la escuela de minas de París. En los años sucesivos la teoría se fue depurando, ampliando su campo de validez y reduciendo las hipótesis necesarias (Samper y Carrera, 1990). De la minería las técnicas geoestadísticas, se han "exportado" a muchos otros campos como

Page 3: Geoestadistica sistemas acuaticos

hidrología, física del suelo, ciencias de la tierra y más recientemente al monitoreo ambiental y al procesamiento de imágenes de satélite. Aunque la aplicación de la herramienta geoestadística es bastante reciente, son innumerables los ejemplos en los que se ha utilizado esta técnica en estudios ambientales con el ánimo de predecir fenómenos espaciales (Robertson, 1987; Cressie y Majure, 1995; Diggle et al., 1995). La columna vertebral del análisis geoestadístico es la determinación de la estructura de autocorrelación entre los datos y su uso en la predicción a través de las técnicas conocidas como kriging y cokriging. Otros temas importantes dentro del estudio de información georeferenciada son el diseño de redes de muestreo (McBratney et al.,1981), la geoestadística multivariada (Wackernagel, 1995) y la simulación (Deutshy Journel, 1992). La geoestadística es solo una las áreas del análisis de datos espaciales. Es importante reconocer cuando la información georeferenciada es susceptible de ser analizada por medio de dicha metodología.

Objetivos Generales:

Comprender  los métodos geoestadisticos utilizados en el análisis de datos geográficos en el ámbito de las ciencias de la tierra.

Introducción:

¿Qué es la Geoestadística?

La Geoestadística es una rama de la estadística aplicada que se especializa en el análisis y la modelación de la variabilidad especial en ciencias de la tierra, su objeto de estudio es el análisis y la predicción de fenómenos en espacio y/o tiempo tales como la ley de metales, porosidades, concentración de un contaminante, etc.…Aunque el prefijo “geo” es usualmente asociado con geología, la Geoestadistica tiene sus orígenes en la minería.Alrededor del año 1941 D.G Krige desarrollo un conjunto de técnicas que explotaban la correlación parcial para hacer predicciones en la evaluación de reservas de minas de oro en Sudáfrica, este definió a la Geoestadistica como la aplicación del formalismo de las funciones aleatorias al reconocimiento y estimación de fenómenos naturales, posteriormente en los años 60 Matheron registró el término “Geoestadistica”.

Actualmente esta ciencia es un conjunto de técnicas usadas para analizar y predecir valores de una propiedad distribuida en un espacio o tiempo, en contraposición con la estadística clásica o convencional, tales valores no se consideran independientes, por el contrario se suponen de manera implícita que están correlacionados unos con otros, es decir, que existe una dependencia espacial. Intuitivamente esto indica que mientras más cercanos este situados dos

Page 4: Geoestadistica sistemas acuaticos

puntos, estos están más correlacionados y mientras más separados hay menos relación entre ellos.En el campo de las geociencias es común encontrar variables distribuidas espacialmente. Para el estudio de estas variables son usados diversos procedimientos geoestadísticos de estimación y/o simulación. Esto es, a partir de un conjunto de muestras tomadas en localizaciones del dominio en que se manifiesta un fenómeno a estudiar y consideradas representativas de su realidad, que por lo general es siempre desconocida, estos procedimientos permiten la descripción o caracterización de las variables con dos fines diferentes, primero, proporcionar valores estimados en localizaciones de interés y segundo, generar valores que en conjunto presenten iguales características de dispersión que los datos originales.

Desarrollo:

El principal objeto de la Geoestadistica es básicamente la exploración de un terreno para descubrir la existencia de minerales, agua, yacimientos geológicos u otra cosa mediante técnicas de análisis espacial por muestreo. Pues bien, para una empresa minera son fundamentales estos procedimientos, como también dentro de ellos el pronóstico científico en la localización de los yacimientos minerales útiles, la elaboración de métodos eficaces para la exploración y la evaluación geólogo económico de los yacimientos para su explotación. Estos procedimientos determinan el agotamiento de los recursos producto de la explotación y los costos del mercado. Los trabajos de búsqueda y exploración se dividen en estadios que son resultado de la aplicación de un principio importante del estudio del subsuelo, el Principio de Aproximaciones Sucesivas. Cada uno de los estadios culmina con la determinación lo más aproximada posible de los recursos minerales del yacimiento, actividad fundamental de las empresas geólogo - mineras conocida como cálculo de recursos y reservas. Los primordiales métodos de clasificación que se utilizan, se basan en la confianza geológica y en la viabilidad económica. Las representaciones de clasificación hacen uso del grado de confiabilidad o certidumbre como factor discriminante entre las distintas clases, entre tanto ninguno de esos sistemas muestran claramente como calcular el error asociado con cada estimación. Un elemento que complica aún más el proceso de categorización es la imposibilidad de cuantificar el error cometido en la creación del modelo geológico del yacimiento. Producto de las dificultades encontradas en cuantificar el error de estimación, los sistemas de clasificación se apoyan más en aspectos cualitativos que en medidas reales de la dispersión de los valores obtenidos. Dado este elemento de subjetividad es que se introduce en la mayoría de los sistemas de clasificación el concepto de persona competente. Los métodos que se utilizan para categorizar los recursos minerales, son por criterio tradicional o geoestadístico.Para realizar procedimientos geoestadísticos, es esencial tener variables distribuidas espacialmente, esto se obtiene a través de muestreos, los cuales representan la realidad de fenómenos a estudiar (por lo general es siempre desconocida). Los procedimientos geoestadísticos permiten la descripción o caracterización de las variables con dos fines diferentes, los cuales pueden ser:

Page 5: Geoestadistica sistemas acuaticos

proporcionar valores estimados en localizaciones de interés y generar valores que en conjunto presenten iguales características de dispersión que los datos originales. Ahora bien, estos pueden ser estimaciones o simulaciones de las metodologías que se emplean, y se pueden aplicar como los temas que se trataran en el siguiente informe como la prospección minera en yacimiento, en el área de medio ambiente o en modelos digitales de elevación, pero también puede ser aplicada a Industria petrolera, minería, ciencias del mar, hidrogeología, pesca, medio ambiente, ciencias agrícolas y forestales, ingeniería civil, procesamiento de imágenes, cartografía, ciencias de materiales, salud pública, meteorología, edafología, finanzas, entre otras. Por lo general el uso de la Geoestadística es un procedimiento válido y confiable en la mayoría de los sistemas de clasificación.Los métodos tradicionales de categorización son: continuidad geológica, densidad de la red de exploración (grado de estudio), exploración contra extrapolación (los bloques cuyos valores han sido estimados por interpolación o sea están localizados dentro de la red de muestreo son clasificados en categorías más confiables que los localizados más allá de la última línea de pozos (extrapolados), la mayoría de los sistemas de clasificación exige no incluir bloques extrapolados en la clase de recursos medidos); También las consideraciones tecnológicas y calidad de los datos. Los métodos geoestadísticos son considerados como los esquemas de clasificación de reserva que están establecidos a medidas reales de la dispersión, ya que son más confiables porque reflejan la cantidad y la calidad de la información que se utiliza para evaluar las reservas, estos se fundamentan en la varianza KRIGING. Por lo general el uso de la Geoestadística es un procedimiento válido y confiable en la mayoría de los sistemas de clasificación, convirtiéndose en un estándar en la estimación de recursos minerales. “El código propuesto por la ONU, por ejemplo, propone el uso de la Geoestadística para clasificar los recursos pues permite de forma rápida y sin ambigüedad identificar las categorías de recursos y reservas minerales (UN-ECE,1996). Si bien el variograma cuantifica la continuidad o nivel de correlación entre las muestras que se localizan en una zona mineralizada dada (utilizado para clasificar los recursos y reservas). Cito un texto en que dice que se han empleado 2 enfoques para clasificar los recursos usando el variograma: 1. El primero se basa en la subdivisión arbitraria del alcance observado. Por ejemplo, todos los bloques estimados con un número mínimo de muestras y ubicados dentro de un determinado radio de influencia podrían ser clasificados como recursos medidos mientras que todos los bloques estimados con cierto número mínimo de muestras y localizados más allá del radio de influencia serían clasificados como indicados. 2. En el segundo enfoque las categorías de recursos están basadas en los valores de la meseta. Por ejemplo, los bloques comprendidos dentro de un alcance del variograma correspondiente a 2/3 del valor de la meseta pueden ser clasificados como medidos, el resto son indicados.Pues bien, el kriging permite obtener, además de la estimación del valor de un bloque, una indicación de la precisión local a través de la varianza kriging (Vk). Desde el inicio del proceso del Kriging la Vk ha sido empleada para determinar los intervalos de confianza de las estimaciones. Para esto es necesario asumir que esta se ajusta a un modelo normal. Sin embargo, en la práctica es raro que los errores de estimación se subordinen a estos modelos de distribución. Para hacer

Page 6: Geoestadistica sistemas acuaticos

el cálculo de la varianza Kriging se emplea la configuración de las muestras en el espacio y no sus valores locales, esta no debe ser interpretada como una medida de la variabilidad local. Por otra parte como Vk es calculado a partir del variograma medio del yacimiento no es solo un índice de la disposición espacial de las muestras sino también caracteriza las varianzas medias globales permitiendo la discriminación entre las clases o categorías de recursos. Un ejemplo de lo citado anteriormente, es decir, de la clasificación de recursos, es de reservas basadas en la cuantificación del error a partir de la desviación estándar, como se observa en la siguiente tabla, es un resúmen de las categorías de la clasificación sugerida por Diehl y David (1982) y Wellmer (1983), basadas en la cuantificación del error utilizando la desviación estándar kriging: Este método se basó en definir los niveles de confianza y de precisión, esta última se define e función a la desviación estándar y el valor estimado Kriging. Otro método para categorizar los recursos es a través de la construcción de la función de densidad de probabilidades Este se examina para detectar evidencias de poblaciones complejas que pueden representar 3 poblaciones superpuestas (probable, posible e inferida).Otros criterios o métodos son como la simulación, que es la representación de un proceso o fenómeno mediante otro más simple, que permite analizar sus características, la cual sirve para realizar modelos de incertidumbre; también la medida de eficiencia de los bloques y la desviación estándar de la interpolación. Medio Ambiente A través de métodos geoestadísticos, se pueden realizar varios estudios en el área de medio ambiente, un ejemplo claro es el estudio de la variabilidad espacial de los cationes del suelo después de quemas prescritas, es decir, esto último es la mejor opción para reducir la carga de combustible de las áreas de cortafuegos, porque la estructura del complejo de combustible resultante no es capaz de soportar una nueva conflagración, la cual dice: “A pesar de ser una técnica utilizada en la gestión forestal, los efectos de la realización de quemas preescritas no se conocen del todo. Para conocer algunos de estos efectos sobre el suelo y, en concreto, evaluar el efecto espacial de una quema prescrita en una parcela, se realizó un trabajo con el fin de estudiar la variabilidad espacial de los cationes del suelo tras quemas prescritas utilizando métodos geoestadísticos (L. Outeiro, F. Asperó, X. Úbeda) modelizando tres cationes del suelo: Ca2+, Mg2+ y K+ con métodos probabilísticos y geoestadísticos. Los métodos geoestadísticos se desarrollaron para describir la distribución espacial de las propiedades geológicas, por lo que son idóneos para describir la variabilidad y heterogeneidad espacial de las variables del suelo. La precisión con la que pueden conocerse las propiedades del suelo en cualquier punto depende en buena medida del área elegida para el muestreo, es decir, de la heterogeneidad de la misma. Por tanto, conforme aumenta la heterogeneidad del suelo, la precisión con que pueden conocerse sus propiedades y el comportamiento del mismo tiende a decrecer. Debido a que el número de observaciones que se pueden efectuar en un área de muestreo es limitado, frecuentemente es necesario extrapolar las propiedades de puntos en que son conocidas a otros que se desconocen, lo que está muy relacionado con la variabilidad en la unidad representativa.En el campo de las geociencias es común encontrar variables distribuidas espacialmente. Para el estudio de estas variables se utilizan diversos procedimientos geoestadísticos de estimación y/o simulación. Esto es, a partir de

Page 7: Geoestadistica sistemas acuaticos

un conjunto de muestras tomadas en localizaciones del dominio en que se manifiesta un fenómeno a estudiar y consideradas representativas de su realidad, que por lo general es siempre desconocida, estos procedimientos permiten la descripción o caracterización de las variables con dos fines diferentes: proporcionar valores estimados en localizaciones de interés y generar valores que en conjunto presenten iguales características de dispersión que los datos originales. La Geoestadística se define como la aplicación de la Teoría de Funciones Aleatorias al reconocimiento y estimación de fenómenos naturales (Journel y Huijbregts, 1978), o simplemente, el estudio de las variables numéricas distribuidas en el espacio (Chauvet, 1994), siendo una herramienta útil en el estudio de estas variables (Zhang, 1992). Si bien el objetivo de este estudio es conocer los efectos que las quemas prescritas pueden tener en el suelo, para saber cuánto tiempo se puede quemar un mismo lugar para su gestión sin efectos perjudiciales. Muchos investigadores han encauzado sus esfuerzos en saber los efectos que tienen las quemas prescritas en las propiedades químicas del suelo, aunque no todos han intentado conocer las variaciones en la disponibilidad de nutrientes. Algunos de estos, señalan grandes cambios en el suelo como consecuencia de las quemas, pero no encuentran cambios significativos en los cationes del suelo tras el fuego. Otros observan importantes modificaciones en los cationes del suelo (Ca2+, Mg2+ y K+) tras quemarse. En las quemas prescritas, la concentración de cationes no se mantiene, ya que el fuego no afecta por igual a todas las zonas y además, las precipitaciones actúan como fuente externa de cationes. Esta variabilidad, que indica cambios en el espacio o en el tiempo en las propiedades de un suelo dado, se puede cuantificar utilizando métodos estadísticos paramétricos, como el coeficiente de variación, y se puede distribuir aleatoriamente o tener una estructura espacial. La variabilidad sin estructura espacial se denomina heterogeneidad. Los controles y las consecuencias pueden ser evaluados cuantificando las estructuras y las escalas de heterogeneidad. La heterogeneidad de las propiedades bióticas y abióticas del suelo se suele cuantificar utilizando la geoestadística, debido a su robustez y las posibilidades de representación mediante mapas. La geoestadística puede determinar un modelo en 2D o 3D de las correlaciones espaciales o las estructuras de las propiedades del suelo mientras que las técnicas de interpolación determinísticas (inverso de la distancia y triangulación) no tienen en cuenta las estructuras espaciales de las propiedades del suelo. El suelo es, por tanto, un sistema complejo en el que la variabilidad espacial de las propiedades y procesos puede incrementarse tras una perturbación como el fuego. Se han utilizado métodos geoestadísticos para estimar la evolución de los cationes del suelo en buenas magnitudes espaciales y temporales en parcelas de 108 m2 en zonas agrícolas complejas después de quemas prescritas (L. Outeiro, F. Asperó, X. Úbeda). En este estudio la hipótesis es experimental y metodológica. La hipótesis experimental es probar los efectos de las quemas prescritas en tres variables del suelo (Ca2+, Mg2+ y K+). La hipótesis metodológica es probar la eficiencia de la geoestadística para mejorar el conocimiento de esas variables en el espacio y el tiempo. Los objetivos del trabajo citado son: 1. Monitorizar las variables del suelo después de una perturbación provocada por una quema prescrita. 2. Estudiar la influencia de los factores ambientales como la precipitación en los valores espaciales de las variables. 3.

Page 8: Geoestadistica sistemas acuaticos

Desarrollar un índice de respuesta temporal monitorizando los impactos de las quemas prescritas en los macronutrientes del suelo. Las muestras de suelo se recogieron en 6 campañas diferentes (antes del fuego, después del fuego, 2 meses, 5 meses, 1 año y 3 años después del fuego prescrito). El intervalo de recogida de muestras se eligió para detectar el efecto de la precipitación (1315 mm en tres años con un pico de intensidad de 72 mm/h) en las propiedades espaciales del suelo como consecuencia de procesos como la infiltración, la erosión del suelo, etc. Posteriormente, se desarrolla un índice de respuesta que permite comparar cada catión después de la máximas, desencadenó diferentes procesos espaciales, siendo el tipo de proceso función de la valencia del catión. Este índice de respuesta mide el porcentaje de cambio en los cationes referido a los valores antes de la quema. Las precipitaciones son un factor clave en la modificación de las propiedades del suelo tras la quema. La lluvia de la primavera de 2003 muestra dos patrones espaciales: los cationes divalentes (Ca2+, Mg2+) aumentan su heterogeneidad espacial y disminuyen su correlación espacial, mientras que el catión monovalente (K+) disminuye su heterogeneidad espacial y aumentan su correlación espacial. En términos de análisis a escala de parcela, es necesario realizar más estudios sobre los efectos del fuego en las variables del suelo. Tras las quemas prescritas las parcelas pierden progresivamente potasio y ganan magnesio y calcio. Se puede aplicar en primer término a la investigación de los efectos sobre el suelo de los incendios. Por otra parte, estos métodos constituyen una primera aproximación para integrar en el tiempo la complejidad en la evolución del suelo después del uso del fuego como técnica de manejo de grandes zonas forestales”. Esta aplicación demuestra, lo importante que es la geoestadística en algunos temas de medio ambiente como lo es las quemas prescritas. Modela Digital de Elevación (MDE) Un MDE puede ser definido como una expresión matemática en la que el terreno se representa como una función bivariable continua (Z), la cual corresponde a la altitud en los puntos de coordenas X e Y. Y “c” es una función que relaciona la variable con su localización geográfica, y es aplicada sobre un dominio espacial. Si Z (x), es el valor de z en el puno x, Z (x) es una variable regionalizada, la cual se puede definir como un concepto no probabilístico o quizá como función continua. Pues bien, usualmente Z (x) está conformada por componentes aleatorios y estructurados. Conviene considerar a Z (x) como una función aleatoria. Ahora bien, algunas consideraciones, es que la realidad es simplemente una realización o instancias de un experimento aleatorio, además solo tenemos una realidad donde hay que hacer inferencia estadística sólo con ello; pero a grandes rasgos no sería posible, requeriría de hipótesis adicionales y homogeneidad espacial. Las funciones aleatorias son sólo un modelo posible de la realidad. Un Modelo Digital de Elevaciones puede representarse de forma genérica mediante la ecuación: z = f(x, y).La imposibilidad de resolver la ecuación anterior para todos los puntos del territorio obliga a definir elementos discretos sobre el mismo que permitan simplificar la codificación de la elevación. Las más habituales son: Curvas de nivel, se trata de líneas, definidas por tanto como una sucesión de pares de coordenadas, que tienen como identificador el valor de la elevación en cada unos de los puntos de la línea. Generalmente el intervalo entre valores de las curvas de nivel es constante.

Page 9: Geoestadistica sistemas acuaticos

Red Irregular de Triángulos (TIN),a partir de un conjunto de puntos, en los que se conoce la elevación, se traza un conjunto de triángulos, formados por tripletas de puntos cercanos no coloniales, formando un mosaico. En ocasiones se parte de las curvas de nivel que, tras descomponerse en un conjunto de puntos, genera una red irregular de triángulos. En este caso hay que tener en cuenta que pueden formarse triángulos a partir de puntos extraídos de la misma curva de nivel, por tanto con el mismo valor, que darán lugar a triángulos planos. Tienen entre sus ventajas el adaptarse mejor a las irregularidades del terreno, ocupar menos espacio y dar muy buenos resultados a la hora de visualizar modelos en 3D o determinar cuencas visuales. Entre los inconvenientes destaca un mayor tiempo de procesamiento y el resultar bastante ineficientes cuando se intenta integrarlos con información de otro tipo; en definitiva hay que utilizarlos para interpolar una capa raster como se vió en el tema anterior. Formato raster, es el más adecuado para la integración de las elevaciones en un SIG ya que va a permitir la utilización de diversas herramientas para la obtención de nuevos mapas a partir del MDE; por tanto va a ser el que se trate en este tema.

Datos Georeferenciados:

Las mediciones de las características de interés en un estudio regionalizado tienen implícitamente asociadas las coordenadas de los sitios en donde estas fueron tomadas. Cuando el área de estudio es considerablemente grande se usa un geoposicionador para establecer dichas coordenadas. En otros casos, por ejemplo en diseños experimentales con parcelas, es suficiente con hacer asignaciones según planos cartesianos. Un esquema general de datos georeferenciados es el siguiente:

En la tabla anterior n es el número de sitios muestreados y p el de variables medidas en cada uno de ellos. Cada xij corresponde a la medida de la variable Xj (j = 1, 2,..., p) en el sitio i (i= 1, 2,..., n), que puede ser cuantitativa o categórica. Algunas de las variables 10pueden estar más intensamente muestreadas que las otras (xij faltantes). Las coordenadas pueden ser planas, geográficas (grados, minutos y segundos) o cartesianas. Sin embargo la posible utilización de unas u otras depende del software empleado para los análisis. 1.4. Justificación del Análisis Exploratorio de Datos Espaciales.

Page 10: Geoestadistica sistemas acuaticos

En la aplicación de la geoestadística es de suma importancia, al igual que en otros procedimientos estadísticos (por ejemplo los modelos ARIMA dentro de la teoría de series de tiempo), el análisis gráfico. La identificación de valores extremos y su ubicación geográfica, la evaluación de la forma de la distribución y el cálculo de medidas de localización, variabilidad y correlación es muy importante para establecer si algunos supuestos necesarios para la aplicación de la teoría geoestadística son válidos o para definir que procedimiento de predicción es el más conveniente. Por ejemplo, como se verá en el capítulo cuatro, la decisión de usar kriging ordinario o kriging universal se fundamenta en identificar si la media es o no constante en la región. El uso de kriging log-normal se basa en un criterio empírico relacionado con la forma asimétrica de la distribución de los datos muestrales. La decisión de emplear cokriging depende de la detección de asociaciones entre las variables.

Gráficos Exploratorios:

Al igual que en un estudio exploratorio clásico, cuando se dispone de información georreferenciada se pueden emplear histogramas, diagramas de tallos y hojas y de caja y bigotes (Hoaglin et al., 1983) con el propósito de identificar localización, variabilidad, forma y observaciones extremas. Adicionalmente los gráficos de dispersión son muy útiles tanto para la detección de relaciones entre las variables como para la identificación de tendencias en el valor promedio de la variable en la región (relación entre la variable medida y las coordenadas geográficas). Un supuesto fundamental en el análisis geoestadístico es que el fenómeno es estacionario, para lo cual, entre otros aspectos, el nivel promedio de la variable debe ser constante en todos los puntos del área de estudio. Una detección de tendencia en el gráfico de dispersión puede ser una muestra de que no se satisface dicho supuesto. El gráfico se construye tomando como eje de las abcisas la variable que representa la coordenada geográfica y en el eje de las ordenadas la variable cuantitativa de estudio. La observación de la nube de puntos resultante, incluso el ajuste de una línea de regresión, permite establecer de manera empírica si existe dicha tendencia. Un gráfico de dispersión entre valores de la variable separados por una distancia espacial dada (dispersograma rezagado) es útil en la detección de autocorrelación espacial. Otro gráfico que tradicionalmente se emplea en la descripción de datos espaciales es el de datos clasificados según puntos de referencia (media, mediana, cuartíles). Este permite comparar zonas del sistema de estudio respecto a las magnitudes de las variables.

Page 11: Geoestadistica sistemas acuaticos

Aplicación: Estudio exploratorio de la distribución de datos fisicoquímicos y biológicos medidos en el estuario Ciénaga Grande de Santa Marta en Marzo de 1997. Con información de las variables salinidad, seston (mg/l), nitritos (µmol/l), silicatos (µmol/l) y clorofila a (µg/l) medidas en una jornada de muestreo realizada en marzo de 1997 en el estuario Ciénaga Grande de Santa Marta (CGSM)(Fig. 1), se realizó un estudio exploratorio de datos. Los resultados encontrados son descritos a continuación: En primera instancia, se evidencia en el diagrama de caja (Fig. 2) y en el gráfico de tallos y hojas (Fig. 3) que, con excepción de la variable nitritos, existe un comportamiento simétrico en las distribuciones de los datos. Se observa también en estas figuras, que en todas las variables se presentan algunos valores “atípicos” o muy alejados del comportamiento general antes mencionado. Lo anterior, antes de ser tomado como un indicador de alta variabilidad o de errores de medición, puede ser considerado como un reflejo del comportamiento espacial de las variables dentro del ecosistema. La simetría de la mayoría de las variables hace pensar que existe una gran zona en donde las condiciones del sistema respecto a la calidad del agua son bastante similares (esto podría ser lo que se conoce como cuerpo de agua de la CGSM) y los valores “alejados” pueden estar representando las condiciones de sitios específicos, particularmente especiales dentro del sistema, como son la zona más estuarina (sitios de muestreo cercanos al sitio Boca de la Barra, Fig.1) y las de desembocaduras de los ríos que bajan de la Sierra Nevada de Santa Marta (costado oriental y sur del sistema, Fig. 1).

Figura 1. Área de estudio y cuadrículas en que fue subdividido el sistema Ciénaga Grande de Santa Marta para realizar la toma de muestras. Cada una de las 115 cuadrículas tiene un área de 4 km2.

Page 12: Geoestadistica sistemas acuaticos

Los datos fueron tomados en el centro de cada una de ellas.

La afirmación de que no existen problemas de alta variabilidad y que por el contrario los datos medidos son bastante homogéneos, puede confirmarse con los valores de los coeficientes de variación (tabla 1). En su mayoría estos son menores del 30% y por consiguiente indicadores de poca heterogeneidad en la información.

Tabla 1. Medidas de localización y variabilidad de algunas variables medidas en la superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en Marzo de 1997.

Las medidas de localización (media y mediana, tabla 1) toman valores similares a los reportados en otros estudios para la misma época del año. Una discusión a este respecto se encuentra en Hernández (1986) y Hernández y Gocke (1990).

Figura 2. Diagramas de caja de algunas variables medidas en la superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en Marzo de 1997. Las variables fueron estandarizadas antes de construir los diagramas.

El gráfico de dispersión de la variable salinidad (una de las de mayor relevancia en el establecimiento del comportamiento espacial de las variables en el sistema) respecto a las coordenadas latitud y longitud (Fig. 4), permite apreciar una leve tendencia en la magnitud de la variable a lo largo de estas direcciones, lo que hace suponer que, a pesar de la homogeneidad antes mencionada, el valor promedio de la misma no es constante en toda la región. Lo anterior se puede

Page 13: Geoestadistica sistemas acuaticos

comprobar en el gráfico 5, en donde se aprecia que en una gran parte de la zona centro de la Ciénaga y hacia la desembocadura de los ríos Sevilla y Aracataca la magnitud de la variable es menor a la de los restantes sitios de muestreo. Esta figura revela claramente la influencia que tienen las entradas de agua (tal vez exceptuando 13la entrada del río Fundación) en el comportamiento de esta variable. Los valores relativamente altos, respecto a los antes descritos, en la zona occidental pueden ser consecuencia del proceso de lavado de suelos hipersalinos que se da en época de lluvias en el complejo Pajarales (sistema con el que tiene frontera la Ciénaga) y que llegan al sistema a través de los Canales Grande y Clarín (Fig. 5). Los valores "altos" en la zona sur pueden ser de igual forma causados por la influencia del canal Grande y por circulación de las masas de agua dentro del sistema (contrario a las manecillas del reloj)

Page 14: Geoestadistica sistemas acuaticos

Figura 3. Diagramas de tallos y hojas de algunas variables medidas en la superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en Marzo de 1997.

Figura 4. Gráficos de dispersión de valores de salinidad respecto a las coordenadas geográficas de medición. Datos tomados en la superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en Marzo de 1997.

Page 15: Geoestadistica sistemas acuaticos

Figura 5. Clasificación de observaciones de la variable salinidad en intervalos (según cuartíles) y ubicación de estas dentro del área de estudio. Datos medidos en el estuario Ciénaga Grande de Santa Marta en marzo de 1997.

Tabla 2. Matriz de correlación calculada con base en información de algunas variables fisicoquímicas y biológicas medidas en el estuario Ciénaga Grande de Santa Marta en marzo de 1997. Los coeficientes que aparecen en negrita son significativos.

Por último de la matriz de correlación (tabla 2) es posible afirmar que la abundancia fitoplanctónica, evaluada a través de la concentración de clorofila a, presenta correlación significativa con las variables fisicoquímicas medidas. Este patrón de correlación entre variables bióticas y abióticas en otros trabajos de menor intensidad muestral no ha podido ser detectado. En general los estudios realizados en la Ciénaga Grande de Santa Marta en los que se pretende determinar los patrones de asociación entre las variables biológicas y fisicoquímicas siempre conducen a que la salinidad es la variable de mayor influencia en el régimen de productividad del sistema. Sin embargo estos resultados en primera instancia pueden estar detectando otro tipo de asociaciones. En los capítulos subsiguientes, cuando se realicen los mapas de distribución espacial, se podrán tener más herramientas para discutir respecto a este tema.

Conclusión:

Habitualmente, los profesionales con interés en estudios del medio ambiente o la explotación, preservación y monitoreo de recursos naturales efectúan regularmente campañas de muestreo de datos, tales como propiedades del suelo, calidad de aguas/aire, volumen de madera, topografía, temperatura, concentración de clorofila, etc. Este proceso de adquisición de datos significa la medición de la variable de interés en un número selecto y finito de lugares; estos valores servirán eventualmente de base para inferir el valor de la variable de interés en lugares no visitados durante la campaña de muestreo. Los métodos geo-estadísticos permiten estimar estos nuevos valores tomando en consideración la estructura espacial de la variable de interés. Aparte del conocimiento de las características de la estructura espacial, los métodos geo-estadísticos permiten también conocer las escalas en las cuales la información se presenta.

Page 16: Geoestadistica sistemas acuaticos

Por otra parte, la Geoestadística permite la producción de mapas precisos, estadísticamente robustos, de variables de interés en el ámbito de las ciencias de la Tierra. A través de este trabajo de investigación, se puede desplegar que en todas las temáticas tratadas con respecto a lo leído la geoestadística da un aporte importante, ya que muchas veces los trabajo hacen referencia a un mejor método para llegar a algo. Por lo tanto siempre y cuando exista un muestreo, el variograma o los elementos de este estarán presentes, además independiente de la problemática planteada en un estudio, a través de los métodos geoestadísticos se puede llegar a una representación cartográfica más aproximada de la representación de la realidad.

Bibliografía:

• Aplicación a la metodología para obtener modelos digitales de elevación. • Métodos geoestadísticos para el estudio de la variabilidad espacial de los cationes del suelo después de quemas prescritas