32
Análisis geoestadístico con ArcGIS parte 2. Análisis exploratorio de los datos Según Matheron (1992), la Geoestadística es la aplicación de la teoría de las variables regionalizadas a la estimación de los depósitos. A su vez una variable regionalizada, es una variable distribuida en el espacio de forma que presenta una estructura espacial de correlación. En fin cuando hablemos de Geoestadística se debe pensar en la variable y su relación espacial. Ejemplo de variables regionalizadas en hidrogeología son la trasmisividad y conductividad hidráulica, la porosidad y el nivel piezométrico; a este último hacemos referencia en el presente artículo. La mayoría de los métodos geoestadísticos sólo son óptimos si la variable de estudio sigue una distribución normal. Recordemos que la distribución normal tiene las siguientes propiedades: Tiene una única moda, que coincide con su media y su mediana. La curva normal es asintótica al eje de abscisas. Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución. El coeficiente de sesgo es igual a cero (0). La curtosis es igual a cero (0). Para determinar si la variable sigue una distribución se deben aplicar alguna de las pruebas de normalidad como Prueba X², Kolmogorov, cálculo del coeficiente de asimetría, curtosis, mediana, mediana y la moda y su comparación de con los de la distribución normal. Si a través de estas pruebas se concluye que la variable puede ser aceptada o se aproxima a una distribución normal, el problema se simplifica y se puede continuar con el análisis geoestadístico; de lo contrario, es necesario realizar una transformación de los datos que puede ser de raíz cuadrada o logarítmica (Carrera, 1990) y hacer nuevamente las verificaciones. Este es un tema extenso y la idea de estos artículos es hacerlos algo prácticos, por ello al final dejaré bibliografía a la cual se puede consultar.

Análisis geoestadístico con ArcGIS_parte 2

Embed Size (px)

Citation preview

Page 1: Análisis geoestadístico con ArcGIS_parte 2

Análisis geoestadístico con ArcGIS parte 2. Análisis exploratorio de los datosSegún Matheron (1992), la Geoestadística es la aplicación de la teoría de las variables regionalizadas a la estimación de los depósitos. A su vez una variable regionalizada, es una variable distribuida en el espacio de forma que presenta una estructura espacial de correlación. En fin cuando hablemos de Geoestadística se debe pensar en la variable y su relación espacial.

Ejemplo de variables regionalizadas en hidrogeología son la trasmisividad y conductividad hidráulica, la porosidad y el nivel piezométrico; a este último hacemos referencia en el presente artículo.

La mayoría de los métodos geoestadísticos sólo son óptimos si la variable de estudio sigue una distribución normal. Recordemos que la distribución normal tiene las siguientes propiedades:

Tiene una única moda, que coincide con su media y su mediana.

La curva normal es asintótica al eje de abscisas.

Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.

El coeficiente de sesgo es igual a cero (0).

La curtosis es igual a cero (0).

Para determinar si la variable sigue una distribución se deben aplicar alguna de las pruebas de normalidad como Prueba X², Kolmogorov, cálculo del coeficiente de asimetría, curtosis, mediana, mediana y la moda y su comparación de con los de la distribución normal.

Si a través de estas pruebas se concluye que la variable puede ser aceptada o se aproxima a una distribución normal, el problema se simplifica y se puede continuar con el análisis geoestadístico; de lo contrario, es necesario realizar una transformación de los datos que puede ser de raíz cuadrada o logarítmica (Carrera, 1990) y hacer nuevamente las verificaciones.

Este es un tema extenso y la idea de estos artículos es hacerlos algo prácticos, por ello al final dejaré bibliografía a la cual se puede consultar.

Para resumir, los pasos a seguir en el análisis exploratorio de los datos son los siguientes.

1.     Organizar los datos de menor a mayor.2.     Calcular la tabla de frecuencia.3.     Realizar el histograma de frecuencias.4.     Calcular los parámetros geoestadístico.

Page 2: Análisis geoestadístico con ArcGIS_parte 2

5.     Verificación de la normalidad con respecto a la media, moda y mediana.6.     Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de

sesgo).7.     Verificación de la normalidad con respecto al coeficiente de variación.8.     Realización de la transformación de los datos, si es necesario.9.     Recalculo de los parámetros estadísticos  y comparación para verificar la normalidad

de los datos.

Los pasos 1 al 4 fueron realizados en el tutorial  “Módulo de Geostadística Analyst con ArcGIS parte 1. Estadística descriptiva”, aquí se continuará con los pasos siguientes 

Se continua con el ejemplo de los datos del monitoreo de niveles piezométricos que se muestran en la siguiente tabla.

Pozo

 X  Y  NP

1  1.038.638  1.368.620         2,00762  1.034.835  1.344.198         2,13133  1.039.637  1.368.963         2,20004  1.039.628  1.368.960         2,21005  1.042.236  1.377.584         2,44496  1.039.030  1.370.440         2,49467  1.036.835  1.354.454         2,85548  1.043.217  1.357.777         2,98769  1.040.082  1.373.095         3,2347

10  1.039.392  1.374.231         3,293011  1.040.434  1.368.119         3,331712  1.039.720  1.368.500         3,350613  1.042.060  1.376.470         3,429114  1.041.545  1.369.212         3,689615  1.042.045  1.371.752         3,799016  1.040.269  1.377.908         3,965117  1.040.731  1.371.643         3,998018  1.042.360  1.376.070         4,292119  1.040.390  1.376.776         4,490020  1.035.335  1.356.941         4,528621  1.047.035  1.371.548         4,622722  1.042.020  1.370.310         4,663723  1.033.716  1.352.675         5,049924  1.042.570  1.377.470         5,100925  1.035.564  1.343.433         5,243826  1.042.520  1.368.530         5,382627  1.042.932  1.368.255         5,869028  1.044.694  1.371.405         6,0000

29  1.041.841  1.363.397         6,1496

30  1.040.838  1.356.677         8,005431  1.044.135  1.364.301         8,072432  1.046.740  1.377.526         8,082733  1.046.626  1.374.772         9,018834  1.042.604  1.360.903         9,2078

Page 3: Análisis geoestadístico con ArcGIS_parte 2

35  1.039.466  1.348.279       10,115636  1.041.429  1.333.870       10,255337  1.045.207  1.363.183       10,837338  1.044.733  1.360.337       11,506639  1.048.893  1.374.744       11,824140  1.040.383  1.355.006       12,226841  1.042.263  1.354.636       12,328042  1.039.411  1.336.953       12,800443  1.048.342  1.369.941       14,624444  1.046.214  1.355.644       14,930145  1.044.935  1.336.931       16,635146  1.041.256  1.339.628       18,163047  1.048.313  1.360.466       19,141048  1.044.224  1.348.328       24,063249  1.044.765  1.341.254       24,235450  1.046.735  1.356.327       25,569851  1.045.454  1.346.959       27,153452  1.050.523  1.361.111       30,080053  1.052.106  1.361.728       35,3188

Los parámetros estadísticos calculados anteriormente se resumen en la siguiente tabla.

Parámetro Datos no agrupados

Observaciones

Media 9.3776Mediana 5.869

Moda 4.378Se tomó la moda calculada

a través de la ecuación datos agrupados.

Desviación estándar

8.0421

Varianza 64.675Coeficiente de

Variación85.8%

Curtosis 1.38Sesgo o asimetría 1.46

5. Verificación de la normalidad con respecto a la media, moda y mediana.

Para que la distribución sea normal o se aproxime, la media, la moda y la mediana deben ser similares, se acepta una diferencia de una unidad entre ella.

Para el ejemplo de estudio tenemos.Media = 9.3776Mediana  = 5.869Moda = 4.378

Se observa la media, la mediana y la moda son diferentes, por lo cual los datos no cumplen el criterio de verificación con respecto a estos parámetros.

Page 4: Análisis geoestadístico con ArcGIS_parte 2

6. Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de sesgo).

Como el coeficiente de sesgo permite verificar la normalidad de los datos, en caso de existir asimetría horizontal, es decir los datos no se ajustan a una distribución normal,  Wester-Oliver proponen evaluar lo siguiente.

  0<|CS|<0.5, se acepta la función de distribución de probabilidad como normal, se puede aplicar el  método geoestadístico a los datos. 

0.5<|CS|<1, es necesario realizar una transformación de datos (normalización) de tipo raíz cuadrada.

|CS|>1, es necesario hacer una transformación de tipo logarítmico (ln o log)

En nuestro caso CS = 1.46, valor mayor que 1, por lo tanto es necesario aplicar una transformación de tipo logarítmico a los datos.

7. Verificación de la normalidad con respecto al coeficiente de variación.

Tanto la función de distribución de los datos como la varianza son funciones de la media la cual es altamente sensible a los valores extremos. En consecuencia se debe tener conocimiento de la afectación de estos valores extremos sobre la media, para ello se calcula el coeficiente de variación. En todo caso se debe verificar lo siguiente. 

Si CV < 100, no hay problema con los valores extremos de los datos

Si 100<CV<=200, Los efectos causados por los valores extremos de los datos son tolerables

Si CV>200, se tiene problemas severos con los valores extremos de los datos.

Esto es importante, pues en caso de que los valores extremos de los datos afecten a la muestra o a la distribución de los mismos, se deberá analizar si es conveniente eliminarlos en caso que obedezcan a un error en la medición o hacer una transformación de los datos para reducir su influencia en la muestra.

En nuestro caso CV = 85.8 < 100, lo cual indica que no hay problemas con valores extremos.

En resumen, la función de distribución de los datos no se asemeja a una distribución normal dado que la media, la mediana y la moda son diferentes y además el CS>1. De acuerdo a los cálculos anteriores, es necesario realizar una transformación logarítmica (la cual consiste en tomar el dato y sacarle el logaritmo ya sea en base 10 o logaritmo natural), una vez realizada la transformación se vuelven a calcular todos los parámetros para realizar las respectivas verificaciones.

8. Realización de la transformación de los datos, si es necesario.

Transformación de los datos (ln).Pozo  X  Y  NP ln

1  1.038.638  1.368.620      2,0076 0,6972  1.034.835  1.344.198      2,1313 0,7573  1.039.637  1.368.963      2,2000 0,7884  1.039.628  1.368.960      2,2100 0,793

Page 5: Análisis geoestadístico con ArcGIS_parte 2

5  1.042.236  1.377.584      2,4449 0,8946  1.039.030  1.370.440      2,4946 0,9147  1.036.835  1.354.454      2,8554 1,0498  1.043.217  1.357.777      2,9876 1,0949  1.040.082  1.373.095      3,2347 1,174

10  1.039.392  1.374.231      3,2930 1,19211  1.040.434  1.368.119      3,3317 1,20312  1.039.720  1.368.500      3,3506 1,20913  1.042.060  1.376.470      3,4291 1,23214  1.041.545  1.369.212      3,6896 1,30615  1.042.045  1.371.752      3,7990 1,33516  1.040.269  1.377.908      3,9651 1,37817  1.040.731  1.371.643      3,9980 1,38618  1.042.360  1.376.070      4,2921 1,45719  1.040.390  1.376.776      4,4900 1,50220  1.035.335  1.356.941      4,5286 1,51021  1.047.035  1.371.548      4,6227 1,53122  1.042.020  1.370.310      4,6637 1,54023  1.033.716  1.352.675      5,0499 1,61924  1.042.570  1.377.470      5,1009 1,62925  1.035.564  1.343.433      5,2438 1,65726  1.042.520  1.368.530      5,3826 1,68327  1.042.932  1.368.255      5,8690 1,77028  1.044.694  1.371.405      6,0000 1,79229  1.041.841  1.363.397      6,1496 1,81630  1.040.838  1.356.677      8,0054 2,08031  1.044.135  1.364.301      8,0724 2,08832  1.046.740  1.377.526      8,0827 2,09033  1.046.626  1.374.772      9,0188 2,19934  1.042.604  1.360.903      9,2078 2,22035  1.039.466  1.348.279    10,1156 2,31436  1.041.429  1.333.870    10,2553 2,32837  1.045.207  1.363.183    10,8373 2,38338  1.044.733  1.360.337    11,5066 2,44339  1.048.893  1.374.744    11,8241 2,47040  1.040.383  1.355.006    12,2268 2,50441  1.042.263  1.354.636    12,3280 2,51242  1.039.411  1.336.953    12,8004 2,54943  1.048.342  1.369.941    14,6244 2,68344  1.046.214  1.355.644    14,9301 2,70345  1.044.935  1.336.931    16,6351 2,81246  1.041.256  1.339.628    18,1630 2,89947  1.048.313  1.360.466    19,1410 2,95248  1.044.224  1.348.328    24,0632 3,18149  1.044.765  1.341.254    24,2354 3,18850  1.046.735  1.356.327    25,5698 3,24151  1.045.454  1.346.959    27,1534 3,30252  1.050.523  1.361.111    30,0800 3,40453  1.052.106  1.361.728    35,3188 3,564

9. Recalculo de los parámetros estadísticos  y comparación para verificar la normalidad de los datos.

Page 6: Análisis geoestadístico con ArcGIS_parte 2

a. Organizar los datos de menor a mayor.Ya están organizados en la tabla anterior

b. Calcular la tabla de frecuencia.

No Intervalo Marca de clase

frecuencia

absoluta

frecuencia absoluta

acumulada

frecuencia relativa

frecuencia relativa

acumulada1 0,6969- 1,0569 0,88 7 7 0,13 0,132 1,0569- 1,4153 1,24 10 17 0,19 0,323 1,4153- 1,7737 1,59 10 27 0,19 0,514 1,7737- 2,1321 1,95 5 32 0,09 0,605 2,1321- 2,4905 2,31 7 39 0,13 0,746 2,4905- 2,8489 2,67 6 45 0,11 0,857 2,8489- 3,2073 3,03 4 49 0,08 0,928 3,2073- 3,5657 3,39 4 53 0,08 1,00

c. Realizar el histograma de frecuencias

d. Calcular los parámetros geoestadístico.Los parámetros estadísticos se realizarán por la metodología de datos no agrupados a excepción de la moda, para ello se utilizará Excel.

Pozo  NP ln Media (xi-media)2

(xi-media)4

(xi-media)³

1      2,0076 0,697 1,92 1,508 2,273 -1,8512      2,1313 0,757 1,92 1,364 1,862 -1,5943      2,2000 0,788 1,92 1,291 1,668 -1,4684      2,2100 0,793 1,92 1,281 1,641 -1,4505      2,4449 0,894 1,92 1,063 1,129 -1,0956      2,4946 0,914 1,92 1,022 1,044 -1,0337      2,8554 1,049 1,92 0,767 0,588 -0,6718      2,9876 1,094 1,92 0,690 0,475 -0,573

Page 7: Análisis geoestadístico con ArcGIS_parte 2

9      3,2347 1,174 1,92 0,564 0,318 -0,42310      3,2930 1,192 1,92 0,537 0,289 -0,39411      3,3317 1,203 1,92 0,520 0,271 -0,37512      3,3506 1,209 1,92 0,512 0,262 -0,36713      3,4291 1,232 1,92 0,480 0,230 -0,33214      3,6896 1,306 1,92 0,384 0,147 -0,23815      3,7990 1,335 1,92 0,348 0,121 -0,20516      3,9651 1,378 1,92 0,300 0,090 -0,16417      3,9980 1,386 1,92 0,291 0,084 -0,15718      4,2921 1,457 1,92 0,219 0,048 -0,10319      4,4900 1,502 1,92 0,179 0,032 -0,07620      4,5286 1,510 1,92 0,172 0,029 -0,07121      4,6227 1,531 1,92 0,155 0,024 -0,06122      4,6637 1,540 1,92 0,148 0,022 -0,05723      5,0499 1,619 1,92 0,093 0,009 -0,02924      5,1009 1,629 1,92 0,087 0,008 -0,02625      5,2438 1,657 1,92 0,072 0,005 -0,01926      5,3826 1,683 1,92 0,058 0,003 -0,01427      5,8690 1,770 1,92 0,024 0,001 -0,00428      6,0000 1,792 1,92 0,018 0,000 -0,00229      6,1496 1,816 1,92 0,012 0,000 -0,00130      8,0054 2,080 1,92 0,024 0,001 0,00431      8,0724 2,088 1,92 0,027 0,001 0,00432      8,0827 2,090 1,92 0,027 0,001 0,00433      9,0188 2,199 1,92 0,075 0,006 0,02134      9,2078 2,220 1,92 0,087 0,008 0,02635    10,1156 2,314 1,92 0,152 0,023 0,05936    10,2553 2,328 1,92 0,162 0,026 0,06537    10,8373 2,383 1,92 0,210 0,044 0,09638    11,5066 2,443 1,92 0,268 0,072 0,13939    11,8241 2,470 1,92 0,297 0,088 0,16240    12,2268 2,504 1,92 0,335 0,112 0,19441    12,3280 2,512 1,92 0,345 0,119 0,20242    12,8004 2,549 1,92 0,390 0,152 0,24443    14,6244 2,683 1,92 0,574 0,330 0,43544    14,9301 2,703 1,92 0,606 0,367 0,47245    16,6351 2,812 1,92 0,786 0,618 0,69746    18,1630 2,899 1,92 0,950 0,902 0,92647    19,1410 2,952 1,92 1,055 1,112 1,08348    24,0632 3,181 1,92 1,577 2,487 1,98149    24,2354 3,188 1,92 1,595 2,544 2,01550    25,5698 3,241 1,92 1,733 3,004 2,28251    27,1534 3,302 1,92 1,895 3,592 2,60952    30,0800 3,404 1,92 2,187 4,785 3,23553    35,3188 3,564 1,92 2,688 7,226 4,407

suma 102,02 32,205 40,295 8,510

Page 8: Análisis geoestadístico con ArcGIS_parte 2

e. Verificación de la normalidad con respecto a la media, moda y mediana.Media = 1.92Mediana  = 1.77Moda = 1.41

La diferencia entre la media, la mediana y la moda es menor que 1, por  lo tanto la distribución de los datos cumple con esta condición.

f. Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de sesgo).

CS = 0.34 se cumple que 0<|CS|<0.5.

g. Verificación de la normalidad con respecto al coeficiente de variación.

CV = 41%, se cumple que CV<100

 Por tanto la distribución de los datos se puede aceptar como normal, dado que la

Page 9: Análisis geoestadístico con ArcGIS_parte 2

moda, la mediana y la media son similares; CS está entre 0 y 0.5 y CV<100. Por ello se puede continuar con el análisis geoestadístico. 

Geostatistical Analyst. Análisis geoestadístico con ArcGIS parte 3Con Geostatistical Analyst es posible explorar la variabilidad de datos, examinar tendencias globales e investigar la autocorrelación y la correlación entre los datos, de igual forma se pueden crear predicciones y calcular errores de predicciones. Lo primero que se tiene que hacer para iniciar un análisis geoestadístico con Arcgis es el análisis exploratorio de los datos, lo cual hemos visto en dos artículos anteriores y por último el análisis estructural de los datos.

1. Análisis Exploratorio de los datos (ver artículo)Paso 1Lo primero que se debe hacer es crear un shape de puntos a partir de datos de coordenadas geográficas o planas.

En este caso utilizaré, el shape de puntos donde se tiene datos del monitoreo de niveles del acuífero del golfo de Urabá, el cual se denomina Niveles.shp.

Paso 2

Page 10: Análisis geoestadístico con ArcGIS_parte 2

Una vez creado o agregado el shape en Arcmap, damos clic en Geostatistical Analyst,seguido de Explore Data y finalmente en Histogram, tal como se muestra en la figura. 

Aparece la siguiente ventana…

En la parte inferior de la ventana,

Bars: Permite elegir el número de intervalos, la herramienta automáticamente calcula la longitud de cada intervalo.

Transformation: Permite realizar una transformación logarítmica a los datos en caso de que estos no sigan una distribución normal (tal como fue explicado aquí).

Layer: Aquí aparece el nombre del Shape, el cual es Niveles, cuando hay varios shpe agregados en Arcmap la herramienta elige el primero de la lista.

Attribute: Aquí aparece por defecto el primer campo que tenemos en la tabla de atributos de nuestro shape… en este caso es el campo pozos. Automáticamente la herramienta calcula los parámetros geoestadísticos que se muestran en la parte superior.

Paso 3

Page 11: Análisis geoestadístico con ArcGIS_parte 2

Lo que sigue es seleccionar el atributo con el cual queremos hacer el análisis geoestadístico, en este caso es el nivel piezométrico, para ello damos clic en la pestaña que está debajo del Attribute y seleccionamos el campo “NP” (nivel piezométrico).

Se observa que inmediatamente cambia la grafica y recalcula los valores de los parámetros estadísticos mostrados en la parte superior, los cuales son los siguientes:

Count (numero de datos): 53Min (dato menor): 2.0076Max (dato mayor): 35.319Mean (Media): 9.3776Std Dev (Desviación estándar): 8.0421Skewness (Coeficiente de sesgo o asimetría): 1.4773Kurtosis (curtosis): 4.4709Median (Mediana): 5.69

Aquí, la moda se calcula como la marca de clase del intervalo con mayor frecuencia…Moda = (0.2+0.53)/2 = 0.365.

El coeficiente de variación se calcula como: CV=S/media*100CV=8.0421/9.3776*100 = 85.7%

A estos parámetros le aplicamos las condiciones necesarias para verificar si los datos siguen la distribución normal. Vemos que la media, la moda y la mediana son diferentes y su diferencia es mayor a uno, el coeficiente de sesgo es mayor a 1, por lo cual es necesario realizar una transformación de los datos, de acuerdo a la literatura y lo hablado anteriormente se recomienda una transformación logarítmica…pero no los preocupemos estos lo hace ArcGis, simplemente en la pestaña Transformation seleccionamos “Log”. En la pestaña Bars colocamos 8 intervalos. El resultado es el siguiente.

Page 12: Análisis geoestadístico con ArcGIS_parte 2

Observamos nuevamente los parámetros…

Count (numero de datos): 53Min (dato menor): 0.69694Max (dato mayor): 3.5644Mean (Media): 1.9248Std Dev (Desviación estándar): 0.78698Skewness (Coeficiente de sesgo o asimetría): 0.33899Kurtosis (curtosis): 2.0591Median (Mediana): 1.7697

El coeficiente de variación se calcula como: CV=S/media*100CV=0.78698/1.9248*100 = 40.88%

El coeficiente de variación mejoró y es igual a 40.88%, por lo cual no hay problema con los valores extremos de los datos.

De lo anterior se concluye que la media y la mediana son similares, su diferencia es menor a 1 y el coeficiente de sesgo está entre 0 y 0.5, por lo cual la distribución de los datos se acepta como normal…se sigue con el análisis geoestadístico.                                                                                            Paso 4Después de haber analizado los parámetros estadísticos y concluir que la distribución de los datos se puede tomar como normal, cerramos la ventana del Histogram y volvemos a dar clic en Geostatistical Analyst, seguido de Explore Data y finalmente en Trend Analysis, tal como se muestra en la figura. 

Page 14: Análisis geoestadístico con ArcGIS_parte 2

Esta ventana nos ayuda a ver qué tendencia siguen los datos para que luego en el análisis estrutural le indiquemos a la herramienta que sea removida. En Graph options, damos clic en Projected Data, Sticks, Input Data Points para que desaparezcan de la gráfica… el resultado debe ser el siguiente.

Es importante analizar si los datos manifiestan tendencias direccionales que permitan establecer correlaciones en esas direcciones, y formular modelos de comportamiento. La tendencia más fuerte se tendrá sobre aquella dirección en la que la línea de tendencia es más gruesa; para nuestro ejemplo se ve claramente una fuerte tendencia en la dirección este-oeste (línea verde) y una débil tendencia en la dirección norte-sur (línea azul).

Page 15: Análisis geoestadístico con ArcGIS_parte 2

Con la barra de desplazamiento resaltada en rojo en la figura anterior se empiezan a desplazar las líneas de tendencias (verde y azul de la misma figura)… y se observa si estas siguen una línea recta, en caso tal la tendencia es lineal; una curva con una concavidad, la tendencia es cuadrática o si es una línea con más de una concavidad, la tendencia será de orden 3.

Como conclusión del análisis exploratorio y que se debe tener en cuenta durante la realización del análisis estructural de los datos, tenemos:

Los datos originales no siguen una distribución normal, por lo tanto se aplica una transformación logarítmica.

Es necesario remover una tendencia de segundo orden

2. Análisis estructural de los datosPaso 5Una vez identificada la tendencia de los datos, el siguiente paso es el análisis estructural y realización del modelo geoestadístico con los datos…para ello damos clic enGeostatistical Analyst, seguido de Geostatistical Winzard, aparece la una  ventanadonde debemos rellanar la siguiente información.

Medthod: Se debe seleccionar el método con el cual se quieren analizar los datos, en este caso es KrigingInput data: el shape al cual se le debe aplicar el análisis geoestadístico en este caso esNiveles.Attibute: El campo con el que se quiere realizar el análisis geoestadístico. En esta caso es el nivel piezométrico (NP).

Damos clic en el botó Next>. Aparece la siguiente ventana, donde rellenamos la siguiente información. 

Page 16: Análisis geoestadístico con ArcGIS_parte 2

En Geostatistical methods, se selecciona Ordinary Kriging-Prediction Map.

En Transformation, se selecciona Log, pues ya habíamos concluido que es necesario realizar transformación logarítmica.

En Order of trend removal, se selecciona la opción Second, pues habíamos visto que los datos siguen una tendencia de segundo orden.

Damos clic en Next>, aparece una ventana  que permite concluir si los datos presentan anisotropía direccional o no la presentan. Si en la grafica aparece un círculo, no hay anisotropía direccional y si aparece otra cosa como la de la figura, se concluye que existe anisotropía direccional la cual se debe tener presente, ya que en la ventana siguiente se le deberá indicar a la herramienta este parámetro.

Page 18: Análisis geoestadístico con ArcGIS_parte 2

En la ventana anterior rellenamos la siguiente información

1. Model: 1. Aquí debemos elegir el modelo geoestadístico que deseemos usar para modelar los datos; para el caso del ejemplo, elegiremos el modelo Spherical.

2. En el paso anterior concluimos que hay anisotropía estructural, por lo tanto, debemos seleccionar Anisotropy.

3. Damos clic en Show search Direction, se habilitarán inmediatamente las opciones de más abajo, las cuales son Angle direction y Bandwidth (lags).

En la grafica anterior vemos que fueron habilitadas Angle direction y Bandwidth (lags), para seguir se procede de la siguiente forma.

Angle direction: Debemos cambiar el Angulo hasta que las líneas que se muestran a la izquierda de la figura coincidan con la dirección de la elipse en su parte superior.

Bandwidth (lags): una vez realizado el paso anterior, los puntos o parte inferior de las líneas deben cortar a la elipse, para ello se aumenta o disminuye el valor de Bandwidth.

…lo dicho anteriormente se resumen en la siguiente imagen.

Page 20: Análisis geoestadístico con ArcGIS_parte 2

Volvemos a dar clic en Next>, en la siguiente ventana se muestra: Un recalculo de los datos en comparación con los valores medidos para verificar

obtenido.

Cálculo de los errores:

        Root-Mean-Square: 3.774        Average Standard Error: 4.361        Mean Standardized: -0.04804        Root-Mean-Square Standardized: 0.9609

Un gráfico de comparación de datos medidos y datos calculados, en la que se puede ver que los datos que más se alejan de la línea, son los que mayores errores presentan en su predicción.

Page 22: Análisis geoestadístico con ArcGIS_parte 2

Damos clic en Ok y aparece el mapa de predicción de niveles piezométrico a partir del método geoestadístico Kriging esférico.

 Pero aun no se termina …la ventajas de los métodos geoestadísticos es que nos permite realizar un mapa de errores. Para ello en el panel del navegador,  damos clic derecho sobre el mapa creado y elegimos la opción Create Prediction Estándar error Map.

Page 24: Análisis geoestadístico con ArcGIS_parte 2

 En la figura anterior observamos que el máximo error es del 58.16%, el cual es muy alto. La confiabilidad del modelo se calcula como 100 menos el error máximo, para el ejemplo: confiabilidad = 100-58.16 = 41.84%. Para aceptar un modelo geoestadístico es necesario tener una confiabilidad superior al 90%, por lo tanto se concluye que es necesario mejorar la densidad de las medidas. En la gráfica también se observa que los errores mayores en la predicción se producen donde existe menos información. Para el caso del monitoreo de niveles de un acuífero esto es indicativo que en estos sitios se deben perforar piezómetros o pozos de monitoreo con el fin de optimizar la red existente. Para seleccionar el modelo que mejor modela nuestros datos, es necesario aplicarles cada uno de ellos y escoger el que presente menor Root-Mean-Square,

Page 25: Análisis geoestadístico con ArcGIS_parte 2

menor Average Standard Error, Root-Mean-Square Standardized más cercano a uno y mayor porcentaje de confiabilidad. Como resumen del modelo aplicado tenemos lo siguiente:

Parámetro Valor

Root-Mean-Square 3.774

Average Standard Error 4.361

Root-Mean-Square Standardized 0.9609

Confiabilidad 41.84

Existen otros conceptos que son muy importantes, pero de los cuales no fue posible mencionar en este artículo: efecto pepita, efecto pepita puro, discontinuidad en el origen, meseta, anisotropía estructural, anisotropía direccional, variograma y partial sill, entre otros. Para profundizar en este tema recomiendo revisar la siguiente bibliografía.

Webster, Richard. Oliver Margaret. 2001. Geostatistics for environmental scientists.Great Britain. John Wiley & Sons Inc.

Sampe Javier y Jesús carrera. 1990. Geoestadistica, aplicaciones a la hidrogeología subterránea. Centro Internacional de métodos nuéricos en Ingeniería. Barcelona

http://cg.ensmp.fr/bibliotheque/public/MATHERON_Ouvrage_00537.pdf

http://www.fcaglp.unlp.edu.ar/~jcu/estadistica/Nociones%20de%20geoestad%EDstica.pdf