Upload
juan-carlos-gonzalez-l
View
10
Download
0
Embed Size (px)
Citation preview
Geoestadstica con RJorge Gaspar Sanz Salinas
Septiembre de 2005
Resumen: A lo largo de la asignatura de doctorado Prediccion y analisis de modelos
superficiales mediante sistemas de informacion geografica se ha cubierto el desarrollo
del estudio de la distribucion espacial de una o varias variables, as como su modeli-
zacion mediante metodos geoestadsiticos (krigeado). En este trabajo se presenta un
resumen de dicho desarrollo utilizando los mismos datos de partida pero empleando
para el mismo herramientas de Software Libre, principalmente una herramienta es-
tadstica R y un Sistema de Informacion Geografica, GRASS, ambos funcionando bajoel Sistema Operativo Linux.
Indice
0. Introduccion 4
0.1. R . . . . . . . . . . . . . . . . 40.2. gstat . . . . . . . . . . . . . . 40.3. GRASS . . . . . . . . . . . . . 50.4. Datos de trabajo . . . . . . . 5
1. Descripcion univariada 6
1.1. Carga y visualizacion de los
datos . . . . . . . . . . . . . . 6
1.2. Metodos graficos para la
descripcion univariada . . . 6
1.3. Metodos numericos . . . . . 9
1.4. Scripts . . . . . . . . . . . . . 10
2. Descripcion bivariada 12
2.1. Metodos graficos . . . . . . . 12
2.2. Metodos numericos . . . . . 13
2.3. Scripts . . . . . . . . . . . . . 14
3. Descripcion espacial 15
3.1. Visualizacion espacial de
datos . . . . . . . . . . . . . . 15
3.2. Ventanas moviles y el efecto
proporcional . . . . . . . . . 18
3.3. Continuidad espacial . . . . 18
3.4. Variograma . . . . . . . . . . 20
3.5. Diagramas de dispersion
cruzados . . . . . . . . . . . 20
3.6. Scripts . . . . . . . . . . . . . 20
4. Estimacion. Metodos determi-
nistas 24
4.1. Scripts . . . . . . . . . . . . . 27
5. Continuidad espacial de V 30
5.1. Variograma omnidireccional 30
5.2. Variograma superficial . . . 30
5.3. Variogramas direccionales . 30
5.4. Variogramas cruzados . . . . 33
5.5. Scripts . . . . . . . . . . . . . 36
6. Modelizacion del variograma ex-
perimental 39
6.1. Estimacion automatizada
del modelo . . . . . . . . . . 41
6.2. Scripts . . . . . . . . . . . . . 44
8. Kriging 45
8.1. wlc . . . . . . . . . . . . . . . 458.2. Krigeado Ordinario (KO) . . . 45
8.3. Krigeado Universal (KU) . . . 46
8.4. Krigeado por bloques (KUB) 46
8.5. Krigeado Local (KUL) . . . . 46
8.6. Cokrigeado (CKO) . . . . . . 48
8.7. Resultados . . . . . . . . . . 51
8.8. Scripts . . . . . . . . . . . . . 56
Modelizacion geoestadstica con R 2
Indice de figuras
1. Distribucion de U y V . . . . 6
2. Histograma de V . . . . . . . 7
3. Histograma acumulado de V 7
4. Grafico de probabilidad
uniforme de V . . . . . . . . 7
5. Grafico de probabilidad
normal . . . . . . . . . . . . . 8
6. Grafico de probabilidad log-
normal . . . . . . . . . . . . . 8
7. Grafico de caja y bigotes de V 9
8. Grafico de caja y bigotes de
V y U . . . . . . . . . . . . . . 12
9. Grafico de cuantiles de V y U 12
10. Grafico de dispersion . . . . 13
11. Distribucion de V . . . . . . 15
12. Mapa graduado de color de V 16
13. Mapa graduado de tamano
de V . . . . . . . . . . . . . . 16
14. Mapas de indicadores . . . . 17
15. Mapa de superficie interpo-
lada . . . . . . . . . . . . . . 18
16. Media y varianza en venta-
na de 3x3 . . . . . . . . . . . 19
17. Grafico de dispersion de
media y varianza . . . . . . . 19
18. h-Scatterplots de direccion
N-S . . . . . . . . . . . . . . . 20
19. h-Scatterplots de direccion
E-W . . . . . . . . . . . . . . 21
20. h-Scatterplots cruzado de U
y V en direccion N-S . . . . . 21
21. Distribucion de wlm . . . . . 2422. Mapas generados por GRASS 2523. Histogramas de los conjun-
tos de datos . . . . . . . . . . 26
24. Variogramas omnidireccio-
nales (i)) . . . . . . . . . . . . 31
25. Mapa del variograma su-
perficial . . . . . . . . . . . . 31
26. Isolneas del variograma
superficial . . . . . . . . . . . 32
27. Variogramas direccionales . 32
28. Deteccion de ejes de aniso-
tropa . . . . . . . . . . . . . 33
29. Variogramas por toleran-
cias (i) . . . . . . . . . . . . . 34
30. Variogramas por toleran-
cias (ii) . . . . . . . . . . . . . 35
31. Variogramas cruzados . . . . 35
32. Modelos de variogramas
disponibles . . . . . . . . . . 39
33. Modelos esferico de ran-
go 30 y meseta parcial de
92000ppm . . . . . . . . . . 40
34. Modelos de variograma
combinados . . . . . . . . . . 40
35. Modelo de variograma de V
ajustado . . . . . . . . . . . . 41
36. Modelado interactivo del va-
riograma . . . . . . . . . . . . 42
37. Descripcion de geoR delconjunto de datos . . . . . . 43
38. Modelo ajustado por geoR . 4339. Conjunto de datos wlc . . . . 4540. Error del Krigeado ordinario 46
41. Error del Krigeado universal 47
42. Error del Krigeado univer-
sal por bloques . . . . . . . . 47
43. Error del Krigeado local
universal . . . . . . . . . . . 48
44. Diferencias con wlc de lamodelizacion de U . . . . . . 50
45. Prediccion en la modeliza-
cion de V (wlm) . . . . . . . . 5146. Desviacion tpica en la mo-
delizacion de V (wlm) . . . . . 5247. Diagramas de caja y bigote
de las diferencias . . . . . . . 53
48. Prediccion en la modeliza-
cion de U (wlm) . . . . . . . . 5449. Desviacion tpica en la mo-
delizacion de U (wlm) . . . . . 54
Indice de cuadros
1. Resumen de estadsticos de
datos de validacion y esti-
mados . . . . . . . . . . . . . 26
2. Estadsticos de los errores
en los metodos de krigeado
de V . . . . . . . . . . . . . . 52
3. Estadsticos de los errores
en los metodos de krigeado
de U . . . . . . . . . . . . . . 55
Modelizacion geoestadstica con R 3
Indice de listados
1. R-Script del tema 1 . . . . . . 10
2. R-Script del tema 2 . . . . . . 14
3. R-Script en Linux del tema 3 . 224. R-Script en Windows del te-
ma 3 . . . . . . . . . . . . . . 23
5. R-Script del tema 4 . . . . . . 27
6. Script para GRASS . . . . . . 277. Script para ps.map del
metodo IDW . . . . . . . . . 28
8. Script para ps.map delmetodo RST . . . . . . . . . . 28
9. Script para ps.map delmetodo Polgonos de in-
fluencia . . . . . . . . . . . . 29
10. Funciones para imprimir
variogramas . . . . . . . . . . 36
11. R-Script del tema 5 . . . . . . 36
12. R-Script del tema 6 . . . . . . 44
13. R-Script del tema 8 . . . . . . 56
Modelizacion geoestadstica con R 4
Tema 0 Introduccion
0.1. R
R [5] es un conjunto integrado de herramientas para manipular datos, realizar todotipo de calculos con los mismos y tambien es capaz de realizar toda clase de graficos
estadsticos.
En [4] se citan las siguientes caractersticas:
es multiplataforma,
almacenamiento y manipulacion efectiva de datos,
operadores para calculo sobre variables indexadas (Arrays), en particular matri-
ces,
una amplia, coherente e integrada coleccion de herramientas para analisis de
datos,
posibilidades graficas para analisis de datos, que funcionan directamente sobre
pantalla o impresora,
y un lenguaje de programacion bien desarrollado, simple y efectivo, que incluye
condicionales, ciclos, funciones recursivas y posibilidad de entradas y salidas.
(Debe destacarse que muchas de las funciones suministradas con el sistema
estan escritas en el lenguaje R).
R puede extenderse mediante paquetes. En Linux, basta con ejecutar el comandoinstall.packages(paquete) para conectar a la red de servidores CRAN (Comprehen-sive R Archive Network) descarga el codigo fuente y si se dispone de los compiladores
pertinentes (C++, Fortran, ...) genera los binarios adaptados perfectamente a la maqui-na. En Windows, al ejecutar dicho comando se descargan directamente los binarios.En esta ultima plataforma se dispone de una interfaz grafica un poco mas elaborada
y permite ademas exportar al formato Windows MetaFile.Los paquetes empleados en el trabajo, ademas de los que se incluyen por defecto en
R son los paquetes de geoestadstica gstat [3], y geoR [6], y el paquete para presentacionde graficos lattice [7].
En definitiva, se dispone de un sistema ampliable que se maneja como una consola
de entrada de comandos que permite adquirir datos desde ficheros, manipularlos,
crear nuevos datos y por ultimo o bien ver las graficas por pantalla o mandarlas a
ficheros PostScript o raster. Otra caracterstica importante es la posibilidad de ejecutarsecuencias de comandos en forma de scripts.
0.2. gstatgstat [2] es un software para llevar a cabo modelizacion, prediccion y simulacion de
datos geoestadsticos. Al igual que el anterior, es Software Libre bajo licencia (GNU1).
Puede usarse de muy diversas formas, directamente tanto de forma no interactiva
(mediante ficheros de parametros) como interactiva mostrando los resultados utili-
zando el programa para presentacion de graficos gnuplot. Pero su uso mas interesantees integrado con otras herramientas. En este sentido se ha conseguido que gstat fun-cione con GRASS, Idrisi, PCRaster y con R.
1http://www.gnu.org
Modelizacion geoestadstica con R 5
En este trabajo se ha usado con R porque este ultimo ofrece caractersticas muyinteresantes para la manipulacion de datos, presentacion de todo tipo de graficas y
repeticion de tareas mediante sentencias de control (bucles, condicionales, etc). Por
otro lado, no ha sido posible compilar gstat para que trabaje conjuntamente con GRASSen su version 6.
0.3. GRASSEste ya veterano software para la gestion de informacion geografica dispone de
herramientas para la modelizacion de variables espaciales mediante metodos deter-
minsticos. Se ha usado en este trabajo para la obtencion de la modelizacion por
polgonos de influencia (Voronoi), Splines de tension y por el metodo de pesos inver-
sos a la distancia.
Ademas se ha utilizado para la presentacion de la cartografa, maquetando senci-
llos mapas con salida PostScript.
0.4. Datos de trabajo
Los datos con los que se va a trabajar durante todo el proyecto son los utilizados
en el libro Applied Geostatistics de Issaks y Srivastava. El conjunto de datos walkeresta a su vez dividido en tres grupos, wlc que es una malla de 78000 puntos quesirven para validacion, wlm es la malla irregular de 470 puntos y wle una malla de 100puntos para algunos calculos estadsticos.
gstat dispone del conjunto wlm, los otros dos seran cargados desde ficheros de textoseparados por comas (CSV) para poder operar con ellos.
Modelizacion geoestadstica con R 6
Tema 1 Descripcion univariada
1.1. Carga y visualizacion de los datos
En este captulo se van a usar los datos wle redondeados a valores enteros. Elprimer paso sera por tanto cargar el fichero walker10.asc, que es un fichero detexto separado por tabuladores que se puede importar directamente con la orden
read.delim2 para a continuacion redondearlo.En la figura 1 se muestra la distribucion de los datos, as como los valores que
toman las variables U y V.
12 14 16 18 20
242
244
246
248
250
X
Y
22 28 4 32 38 20 0 14 31 34
16 17 11 29 37 55 11 3 34 35
14 15 15 15 16 17 13 2 40 38
14 15 15 16 17 18 14 6 28 25
15 16 16 23 24 25 7 15 21 20
21 18 20 27 29 19 7 16 19 22
21 8 27 27 32 4 10 15 17 19
16 9 22 24 25 10 7 19 19 22
16 7 34 36 29 7 4 18 18 20
15 12 24 27 30 0 2 18 18 18
87 100 47 111 124 109 0 98 134 144
77 84 74 108 121 143 91 52 136 144
75 80 83 87 94 99 95 48 139 145
74 80 85 90 97 101 96 72 128 130
77 82 86 101 109 113 79 102 120 121
89 88 94 110 116 108 73 107 118 127
88 70 103 111 122 64 84 105 113 123
82 74 97 105 112 91 73 115 118 129
82 61 110 121 119 77 52 111 117 124
81 77 103 112 123 19 40 111 114 120
Figura 1: Distribucion de U y V
1.2. Metodos graficos para la descripcion univariada
El metodo grafico mas utilizado es el histograma, en el que debemos integrar la
variable en clases. La variable V se vara entre 0ppm y 145ppm por lo que dividirla enclases de 10 unidades es conveniente (fig. 2 en la pagina siguiente).
Otro grafico interesante es el histograma acumulado en el que a partir de las
mismas clases del histograma anterior se muestra la suma acumulada (fig 3 en la
pagina siguiente).
El grafico de probabilidad acumulada muestra la proporcion de datos para cada
punto que son menores que el (fig 4 en la pagina siguiente)
Las figuras 5 en la pagina 8 y 6 en la pagina 8 muestran la similitud de nuestra
muestra con la distribucion normal y lognormal. Las lneas trazadas pasan por el
primer y tercer cuartil.
Modelizacion geoestadstica con R 7
V
Fre
qu
en
cy
1 1
0
1
2 2
3
14
15
11
14
17
12
3
40
24
68
10
12
14
16
0 50 100 150
Figura 2: Histograma de V
0 10 20 30 40 50 60 70 80 90 100 120 140
Variable
Fre
cu
en
cia
acu
mu
lada
020
40
60
80
100
Figura 3: Histograma acumulado de V
0 50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
V
Pro
babilid
ad a
cu
mu
lada
Figura 4: Grafico de probabilidad uniforme de V
Modelizacion geoestadstica con R 8
0 50 100 150
2
1
01
2
Sample Quantiles
Th
eore
tical Q
uan
tile
s
Figura 5: Grafico de probabilidad normal
3.0 3.5 4.0 4.5 5.0
2
1
01
2
Sample Quantiles
Th
eore
tical Q
uan
tile
s
Figura 6: Grafico de probabilidad lognormal
Modelizacion geoestadstica con R 9
1.3. Metodos numericos
1.3.1. Medidas de localizacion
Se puede solicitar una descripcion sencilla de nuestros datos con el comando
summary(V) que devuelve tanto los valores maximos y mnimos, la media, la me-diana y el segundo y tercer cuartil. En cualquier caso estan disponibles comandos
como min, max, mean y median.Para calcular la moda no hay un comando definido, pero a partir de la tabla defi-
nida del corte de V (tcutV) donde se almacenan las frecuencias relativas en las clasesdefinidas previamente (secV), podemos solicitar aquella clase que almacene el valormaximo con el comando tcutV[tcutV==max(tcutV)].
En resumen:
Mnimo 0
Maximo 145
Media 100.5
Mediana 97.55
Moda 110-120
Rango 145
R puede calcular cualquier cuantil de una muestra, por ejemplo los cuartiles conel comando quantile y pasando un vector con los valores de los cuantiles a obtener,en este caso una secuencia de 0 a 1 cada 0.25 unidades:
> print(cuantiles dt dt2;dt;as.numeric(cuantiles["75%"]-cuantiles["25%"])
Modelizacion geoestadstica con R 10
[1] 695.3409[1] 26.36932[1] 34.5
1.3.3. Medidas de forma
El coeficiente de sesgo o asimetra (skewness) se calcula a partir de la formula
CS =1n
ni=1 (xi m)
3
3(1)
El coeficiente de curtosis o apuntalamiento se calcula como
K =
ni=1
(xim)4
n
4 3 (2)
El coeficiente de variacion no es mas que el cociente entre la desviacion tpica y la
media, siendo trivial su calculo.
En R estos tres coeficientes se calculan como:> media print(CS print(K print(CV
Modelizacion geoestadstica con R 11
4849 logV
Modelizacion geoestadstica con R 12
Tema 2 Descripcion bivariada
2.1. Metodos graficos
La visualizacion de pares de histogramas y sobre todo de graficos de caja y bigotes
( 8)pueden aportar informacion de como son dos variables.
VU
0 50 100 150
Vari
able
s
Figura 8: Grafico de caja y bigotes de V y U
El diagrama de cuantiles muestra cada cuantil de una variable contra el mismo
cuantil de la otra formando un grafico de puntos. Si estos puntos adoptan la forma de
una lnea significa que ambas variables son similares pero su localizacion y dispersion
son diferentes.
0 50 100 150
0
10
20
30
40
50
V
U
0%
25%
50%
75%
100%
U=V
Cuartiles
Figura 9: Grafico de cuantiles de V y U
Por ultimo, el diagrama de dispersion ( 10 en la pagina siguiente)puede mostrar
informacion sobre las tendencias de ambas variables y la existencia de outliers que
Modelizacion geoestadstica con R 13
pueden ser susceptibles de ser eliminados.
0 50 100 150
010
20
30
40
50
V
U
Figura 10: Grafico de dispersion
2.2. Metodos numericos
El coeficiente de correlacion o de Pearson es el indicador mas utilizado para com-
probar la relacion entre variables, en R se corresponde con el comando cor(U,V).
=1n
ni=1 (xi mx) (yi my)
x y(3)
El numerador de esta ultima ecuacion es otro indicador, la covarianza, que se
obtiene con el comando cov(U,V).El coeficiente de correlacion de orden utiliza el orden en que aparece un valor
determinado en lugar de su propio valor. Por esta razon este coeficiente es menos
sensible a valores extremos y por tanto, si difiere mucho del coeficiente de Pearson
indica la existencia de estos valores extremos. En R se obtiene con el mismo comandoque el de correlacion, pero cambiando el metodo.
Orden =1n
ni=1 (Rxi mRx) (Ryi mRy)
Rx Ry(4)
> cov(U,V);cor(U,V,method="pearson");cor(U,V,method="spearman")[1] 218.2778[1] 0.8393395[1] 0.8576604
Modelizacion geoestadstica con R 14
2.3. Scripts
Listado 2: R-Script del tema 2
1 #TEMA 2 - DESCRIPCION BIVARIADA2 ps.options(family="Bookman",pointsize
=15)3 rm(list=ls())45 #Cargar wle y redondearlo6 wle
Modelizacion geoestadstica con R 15
Tema 3 Descripcion espacial
3.1. Visualizacion espacial de datos
3.1.1. Mapas de localizacion
Se trata de trazar un mapa de puntos e indicar por ejemplo los 10 valores maximos
y los 10 valores mnimos. En R se trata de obtener los conjuntos de datos de wle conlos valores maximos y mnimos y pintarlos sobre un mapa de localizacion de V.
12 14 16 18 20
240
242
244
246
248
250
X
Y
87 100 47 111 124 109 0 98 134 144
77 84 74 108 121 143 91 52 136 144
75 80 83 87 94 99 95 48 139 145
74 80 85 90 97 101 96 72 128 130
77 82 86 101 109 113 79 102 120 121
89 88 94 110 116 108 73 107 118 127
88 70 103 111 122 64 84 105 113 123
82 74 97 105 112 91 73 115 118 129
82 61 110 121 119 77 52 111 117 124
81 77 103 112 123 19 40 111 114 120
MximosMnimos
Figura 11: Distribucion de V
3.1.2. Mapas de smbolos graduados
Utilizando la biblioteca lattice, se pueden generar mapas de smbolos graduadospor color con el comando levelplot. R dispone de diferentes paletas de color, peroen este caso se usara una escala de grises.
Otro tipo de mapa es el de gradacion de smbolos por tamano. En este caso el
paquete gstat proporciona el comando bubble. El resultado es mejorable, pero sirvea modo de ejemplo.
3.1.3. Mapas de indicadores
Se trata de mapas graduados de color con solo dos niveles. El umbral entre ambos
niveles se va variando y se observa el conjunto de mapas generados. Estos mapas
pueden mostrar alineaciones en la distribucion espacial de la variable y la ubicacion
de maximos y mnimos. Las figuras 14(c) y 14(d) muestran la alineacion norte-sur de
los datos.
Modelizacion geoestadstica con R 16
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
Figura 12: Mapa graduado de color de V
V
x
y
12 14 16 18 20
242
244
246
248
250
081.75100.5116.25145
Figura 13: Mapa graduado de tamano de V
Modelizacion geoestadstica con R 17
Umbral = 73.375
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(a) Cuantil 12.5 %
Umbral = 81.75
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(b) Cuantil 25 %
Umbral = 89.125
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(c) Cuantil 37.5 %
Umbral = 100.5
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(d) Cuantil 50 %
Umbral = 109.875
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(e) Cuantil 62.5 %
Umbral = 116.25
X
Y
12 14 16 18
242
244
246
248
0
20
40
60
80
100
120
140
(f) Cuantil 75 %
Figura 14: Mapas de indicadores
Modelizacion geoestadstica con R 18
3.1.4. Mapas de superficies interpoladas
Es posible interpolar polinomios de un orden determinado, que pasen por todos
los puntos de la muestra. Estos polinomios suelen ofrecer superficies suavizadas pero
que muestran las tendencias y la distribucion de la variable.
Para poder obtener estos polinomios en R, se ha de cargar el paquete spatial quedispone de la funcion surf.ls que obtiene el mejor polinomio de hasta grado 6 que seajusta a los datos mediante mnimos cuadrados (fig. 15). Este mapa ha sido generado
en Windows ya que el paquete spatial no ha sido posible instalarlo en Linux, por loque el script que genera este grafico esta separado del resto del tema.
12 14 16 18 20
242
244
246
248
250
Figura 15: Mapa de superficie interpolada
3.2. Ventanas moviles y el efecto proporcional
Se pueden trazar mapas en las que el valor de cada punto es la media o la varianza
de sus vecinos. Por lo tanto se crea una ventana movil de tamano impar que va
recorriendo los valores. En R esta operacion requiere algo de programacion que seincluye en el script del tema y que se presenta en la figura 16 en la pagina siguiente.
Un grafico de dispersion entre las medias y las varianzas demuestra la existencia
de una relacion entre ambas. En este caso, en la figura 17 en la pagina siguiente, se
puede ver que ambas medidas no estan correladas, siendo el coeficiente de correlacion
() bastante bajo.
3.3. Continuidad espacial
3.3.1. Diagramas de dispersion de tipo h
Este tipo de diagramas muestran contrapuestas la variable contra esta a una dis-
tancia determinada. Cuando los datos estan en forma de malla, se pueden obtener
de forma sencilla los mapas de dispersion en las direcciones norte-sur y este-oeste a
diferentes distancias.
Obtener estos diagramas en R es relativamente sencillo debido a la flexibilidad enla manipulacion de variables indexadas (arrays). Se han obtenido los diagramas con
Modelizacion geoestadstica con R 19
12 14 16 18 20
242
244
246
248
250
X
Y
85.22
235.94
85.22
255.19
87.22
111.69
86.33
90.25
83.89
39.36
80.22
17.94
79.11
18.61
78.56
201.78
95.56
409.53
94.67
443.25
94.67
220.5
93.89
186.86
90.67
92.75
86
42.5
85.67
91.25
86
377.5
111.33
75.75
111.11
72.86
107.78
79.94
105.78
122.94
98.67
123.5
92.44
74.03
93.22
199.44
94.33
611.5
97.67
1095.75
102.44
428.53
104.33
300.25
106
281
105
69.5
99
69.75
104.44
311.53
110.67
289.25
78.44
1332.03
88.22
616.94
93.67
459.75
96.44
457.78
99.11
219.86
98.11
93.36
104.11
288.36
97.33
1628.25
76.56
1165.53
85.78
468.19
91.11
342.86
92.78
320.44
94.56
248.78
89.44
392.78
88.56
823.28
81.67
1753
94.56
955.28
98.67
553.25
100.67
353.25
100.11
299.61
99.44
441.03
97.67
828.75
95.22
1163.69
88.11
2227.36
117.67
35.5
117.22
53.69
117.22
68.19
115.11
76.86
113.89
334.86
111.67
1042.25
110.44
1659.03
115.56
1588.03
Figura 16: Media y varianza en ventana de 3x3
80 90 100 110
0500
1000
1500
2000
media
vari
an
za
= 0.11
Figura 17: Grafico de dispersion de media y varianza
Modelizacion geoestadstica con R 20
distancia (h) variando de 1 a 4 puntos y en las direcciones norte-sur (fig. 18) y este-
oeste (fig:03:vew). Se aprecia la alta correlacion en las direcciones N-S (0,5 < < 0,7) yla baja correlacion en direccion E-W (0,4 < < 0,3).
0 50 100 150
20
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.74
h = 1
0 50 100 150
20
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.59
h = 2
0 50 100 150
20
40
60
80
100
120
V(t+h)
V(t
)
x=y
= 0.56
h = 3
0 50 100 150
20
40
60
80
100
120
V(t+h)
V(t
)
x=y
= 0.48
h = 4
Figura 18: h-Scatterplots de direccion N-S
3.4. Variograma
La funcion del variograma muestra la variacion de la variable agrupando los datos
segun sus distancias relativas. Ha de establecerse por tanto el numero de ((cajas))
o lags en los que queremos dividir los datos. Por otro lado, como en el apartado
anterior, podemos obtener el variograma en una direccion determinada o en todas
direcciones (variograma omnidireccional). Formalmente la funcion del variograma se
expresa como:
(h) =1
2N(h)
N(h)
i=1
(vi vi+h)2 (5)
En R existen diversos paquetes que calculan el variograma pero probablemente elmas completo es el paquete gstat. El uso de esta funcion se hara en el tema 5.
3.5. Diagramas de dispersion cruzados
El ultimo grafico que se va a mostrar en este tema es el de dispersion cruzada
entre dos variables. Es un h-Scatterplot en el que en lugar de ccontrastarla misma
variable se utiliza el valor de otra. Se ha calculado solo la variacion en la direccion
N-S de las variables U y V.
3.6. Scripts
Modelizacion geoestadstica con R 21
0 50 100 150
020
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.21
h = 1
0 50 100 150
020
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.41
h = 2
0 50 100 150
020
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.35
h = 3
0 50 100 150
20
40
60
80
100
120
140
V(t+h)
V(t
)
x=y
= 0.3
h = 4
Figura 19: h-Scatterplots de direccion E-W
0 50 100 150
010
20
30
40
50
V(t+h)
U(t
) x=y
= 0.6
h = 1
0 50 100 150
010
20
30
40
V(t+h)
U(t
)
x=y
= 0.45
h = 2
0 50 100 150
05
10
15
20
25
30
35
V(t+h)
U(t
)
x=y
= 0.36
h = 3
0 50 100 150
05
10
15
20
25
30
35
V(t+h)
U(t
)
x=y
= 0.28
h = 4
Figura 20: h-Scatterplots cruzado de U y V en direccion N-S
Modelizacion geoestadstica con R 22
Listado 3: R-Script en Linux del tema 3
1 #TEMA 3 : DESCRIPCION ESPACIAL2 ps.options(family="Bookman",pointsize
=15)3 rm(list=ls())45 #Cargar paquetes6 library(lattice)7 library(gstat)89 #Cargar wle y redondearlo
10 wle
Modelizacion geoestadstica con R 23
-1])97 }98 }99 dev.off()
100101 #Grafico de media contra varianza 3x3102 postscript("imgs/03/mediavar2.ps")103 media
Modelizacion geoestadstica con R 24
Tema 4 Estimacion. Metodos deterministas
En esta seccion se va a estimar el valor de la variable V en toda la extension de
trabajo a partir de los valores en el conjunto de datos wlm (fig. 21).Este conjunto de datos se obtiene facilmente al estar presente en el paquete gstat
y cargandose con ejecutar el comando data(walker).
X
Y
50 100 150 200 250
50
100
150
200
250
Figura 21: Distribucion de wlm
La estimacion de estos datos se ha realizado desde GRASS, para ello primero se haexportado este conjunto de datos a un fichero csv para a continuacion importarlo en
GRASS como una cobertura vectorial (GRASS ya no utiliza sites).En GRASS se han utilizado las funciones v.voronoi, v.surf.idw y v.surf.rst
que implementan el metodo de polgonos de influencia, el de pesos inversos a la dis-
tancia y el de splines de tension respectivamente. Ademas de las coberturas raster con
los valores estimados se han obtenido las curvas de nivel cada 250ppm. Finalmente
se han maquetado tres sencillos mapas con los resultados de estos tres metodos.
Al final del tema se presenta el script en GRASS que genera los mapas y exporta aficheros csv los valores de los tres mapas para poder estudiarlos en R. Igualmente sepresentan los tres ficheros que indican la maquetacion de los mapas.
A continuacion se importa el conjunto de datos wlc que consiste en 78000 puntosde validacion y que se entiende como valores correctos..
En el cuadro 1 se muestran los estadsticos de estos cuatro conjunto de datos y
en la figura 23 en la pagina 26 se pueden ver los histogramas. Se pueden observar
las siguientes caractersticas:
Se observa como el metodo de Polgonos de influencia es el que mejor mantiene
las caractersticas estadsticas.
Modelizacion geoestadstica con R 25
200
100
100
200
Polgonos de influencia de V
Leyenda
Escala0 50
0
200
400
600
800
1000
1200
1400
200
100
100
200
Inverso a la distancia de V
Leyenda
Equidistancia de curvas = 250ppm
Escala0 50
200
400
600
800
1000
1200
1400
200
100
100
200
Splines de Tensin de V (T=100)
Leyenda
Equidistancia de curvas = 250ppm
Escala0 50
0
200
400
600
800
1000
1200
1400
Figura 22: Mapas generados por GRASS
Modelizacion geoestadstica con R 26
Cuadro 1: Resumen de estadsticos de datos de validacion y estimados
wlc Voronoi IDW RSTMn. 0.00 0.00 0.46 -47.51Q1 67.79 70.70 163.00 121.20Median. 221.30 224.40 297.20 277.90Media 278.00 275.10 316.80 277.90Q3 428.30 425.90 428.50 379.50Max. 1631.00 1528.00 1498.00 1530.002 62423.16 60039.41 39458.06 44820.41 249.84 245.03 198.64 211.71Simetr. 0.90 0.89 0.63 0.76Apunt. 0.77 1.25 1.39 2.44CV 0.90 0.89 0.63 0.76
El metodo de Splines de tension ofrece resultados negativos pese a calcularse
con un valor de tension alto (100).
Cabe destacar la diferencia entre los metodos estadsticos y wlc en el apuntala-miento, claramente observable en los histogramas.
WLC
V
Fre
cu
en
cia
0 500 1000 1500
05000
10000
15000
20000
25000
Vor
V
Fre
cu
en
cia
0 500 1000 1500
05000
10000
15000
20000
IDW
V
Fre
cu
en
cia
0 500 1000 1500
05000
10000
15000
RST
V
Fre
cu
en
cia
0 500 1000 1500
05000
10000
15000
Figura 23: Histogramas de los conjuntos de datos
Modelizacion geoestadstica con R 27
4.1. Scripts
Listado 5: R-Script del tema 4
1 #TEMA 4 - ESTIMACION2 ps.options(family="Bookman",pointsize
=15)3 rm(list=ls())45 #Cargar los datos wlm6 library(lattice)7 library(gstat)8 data(walker)9 wlm
Modelizacion geoestadstica con R 28
coordenadas
Listado 7: Script para ps.map del metodoIDW
1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 label u
10 end11 vlines idwcontour12 color white13 width 0.514 end15 raster idw16 maploc 0.7 3 7 10171819 rectangle 0 390 260 30520 color black21 fcolor white22 end23 text 160 365 Inverso a la distancia
de V24 font Bookman25 size 1026 end27 text 20 385 Leyenda28 font Bookman29 size 630 end31 colortable y32 where 2 0.733 raster idw34 width 0.335 height 236 cols 637 font Bookman38 fontsize 839 color black40 end41 text 160 320 Equidistancia de curvas
= 250ppm42 font Bookman43 size 644 end45 text 160 345 Escala46 font Bookman47 size 648 end49 scalebar f50 where 5 2.151 length 5052 height 0.0553 segment 554 numbers 555 fontsize 856 end57 paper a4
58 left 0.559 right 0.560 bottom 0.561 top 0.562 end63 end
Listado 8: Script para ps.map del metodoRST
1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 label u
10 end11 vlines spcontour12 color white13 width 0.514 end15 raster splines16 maploc 0.7 3 7 10171819 rectangle 0 390 260 30520 color black21 fcolor white22 end23 text 160 365 Splines de Tension de V
(T=100)24 font Bookman25 size 1026 end27 text 20 385 Leyenda28 font Bookman29 size 630 end31 colortable y32 where 2 0.733 raster splines34 width 0.335 height 236 cols 637 font Bookman38 fontsize 839 color black40 end41 text 160 320 Equidistancia de curvas
= 250ppm42 font Bookman43 size 644 end45 text 160 345 Escala46 font Bookman47 size 648 end49 scalebar f50 where 5 2.151 length 5052 height 0.05
Modelizacion geoestadstica con R 29
53 segment 554 numbers 555 fontsize 856 end57 paper a458 left 0.559 right 0.560 bottom 0.561 top 0.562 end63 end
Listado 9: Script para ps.map del metodoPolgonos de influencia
1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 end
10 vareas clvorwle11 color black12 fcolor none13 end14 raster rvorwle15 maploc 0.7 3 7 10161718 rectangle 0 390 260 30519 color black20 fcolor white21 end22 text 160 365 Polgonos de influencia
de V
23 font Bookman24 size 1025 end26 text 20 385 Leyenda27 font Bookman28 size 629 end30 colortable y31 where 2 0.732 raster rvorwle33 width 0.334 height 235 cols 636 font Bookman37 fontsize 838 color black39 end40 text 160 345 Escala41 font Bookman42 size 643 end44 scalebar f45 where 5 2.146 length 5047 height 0.0548 segment 549 numbers 550 fontsize 851 end52 paper a453 left 0.554 right 0.555 bottom 0.556 top 0.557 end58 end
Modelizacion geoestadstica con R 30
Tema 5 Continuidad espacial de V
5.1. Variograma omnidireccional
El calculo del variograma omnidireccional con gstat es sencillo. En primer lugarse ha de crear un objeto de tipo gstat anadiendole los datos de trabajo. A continua-cion se ejecuta el comando variogram con las opciones pertinentes.
La opcion principal es el tamano de los lags. Ningun paquete de los consultados
permite elegir una tolerancia para incluir pares en cada lag, siendo unicamente GSLIBel que acepta este parametro, pero no en R. Otros parametros permiten obtener elmapa superficial o la nube de puntos o establecer restricciones de direccion como se
vera mas adelante.
En el script del tema se han creado diversas funciones para realizar graficas de
uno o varios variogramas presentando el numero de pares y una leyenda.
Si se muestra el variograma en R, aparece el listado con los lags, el numero depares, el valor del variograma, las direcciones horizontales y verticales (si las hubiera)
y la variable utilizada.
> gstatV varOmni varOmni
np dist gamma dir.hor dir.ver id1 565 7.291342 42743.67 0 0 V2 2072 15.022197 67877.29 0 0 V3 2948 24.783924 79062.05 0 0 V4 3210 34.757173 94338.18 0 0 V5 4044 44.673417 88377.42 0 0 V6 4265 54.887742 94888.71 0 0 V7 4926 64.548384 92944.57 0 0 V8 5196 74.614543 94322.57 0 0 V9 5533 84.724877 89014.25 0 0 V10 5167 94.880575 98948.24 0 0 V11 707 100.470981 86139.86 0 0 V
La figura 24 en la pagina siguiente muestra los variogramas omnidireccionales con
lags de tamano 5, 10, 15 y 20. Se descartan los extremos y entre el de 10 y el de 15
se opta por el de 10 por presentar equilibrio entre el numero de lags y la continuidad
buscada. El parametro que habra que modificar sera tal vez la distancia maxima
computada, para evitar el salto que aparece, dejandola en 80 metros en sucesivos
calculos.
5.2. Variograma superficial
Estableciendo la opcion map=TRUE se obtiene el variograma superficial, que puedeser grafiado con los comandos levelplot y contourplot (figs. 25 y 26). Estas image-nes pueden servir para conocer la existencia de anisotropa geometrica, mostrando los
ejes de maxima y mnima continuidad. Este metodo puede ser util para una primera
aproximacion, pero es difcil de cuantificar. Por esta razon se usaran los variogramas
direccionales.
5.3. Variogramas direccionales
5.3.1. Busqueda de los ejes de anisotropa
En lugar de tomar todos los pares para calcular el variograma, se puede establecer
una direccion determinada y una tolerancia angular para que solo se computen los
Modelizacion geoestadstica con R 31
0 20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
t = 5
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
t = 10
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
t = 15
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
t = 20
Figura 24: Variogramas omnidireccionales (i))
map.dx
map.d
y
100 50 0 50 100
100
50
0
50
100
40000
60000
80000
100000
120000
140000
160000
180000
200000
Figura 25: Mapa del variograma superficial
Modelizacion geoestadstica con R 32
map.dx
map.d
y
100 50 0 50 100
100
50
0
50
100
Figura 26: Isolneas del variograma superficial
pares de vectores en ese rango de direcciones. Comparando diferentes variogramas
direccionales se pueden obtener las direcciones de maxima y mnima continuidad .
En este trabajo se van a grafiar los variogramas cada 15 grados sexagesimales,
agrupados en dos graficos para que facilitar la lectura (fig 27). Para obtener numeri-
camente las direcciones de los ejes se ha procedido del siguiente modo: se establece
como valor de meseta 90.000ppm, a continuacion se halla la distancia a la que se
corresponde dicho valor de semivarianza interpolando linealmente los valores alrede-
dor de dicho valor. Por ultimo se ha creado un grafico donde en el eje de las ordenadas
se presentan las direcciones y en las abscisas la distancia obtenida.
Se comprueba el gran salto entre los grados 135 y 140 debido a que el resalte que
se observa en los variogramas desciende y por tanto la distancia avanza de forma
abrupta. En cualquier caso, los valores obtenidos, unos 160 grados de maximo y en
torno a los 90 grados de mnimo, se asemejan a los obtenidos en los apuntes de la
asignatura.
20 40 60 80 100
020000
40000
60000
80000
100000
Distancia
Sem
ivari
ogra
ma
0306090120150180
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
154575105135165
Figura 27: Variogramas direccionales
Modelizacion geoestadstica con R 33
Direccin
Dis
tan
cia
en
lag =
4
0 20 40 60 80 100 120 140 160 180
0 20 40 60 80 100 120 140 160 180
30
40
50
60
Figura 28: Deteccion de ejes de anisotropa
5.3.2. Obtencion de la tolerancia angular
Se pretende en este caso encontrar la tolerancia angular mas pequena posible que
haga el variograma representativo y mas adaptado por tanto a la direccion elegida. Se
trata en definitiva de un proceso repetitivo como el anterior, pero esta vez variaran las
tolerancias y se buscaran los numeros de pares en el primer lag (el que menos pares
suele presentar) mayor a 30 que a su vez generen un variograma que sea continuo
(figs 29 y 30).
Se observa que en los primeros variogramas la direccion de mnima continuidad
presenta un ((efecto hueco)) muy importante en la distancia 60, en cualquier caso
parece que 40 es una tolerancia suficiente.
5.4. Variogramas cruzados
Estos variogramas presentan la continuidad espacial entre variables. Se pueden
calcular por tanto los variogramas omnidireccionales y en las direcciones obtenidas
anteriormente. La figura 31 presenta estos tres variogramas y se puede apreciar como
tanto el omnidireccional como el de maxima continuidad no presentan grandes dis-
continuidades, el de mnima continuidad ofrece un aspecto poco clarificador debido
seguramente a la existencia de datos anomalos en alguna o ambas variables.
Modelizacion geoestadstica con R 34
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
tol = 15
Distancia
Sem
ivari
ogra
ma
234
464
396
424613 608
530588
754
640
tol = 15
73
303
487
587 829876
1092 1165 1254
1121
90160
20 40 60 80 100
020000
40000
60000
80000
100000
tol = 20
Distancia
Sem
ivari
ogra
ma
280
483
537729 694
696
982
799
903
902
tol = 20
115
458
704
828 1065
1174
1473 15981637
1481
90160
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
tol = 25
Distancia
Sem
ivari
ogra
ma
305
503
783822 891
968
1089
10711115
1090
tol = 25
118
546
883
985 1284
14731771 1889
1940
1806
90160
20 40 60 80 100
020000
40000
60000
80000
120000
tol = 30
Distancia
Sem
ivari
ogra
ma
320
585
1006 911
1296
1062
1392
11931464
1295
tol = 30
151
723
1094
11511562
17732052
2258
2302
2100
90160
Figura 29: Variogramas por tolerancias (i)
Modelizacion geoestadstica con R 35
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
tol = 35
Distancia
Sem
ivari
ogra
ma
329
744
1076
1171
1383
1368
15131624 1624
1539
tol = 35
161
856
1205
13611752
1993
23652485
2677
2415
90160
20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
tol = 40
Distancia
Sem
ivari
ogra
ma
334
895
1146
1368
1563
1520
1822 1769 1884
1816
tol = 40
179
980
1309
15821904
22712656
28552941
2728
90160
20 40 60 80 100
020000
40000
60000
80000
100000
tol = 45
Distancia
Sem
ivari
ogra
ma
343
1072
1362
1502
1847
1812
1998 20722181
2011
tol = 45
203
1058
1495
1708
2255
24392949
31033284
3002
90160
20 40 60 80 100
020000
40000
60000
80000
100000
tol = 50
Distancia
Sem
ivari
ogra
ma
359
1209
1627
1626
20502146
2228 22842476
2293
tol = 50
230
1114
1716
1856
2528
27103143 3354
3564
3230
90160
Figura 30: Variogramas por tolerancias (ii)
20 40 60 80 100 120
0e+00
1e+05
2e+05
3e+05
4e+05
5e+05
Distancia
Sem
ivari
ogra
ma
Cruzado85160
Figura 31: Variogramas cruzados
Modelizacion geoestadstica con R 36
5.5. Scripts
Listado 10: Funciones para imprimir va-
riogramas
1 #FUNCIONES PARA MOSTRAR VARIOGRAMAS2 #-------------Plotear el primer
variograma3 plotvar
Modelizacion geoestadstica con R 37
38 lp
Modelizacion geoestadstica con R 38
U")128 postscript("imgs/05/cross.ps")129 pintavars(varsCruz,colores,etiqs,
separaciones,"",posleyenda)
130 dev.off()
Modelizacion geoestadstica con R 39
Tema 6 Modelizacion del variograma experimental
Con el paquete gstat se puede modelizar el variograma a partir de los modelos mascomunes (efecto pepita puro, exponencial, esferico, gaussiano) y muchos mas. Para
verlos, basta con ejecutar la orden show.vgms()
distance
sem
ivari
an
ce
vgm(1,"Nug",0)
0.0 0.5 1.0 1.5 2.0 2.5 3.0
vgm(1,"Exp",1) vgm(1,"Sph",1)
0.0 0.5 1.0 1.5 2.0 2.5 3.0
vgm(1,"Gau",1)
0
1
2
3
vgm(1,"Exc",1)
0
1
2
3
vgm(1,"Mat",1) vgm(1,"Cir",1) vgm(1,"Lin",0) vgm(1,"Bes",1) vgm(1,"Pen",1)
vgm(1,"Per",1) vgm(1,"Hol",1) vgm(1,"Log",1) vgm(1,"Pow",1)
0
1
2
3
vgm(1,"Spl",1)
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0
1
2
3
vgm(1,"Err",0) vgm(1,"Int",0)
Figura 32: Modelos de variogramas disponibles
Para crear un modelo basta con utilizar la orden v.model. Una vez creado un mo-delo se puede anadir al objeto de tipo gstat para incluirlo junto con el variogramaexperimental. Por ejemplo si deseamos un modelo esferico bastara con indicar la me-
seta y el rango. Este modelo y el variograma se presentan graficamente en la figura 33
en la pagina siguiente.
> vgm(92000,"Sph",30)model psill range
1 Sph 92000 30
Pero los modelos pueden combinarse y formar ((estructuras imbricadas)) simple-
mente anadiendo su definicion unos sobre otros. As, podemos anadir crear un modelo
para el variograma direccional de 160o de la Variable V segun la siguiente definicion:
(h) = 22,000 + 40,000 Esf30(h) + 45,000 Esf150(h) (6)
Crea el modelo de la figura 34 y su definicion en R es la siguiente:> vgm(40e3,"Sph",30,add.to=vgm(22000,"Nug",add.to=vgm(45e3,"Sph",150)))model psill range
1 Sph 45000 1502 Nug 22000 03 Sph 40000 30
Modelizacion geoestadstica con R 40
Distancia
Sem
ivari
ogra
ma
20 40 60 80 100
20000
40000
60000
80000
Figura 33: Modelos esferico de rango 30 y meseta parcial de 92000ppm
Distancia
Sem
ivari
ogra
ma
20 40 60 80 100
20000
40000
60000
80000
Figura 34: Modelos de variograma combinados
Modelizacion geoestadstica con R 41
6.1. Estimacion automatizada del modelo
6.1.1. gstat
Tanto el paquete gstat como el paquete geoR proporcionan funciones para la esti-macion automatizada del modelo de variograma. En ambos casos deberemos ajustar
manualmente unos parametros iniciales para pasarlos como parametros de entrada,
junto con el variograma.
De este modo, si queremos modelar el variograma omnidireccional de V mediante
un modelo exponencial con efecto pepita, basta con proceder del siguiente modo (fig.
35):
> m mfit g print(g)data:V : formula = V1 ; locations = X + Y ; data dim = 470 x 6variograms:
model psill rangeV[1] Nug 186.3867 0.00000V[2] Exp 93809.2943 12.01007
Distancia
Sem
ivari
ogra
ma
20 40 60 80 100
20000
40000
60000
80000
Figura 35: Modelo de variograma de V ajustado
6.1.2. geoR
El paquete geoR proporciona una herramienta ciertamente interesante. Se tratade estimar de forma manual el modelo pero haciendo uso de una interfaz grafica de
usuario escrita en el lenguaje TclTk. Se pasa a la funcion eyefit el variograma amodelar y aparece un cuadro de dialogo donde es posible elegir el tipo de modelo y
sus parametros mediante barras deslizantes.
> library(geoR)
-------------------------------------------------------------
Functions for geostatistical data analysisFor an Introduction to geoR go to http://www.est.ufpr.br/geoRgeoR version 1.5-7 (built on 2005/06/07) is now loaded-------------------------------------------------------------
> geoV
Modelizacion geoestadstica con R 42
> vario.b vario.m vario.m2 vario.m2variofit: model parameters estimated by WLS (weighted least squares):covariance model is: exponentialparameter estimates:
tausq sigmasq phi14873.1088 79431.7551 13.4973
variofit: minimised weighted sum of squares = 612531182238
Modelizacion geoestadstica con R 43
0 50 100 150 200 250
050
100
150
200
250
300
X Coord
Y C
oord
0 500 1000 1500
050
100
150
200
250
300
data
Coord
Y
0 50 100 150 200 250
0500
1000
1500
Coord X
data
data
Fre
qu
en
cy
0 500 1000 1500
020
40
60
80
100
Figura 37: Descripcion de geoR del conjunto de datos
0 20 40 60 80 100
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
Distancia
Sem
ivari
ogra
ma
Figura 38: Modelo ajustado por geoR
Modelizacion geoestadstica con R 44
6.2. Scripts
Listado 12: R-Script del tema 6
1 # TEMA 6 MODELIZACION DEL VARIOGRAMA2 ps.options(family="Bookman",pointsize
=15)3 rm(list=ls())45 library(lattice)6 library(gstat)78 #Anadir las funciones programadas9 source("Variogramas.R")
1011 #Cargar los datos wlm12 data(walker)13 wlm
Modelizacion geoestadstica con R 45
Tema 8 Kriging
Denotado en la literatura en espanol como ((krigeado)), este conjunto de metodos
desarrollado por Denis Krige en los anos 50 del sigo XX es el metodo geoestadstico
mas ampliamente aceptado. El fin ultimo del estudio y modelizacion del variograma
es su aplicacion en este metodo para el calculo del valor de la variable en puntos
arbitrarios (generalmente una malla regular) mediante esta familia de metodos.
8.1. wlc
Antes de empezar a modelar los datos de wlm, se presentan las distribuciones de Uy V en wlc para poder compararlas con los modelos siguientes.
X
Y
50 100 150 200
50
100
150
200
250
0
200
400
600
800
1000
1200
1400
1600
(a) V
X
Y
50 100 150 200
50
100
150
200
250
0
1000
2000
3000
4000
5000
(b) U
Figura 39: Conjunto de datos wlc
8.2. Krigeado Ordinario (KO)
Para generar el krigeado antes necesitamos un conjunto de puntos sobre el que
calcular el krigeado. Para realizar las pruebas se ha empleado una malla regular de
unas 5000 celdas y para obtener los resultados finales se han empleado las localiza-
ciones del conjunto de datos wlc (78000).wlmGrid
Modelizacion geoestadstica con R 46
Error
Fre
cu
en
cia
500 0 500 1000
05000
10000
15000
20000
25000
30000
30 150610
1900
4409
8762
15587
29491
12274
3190
1128326 99 29 8 6 2
Figura 40: Error del Krigeado ordinario
8.3. Krigeado Universal (KU)
El krigeado Universal introduce un modelo de tendencia al considerar que la media
local para cada localizacion no es constante. Basta con cambiar la formula de la orden
krige a VX+Y para que se ejecute esta variedad del krigeado.KU
Modelizacion geoestadstica con R 47
Error
Fre
cu
en
cia
500 0 500 1000
05000
10000
15000
20000
25000
30000
22 142618
1919
4405
8874
15624
30154
11348
3206
1160383 101 29 8 6 2
Figura 41: Error del Krigeado universal
Error
Fre
cu
en
cia
500 0 500 1000
05000
10000
15000
20000
25000
30000
16 111584
1869
4673
9198
15307
29782
11473
3318
1207335 89 26 6 5 2
Figura 42: Error del Krigeado universal por bloques
Modelizacion geoestadstica con R 48
Si se utilizan los parametros nmax y distmax operan ambos criterios
Este metodo tambien se puede combinar con el krigeado ordinario o universal y
el krigeado puntual o por bloques. En este trabajo se ha realizado el krigeado local
universal de la variable V indicando una distancia maxima de 15 metros y un numero
mnimo de 4 puntos (figs 45(d) y 46(d)).
KUL
Modelizacion geoestadstica con R 49
#Crear el objeto gstat y anadir las localizacionesg
Modelizacion geoestadstica con R 50
Error
Fre
cu
en
cia
0 2000 4000 6000 8000
010000
20000
30000
40000
50000
22
14892
50962
7493
26001131492195 96 62 27 12 6 0 4 0 3 3 0 0 1
(a) Error del CKO
Error
Fre
cu
en
cia
2000 0 2000 4000 6000 8000 10000
010000
20000
30000
40000
3 22 59294
22081
42942
8044
2657107743519995 50 23 7 4 1 3 0 2 1 1 0 0 1
(b) Error del UKO
Figura 44: Diferencias con wlc de la modelizacion de U
Modelizacion geoestadstica con R 51
8.7. Resultados
8.7.1. Modelizacion de V
A continuacion se muestran los resultados de los metodos de krigeado empleados
para modelar la variable V, as como sus predicciones de error. Por ultimo se compa-
ran se muestran los estadsticos de las diferencias entre los valores estimados y los
valores reales (wlc).En el diagrama de cajas (fig. 47 en la pagina 53) se aprecia como el krigeado
por bloques parece que ofrece el resultado con menos outliers al contrario que el
krigeado local. Ademas el krigeado local no consigue dar valores a todos los puntos,
pese a indicar una distancia maxima de 30 metros. El krigeado por bloques ofrece
diferencias tanto maximas como mnimas mas pequenas que el resto (cuadro 2 en la
pagina siguiente).
X
Y
50 100 150 200
50
100
150
200
250
0
200
400
600
800
1000
1200
1400
1600
(a) KO
X
Y
50 100 150 200
50
100
150
200
250
0
200
400
600
800
1000
1200
1400
1600
(b) KU
X
Y
50 100 150 200
50
100
150
200
250
0
200
400
600
800
1000
1200
1400
1600
(c) KUB
X
Y
50 100 150 200
50
100
150
200
250
0
200
400
600
800
1000
1200
1400
1600
(d) KUL
Figura 45: Prediccion en la modelizacion de V (wlm)
8.7.2. Modelizacion de U
Viendo la prediccion del cokrigeado, se observa que el resultado no es demasia-
do satisfactorio, seguramente porque la modelizacion del variograma, al restringir al
Modelizacion geoestadstica con R 52
X
Y
50 100 150 200
50
100
150
200
250
0
50
100
150
200
250
300
350
(a) KO
X
Y
50 100 150 200
50
100
150
200
250
0
50
100
150
200
250
300
350
(b) KU
X
Y
50 100 150 200
50
100
150
200
250
0
50
100
150
200
250
300
350
(c) KUB
X
Y
50 100 150 200
50
100
150
200
250
0
50
100
150
200
250
300
350
(d) KUL
Figura 46: Desviacion tpica en la modelizacion de V (wlm)
Cuadro 2: Estadsticos de los errores en los metodos de krigeado de V
Estadsticos
KO KU KUB KUL
Media 5.77 4.35 4.47 -4.13
Mnimo -686.11 -684.74 -645.48 -928.96
Q1 -71.55 -72.55 -76.87 -80.85
Q2 28.6 25.94 28.71 12.572
Q3 89.31 84.83 86.51 77.19
Max. 967.39 967.42 913.93 969.61
Var. 21394.29 21344.87 21325.76 22621.25
Desv. 146.27 146.10 146.03 150.40
CS -0.39 -0.34 -0.32 -0.32
K 1.45 1.47 1.23 1.86
CV 25.34 33.56 32.68 -36.42
Modelizacion geoestadstica con R 53
KO
KU
KU
BK
UL
1000 500 0 500 1000
Figura 47: Diagramas de caja y bigote de las diferencias
Modelizacion geoestadstica con R 54
mismo rango a los modelos tanto de U, como de V y el cruzado, a generado una peor
modelizacion final. As y todo, el cokrigeado a dado valores maximos y mnimos meno-
res al ordinario y el resto de parametros estadsticos no son muy diferentes (cuadro 3
en la pagina siguiente).
X
Y
50 100 150 200
50
100
150
200
250
0
1000
2000
3000
4000
5000
(a) CKO
X
Y
50 100 150 200
50
100
150
200
250
0
1000
2000
3000
4000
5000
(b) UKO
Figura 48: Prediccion en la modelizacion de U (wlm)
X
Y
50 100 150 200
50
100
150
200
250
0
100
200
300
400
500
600
700
800
(a) CKO
X
Y
50 100 150 200
50
100
150
200
250
0
100
200
300
400
500
600
700
800
(b) UKO
Figura 49: Desviacion tpica en la modelizacion de U (wlm)
Modelizacion geoestadstica con R 55
Cuadro 3: Estadsticos de los errores en los metodos de krigeado de U
Estadsticos
CKO UKO
Media -250.44 -255.68
Mnimo -1366.57 -2625.11
Q1 -487.89 -506.54
Q2 -404.07 -418.417
Q3 -196.54 -158.85
Max. 8973.018 9034.47
Var. 197185.3 197649.9
Desv. 444.05 444.58
CS 3.78 3.30
K 25.17 21.42
CV -1.77 -1.74
Modelizacion geoestadstica con R 56
8.8. Scripts
Listado 13: R-Script del tema 8
1 # TEMA 8 KRIGING2 ps.options(family="Bookman",pointsize
=15)3 # rm(list=ls())45 library(lattice)6 library(gstat)78 #Funcion que devuelve estadsticas9 calcestads
Modelizacion geoestadstica con R 57
85 dev.off()868788 #KRIGEADO UNIVERSAL POR BLOQUES89 print("Calculando KUB...")90 KUB
Modelizacion geoestadstica con R 58
171 postscript("imgs/08/UKO%01d.ps",onefile=FALSE)
172 graf1
Modelizacion geoestadstica con R 59
Referencias
[1] MARTINEZ LLARIO, JOSE CARLOS y COLL ALIAGA, ELOINA, Apuntes de geoestadsti-
ca basica. Aplicaciones mediante Sistemas de Informacion Geografica, UPV, Valen-
cia, 2005.
[2] PEBESMA, EDZER J., gstats user manual, Dept. of Physical Geography, Utrecht
University, Utretch, Holanda, 2001.
URL http://www.gstat.org
[3] PEBESMA, EDZER J., Multivariable geostatistics in S: the gstat package, Computers
& Geosciences, tomo 30, pags. 683691, 2004.
[4] R DEVELOPMENT CORE TEAM, Introduccion a R, R Foundation for Statistical Com-
puting, Vienna, Austria, 2000.
[5] R DEVELOPMENT CORE TEAM, R: A language and environment for statistical com-
puting, R Foundation for Statistical Computing, Vienna, Austria, 2004, ISBN 3-
900051-07-0.
URL http://www.R-project.org
[6] RIBEIRO, PAULO J. JR y DIGGLE, PETER J., geoR: a package for geostatistical
analysis, R-NEWS, tomo 1(2), pags. 1418, 2001, iSSN 1609-3631.
URL CRAN://doc/Rnews/
[7] SARKAR, DEEPAYAN, lattice: Lattice Graphics, 2004, r package version 0.10-16.
IntroduccinRgstatGRASSDatos de trabajo
Descripcin univariadaCarga y visualizacin de los datosMtodos grficos para la descripcin univariadaMtodos numricosScripts
Descripcin bivariadaMtodos grficosMtodos numricosScripts
Descripcin espacialVisualizacin espacial de datosVentanas mviles y el efecto proporcionalContinuidad espacialVariogramaDiagramas de dispersin cruzadosScripts
Estimacin. Mtodos deterministasScripts
Continuidad espacial de VVariograma omnidireccionalVariograma superficialVariogramas direccionalesVariogramas cruzadosScripts
Modelizacin del variograma experimentalEstimacin automatizada del modeloScripts
KrigingwlcKrigeado Ordinario (KO)Krigeado Universal (KU)Krigeado por bloques (KUB)Krigeado Local (KUL)Cokrigeado (CKO)ResultadosScripts