main-100625173233-phpapp02

Embed Size (px)

Citation preview

  • Geoestadstica con RJorge Gaspar Sanz Salinas

    Septiembre de 2005

    Resumen: A lo largo de la asignatura de doctorado Prediccion y analisis de modelos

    superficiales mediante sistemas de informacion geografica se ha cubierto el desarrollo

    del estudio de la distribucion espacial de una o varias variables, as como su modeli-

    zacion mediante metodos geoestadsiticos (krigeado). En este trabajo se presenta un

    resumen de dicho desarrollo utilizando los mismos datos de partida pero empleando

    para el mismo herramientas de Software Libre, principalmente una herramienta es-

    tadstica R y un Sistema de Informacion Geografica, GRASS, ambos funcionando bajoel Sistema Operativo Linux.

    Indice

    0. Introduccion 4

    0.1. R . . . . . . . . . . . . . . . . 40.2. gstat . . . . . . . . . . . . . . 40.3. GRASS . . . . . . . . . . . . . 50.4. Datos de trabajo . . . . . . . 5

    1. Descripcion univariada 6

    1.1. Carga y visualizacion de los

    datos . . . . . . . . . . . . . . 6

    1.2. Metodos graficos para la

    descripcion univariada . . . 6

    1.3. Metodos numericos . . . . . 9

    1.4. Scripts . . . . . . . . . . . . . 10

    2. Descripcion bivariada 12

    2.1. Metodos graficos . . . . . . . 12

    2.2. Metodos numericos . . . . . 13

    2.3. Scripts . . . . . . . . . . . . . 14

    3. Descripcion espacial 15

    3.1. Visualizacion espacial de

    datos . . . . . . . . . . . . . . 15

    3.2. Ventanas moviles y el efecto

    proporcional . . . . . . . . . 18

    3.3. Continuidad espacial . . . . 18

    3.4. Variograma . . . . . . . . . . 20

    3.5. Diagramas de dispersion

    cruzados . . . . . . . . . . . 20

    3.6. Scripts . . . . . . . . . . . . . 20

    4. Estimacion. Metodos determi-

    nistas 24

    4.1. Scripts . . . . . . . . . . . . . 27

    5. Continuidad espacial de V 30

    5.1. Variograma omnidireccional 30

    5.2. Variograma superficial . . . 30

    5.3. Variogramas direccionales . 30

    5.4. Variogramas cruzados . . . . 33

    5.5. Scripts . . . . . . . . . . . . . 36

    6. Modelizacion del variograma ex-

    perimental 39

    6.1. Estimacion automatizada

    del modelo . . . . . . . . . . 41

    6.2. Scripts . . . . . . . . . . . . . 44

    8. Kriging 45

    8.1. wlc . . . . . . . . . . . . . . . 458.2. Krigeado Ordinario (KO) . . . 45

    8.3. Krigeado Universal (KU) . . . 46

    8.4. Krigeado por bloques (KUB) 46

    8.5. Krigeado Local (KUL) . . . . 46

    8.6. Cokrigeado (CKO) . . . . . . 48

    8.7. Resultados . . . . . . . . . . 51

    8.8. Scripts . . . . . . . . . . . . . 56

  • Modelizacion geoestadstica con R 2

    Indice de figuras

    1. Distribucion de U y V . . . . 6

    2. Histograma de V . . . . . . . 7

    3. Histograma acumulado de V 7

    4. Grafico de probabilidad

    uniforme de V . . . . . . . . 7

    5. Grafico de probabilidad

    normal . . . . . . . . . . . . . 8

    6. Grafico de probabilidad log-

    normal . . . . . . . . . . . . . 8

    7. Grafico de caja y bigotes de V 9

    8. Grafico de caja y bigotes de

    V y U . . . . . . . . . . . . . . 12

    9. Grafico de cuantiles de V y U 12

    10. Grafico de dispersion . . . . 13

    11. Distribucion de V . . . . . . 15

    12. Mapa graduado de color de V 16

    13. Mapa graduado de tamano

    de V . . . . . . . . . . . . . . 16

    14. Mapas de indicadores . . . . 17

    15. Mapa de superficie interpo-

    lada . . . . . . . . . . . . . . 18

    16. Media y varianza en venta-

    na de 3x3 . . . . . . . . . . . 19

    17. Grafico de dispersion de

    media y varianza . . . . . . . 19

    18. h-Scatterplots de direccion

    N-S . . . . . . . . . . . . . . . 20

    19. h-Scatterplots de direccion

    E-W . . . . . . . . . . . . . . 21

    20. h-Scatterplots cruzado de U

    y V en direccion N-S . . . . . 21

    21. Distribucion de wlm . . . . . 2422. Mapas generados por GRASS 2523. Histogramas de los conjun-

    tos de datos . . . . . . . . . . 26

    24. Variogramas omnidireccio-

    nales (i)) . . . . . . . . . . . . 31

    25. Mapa del variograma su-

    perficial . . . . . . . . . . . . 31

    26. Isolneas del variograma

    superficial . . . . . . . . . . . 32

    27. Variogramas direccionales . 32

    28. Deteccion de ejes de aniso-

    tropa . . . . . . . . . . . . . 33

    29. Variogramas por toleran-

    cias (i) . . . . . . . . . . . . . 34

    30. Variogramas por toleran-

    cias (ii) . . . . . . . . . . . . . 35

    31. Variogramas cruzados . . . . 35

    32. Modelos de variogramas

    disponibles . . . . . . . . . . 39

    33. Modelos esferico de ran-

    go 30 y meseta parcial de

    92000ppm . . . . . . . . . . 40

    34. Modelos de variograma

    combinados . . . . . . . . . . 40

    35. Modelo de variograma de V

    ajustado . . . . . . . . . . . . 41

    36. Modelado interactivo del va-

    riograma . . . . . . . . . . . . 42

    37. Descripcion de geoR delconjunto de datos . . . . . . 43

    38. Modelo ajustado por geoR . 4339. Conjunto de datos wlc . . . . 4540. Error del Krigeado ordinario 46

    41. Error del Krigeado universal 47

    42. Error del Krigeado univer-

    sal por bloques . . . . . . . . 47

    43. Error del Krigeado local

    universal . . . . . . . . . . . 48

    44. Diferencias con wlc de lamodelizacion de U . . . . . . 50

    45. Prediccion en la modeliza-

    cion de V (wlm) . . . . . . . . 5146. Desviacion tpica en la mo-

    delizacion de V (wlm) . . . . . 5247. Diagramas de caja y bigote

    de las diferencias . . . . . . . 53

    48. Prediccion en la modeliza-

    cion de U (wlm) . . . . . . . . 5449. Desviacion tpica en la mo-

    delizacion de U (wlm) . . . . . 54

    Indice de cuadros

    1. Resumen de estadsticos de

    datos de validacion y esti-

    mados . . . . . . . . . . . . . 26

    2. Estadsticos de los errores

    en los metodos de krigeado

    de V . . . . . . . . . . . . . . 52

    3. Estadsticos de los errores

    en los metodos de krigeado

    de U . . . . . . . . . . . . . . 55

  • Modelizacion geoestadstica con R 3

    Indice de listados

    1. R-Script del tema 1 . . . . . . 10

    2. R-Script del tema 2 . . . . . . 14

    3. R-Script en Linux del tema 3 . 224. R-Script en Windows del te-

    ma 3 . . . . . . . . . . . . . . 23

    5. R-Script del tema 4 . . . . . . 27

    6. Script para GRASS . . . . . . 277. Script para ps.map del

    metodo IDW . . . . . . . . . 28

    8. Script para ps.map delmetodo RST . . . . . . . . . . 28

    9. Script para ps.map delmetodo Polgonos de in-

    fluencia . . . . . . . . . . . . 29

    10. Funciones para imprimir

    variogramas . . . . . . . . . . 36

    11. R-Script del tema 5 . . . . . . 36

    12. R-Script del tema 6 . . . . . . 44

    13. R-Script del tema 8 . . . . . . 56

  • Modelizacion geoestadstica con R 4

    Tema 0 Introduccion

    0.1. R

    R [5] es un conjunto integrado de herramientas para manipular datos, realizar todotipo de calculos con los mismos y tambien es capaz de realizar toda clase de graficos

    estadsticos.

    En [4] se citan las siguientes caractersticas:

    es multiplataforma,

    almacenamiento y manipulacion efectiva de datos,

    operadores para calculo sobre variables indexadas (Arrays), en particular matri-

    ces,

    una amplia, coherente e integrada coleccion de herramientas para analisis de

    datos,

    posibilidades graficas para analisis de datos, que funcionan directamente sobre

    pantalla o impresora,

    y un lenguaje de programacion bien desarrollado, simple y efectivo, que incluye

    condicionales, ciclos, funciones recursivas y posibilidad de entradas y salidas.

    (Debe destacarse que muchas de las funciones suministradas con el sistema

    estan escritas en el lenguaje R).

    R puede extenderse mediante paquetes. En Linux, basta con ejecutar el comandoinstall.packages(paquete) para conectar a la red de servidores CRAN (Comprehen-sive R Archive Network) descarga el codigo fuente y si se dispone de los compiladores

    pertinentes (C++, Fortran, ...) genera los binarios adaptados perfectamente a la maqui-na. En Windows, al ejecutar dicho comando se descargan directamente los binarios.En esta ultima plataforma se dispone de una interfaz grafica un poco mas elaborada

    y permite ademas exportar al formato Windows MetaFile.Los paquetes empleados en el trabajo, ademas de los que se incluyen por defecto en

    R son los paquetes de geoestadstica gstat [3], y geoR [6], y el paquete para presentacionde graficos lattice [7].

    En definitiva, se dispone de un sistema ampliable que se maneja como una consola

    de entrada de comandos que permite adquirir datos desde ficheros, manipularlos,

    crear nuevos datos y por ultimo o bien ver las graficas por pantalla o mandarlas a

    ficheros PostScript o raster. Otra caracterstica importante es la posibilidad de ejecutarsecuencias de comandos en forma de scripts.

    0.2. gstatgstat [2] es un software para llevar a cabo modelizacion, prediccion y simulacion de

    datos geoestadsticos. Al igual que el anterior, es Software Libre bajo licencia (GNU1).

    Puede usarse de muy diversas formas, directamente tanto de forma no interactiva

    (mediante ficheros de parametros) como interactiva mostrando los resultados utili-

    zando el programa para presentacion de graficos gnuplot. Pero su uso mas interesantees integrado con otras herramientas. En este sentido se ha conseguido que gstat fun-cione con GRASS, Idrisi, PCRaster y con R.

    1http://www.gnu.org

  • Modelizacion geoestadstica con R 5

    En este trabajo se ha usado con R porque este ultimo ofrece caractersticas muyinteresantes para la manipulacion de datos, presentacion de todo tipo de graficas y

    repeticion de tareas mediante sentencias de control (bucles, condicionales, etc). Por

    otro lado, no ha sido posible compilar gstat para que trabaje conjuntamente con GRASSen su version 6.

    0.3. GRASSEste ya veterano software para la gestion de informacion geografica dispone de

    herramientas para la modelizacion de variables espaciales mediante metodos deter-

    minsticos. Se ha usado en este trabajo para la obtencion de la modelizacion por

    polgonos de influencia (Voronoi), Splines de tension y por el metodo de pesos inver-

    sos a la distancia.

    Ademas se ha utilizado para la presentacion de la cartografa, maquetando senci-

    llos mapas con salida PostScript.

    0.4. Datos de trabajo

    Los datos con los que se va a trabajar durante todo el proyecto son los utilizados

    en el libro Applied Geostatistics de Issaks y Srivastava. El conjunto de datos walkeresta a su vez dividido en tres grupos, wlc que es una malla de 78000 puntos quesirven para validacion, wlm es la malla irregular de 470 puntos y wle una malla de 100puntos para algunos calculos estadsticos.

    gstat dispone del conjunto wlm, los otros dos seran cargados desde ficheros de textoseparados por comas (CSV) para poder operar con ellos.

  • Modelizacion geoestadstica con R 6

    Tema 1 Descripcion univariada

    1.1. Carga y visualizacion de los datos

    En este captulo se van a usar los datos wle redondeados a valores enteros. Elprimer paso sera por tanto cargar el fichero walker10.asc, que es un fichero detexto separado por tabuladores que se puede importar directamente con la orden

    read.delim2 para a continuacion redondearlo.En la figura 1 se muestra la distribucion de los datos, as como los valores que

    toman las variables U y V.

    12 14 16 18 20

    242

    244

    246

    248

    250

    X

    Y

    22 28 4 32 38 20 0 14 31 34

    16 17 11 29 37 55 11 3 34 35

    14 15 15 15 16 17 13 2 40 38

    14 15 15 16 17 18 14 6 28 25

    15 16 16 23 24 25 7 15 21 20

    21 18 20 27 29 19 7 16 19 22

    21 8 27 27 32 4 10 15 17 19

    16 9 22 24 25 10 7 19 19 22

    16 7 34 36 29 7 4 18 18 20

    15 12 24 27 30 0 2 18 18 18

    87 100 47 111 124 109 0 98 134 144

    77 84 74 108 121 143 91 52 136 144

    75 80 83 87 94 99 95 48 139 145

    74 80 85 90 97 101 96 72 128 130

    77 82 86 101 109 113 79 102 120 121

    89 88 94 110 116 108 73 107 118 127

    88 70 103 111 122 64 84 105 113 123

    82 74 97 105 112 91 73 115 118 129

    82 61 110 121 119 77 52 111 117 124

    81 77 103 112 123 19 40 111 114 120

    Figura 1: Distribucion de U y V

    1.2. Metodos graficos para la descripcion univariada

    El metodo grafico mas utilizado es el histograma, en el que debemos integrar la

    variable en clases. La variable V se vara entre 0ppm y 145ppm por lo que dividirla enclases de 10 unidades es conveniente (fig. 2 en la pagina siguiente).

    Otro grafico interesante es el histograma acumulado en el que a partir de las

    mismas clases del histograma anterior se muestra la suma acumulada (fig 3 en la

    pagina siguiente).

    El grafico de probabilidad acumulada muestra la proporcion de datos para cada

    punto que son menores que el (fig 4 en la pagina siguiente)

    Las figuras 5 en la pagina 8 y 6 en la pagina 8 muestran la similitud de nuestra

    muestra con la distribucion normal y lognormal. Las lneas trazadas pasan por el

    primer y tercer cuartil.

  • Modelizacion geoestadstica con R 7

    V

    Fre

    qu

    en

    cy

    1 1

    0

    1

    2 2

    3

    14

    15

    11

    14

    17

    12

    3

    40

    24

    68

    10

    12

    14

    16

    0 50 100 150

    Figura 2: Histograma de V

    0 10 20 30 40 50 60 70 80 90 100 120 140

    Variable

    Fre

    cu

    en

    cia

    acu

    mu

    lada

    020

    40

    60

    80

    100

    Figura 3: Histograma acumulado de V

    0 50 100 150

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    V

    Pro

    babilid

    ad a

    cu

    mu

    lada

    Figura 4: Grafico de probabilidad uniforme de V

  • Modelizacion geoestadstica con R 8

    0 50 100 150

    2

    1

    01

    2

    Sample Quantiles

    Th

    eore

    tical Q

    uan

    tile

    s

    Figura 5: Grafico de probabilidad normal

    3.0 3.5 4.0 4.5 5.0

    2

    1

    01

    2

    Sample Quantiles

    Th

    eore

    tical Q

    uan

    tile

    s

    Figura 6: Grafico de probabilidad lognormal

  • Modelizacion geoestadstica con R 9

    1.3. Metodos numericos

    1.3.1. Medidas de localizacion

    Se puede solicitar una descripcion sencilla de nuestros datos con el comando

    summary(V) que devuelve tanto los valores maximos y mnimos, la media, la me-diana y el segundo y tercer cuartil. En cualquier caso estan disponibles comandos

    como min, max, mean y median.Para calcular la moda no hay un comando definido, pero a partir de la tabla defi-

    nida del corte de V (tcutV) donde se almacenan las frecuencias relativas en las clasesdefinidas previamente (secV), podemos solicitar aquella clase que almacene el valormaximo con el comando tcutV[tcutV==max(tcutV)].

    En resumen:

    Mnimo 0

    Maximo 145

    Media 100.5

    Mediana 97.55

    Moda 110-120

    Rango 145

    R puede calcular cualquier cuantil de una muestra, por ejemplo los cuartiles conel comando quantile y pasando un vector con los valores de los cuantiles a obtener,en este caso una secuencia de 0 a 1 cada 0.25 unidades:

    > print(cuantiles dt dt2;dt;as.numeric(cuantiles["75%"]-cuantiles["25%"])

  • Modelizacion geoestadstica con R 10

    [1] 695.3409[1] 26.36932[1] 34.5

    1.3.3. Medidas de forma

    El coeficiente de sesgo o asimetra (skewness) se calcula a partir de la formula

    CS =1n

    ni=1 (xi m)

    3

    3(1)

    El coeficiente de curtosis o apuntalamiento se calcula como

    K =

    ni=1

    (xim)4

    n

    4 3 (2)

    El coeficiente de variacion no es mas que el cociente entre la desviacion tpica y la

    media, siendo trivial su calculo.

    En R estos tres coeficientes se calculan como:> media print(CS print(K print(CV

  • Modelizacion geoestadstica con R 11

    4849 logV

  • Modelizacion geoestadstica con R 12

    Tema 2 Descripcion bivariada

    2.1. Metodos graficos

    La visualizacion de pares de histogramas y sobre todo de graficos de caja y bigotes

    ( 8)pueden aportar informacion de como son dos variables.

    VU

    0 50 100 150

    Vari

    able

    s

    Figura 8: Grafico de caja y bigotes de V y U

    El diagrama de cuantiles muestra cada cuantil de una variable contra el mismo

    cuantil de la otra formando un grafico de puntos. Si estos puntos adoptan la forma de

    una lnea significa que ambas variables son similares pero su localizacion y dispersion

    son diferentes.

    0 50 100 150

    0

    10

    20

    30

    40

    50

    V

    U

    0%

    25%

    50%

    75%

    100%

    U=V

    Cuartiles

    Figura 9: Grafico de cuantiles de V y U

    Por ultimo, el diagrama de dispersion ( 10 en la pagina siguiente)puede mostrar

    informacion sobre las tendencias de ambas variables y la existencia de outliers que

  • Modelizacion geoestadstica con R 13

    pueden ser susceptibles de ser eliminados.

    0 50 100 150

    010

    20

    30

    40

    50

    V

    U

    Figura 10: Grafico de dispersion

    2.2. Metodos numericos

    El coeficiente de correlacion o de Pearson es el indicador mas utilizado para com-

    probar la relacion entre variables, en R se corresponde con el comando cor(U,V).

    =1n

    ni=1 (xi mx) (yi my)

    x y(3)

    El numerador de esta ultima ecuacion es otro indicador, la covarianza, que se

    obtiene con el comando cov(U,V).El coeficiente de correlacion de orden utiliza el orden en que aparece un valor

    determinado en lugar de su propio valor. Por esta razon este coeficiente es menos

    sensible a valores extremos y por tanto, si difiere mucho del coeficiente de Pearson

    indica la existencia de estos valores extremos. En R se obtiene con el mismo comandoque el de correlacion, pero cambiando el metodo.

    Orden =1n

    ni=1 (Rxi mRx) (Ryi mRy)

    Rx Ry(4)

    > cov(U,V);cor(U,V,method="pearson");cor(U,V,method="spearman")[1] 218.2778[1] 0.8393395[1] 0.8576604

  • Modelizacion geoestadstica con R 14

    2.3. Scripts

    Listado 2: R-Script del tema 2

    1 #TEMA 2 - DESCRIPCION BIVARIADA2 ps.options(family="Bookman",pointsize

    =15)3 rm(list=ls())45 #Cargar wle y redondearlo6 wle

  • Modelizacion geoestadstica con R 15

    Tema 3 Descripcion espacial

    3.1. Visualizacion espacial de datos

    3.1.1. Mapas de localizacion

    Se trata de trazar un mapa de puntos e indicar por ejemplo los 10 valores maximos

    y los 10 valores mnimos. En R se trata de obtener los conjuntos de datos de wle conlos valores maximos y mnimos y pintarlos sobre un mapa de localizacion de V.

    12 14 16 18 20

    240

    242

    244

    246

    248

    250

    X

    Y

    87 100 47 111 124 109 0 98 134 144

    77 84 74 108 121 143 91 52 136 144

    75 80 83 87 94 99 95 48 139 145

    74 80 85 90 97 101 96 72 128 130

    77 82 86 101 109 113 79 102 120 121

    89 88 94 110 116 108 73 107 118 127

    88 70 103 111 122 64 84 105 113 123

    82 74 97 105 112 91 73 115 118 129

    82 61 110 121 119 77 52 111 117 124

    81 77 103 112 123 19 40 111 114 120

    MximosMnimos

    Figura 11: Distribucion de V

    3.1.2. Mapas de smbolos graduados

    Utilizando la biblioteca lattice, se pueden generar mapas de smbolos graduadospor color con el comando levelplot. R dispone de diferentes paletas de color, peroen este caso se usara una escala de grises.

    Otro tipo de mapa es el de gradacion de smbolos por tamano. En este caso el

    paquete gstat proporciona el comando bubble. El resultado es mejorable, pero sirvea modo de ejemplo.

    3.1.3. Mapas de indicadores

    Se trata de mapas graduados de color con solo dos niveles. El umbral entre ambos

    niveles se va variando y se observa el conjunto de mapas generados. Estos mapas

    pueden mostrar alineaciones en la distribucion espacial de la variable y la ubicacion

    de maximos y mnimos. Las figuras 14(c) y 14(d) muestran la alineacion norte-sur de

    los datos.

  • Modelizacion geoestadstica con R 16

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    Figura 12: Mapa graduado de color de V

    V

    x

    y

    12 14 16 18 20

    242

    244

    246

    248

    250

    081.75100.5116.25145

    Figura 13: Mapa graduado de tamano de V

  • Modelizacion geoestadstica con R 17

    Umbral = 73.375

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (a) Cuantil 12.5 %

    Umbral = 81.75

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (b) Cuantil 25 %

    Umbral = 89.125

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (c) Cuantil 37.5 %

    Umbral = 100.5

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (d) Cuantil 50 %

    Umbral = 109.875

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (e) Cuantil 62.5 %

    Umbral = 116.25

    X

    Y

    12 14 16 18

    242

    244

    246

    248

    0

    20

    40

    60

    80

    100

    120

    140

    (f) Cuantil 75 %

    Figura 14: Mapas de indicadores

  • Modelizacion geoestadstica con R 18

    3.1.4. Mapas de superficies interpoladas

    Es posible interpolar polinomios de un orden determinado, que pasen por todos

    los puntos de la muestra. Estos polinomios suelen ofrecer superficies suavizadas pero

    que muestran las tendencias y la distribucion de la variable.

    Para poder obtener estos polinomios en R, se ha de cargar el paquete spatial quedispone de la funcion surf.ls que obtiene el mejor polinomio de hasta grado 6 que seajusta a los datos mediante mnimos cuadrados (fig. 15). Este mapa ha sido generado

    en Windows ya que el paquete spatial no ha sido posible instalarlo en Linux, por loque el script que genera este grafico esta separado del resto del tema.

    12 14 16 18 20

    242

    244

    246

    248

    250

    Figura 15: Mapa de superficie interpolada

    3.2. Ventanas moviles y el efecto proporcional

    Se pueden trazar mapas en las que el valor de cada punto es la media o la varianza

    de sus vecinos. Por lo tanto se crea una ventana movil de tamano impar que va

    recorriendo los valores. En R esta operacion requiere algo de programacion que seincluye en el script del tema y que se presenta en la figura 16 en la pagina siguiente.

    Un grafico de dispersion entre las medias y las varianzas demuestra la existencia

    de una relacion entre ambas. En este caso, en la figura 17 en la pagina siguiente, se

    puede ver que ambas medidas no estan correladas, siendo el coeficiente de correlacion

    () bastante bajo.

    3.3. Continuidad espacial

    3.3.1. Diagramas de dispersion de tipo h

    Este tipo de diagramas muestran contrapuestas la variable contra esta a una dis-

    tancia determinada. Cuando los datos estan en forma de malla, se pueden obtener

    de forma sencilla los mapas de dispersion en las direcciones norte-sur y este-oeste a

    diferentes distancias.

    Obtener estos diagramas en R es relativamente sencillo debido a la flexibilidad enla manipulacion de variables indexadas (arrays). Se han obtenido los diagramas con

  • Modelizacion geoestadstica con R 19

    12 14 16 18 20

    242

    244

    246

    248

    250

    X

    Y

    85.22

    235.94

    85.22

    255.19

    87.22

    111.69

    86.33

    90.25

    83.89

    39.36

    80.22

    17.94

    79.11

    18.61

    78.56

    201.78

    95.56

    409.53

    94.67

    443.25

    94.67

    220.5

    93.89

    186.86

    90.67

    92.75

    86

    42.5

    85.67

    91.25

    86

    377.5

    111.33

    75.75

    111.11

    72.86

    107.78

    79.94

    105.78

    122.94

    98.67

    123.5

    92.44

    74.03

    93.22

    199.44

    94.33

    611.5

    97.67

    1095.75

    102.44

    428.53

    104.33

    300.25

    106

    281

    105

    69.5

    99

    69.75

    104.44

    311.53

    110.67

    289.25

    78.44

    1332.03

    88.22

    616.94

    93.67

    459.75

    96.44

    457.78

    99.11

    219.86

    98.11

    93.36

    104.11

    288.36

    97.33

    1628.25

    76.56

    1165.53

    85.78

    468.19

    91.11

    342.86

    92.78

    320.44

    94.56

    248.78

    89.44

    392.78

    88.56

    823.28

    81.67

    1753

    94.56

    955.28

    98.67

    553.25

    100.67

    353.25

    100.11

    299.61

    99.44

    441.03

    97.67

    828.75

    95.22

    1163.69

    88.11

    2227.36

    117.67

    35.5

    117.22

    53.69

    117.22

    68.19

    115.11

    76.86

    113.89

    334.86

    111.67

    1042.25

    110.44

    1659.03

    115.56

    1588.03

    Figura 16: Media y varianza en ventana de 3x3

    80 90 100 110

    0500

    1000

    1500

    2000

    media

    vari

    an

    za

    = 0.11

    Figura 17: Grafico de dispersion de media y varianza

  • Modelizacion geoestadstica con R 20

    distancia (h) variando de 1 a 4 puntos y en las direcciones norte-sur (fig. 18) y este-

    oeste (fig:03:vew). Se aprecia la alta correlacion en las direcciones N-S (0,5 < < 0,7) yla baja correlacion en direccion E-W (0,4 < < 0,3).

    0 50 100 150

    20

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.74

    h = 1

    0 50 100 150

    20

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.59

    h = 2

    0 50 100 150

    20

    40

    60

    80

    100

    120

    V(t+h)

    V(t

    )

    x=y

    = 0.56

    h = 3

    0 50 100 150

    20

    40

    60

    80

    100

    120

    V(t+h)

    V(t

    )

    x=y

    = 0.48

    h = 4

    Figura 18: h-Scatterplots de direccion N-S

    3.4. Variograma

    La funcion del variograma muestra la variacion de la variable agrupando los datos

    segun sus distancias relativas. Ha de establecerse por tanto el numero de ((cajas))

    o lags en los que queremos dividir los datos. Por otro lado, como en el apartado

    anterior, podemos obtener el variograma en una direccion determinada o en todas

    direcciones (variograma omnidireccional). Formalmente la funcion del variograma se

    expresa como:

    (h) =1

    2N(h)

    N(h)

    i=1

    (vi vi+h)2 (5)

    En R existen diversos paquetes que calculan el variograma pero probablemente elmas completo es el paquete gstat. El uso de esta funcion se hara en el tema 5.

    3.5. Diagramas de dispersion cruzados

    El ultimo grafico que se va a mostrar en este tema es el de dispersion cruzada

    entre dos variables. Es un h-Scatterplot en el que en lugar de ccontrastarla misma

    variable se utiliza el valor de otra. Se ha calculado solo la variacion en la direccion

    N-S de las variables U y V.

    3.6. Scripts

  • Modelizacion geoestadstica con R 21

    0 50 100 150

    020

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.21

    h = 1

    0 50 100 150

    020

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.41

    h = 2

    0 50 100 150

    020

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.35

    h = 3

    0 50 100 150

    20

    40

    60

    80

    100

    120

    140

    V(t+h)

    V(t

    )

    x=y

    = 0.3

    h = 4

    Figura 19: h-Scatterplots de direccion E-W

    0 50 100 150

    010

    20

    30

    40

    50

    V(t+h)

    U(t

    ) x=y

    = 0.6

    h = 1

    0 50 100 150

    010

    20

    30

    40

    V(t+h)

    U(t

    )

    x=y

    = 0.45

    h = 2

    0 50 100 150

    05

    10

    15

    20

    25

    30

    35

    V(t+h)

    U(t

    )

    x=y

    = 0.36

    h = 3

    0 50 100 150

    05

    10

    15

    20

    25

    30

    35

    V(t+h)

    U(t

    )

    x=y

    = 0.28

    h = 4

    Figura 20: h-Scatterplots cruzado de U y V en direccion N-S

  • Modelizacion geoestadstica con R 22

    Listado 3: R-Script en Linux del tema 3

    1 #TEMA 3 : DESCRIPCION ESPACIAL2 ps.options(family="Bookman",pointsize

    =15)3 rm(list=ls())45 #Cargar paquetes6 library(lattice)7 library(gstat)89 #Cargar wle y redondearlo

    10 wle

  • Modelizacion geoestadstica con R 23

    -1])97 }98 }99 dev.off()

    100101 #Grafico de media contra varianza 3x3102 postscript("imgs/03/mediavar2.ps")103 media

  • Modelizacion geoestadstica con R 24

    Tema 4 Estimacion. Metodos deterministas

    En esta seccion se va a estimar el valor de la variable V en toda la extension de

    trabajo a partir de los valores en el conjunto de datos wlm (fig. 21).Este conjunto de datos se obtiene facilmente al estar presente en el paquete gstat

    y cargandose con ejecutar el comando data(walker).

    X

    Y

    50 100 150 200 250

    50

    100

    150

    200

    250

    Figura 21: Distribucion de wlm

    La estimacion de estos datos se ha realizado desde GRASS, para ello primero se haexportado este conjunto de datos a un fichero csv para a continuacion importarlo en

    GRASS como una cobertura vectorial (GRASS ya no utiliza sites).En GRASS se han utilizado las funciones v.voronoi, v.surf.idw y v.surf.rst

    que implementan el metodo de polgonos de influencia, el de pesos inversos a la dis-

    tancia y el de splines de tension respectivamente. Ademas de las coberturas raster con

    los valores estimados se han obtenido las curvas de nivel cada 250ppm. Finalmente

    se han maquetado tres sencillos mapas con los resultados de estos tres metodos.

    Al final del tema se presenta el script en GRASS que genera los mapas y exporta aficheros csv los valores de los tres mapas para poder estudiarlos en R. Igualmente sepresentan los tres ficheros que indican la maquetacion de los mapas.

    A continuacion se importa el conjunto de datos wlc que consiste en 78000 puntosde validacion y que se entiende como valores correctos..

    En el cuadro 1 se muestran los estadsticos de estos cuatro conjunto de datos y

    en la figura 23 en la pagina 26 se pueden ver los histogramas. Se pueden observar

    las siguientes caractersticas:

    Se observa como el metodo de Polgonos de influencia es el que mejor mantiene

    las caractersticas estadsticas.

  • Modelizacion geoestadstica con R 25

    200

    100

    100

    200

    Polgonos de influencia de V

    Leyenda

    Escala0 50

    0

    200

    400

    600

    800

    1000

    1200

    1400

    200

    100

    100

    200

    Inverso a la distancia de V

    Leyenda

    Equidistancia de curvas = 250ppm

    Escala0 50

    200

    400

    600

    800

    1000

    1200

    1400

    200

    100

    100

    200

    Splines de Tensin de V (T=100)

    Leyenda

    Equidistancia de curvas = 250ppm

    Escala0 50

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Figura 22: Mapas generados por GRASS

  • Modelizacion geoestadstica con R 26

    Cuadro 1: Resumen de estadsticos de datos de validacion y estimados

    wlc Voronoi IDW RSTMn. 0.00 0.00 0.46 -47.51Q1 67.79 70.70 163.00 121.20Median. 221.30 224.40 297.20 277.90Media 278.00 275.10 316.80 277.90Q3 428.30 425.90 428.50 379.50Max. 1631.00 1528.00 1498.00 1530.002 62423.16 60039.41 39458.06 44820.41 249.84 245.03 198.64 211.71Simetr. 0.90 0.89 0.63 0.76Apunt. 0.77 1.25 1.39 2.44CV 0.90 0.89 0.63 0.76

    El metodo de Splines de tension ofrece resultados negativos pese a calcularse

    con un valor de tension alto (100).

    Cabe destacar la diferencia entre los metodos estadsticos y wlc en el apuntala-miento, claramente observable en los histogramas.

    WLC

    V

    Fre

    cu

    en

    cia

    0 500 1000 1500

    05000

    10000

    15000

    20000

    25000

    Vor

    V

    Fre

    cu

    en

    cia

    0 500 1000 1500

    05000

    10000

    15000

    20000

    IDW

    V

    Fre

    cu

    en

    cia

    0 500 1000 1500

    05000

    10000

    15000

    RST

    V

    Fre

    cu

    en

    cia

    0 500 1000 1500

    05000

    10000

    15000

    Figura 23: Histogramas de los conjuntos de datos

  • Modelizacion geoestadstica con R 27

    4.1. Scripts

    Listado 5: R-Script del tema 4

    1 #TEMA 4 - ESTIMACION2 ps.options(family="Bookman",pointsize

    =15)3 rm(list=ls())45 #Cargar los datos wlm6 library(lattice)7 library(gstat)8 data(walker)9 wlm

  • Modelizacion geoestadstica con R 28

    coordenadas

    Listado 7: Script para ps.map del metodoIDW

    1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 label u

    10 end11 vlines idwcontour12 color white13 width 0.514 end15 raster idw16 maploc 0.7 3 7 10171819 rectangle 0 390 260 30520 color black21 fcolor white22 end23 text 160 365 Inverso a la distancia

    de V24 font Bookman25 size 1026 end27 text 20 385 Leyenda28 font Bookman29 size 630 end31 colortable y32 where 2 0.733 raster idw34 width 0.335 height 236 cols 637 font Bookman38 fontsize 839 color black40 end41 text 160 320 Equidistancia de curvas

    = 250ppm42 font Bookman43 size 644 end45 text 160 345 Escala46 font Bookman47 size 648 end49 scalebar f50 where 5 2.151 length 5052 height 0.0553 segment 554 numbers 555 fontsize 856 end57 paper a4

    58 left 0.559 right 0.560 bottom 0.561 top 0.562 end63 end

    Listado 8: Script para ps.map del metodoRST

    1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 label u

    10 end11 vlines spcontour12 color white13 width 0.514 end15 raster splines16 maploc 0.7 3 7 10171819 rectangle 0 390 260 30520 color black21 fcolor white22 end23 text 160 365 Splines de Tension de V

    (T=100)24 font Bookman25 size 1026 end27 text 20 385 Leyenda28 font Bookman29 size 630 end31 colortable y32 where 2 0.733 raster splines34 width 0.335 height 236 cols 637 font Bookman38 fontsize 839 color black40 end41 text 160 320 Equidistancia de curvas

    = 250ppm42 font Bookman43 size 644 end45 text 160 345 Escala46 font Bookman47 size 648 end49 scalebar f50 where 5 2.151 length 5052 height 0.05

  • Modelizacion geoestadstica con R 29

    53 segment 554 numbers 555 fontsize 856 end57 paper a458 left 0.559 right 0.560 bottom 0.561 top 0.562 end63 end

    Listado 9: Script para ps.map del metodoPolgonos de influencia

    1 grid 502 color black3 numbers 2 black4 end5 vpoints wle6 color black7 fcolor black8 size 19 end

    10 vareas clvorwle11 color black12 fcolor none13 end14 raster rvorwle15 maploc 0.7 3 7 10161718 rectangle 0 390 260 30519 color black20 fcolor white21 end22 text 160 365 Polgonos de influencia

    de V

    23 font Bookman24 size 1025 end26 text 20 385 Leyenda27 font Bookman28 size 629 end30 colortable y31 where 2 0.732 raster rvorwle33 width 0.334 height 235 cols 636 font Bookman37 fontsize 838 color black39 end40 text 160 345 Escala41 font Bookman42 size 643 end44 scalebar f45 where 5 2.146 length 5047 height 0.0548 segment 549 numbers 550 fontsize 851 end52 paper a453 left 0.554 right 0.555 bottom 0.556 top 0.557 end58 end

  • Modelizacion geoestadstica con R 30

    Tema 5 Continuidad espacial de V

    5.1. Variograma omnidireccional

    El calculo del variograma omnidireccional con gstat es sencillo. En primer lugarse ha de crear un objeto de tipo gstat anadiendole los datos de trabajo. A continua-cion se ejecuta el comando variogram con las opciones pertinentes.

    La opcion principal es el tamano de los lags. Ningun paquete de los consultados

    permite elegir una tolerancia para incluir pares en cada lag, siendo unicamente GSLIBel que acepta este parametro, pero no en R. Otros parametros permiten obtener elmapa superficial o la nube de puntos o establecer restricciones de direccion como se

    vera mas adelante.

    En el script del tema se han creado diversas funciones para realizar graficas de

    uno o varios variogramas presentando el numero de pares y una leyenda.

    Si se muestra el variograma en R, aparece el listado con los lags, el numero depares, el valor del variograma, las direcciones horizontales y verticales (si las hubiera)

    y la variable utilizada.

    > gstatV varOmni varOmni

    np dist gamma dir.hor dir.ver id1 565 7.291342 42743.67 0 0 V2 2072 15.022197 67877.29 0 0 V3 2948 24.783924 79062.05 0 0 V4 3210 34.757173 94338.18 0 0 V5 4044 44.673417 88377.42 0 0 V6 4265 54.887742 94888.71 0 0 V7 4926 64.548384 92944.57 0 0 V8 5196 74.614543 94322.57 0 0 V9 5533 84.724877 89014.25 0 0 V10 5167 94.880575 98948.24 0 0 V11 707 100.470981 86139.86 0 0 V

    La figura 24 en la pagina siguiente muestra los variogramas omnidireccionales con

    lags de tamano 5, 10, 15 y 20. Se descartan los extremos y entre el de 10 y el de 15

    se opta por el de 10 por presentar equilibrio entre el numero de lags y la continuidad

    buscada. El parametro que habra que modificar sera tal vez la distancia maxima

    computada, para evitar el salto que aparece, dejandola en 80 metros en sucesivos

    calculos.

    5.2. Variograma superficial

    Estableciendo la opcion map=TRUE se obtiene el variograma superficial, que puedeser grafiado con los comandos levelplot y contourplot (figs. 25 y 26). Estas image-nes pueden servir para conocer la existencia de anisotropa geometrica, mostrando los

    ejes de maxima y mnima continuidad. Este metodo puede ser util para una primera

    aproximacion, pero es difcil de cuantificar. Por esta razon se usaran los variogramas

    direccionales.

    5.3. Variogramas direccionales

    5.3.1. Busqueda de los ejes de anisotropa

    En lugar de tomar todos los pares para calcular el variograma, se puede establecer

    una direccion determinada y una tolerancia angular para que solo se computen los

  • Modelizacion geoestadstica con R 31

    0 20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    t = 5

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    t = 10

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    t = 15

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    t = 20

    Figura 24: Variogramas omnidireccionales (i))

    map.dx

    map.d

    y

    100 50 0 50 100

    100

    50

    0

    50

    100

    40000

    60000

    80000

    100000

    120000

    140000

    160000

    180000

    200000

    Figura 25: Mapa del variograma superficial

  • Modelizacion geoestadstica con R 32

    map.dx

    map.d

    y

    100 50 0 50 100

    100

    50

    0

    50

    100

    Figura 26: Isolneas del variograma superficial

    pares de vectores en ese rango de direcciones. Comparando diferentes variogramas

    direccionales se pueden obtener las direcciones de maxima y mnima continuidad .

    En este trabajo se van a grafiar los variogramas cada 15 grados sexagesimales,

    agrupados en dos graficos para que facilitar la lectura (fig 27). Para obtener numeri-

    camente las direcciones de los ejes se ha procedido del siguiente modo: se establece

    como valor de meseta 90.000ppm, a continuacion se halla la distancia a la que se

    corresponde dicho valor de semivarianza interpolando linealmente los valores alrede-

    dor de dicho valor. Por ultimo se ha creado un grafico donde en el eje de las ordenadas

    se presentan las direcciones y en las abscisas la distancia obtenida.

    Se comprueba el gran salto entre los grados 135 y 140 debido a que el resalte que

    se observa en los variogramas desciende y por tanto la distancia avanza de forma

    abrupta. En cualquier caso, los valores obtenidos, unos 160 grados de maximo y en

    torno a los 90 grados de mnimo, se asemejan a los obtenidos en los apuntes de la

    asignatura.

    20 40 60 80 100

    020000

    40000

    60000

    80000

    100000

    Distancia

    Sem

    ivari

    ogra

    ma

    0306090120150180

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    154575105135165

    Figura 27: Variogramas direccionales

  • Modelizacion geoestadstica con R 33

    Direccin

    Dis

    tan

    cia

    en

    lag =

    4

    0 20 40 60 80 100 120 140 160 180

    0 20 40 60 80 100 120 140 160 180

    30

    40

    50

    60

    Figura 28: Deteccion de ejes de anisotropa

    5.3.2. Obtencion de la tolerancia angular

    Se pretende en este caso encontrar la tolerancia angular mas pequena posible que

    haga el variograma representativo y mas adaptado por tanto a la direccion elegida. Se

    trata en definitiva de un proceso repetitivo como el anterior, pero esta vez variaran las

    tolerancias y se buscaran los numeros de pares en el primer lag (el que menos pares

    suele presentar) mayor a 30 que a su vez generen un variograma que sea continuo

    (figs 29 y 30).

    Se observa que en los primeros variogramas la direccion de mnima continuidad

    presenta un ((efecto hueco)) muy importante en la distancia 60, en cualquier caso

    parece que 40 es una tolerancia suficiente.

    5.4. Variogramas cruzados

    Estos variogramas presentan la continuidad espacial entre variables. Se pueden

    calcular por tanto los variogramas omnidireccionales y en las direcciones obtenidas

    anteriormente. La figura 31 presenta estos tres variogramas y se puede apreciar como

    tanto el omnidireccional como el de maxima continuidad no presentan grandes dis-

    continuidades, el de mnima continuidad ofrece un aspecto poco clarificador debido

    seguramente a la existencia de datos anomalos en alguna o ambas variables.

  • Modelizacion geoestadstica con R 34

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    tol = 15

    Distancia

    Sem

    ivari

    ogra

    ma

    234

    464

    396

    424613 608

    530588

    754

    640

    tol = 15

    73

    303

    487

    587 829876

    1092 1165 1254

    1121

    90160

    20 40 60 80 100

    020000

    40000

    60000

    80000

    100000

    tol = 20

    Distancia

    Sem

    ivari

    ogra

    ma

    280

    483

    537729 694

    696

    982

    799

    903

    902

    tol = 20

    115

    458

    704

    828 1065

    1174

    1473 15981637

    1481

    90160

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    tol = 25

    Distancia

    Sem

    ivari

    ogra

    ma

    305

    503

    783822 891

    968

    1089

    10711115

    1090

    tol = 25

    118

    546

    883

    985 1284

    14731771 1889

    1940

    1806

    90160

    20 40 60 80 100

    020000

    40000

    60000

    80000

    120000

    tol = 30

    Distancia

    Sem

    ivari

    ogra

    ma

    320

    585

    1006 911

    1296

    1062

    1392

    11931464

    1295

    tol = 30

    151

    723

    1094

    11511562

    17732052

    2258

    2302

    2100

    90160

    Figura 29: Variogramas por tolerancias (i)

  • Modelizacion geoestadstica con R 35

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    tol = 35

    Distancia

    Sem

    ivari

    ogra

    ma

    329

    744

    1076

    1171

    1383

    1368

    15131624 1624

    1539

    tol = 35

    161

    856

    1205

    13611752

    1993

    23652485

    2677

    2415

    90160

    20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    tol = 40

    Distancia

    Sem

    ivari

    ogra

    ma

    334

    895

    1146

    1368

    1563

    1520

    1822 1769 1884

    1816

    tol = 40

    179

    980

    1309

    15821904

    22712656

    28552941

    2728

    90160

    20 40 60 80 100

    020000

    40000

    60000

    80000

    100000

    tol = 45

    Distancia

    Sem

    ivari

    ogra

    ma

    343

    1072

    1362

    1502

    1847

    1812

    1998 20722181

    2011

    tol = 45

    203

    1058

    1495

    1708

    2255

    24392949

    31033284

    3002

    90160

    20 40 60 80 100

    020000

    40000

    60000

    80000

    100000

    tol = 50

    Distancia

    Sem

    ivari

    ogra

    ma

    359

    1209

    1627

    1626

    20502146

    2228 22842476

    2293

    tol = 50

    230

    1114

    1716

    1856

    2528

    27103143 3354

    3564

    3230

    90160

    Figura 30: Variogramas por tolerancias (ii)

    20 40 60 80 100 120

    0e+00

    1e+05

    2e+05

    3e+05

    4e+05

    5e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    Cruzado85160

    Figura 31: Variogramas cruzados

  • Modelizacion geoestadstica con R 36

    5.5. Scripts

    Listado 10: Funciones para imprimir va-

    riogramas

    1 #FUNCIONES PARA MOSTRAR VARIOGRAMAS2 #-------------Plotear el primer

    variograma3 plotvar

  • Modelizacion geoestadstica con R 37

    38 lp

  • Modelizacion geoestadstica con R 38

    U")128 postscript("imgs/05/cross.ps")129 pintavars(varsCruz,colores,etiqs,

    separaciones,"",posleyenda)

    130 dev.off()

  • Modelizacion geoestadstica con R 39

    Tema 6 Modelizacion del variograma experimental

    Con el paquete gstat se puede modelizar el variograma a partir de los modelos mascomunes (efecto pepita puro, exponencial, esferico, gaussiano) y muchos mas. Para

    verlos, basta con ejecutar la orden show.vgms()

    distance

    sem

    ivari

    an

    ce

    vgm(1,"Nug",0)

    0.0 0.5 1.0 1.5 2.0 2.5 3.0

    vgm(1,"Exp",1) vgm(1,"Sph",1)

    0.0 0.5 1.0 1.5 2.0 2.5 3.0

    vgm(1,"Gau",1)

    0

    1

    2

    3

    vgm(1,"Exc",1)

    0

    1

    2

    3

    vgm(1,"Mat",1) vgm(1,"Cir",1) vgm(1,"Lin",0) vgm(1,"Bes",1) vgm(1,"Pen",1)

    vgm(1,"Per",1) vgm(1,"Hol",1) vgm(1,"Log",1) vgm(1,"Pow",1)

    0

    1

    2

    3

    vgm(1,"Spl",1)

    0.0 0.5 1.0 1.5 2.0 2.5 3.0

    0

    1

    2

    3

    vgm(1,"Err",0) vgm(1,"Int",0)

    Figura 32: Modelos de variogramas disponibles

    Para crear un modelo basta con utilizar la orden v.model. Una vez creado un mo-delo se puede anadir al objeto de tipo gstat para incluirlo junto con el variogramaexperimental. Por ejemplo si deseamos un modelo esferico bastara con indicar la me-

    seta y el rango. Este modelo y el variograma se presentan graficamente en la figura 33

    en la pagina siguiente.

    > vgm(92000,"Sph",30)model psill range

    1 Sph 92000 30

    Pero los modelos pueden combinarse y formar ((estructuras imbricadas)) simple-

    mente anadiendo su definicion unos sobre otros. As, podemos anadir crear un modelo

    para el variograma direccional de 160o de la Variable V segun la siguiente definicion:

    (h) = 22,000 + 40,000 Esf30(h) + 45,000 Esf150(h) (6)

    Crea el modelo de la figura 34 y su definicion en R es la siguiente:> vgm(40e3,"Sph",30,add.to=vgm(22000,"Nug",add.to=vgm(45e3,"Sph",150)))model psill range

    1 Sph 45000 1502 Nug 22000 03 Sph 40000 30

  • Modelizacion geoestadstica con R 40

    Distancia

    Sem

    ivari

    ogra

    ma

    20 40 60 80 100

    20000

    40000

    60000

    80000

    Figura 33: Modelos esferico de rango 30 y meseta parcial de 92000ppm

    Distancia

    Sem

    ivari

    ogra

    ma

    20 40 60 80 100

    20000

    40000

    60000

    80000

    Figura 34: Modelos de variograma combinados

  • Modelizacion geoestadstica con R 41

    6.1. Estimacion automatizada del modelo

    6.1.1. gstat

    Tanto el paquete gstat como el paquete geoR proporcionan funciones para la esti-macion automatizada del modelo de variograma. En ambos casos deberemos ajustar

    manualmente unos parametros iniciales para pasarlos como parametros de entrada,

    junto con el variograma.

    De este modo, si queremos modelar el variograma omnidireccional de V mediante

    un modelo exponencial con efecto pepita, basta con proceder del siguiente modo (fig.

    35):

    > m mfit g print(g)data:V : formula = V1 ; locations = X + Y ; data dim = 470 x 6variograms:

    model psill rangeV[1] Nug 186.3867 0.00000V[2] Exp 93809.2943 12.01007

    Distancia

    Sem

    ivari

    ogra

    ma

    20 40 60 80 100

    20000

    40000

    60000

    80000

    Figura 35: Modelo de variograma de V ajustado

    6.1.2. geoR

    El paquete geoR proporciona una herramienta ciertamente interesante. Se tratade estimar de forma manual el modelo pero haciendo uso de una interfaz grafica de

    usuario escrita en el lenguaje TclTk. Se pasa a la funcion eyefit el variograma amodelar y aparece un cuadro de dialogo donde es posible elegir el tipo de modelo y

    sus parametros mediante barras deslizantes.

    > library(geoR)

    -------------------------------------------------------------

    Functions for geostatistical data analysisFor an Introduction to geoR go to http://www.est.ufpr.br/geoRgeoR version 1.5-7 (built on 2005/06/07) is now loaded-------------------------------------------------------------

    > geoV

  • Modelizacion geoestadstica con R 42

    > vario.b vario.m vario.m2 vario.m2variofit: model parameters estimated by WLS (weighted least squares):covariance model is: exponentialparameter estimates:

    tausq sigmasq phi14873.1088 79431.7551 13.4973

    variofit: minimised weighted sum of squares = 612531182238

  • Modelizacion geoestadstica con R 43

    0 50 100 150 200 250

    050

    100

    150

    200

    250

    300

    X Coord

    Y C

    oord

    0 500 1000 1500

    050

    100

    150

    200

    250

    300

    data

    Coord

    Y

    0 50 100 150 200 250

    0500

    1000

    1500

    Coord X

    data

    data

    Fre

    qu

    en

    cy

    0 500 1000 1500

    020

    40

    60

    80

    100

    Figura 37: Descripcion de geoR del conjunto de datos

    0 20 40 60 80 100

    0e+00

    2e+04

    4e+04

    6e+04

    8e+04

    1e+05

    Distancia

    Sem

    ivari

    ogra

    ma

    Figura 38: Modelo ajustado por geoR

  • Modelizacion geoestadstica con R 44

    6.2. Scripts

    Listado 12: R-Script del tema 6

    1 # TEMA 6 MODELIZACION DEL VARIOGRAMA2 ps.options(family="Bookman",pointsize

    =15)3 rm(list=ls())45 library(lattice)6 library(gstat)78 #Anadir las funciones programadas9 source("Variogramas.R")

    1011 #Cargar los datos wlm12 data(walker)13 wlm

  • Modelizacion geoestadstica con R 45

    Tema 8 Kriging

    Denotado en la literatura en espanol como ((krigeado)), este conjunto de metodos

    desarrollado por Denis Krige en los anos 50 del sigo XX es el metodo geoestadstico

    mas ampliamente aceptado. El fin ultimo del estudio y modelizacion del variograma

    es su aplicacion en este metodo para el calculo del valor de la variable en puntos

    arbitrarios (generalmente una malla regular) mediante esta familia de metodos.

    8.1. wlc

    Antes de empezar a modelar los datos de wlm, se presentan las distribuciones de Uy V en wlc para poder compararlas con los modelos siguientes.

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    200

    400

    600

    800

    1000

    1200

    1400

    1600

    (a) V

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    1000

    2000

    3000

    4000

    5000

    (b) U

    Figura 39: Conjunto de datos wlc

    8.2. Krigeado Ordinario (KO)

    Para generar el krigeado antes necesitamos un conjunto de puntos sobre el que

    calcular el krigeado. Para realizar las pruebas se ha empleado una malla regular de

    unas 5000 celdas y para obtener los resultados finales se han empleado las localiza-

    ciones del conjunto de datos wlc (78000).wlmGrid

  • Modelizacion geoestadstica con R 46

    Error

    Fre

    cu

    en

    cia

    500 0 500 1000

    05000

    10000

    15000

    20000

    25000

    30000

    30 150610

    1900

    4409

    8762

    15587

    29491

    12274

    3190

    1128326 99 29 8 6 2

    Figura 40: Error del Krigeado ordinario

    8.3. Krigeado Universal (KU)

    El krigeado Universal introduce un modelo de tendencia al considerar que la media

    local para cada localizacion no es constante. Basta con cambiar la formula de la orden

    krige a VX+Y para que se ejecute esta variedad del krigeado.KU

  • Modelizacion geoestadstica con R 47

    Error

    Fre

    cu

    en

    cia

    500 0 500 1000

    05000

    10000

    15000

    20000

    25000

    30000

    22 142618

    1919

    4405

    8874

    15624

    30154

    11348

    3206

    1160383 101 29 8 6 2

    Figura 41: Error del Krigeado universal

    Error

    Fre

    cu

    en

    cia

    500 0 500 1000

    05000

    10000

    15000

    20000

    25000

    30000

    16 111584

    1869

    4673

    9198

    15307

    29782

    11473

    3318

    1207335 89 26 6 5 2

    Figura 42: Error del Krigeado universal por bloques

  • Modelizacion geoestadstica con R 48

    Si se utilizan los parametros nmax y distmax operan ambos criterios

    Este metodo tambien se puede combinar con el krigeado ordinario o universal y

    el krigeado puntual o por bloques. En este trabajo se ha realizado el krigeado local

    universal de la variable V indicando una distancia maxima de 15 metros y un numero

    mnimo de 4 puntos (figs 45(d) y 46(d)).

    KUL

  • Modelizacion geoestadstica con R 49

    #Crear el objeto gstat y anadir las localizacionesg

  • Modelizacion geoestadstica con R 50

    Error

    Fre

    cu

    en

    cia

    0 2000 4000 6000 8000

    010000

    20000

    30000

    40000

    50000

    22

    14892

    50962

    7493

    26001131492195 96 62 27 12 6 0 4 0 3 3 0 0 1

    (a) Error del CKO

    Error

    Fre

    cu

    en

    cia

    2000 0 2000 4000 6000 8000 10000

    010000

    20000

    30000

    40000

    3 22 59294

    22081

    42942

    8044

    2657107743519995 50 23 7 4 1 3 0 2 1 1 0 0 1

    (b) Error del UKO

    Figura 44: Diferencias con wlc de la modelizacion de U

  • Modelizacion geoestadstica con R 51

    8.7. Resultados

    8.7.1. Modelizacion de V

    A continuacion se muestran los resultados de los metodos de krigeado empleados

    para modelar la variable V, as como sus predicciones de error. Por ultimo se compa-

    ran se muestran los estadsticos de las diferencias entre los valores estimados y los

    valores reales (wlc).En el diagrama de cajas (fig. 47 en la pagina 53) se aprecia como el krigeado

    por bloques parece que ofrece el resultado con menos outliers al contrario que el

    krigeado local. Ademas el krigeado local no consigue dar valores a todos los puntos,

    pese a indicar una distancia maxima de 30 metros. El krigeado por bloques ofrece

    diferencias tanto maximas como mnimas mas pequenas que el resto (cuadro 2 en la

    pagina siguiente).

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    200

    400

    600

    800

    1000

    1200

    1400

    1600

    (a) KO

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    200

    400

    600

    800

    1000

    1200

    1400

    1600

    (b) KU

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    200

    400

    600

    800

    1000

    1200

    1400

    1600

    (c) KUB

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    200

    400

    600

    800

    1000

    1200

    1400

    1600

    (d) KUL

    Figura 45: Prediccion en la modelizacion de V (wlm)

    8.7.2. Modelizacion de U

    Viendo la prediccion del cokrigeado, se observa que el resultado no es demasia-

    do satisfactorio, seguramente porque la modelizacion del variograma, al restringir al

  • Modelizacion geoestadstica con R 52

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    50

    100

    150

    200

    250

    300

    350

    (a) KO

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    50

    100

    150

    200

    250

    300

    350

    (b) KU

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    50

    100

    150

    200

    250

    300

    350

    (c) KUB

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    50

    100

    150

    200

    250

    300

    350

    (d) KUL

    Figura 46: Desviacion tpica en la modelizacion de V (wlm)

    Cuadro 2: Estadsticos de los errores en los metodos de krigeado de V

    Estadsticos

    KO KU KUB KUL

    Media 5.77 4.35 4.47 -4.13

    Mnimo -686.11 -684.74 -645.48 -928.96

    Q1 -71.55 -72.55 -76.87 -80.85

    Q2 28.6 25.94 28.71 12.572

    Q3 89.31 84.83 86.51 77.19

    Max. 967.39 967.42 913.93 969.61

    Var. 21394.29 21344.87 21325.76 22621.25

    Desv. 146.27 146.10 146.03 150.40

    CS -0.39 -0.34 -0.32 -0.32

    K 1.45 1.47 1.23 1.86

    CV 25.34 33.56 32.68 -36.42

  • Modelizacion geoestadstica con R 53

    KO

    KU

    KU

    BK

    UL

    1000 500 0 500 1000

    Figura 47: Diagramas de caja y bigote de las diferencias

  • Modelizacion geoestadstica con R 54

    mismo rango a los modelos tanto de U, como de V y el cruzado, a generado una peor

    modelizacion final. As y todo, el cokrigeado a dado valores maximos y mnimos meno-

    res al ordinario y el resto de parametros estadsticos no son muy diferentes (cuadro 3

    en la pagina siguiente).

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    1000

    2000

    3000

    4000

    5000

    (a) CKO

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    1000

    2000

    3000

    4000

    5000

    (b) UKO

    Figura 48: Prediccion en la modelizacion de U (wlm)

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    100

    200

    300

    400

    500

    600

    700

    800

    (a) CKO

    X

    Y

    50 100 150 200

    50

    100

    150

    200

    250

    0

    100

    200

    300

    400

    500

    600

    700

    800

    (b) UKO

    Figura 49: Desviacion tpica en la modelizacion de U (wlm)

  • Modelizacion geoestadstica con R 55

    Cuadro 3: Estadsticos de los errores en los metodos de krigeado de U

    Estadsticos

    CKO UKO

    Media -250.44 -255.68

    Mnimo -1366.57 -2625.11

    Q1 -487.89 -506.54

    Q2 -404.07 -418.417

    Q3 -196.54 -158.85

    Max. 8973.018 9034.47

    Var. 197185.3 197649.9

    Desv. 444.05 444.58

    CS 3.78 3.30

    K 25.17 21.42

    CV -1.77 -1.74

  • Modelizacion geoestadstica con R 56

    8.8. Scripts

    Listado 13: R-Script del tema 8

    1 # TEMA 8 KRIGING2 ps.options(family="Bookman",pointsize

    =15)3 # rm(list=ls())45 library(lattice)6 library(gstat)78 #Funcion que devuelve estadsticas9 calcestads

  • Modelizacion geoestadstica con R 57

    85 dev.off()868788 #KRIGEADO UNIVERSAL POR BLOQUES89 print("Calculando KUB...")90 KUB

  • Modelizacion geoestadstica con R 58

    171 postscript("imgs/08/UKO%01d.ps",onefile=FALSE)

    172 graf1

  • Modelizacion geoestadstica con R 59

    Referencias

    [1] MARTINEZ LLARIO, JOSE CARLOS y COLL ALIAGA, ELOINA, Apuntes de geoestadsti-

    ca basica. Aplicaciones mediante Sistemas de Informacion Geografica, UPV, Valen-

    cia, 2005.

    [2] PEBESMA, EDZER J., gstats user manual, Dept. of Physical Geography, Utrecht

    University, Utretch, Holanda, 2001.

    URL http://www.gstat.org

    [3] PEBESMA, EDZER J., Multivariable geostatistics in S: the gstat package, Computers

    & Geosciences, tomo 30, pags. 683691, 2004.

    [4] R DEVELOPMENT CORE TEAM, Introduccion a R, R Foundation for Statistical Com-

    puting, Vienna, Austria, 2000.

    [5] R DEVELOPMENT CORE TEAM, R: A language and environment for statistical com-

    puting, R Foundation for Statistical Computing, Vienna, Austria, 2004, ISBN 3-

    900051-07-0.

    URL http://www.R-project.org

    [6] RIBEIRO, PAULO J. JR y DIGGLE, PETER J., geoR: a package for geostatistical

    analysis, R-NEWS, tomo 1(2), pags. 1418, 2001, iSSN 1609-3631.

    URL CRAN://doc/Rnews/

    [7] SARKAR, DEEPAYAN, lattice: Lattice Graphics, 2004, r package version 0.10-16.

    IntroduccinRgstatGRASSDatos de trabajo

    Descripcin univariadaCarga y visualizacin de los datosMtodos grficos para la descripcin univariadaMtodos numricosScripts

    Descripcin bivariadaMtodos grficosMtodos numricosScripts

    Descripcin espacialVisualizacin espacial de datosVentanas mviles y el efecto proporcionalContinuidad espacialVariogramaDiagramas de dispersin cruzadosScripts

    Estimacin. Mtodos deterministasScripts

    Continuidad espacial de VVariograma omnidireccionalVariograma superficialVariogramas direccionalesVariogramas cruzadosScripts

    Modelizacin del variograma experimentalEstimacin automatizada del modeloScripts

    KrigingwlcKrigeado Ordinario (KO)Krigeado Universal (KU)Krigeado por bloques (KUB)Krigeado Local (KUL)Cokrigeado (CKO)ResultadosScripts