43
Estatística Espacial (MI418) / Geoestatística (ME907) Guilherme Ludwig 2019-01-08

Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

  • Upload
    others

  • View
    2

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Estatística Espacial (MI418) / Geoestatística (ME907)

Guilherme Ludwig

2019-01-08

Page 2: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Geoestatística e interpolação

Estatística espacial em espaços discretos

Processos pontuais

Estrutura do curso

Page 3: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Introdução

Estatística espacial está interessada em fenômenos com estrutura de dependência noespaço e tempo. Do ponto de vista probabilístico, processos de forma {Xs, s ∈ D},processos estocásticos indexados em um conjunto espacial D, com Xs tomando valoresem E . Note que s pode ser determinístico ou aleatório.

Lei de Tobler: “Todas as coisas estão relacionadas entre si, mas as coisas próximas sãomais relacionadas que as distantes.” (“Everything is related to everything else, but nearthings are more related than distant things.”)

Page 4: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Introdução a geoestatística

Geoestatística engloba problemas indexados num espaço contínuo, com D sendotradicionalmente R2 (espacial) ou R2 × R+ (espaço-temporal). O campo aleatório Xs éuma coleção de variáveis aleatórias.

Alguns objetivos imediatos:

1. Descrição de fenômenos com variabilidade espacial, predição e interpolação emlocais não amostrados (kriging).

2. Acomodar variação espacial para melhorar precisão de coeficientes de regressão.

Page 5: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo simulado: D = [0, 20]2, Xs ∼ GP

−4

−3

−2

−1

−1

0

0

1

1

2

2

2

3

3

4

0 5 10 15 20

05

1015

20

x

y

z

Page 6: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo simulado

−6

−4

−2

0

2

4

6

0 5 10 15 20

0

5

10

15

20

Page 7: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo simulado + erro (não é diferenciável)

−6

−4

−2

0

2

4

6

0 5 10 15 20

0

5

10

15

20

Page 8: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Número finito de locais amostrados

0 5 10 15 20

05

1015

20

sX

sY

−0.89

2.26

0.2

3.31

−0.95

−3.07

4.44

−1.261.71

−1.75

−0.733.93

1.22

−0.19

1.8

1.95

−1.08

5.46

3.48

−0.92

Page 9: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Idéia

Modelo inicial, sem definir nada rigorosamente ainda:

Y (s) = Z (s) + ε(s),

para todo s ∈ D.

Queremos, para um ponto arbitrário s0 ∈ D, obter alguma predição boa de Z (s0) combase em Y (s1), . . . ,Y (sn) observados.

Cuidado com nomenclatura (inferência clássica):

I Eu estimo números/parâmetros (e.g. µ(s0) estimador de E[Z (s0)]).I Eu prevejo variáveis aleatórias (e.g. Z (s0) previsão de Z (s0)).

Page 10: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Precisão está relacionada com estrutura de amostra. . .

0 5 10 15 20

05

1015

20

sX2

sY2

1.874.02

−0.422.71

4.03

−0.212.16

0.03−0.28

3.42

1.360.16

−0.11

0.3−0.48

3.951.6

−0.83

3.4−1.59

Page 11: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Teoria, geral

Cressie (1993), Cressie and Wikle (2011) e Gaetan and Guyon (2010)

Page 12: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Distribuição condicional

Sem nos preocuparmos com a questão de estimação de parâmetros, assuma que todosos parâmetros do processo são conhecidos; além disso, para cada coleção de pontoss0, s1, . . . , sn, assuma que o vetor Yt = (Y (s0),Y (s1), . . . ,Y (sn)) tem distribuição

Y ∼ N((

µ0µ

),

(τ2

0 + σ2 Σt0

Σ0 Σ

)).

Então

Z (s0)|Y1, . . . ,Yn = yn ∼ N(µ0 + Σt

0Σ−1(yn − µ), τ20 −Σt

0Σ−1Σ0).

Page 13: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

O problema de interpolação

−4

−3

−2

−1

−1

0

0

1

1

2

2

2

3

3

4

0 5 10 15 20

05

1015

20

0 5 10 15 20

05

1015

20

sX

sY

−0.89

2.26

0.2

3.31

−0.95

−3.07

4.44

−1.261.71

−1.75

−0.733.93

1.22

−0.19

1.8

1.95

−1.08

5.46

3.48

−0.92

Page 14: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

O problema de interpolação (grid aleatório)## [using ordinary kriging]

ordinary kriging predictions

[−2.665,−1.215](−1.215,0.2363](0.2363,1.687](1.687,3.138](3.138,4.589]

Page 15: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

O problema de interpolação (grid regular)## [using ordinary kriging]

ordinary kriging predictions

[−1.201,−0.1414](−0.1414,0.9185](0.9185,1.978](1.978,3.038](3.038,4.098]

Page 16: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Dados espaciais: volume de chuvaChuva na Suíça, durante o período de passagem da nuvem radioativa de Chernobyl (c.1986), tamanho corresponde ao volume. Fonte: geoR:sic.100.

0 50 100 150 200 250 300 350

−50

050

100

150

200

250

X Coord

Y C

oord

Page 17: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

O problema de regressão

I Na prática, o efeito espacial pode representar algo como variáveis que não foramcoletadas, por exemplo. Considere um modelo do tipo

y(si ) = βtx(si ) + η(si ) + εi ,

onde η é o chamado efeito espacial.I Para experimentos planejados, podemos escolher blocos de tamanho relacionado ao

alcance da dependência do processo. Dentro de cada nível do bloco, as observaçõesdevem estar sob condições homogêneas. Aleatorização + Blocagem é suficientepara removermos o efeito espacial de um experimento bem planejado.

I Para estudos observacionais (análise de regressão), não temos essa opção. Paratentar remediar as coisas, o efeito espacial é incluído como um efeito aleatório, comestrutura de dependência espacial.

Page 18: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo: soja em Wisconsin

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●

●●

●●●

●●

●●●●

●●●●●●●●●●

●●●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●● ●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

● ●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●● ●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●● ●

●●

●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●

●●●

●●

●●●

●●

●●

●●●●

●●●

●●

●●●

●●

●●●●

●●

●●

●●●●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●

●●●●●●●

●●

●●

●●

●●●●

●●

●●●●●

●●

●●●●

●●●●●

●●●

●●

●●●●●●●

●●

●●

●●

●●●●●●

●●●

●●●●

●●

●●●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●●●

●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●

●●

●●

●●●●●●●●

●●

●●●

●●

●●●●

●●

●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●

●●●●●●

●●

●●

●●

●●

●●●

●●●●

●●●●●

●●

●●

●●●●

●●

●●●●

●●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●

● ●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●●●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●●●

●●

●●

●●●●●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●●●

●●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●●

●●●

●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●●●

●●●

●●

●●●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●● ●●

●●

●●●

●●

●●

●●

●●●●

●●●●

●●●

●●

●●

●●●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●●●

●●● ●●

●●

●●

●●

●●

●●●●

● ●●●

●●

●● ●

●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

Yield●

(29.1,56.5]

(56.5,60.4]

(60.4,63.9]

(63.9,83.9]

Figure 1:

Dados de Smidt et al. (2016).

Page 19: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo: soja em Wisconsin

●●●●●●

●●●●●●

●●●●●●

●●●●●●

●●●●●●●

●●●●●●●●

●●●●●●●●

●●●●●●●●●

●●●●●●●●●

●●●●●

●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

920

940

960

Value

Elevation (feet)

●●●●●●

●●●●●●

●●●●●●

●●●●●●

●●●●●●●

●●●●●●●●

●●●●●●●●

●●●●●●●●●

●●●●●●●●●

●●●●●

●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

Value●

100

140

180

Seeding Rate (seeds/ha)

Figure 2: Covariáveis com estrutura espacial

Page 20: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo: soja em Wisconsin

42.552

42.554

42.556

−89.985 −89.980 −89.975 −89.970x

y

−20

−10

0

10

Residuals

Figure 3: Resíduos do ajuste de quadrados mínimos

Page 21: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Modelos espaço-temporaisOs maiores desafios de estatística espacial modernos são os modelos espaço-temporais,em particular pela sua conexão com questões de mudança climática. Temperatura dasuperfície do oceano, fonte: https://ourocean.jpl.nasa.gov/

Figure 4: Fonte: https://ourocean.jpl.nasa.gov/

Page 22: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Introdução a dados areais

Lattice data engloba problemas indexados num espaço discreto, com D sendotradicionalmente Z2 (espacial). Porém, a teoria de lattice se estende a dados areais, istoé, o processo Xs está definido em um número discreto de células s com alguma noção deadjacência entre elas.

Page 23: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Campos aleatórios no Z2

Figure 5: Modelo de Ising; copiei a figura de Gaetan and Guyon (2010)

Page 24: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Dados areais

Percentage with blood group A in Eire

under 27.9127.91 − 29.2629.26 − 31.02over 31.02

Page 25: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Dados areais: adjacencia

Page 26: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Introdução a processos pontuais

Um processo pontual é um modelo estocástico para padrões de pontos indistinguíveis(point patterns) em uma região. Uma realização de um processo pontual é uma coleçãode pontos x = {x1, . . . , xN} em uma região S. Note que tanto o número de pontos Nquanto a localização dos pontos xi , i = 1, . . . ,N são variáveis aleatórias.

Nos exemplos e aplicações, consideramos apenas S = R2, mas os processos existem emoutros espaços (Rd , superfície de esferas, etc).

Fenômenos que podem ser modelados com processos pontuais incluem configurações deárvores, células, terremotos e galáxias, entre outros (Illian et al., 2008).

Page 27: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Interesses de pesquisa

I Dependência dos pontos entre si: como caracterizar independência, repulsão eagrupamento.

I Estatísticas de resumo do processo pontual: número esperado de pontos,intensidade, etc.

I Dependência dos pontos em relação a efeitos ambientais (covariáveis). Emparticular, como caracterizar a dependência entre os pontos e covariáveis.

I Exemplos e parte do código usa o pacote spatstat (Baddeley et al., 2005)

Page 28: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

História

Figure 6: Peter Guttorp, 31o. CBM: https://www.youtube.com/watch?v=2gNIpiSKzTQ

Page 29: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Teoria, processos pontuais

Daley and Vere-Jones (2003), Møller and Waagepetersen (2003) e Illian et al. (2008)

Page 30: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo: árvores tropicais

Beilschmiedia pendula

Árvores do tipo Beilschmiedia pendula, na ilha de Barro Colorado (Panamá). São 3605árvores em uma janela de 1000× 500m2. Fonte: spatstat::bei.

Page 31: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Exemplo: árvores tropicais

0.05

0.1

0.15

0.2

0.25

0.3

Beilschmiedia pendula + Slope gradient

Sobreposição das árvores à covariável correspondente à inclinação do terreno (efeitoambiental).

Page 32: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Chorley and South Ribble, UK

Câncer em Chorley−Ribble

PulmãoLaringeIncinerador

Page 33: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Função de intensidade

I Suponha que B ⊂ S = R2. Seja n(x) a cardinalidade de x. Então x é localmentefinito se n(xB) <∞ quando |B| <∞, onde xB = x ∩ B. Em outras palavras,quando olhamos o processo em uma caixa B, nós estamos interessados apenas emconfigurações de pontos finitas.

I Defina a variável aleatória N(X ∩ B) = n(XB), e a medida de intensidade Λ por

Λ(B) = E(N(X ∩ B)).

A função de intensidade λ é dada por

Λ(B) =∫

Bλ(s)ds,

e se λ(s) = λ para todo s, o processo é chamado de homogêneo.

Page 34: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Processo de Poisson

Seja µ uma medida difusa e localmente finita, tal que

µ(B) =∫

Bρ(s)ds.

Um processo de Poisson no R2 pode ser caracterizado como

1. Para qualquer B ⊂ R2 com µ(B) <∞, N(B) ∼ Poisson(µ(B)).2. Se B1,B2 ⊂ R2 são disjuntos, então N(B1),N(B2) são independentes.

Equivalente:

2.’ Seja f uma função de densidade, f = ρ/∫ρ, x1, . . . , xn condicionado a N = n tem

densidade conjunta

fn(x1, . . . , xn|N = n) =n∏

i=1f (xi )

Page 35: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Processo de Poisson simulado na caixa [0, 1]2

PP Poisson homogêneo, ρ = 100 Não−homogêneo, ρ(u) = exp(2 + 4u1)

Page 36: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Complete Spatial RandomnessUm dos primeiros testes χ2 foi implementado para testar homogeneidade espacial

library(spatstat)set.seed(1)X <- rpoispp(100, win = owin(c(0,1), c(0,1)))f <- function(x,y) exp(2+4*x)Y <- rpoispp(f, win = owin(c(0,1), c(0,1)))Test.A <- quadrat.test(X, 3, 3); Test.A$p.value

## [1] 0.841937

Test.B <- quadrat.test(Y, 3, 3); Test.B$p.value

## [1] 5.306599e-16

Page 37: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Complete Spatial Randomness

7 8 13

11 14 15

8 11 6

10.3 10.3 10.3

10.3 10.3 10.3

10.3 10.3 10.3

−1 −0.73 0.83

0.21 1.1 1.5

−0.73 0.21 −1.3

Teste quando PPP homogêneo, ρ = 100

1 13 29

2 5 22

0 6 27

11.7 11.7 11.7

11.7 11.7 11.7

11.7 11.7 11.7

−3.1 0.39 5.1

−2.8 −2 3

−3.4 −1.7 4.5

Teste quando PPPNH, ρ(u) = exp(2 + 4u1)

Page 38: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Interações de segunda ordem, caso não-Poisson: atração e repulsão

Processo Hardcore (repulsivo) Processo de Poisson Processo de Thomas (atrativo)

Page 39: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Agora, a parte burocrática...

Page 40: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Avaliação, parte comum

I A presença mínima no curso deve ser de 75%. Em outras palavras, 7 ou menosfaltas ok, 8 ou mais resultará em reprovação. A Unicamp só abona faltas em casosmuito específicos, justificados em até 15 dias da falta e dentro do período do curso(acabamos no 15/02), veja o regulamento.

I Uma prova no dia 25/01, com peso 40%. O material de ME907 está contido emMI418; a prova será somente dos tópicos de ME907 (isto é, paramos antes deestatística espaço-temporal). Tanto alunos de graduação quanto pós-graduaçãodevem fazer a prova.

I A segunda parte da nota no curso será diferente para os alunos de graduação epós-graduação. Ambos terão que fazer um trabalho, e deverão informar acaracterística do trabalho até dia 14/01 (segunda-feira da semana que vem).

Page 41: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Avaliação, graduação

I Os alunos de graduação e alunos especiais devem preparar uma apresentação de 40minutos sobre uma análise de dados espaciais e/ou espaço temporais, em qualquertópico do curso. Os dados devem ser diferentes para cada aluno, e devem serbaseados em problemas reais, de preferência brasileiros. A análise deve mostrardomínio sobre o assunto da disciplina, explicando a metodologia na prática.

I O aluno pode optar por fazer uma leitura de artigo, como na pós-graduação.I A apresentação tem peso 60% na nota do aluno de graduação.I O aluno de graduação tem direito a um exame (dia 18/02), se tiver nota no curso

maior que 2.5, mas menor que 5. Se o aluno tiver nota maior que 5 e quiser tentaraumentá-la com um exame, deve me informar antes (até dia 15, no máximo).

I Não haverá exame se nenhum aluno precisar (i.e. estiver sob risco de reprovação).

Page 42: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Avaliação, pós graduação

I Os alunos de pós-graduação deverão preparar uma apresentação de 40 minutossobre um artigo científico envolvendo estatística espacial, publicado recentementeem revista de alta qualidade. A apresentação deve explicar as idéias principais doartigo, e oferecer uma visão crítica sobre o conteúdo.

I O artigo deve ter sido publicado após 2015. O artigo deve ser de revista de altaqualidade (A1 ou similar, e.g. Annals of Statistics, JASA, JRSS, etc.) ou emrevistas específicas de estatística espacial de alta qualidade (Spatial Statistics,Environmetrics, etc.). Tragam duas ou mais opções de artigos, caso alguém escolhaum mesmo artigo e a gente precise mudar.

I Cada apresentação deverá ser comentada por um segundo aluno, no estilo da ASA;o segundo aluno terá 10 minutos para fazer observações, comentários, discussão,etc.

Page 43: Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 › aula01.pdf · Introduçãoageoestatística Geoestatísticaenglobaproblemasindexadosnumespaçocontínuo,comDsendo

Referências IBaddeley, A., Turner, R., et al. (2005). Spatstat: an r package for analyzing spatialpoint patterns. Journal of statistical software, 12(6):1–42.

Cressie, N. (1993). Statistics for Spatial Data, 2nd edition. Wiley, New York.Cressie, N. and Wikle, C. K. (2011). Statistics for Spatio-Temporal Data. Wiley, NewYork.

Daley, D. J. and Vere-Jones, D. (2003). An Introduction to the Theory of PointProcesses, vol. 1. Springer, New York.

Gaetan, C. and Guyon, X. (2010). Spatial Statistics and Modeling. Springer, New York.Illian, J., Penttinen, A., Stoyan, H., and Stoyan, D. (2008). Statistical Analysis andModelling of Spatial Point Patterns, volume 70. John Wiley & Sons.

Møller, J. and Waagepetersen, R. P. (2003). Statistical Inference and Simulation forSpatial Point Processes. Chapman & Hall, Baton Rouge.

Smidt, E. R., Conley, S. P., Zhu, J., and Arriaga, F. J. (2016). Identifying fieldattributes that predict soybean yield using random forest analysis. Agronomy Journal,108(2):637–646.