Estatística Espacial (MI418) / Geoestatística (ME907) › ~gvludwig › 2019s0-me907-mi418 ›...

Preview:

Citation preview

Estatística Espacial (MI418) / Geoestatística (ME907)

Guilherme Ludwig

2019-01-08

Geoestatística e interpolação

Estatística espacial em espaços discretos

Processos pontuais

Estrutura do curso

Introdução

Estatística espacial está interessada em fenômenos com estrutura de dependência noespaço e tempo. Do ponto de vista probabilístico, processos de forma {Xs, s ∈ D},processos estocásticos indexados em um conjunto espacial D, com Xs tomando valoresem E . Note que s pode ser determinístico ou aleatório.

Lei de Tobler: “Todas as coisas estão relacionadas entre si, mas as coisas próximas sãomais relacionadas que as distantes.” (“Everything is related to everything else, but nearthings are more related than distant things.”)

Introdução a geoestatística

Geoestatística engloba problemas indexados num espaço contínuo, com D sendotradicionalmente R2 (espacial) ou R2 × R+ (espaço-temporal). O campo aleatório Xs éuma coleção de variáveis aleatórias.

Alguns objetivos imediatos:

1. Descrição de fenômenos com variabilidade espacial, predição e interpolação emlocais não amostrados (kriging).

2. Acomodar variação espacial para melhorar precisão de coeficientes de regressão.

Exemplo simulado: D = [0, 20]2, Xs ∼ GP

−4

−3

−2

−1

−1

0

0

1

1

2

2

2

3

3

4

0 5 10 15 20

05

1015

20

x

y

z

Exemplo simulado

−6

−4

−2

0

2

4

6

0 5 10 15 20

0

5

10

15

20

Exemplo simulado + erro (não é diferenciável)

−6

−4

−2

0

2

4

6

0 5 10 15 20

0

5

10

15

20

Número finito de locais amostrados

0 5 10 15 20

05

1015

20

sX

sY

−0.89

2.26

0.2

3.31

−0.95

−3.07

4.44

−1.261.71

−1.75

−0.733.93

1.22

−0.19

1.8

1.95

−1.08

5.46

3.48

−0.92

Idéia

Modelo inicial, sem definir nada rigorosamente ainda:

Y (s) = Z (s) + ε(s),

para todo s ∈ D.

Queremos, para um ponto arbitrário s0 ∈ D, obter alguma predição boa de Z (s0) combase em Y (s1), . . . ,Y (sn) observados.

Cuidado com nomenclatura (inferência clássica):

I Eu estimo números/parâmetros (e.g. µ(s0) estimador de E[Z (s0)]).I Eu prevejo variáveis aleatórias (e.g. Z (s0) previsão de Z (s0)).

Precisão está relacionada com estrutura de amostra. . .

0 5 10 15 20

05

1015

20

sX2

sY2

1.874.02

−0.422.71

4.03

−0.212.16

0.03−0.28

3.42

1.360.16

−0.11

0.3−0.48

3.951.6

−0.83

3.4−1.59

Teoria, geral

Cressie (1993), Cressie and Wikle (2011) e Gaetan and Guyon (2010)

Distribuição condicional

Sem nos preocuparmos com a questão de estimação de parâmetros, assuma que todosos parâmetros do processo são conhecidos; além disso, para cada coleção de pontoss0, s1, . . . , sn, assuma que o vetor Yt = (Y (s0),Y (s1), . . . ,Y (sn)) tem distribuição

Y ∼ N((

µ0µ

),

(τ2

0 + σ2 Σt0

Σ0 Σ

)).

Então

Z (s0)|Y1, . . . ,Yn = yn ∼ N(µ0 + Σt

0Σ−1(yn − µ), τ20 −Σt

0Σ−1Σ0).

O problema de interpolação

−4

−3

−2

−1

−1

0

0

1

1

2

2

2

3

3

4

0 5 10 15 20

05

1015

20

0 5 10 15 20

05

1015

20

sX

sY

−0.89

2.26

0.2

3.31

−0.95

−3.07

4.44

−1.261.71

−1.75

−0.733.93

1.22

−0.19

1.8

1.95

−1.08

5.46

3.48

−0.92

O problema de interpolação (grid aleatório)## [using ordinary kriging]

ordinary kriging predictions

[−2.665,−1.215](−1.215,0.2363](0.2363,1.687](1.687,3.138](3.138,4.589]

O problema de interpolação (grid regular)## [using ordinary kriging]

ordinary kriging predictions

[−1.201,−0.1414](−0.1414,0.9185](0.9185,1.978](1.978,3.038](3.038,4.098]

Dados espaciais: volume de chuvaChuva na Suíça, durante o período de passagem da nuvem radioativa de Chernobyl (c.1986), tamanho corresponde ao volume. Fonte: geoR:sic.100.

0 50 100 150 200 250 300 350

−50

050

100

150

200

250

X Coord

Y C

oord

O problema de regressão

I Na prática, o efeito espacial pode representar algo como variáveis que não foramcoletadas, por exemplo. Considere um modelo do tipo

y(si ) = βtx(si ) + η(si ) + εi ,

onde η é o chamado efeito espacial.I Para experimentos planejados, podemos escolher blocos de tamanho relacionado ao

alcance da dependência do processo. Dentro de cada nível do bloco, as observaçõesdevem estar sob condições homogêneas. Aleatorização + Blocagem é suficientepara removermos o efeito espacial de um experimento bem planejado.

I Para estudos observacionais (análise de regressão), não temos essa opção. Paratentar remediar as coisas, o efeito espacial é incluído como um efeito aleatório, comestrutura de dependência espacial.

Exemplo: soja em Wisconsin

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●

●●

●●●

●●

●●●●

●●●●●●●●●●

●●●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●● ●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

● ●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●● ●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●● ●

●●

●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●

●●●

●●

●●●

●●

●●

●●●●

●●●

●●

●●●

●●

●●●●

●●

●●

●●●●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●

●●●●●●●

●●

●●

●●

●●●●

●●

●●●●●

●●

●●●●

●●●●●

●●●

●●

●●●●●●●

●●

●●

●●

●●●●●●

●●●

●●●●

●●

●●●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●●●

●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●

●●

●●

●●●●●●●●

●●

●●●

●●

●●●●

●●

●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●

●●●●●●

●●

●●

●●

●●

●●●

●●●●

●●●●●

●●

●●

●●●●

●●

●●●●

●●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●

● ●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●●●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●●●

●●

●●

●●●●●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●●●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●●●

●●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●●

●●●

●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●●●

●●●

●●

●●●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●●

●●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●● ●●

●●

●●●

●●

●●

●●

●●●●

●●●●

●●●

●●

●●

●●●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●●●

●●● ●●

●●

●●

●●

●●

●●●●

● ●●●

●●

●● ●

●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

Yield●

(29.1,56.5]

(56.5,60.4]

(60.4,63.9]

(63.9,83.9]

Figure 1:

Dados de Smidt et al. (2016).

Exemplo: soja em Wisconsin

●●●●●●

●●●●●●

●●●●●●

●●●●●●

●●●●●●●

●●●●●●●●

●●●●●●●●

●●●●●●●●●

●●●●●●●●●

●●●●●

●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

920

940

960

Value

Elevation (feet)

●●●●●●

●●●●●●

●●●●●●

●●●●●●

●●●●●●●

●●●●●●●●

●●●●●●●●

●●●●●●●●●

●●●●●●●●●

●●●●●

●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●

●●●●●●●

●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●

●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●

42.551

42.552

42.553

42.554

42.555

42.556

−89.985 −89.980 −89.975 −89.970lon

lat

Value●

100

140

180

Seeding Rate (seeds/ha)

Figure 2: Covariáveis com estrutura espacial

Exemplo: soja em Wisconsin

42.552

42.554

42.556

−89.985 −89.980 −89.975 −89.970x

y

−20

−10

0

10

Residuals

Figure 3: Resíduos do ajuste de quadrados mínimos

Modelos espaço-temporaisOs maiores desafios de estatística espacial modernos são os modelos espaço-temporais,em particular pela sua conexão com questões de mudança climática. Temperatura dasuperfície do oceano, fonte: https://ourocean.jpl.nasa.gov/

Figure 4: Fonte: https://ourocean.jpl.nasa.gov/

Introdução a dados areais

Lattice data engloba problemas indexados num espaço discreto, com D sendotradicionalmente Z2 (espacial). Porém, a teoria de lattice se estende a dados areais, istoé, o processo Xs está definido em um número discreto de células s com alguma noção deadjacência entre elas.

Campos aleatórios no Z2

Figure 5: Modelo de Ising; copiei a figura de Gaetan and Guyon (2010)

Dados areais

Percentage with blood group A in Eire

under 27.9127.91 − 29.2629.26 − 31.02over 31.02

Dados areais: adjacencia

Introdução a processos pontuais

Um processo pontual é um modelo estocástico para padrões de pontos indistinguíveis(point patterns) em uma região. Uma realização de um processo pontual é uma coleçãode pontos x = {x1, . . . , xN} em uma região S. Note que tanto o número de pontos Nquanto a localização dos pontos xi , i = 1, . . . ,N são variáveis aleatórias.

Nos exemplos e aplicações, consideramos apenas S = R2, mas os processos existem emoutros espaços (Rd , superfície de esferas, etc).

Fenômenos que podem ser modelados com processos pontuais incluem configurações deárvores, células, terremotos e galáxias, entre outros (Illian et al., 2008).

Interesses de pesquisa

I Dependência dos pontos entre si: como caracterizar independência, repulsão eagrupamento.

I Estatísticas de resumo do processo pontual: número esperado de pontos,intensidade, etc.

I Dependência dos pontos em relação a efeitos ambientais (covariáveis). Emparticular, como caracterizar a dependência entre os pontos e covariáveis.

I Exemplos e parte do código usa o pacote spatstat (Baddeley et al., 2005)

História

Figure 6: Peter Guttorp, 31o. CBM: https://www.youtube.com/watch?v=2gNIpiSKzTQ

Teoria, processos pontuais

Daley and Vere-Jones (2003), Møller and Waagepetersen (2003) e Illian et al. (2008)

Exemplo: árvores tropicais

Beilschmiedia pendula

Árvores do tipo Beilschmiedia pendula, na ilha de Barro Colorado (Panamá). São 3605árvores em uma janela de 1000× 500m2. Fonte: spatstat::bei.

Exemplo: árvores tropicais

0.05

0.1

0.15

0.2

0.25

0.3

Beilschmiedia pendula + Slope gradient

Sobreposição das árvores à covariável correspondente à inclinação do terreno (efeitoambiental).

Chorley and South Ribble, UK

Câncer em Chorley−Ribble

PulmãoLaringeIncinerador

Função de intensidade

I Suponha que B ⊂ S = R2. Seja n(x) a cardinalidade de x. Então x é localmentefinito se n(xB) <∞ quando |B| <∞, onde xB = x ∩ B. Em outras palavras,quando olhamos o processo em uma caixa B, nós estamos interessados apenas emconfigurações de pontos finitas.

I Defina a variável aleatória N(X ∩ B) = n(XB), e a medida de intensidade Λ por

Λ(B) = E(N(X ∩ B)).

A função de intensidade λ é dada por

Λ(B) =∫

Bλ(s)ds,

e se λ(s) = λ para todo s, o processo é chamado de homogêneo.

Processo de Poisson

Seja µ uma medida difusa e localmente finita, tal que

µ(B) =∫

Bρ(s)ds.

Um processo de Poisson no R2 pode ser caracterizado como

1. Para qualquer B ⊂ R2 com µ(B) <∞, N(B) ∼ Poisson(µ(B)).2. Se B1,B2 ⊂ R2 são disjuntos, então N(B1),N(B2) são independentes.

Equivalente:

2.’ Seja f uma função de densidade, f = ρ/∫ρ, x1, . . . , xn condicionado a N = n tem

densidade conjunta

fn(x1, . . . , xn|N = n) =n∏

i=1f (xi )

Processo de Poisson simulado na caixa [0, 1]2

PP Poisson homogêneo, ρ = 100 Não−homogêneo, ρ(u) = exp(2 + 4u1)

Complete Spatial RandomnessUm dos primeiros testes χ2 foi implementado para testar homogeneidade espacial

library(spatstat)set.seed(1)X <- rpoispp(100, win = owin(c(0,1), c(0,1)))f <- function(x,y) exp(2+4*x)Y <- rpoispp(f, win = owin(c(0,1), c(0,1)))Test.A <- quadrat.test(X, 3, 3); Test.A$p.value

## [1] 0.841937

Test.B <- quadrat.test(Y, 3, 3); Test.B$p.value

## [1] 5.306599e-16

Complete Spatial Randomness

7 8 13

11 14 15

8 11 6

10.3 10.3 10.3

10.3 10.3 10.3

10.3 10.3 10.3

−1 −0.73 0.83

0.21 1.1 1.5

−0.73 0.21 −1.3

Teste quando PPP homogêneo, ρ = 100

1 13 29

2 5 22

0 6 27

11.7 11.7 11.7

11.7 11.7 11.7

11.7 11.7 11.7

−3.1 0.39 5.1

−2.8 −2 3

−3.4 −1.7 4.5

Teste quando PPPNH, ρ(u) = exp(2 + 4u1)

Interações de segunda ordem, caso não-Poisson: atração e repulsão

Processo Hardcore (repulsivo) Processo de Poisson Processo de Thomas (atrativo)

Agora, a parte burocrática...

Avaliação, parte comum

I A presença mínima no curso deve ser de 75%. Em outras palavras, 7 ou menosfaltas ok, 8 ou mais resultará em reprovação. A Unicamp só abona faltas em casosmuito específicos, justificados em até 15 dias da falta e dentro do período do curso(acabamos no 15/02), veja o regulamento.

I Uma prova no dia 25/01, com peso 40%. O material de ME907 está contido emMI418; a prova será somente dos tópicos de ME907 (isto é, paramos antes deestatística espaço-temporal). Tanto alunos de graduação quanto pós-graduaçãodevem fazer a prova.

I A segunda parte da nota no curso será diferente para os alunos de graduação epós-graduação. Ambos terão que fazer um trabalho, e deverão informar acaracterística do trabalho até dia 14/01 (segunda-feira da semana que vem).

Avaliação, graduação

I Os alunos de graduação e alunos especiais devem preparar uma apresentação de 40minutos sobre uma análise de dados espaciais e/ou espaço temporais, em qualquertópico do curso. Os dados devem ser diferentes para cada aluno, e devem serbaseados em problemas reais, de preferência brasileiros. A análise deve mostrardomínio sobre o assunto da disciplina, explicando a metodologia na prática.

I O aluno pode optar por fazer uma leitura de artigo, como na pós-graduação.I A apresentação tem peso 60% na nota do aluno de graduação.I O aluno de graduação tem direito a um exame (dia 18/02), se tiver nota no curso

maior que 2.5, mas menor que 5. Se o aluno tiver nota maior que 5 e quiser tentaraumentá-la com um exame, deve me informar antes (até dia 15, no máximo).

I Não haverá exame se nenhum aluno precisar (i.e. estiver sob risco de reprovação).

Avaliação, pós graduação

I Os alunos de pós-graduação deverão preparar uma apresentação de 40 minutossobre um artigo científico envolvendo estatística espacial, publicado recentementeem revista de alta qualidade. A apresentação deve explicar as idéias principais doartigo, e oferecer uma visão crítica sobre o conteúdo.

I O artigo deve ter sido publicado após 2015. O artigo deve ser de revista de altaqualidade (A1 ou similar, e.g. Annals of Statistics, JASA, JRSS, etc.) ou emrevistas específicas de estatística espacial de alta qualidade (Spatial Statistics,Environmetrics, etc.). Tragam duas ou mais opções de artigos, caso alguém escolhaum mesmo artigo e a gente precise mudar.

I Cada apresentação deverá ser comentada por um segundo aluno, no estilo da ASA;o segundo aluno terá 10 minutos para fazer observações, comentários, discussão,etc.

Referências IBaddeley, A., Turner, R., et al. (2005). Spatstat: an r package for analyzing spatialpoint patterns. Journal of statistical software, 12(6):1–42.

Cressie, N. (1993). Statistics for Spatial Data, 2nd edition. Wiley, New York.Cressie, N. and Wikle, C. K. (2011). Statistics for Spatio-Temporal Data. Wiley, NewYork.

Daley, D. J. and Vere-Jones, D. (2003). An Introduction to the Theory of PointProcesses, vol. 1. Springer, New York.

Gaetan, C. and Guyon, X. (2010). Spatial Statistics and Modeling. Springer, New York.Illian, J., Penttinen, A., Stoyan, H., and Stoyan, D. (2008). Statistical Analysis andModelling of Spatial Point Patterns, volume 70. John Wiley & Sons.

Møller, J. and Waagepetersen, R. P. (2003). Statistical Inference and Simulation forSpatial Point Processes. Chapman & Hall, Baton Rouge.

Smidt, E. R., Conley, S. P., Zhu, J., and Arriaga, F. J. (2016). Identifying fieldattributes that predict soybean yield using random forest analysis. Agronomy Journal,108(2):637–646.