Upload
others
View
2
Download
1
Embed Size (px)
Citation preview
Estatística Espacial (MI418) / Geoestatística (ME907)
Guilherme Ludwig
2019-01-08
Geoestatística e interpolação
Estatística espacial em espaços discretos
Processos pontuais
Estrutura do curso
Introdução
Estatística espacial está interessada em fenômenos com estrutura de dependência noespaço e tempo. Do ponto de vista probabilístico, processos de forma {Xs, s ∈ D},processos estocásticos indexados em um conjunto espacial D, com Xs tomando valoresem E . Note que s pode ser determinístico ou aleatório.
Lei de Tobler: “Todas as coisas estão relacionadas entre si, mas as coisas próximas sãomais relacionadas que as distantes.” (“Everything is related to everything else, but nearthings are more related than distant things.”)
Introdução a geoestatística
Geoestatística engloba problemas indexados num espaço contínuo, com D sendotradicionalmente R2 (espacial) ou R2 × R+ (espaço-temporal). O campo aleatório Xs éuma coleção de variáveis aleatórias.
Alguns objetivos imediatos:
1. Descrição de fenômenos com variabilidade espacial, predição e interpolação emlocais não amostrados (kriging).
2. Acomodar variação espacial para melhorar precisão de coeficientes de regressão.
Exemplo simulado: D = [0, 20]2, Xs ∼ GP
−4
−3
−2
−1
−1
0
0
1
1
2
2
2
3
3
4
0 5 10 15 20
05
1015
20
x
y
z
Exemplo simulado
−6
−4
−2
0
2
4
6
0 5 10 15 20
0
5
10
15
20
Exemplo simulado + erro (não é diferenciável)
−6
−4
−2
0
2
4
6
0 5 10 15 20
0
5
10
15
20
Número finito de locais amostrados
0 5 10 15 20
05
1015
20
sX
sY
−0.89
2.26
0.2
3.31
−0.95
−3.07
4.44
−1.261.71
−1.75
−0.733.93
1.22
−0.19
1.8
1.95
−1.08
5.46
3.48
−0.92
Idéia
Modelo inicial, sem definir nada rigorosamente ainda:
Y (s) = Z (s) + ε(s),
para todo s ∈ D.
Queremos, para um ponto arbitrário s0 ∈ D, obter alguma predição boa de Z (s0) combase em Y (s1), . . . ,Y (sn) observados.
Cuidado com nomenclatura (inferência clássica):
I Eu estimo números/parâmetros (e.g. µ(s0) estimador de E[Z (s0)]).I Eu prevejo variáveis aleatórias (e.g. Z (s0) previsão de Z (s0)).
Precisão está relacionada com estrutura de amostra. . .
0 5 10 15 20
05
1015
20
sX2
sY2
1.874.02
−0.422.71
4.03
−0.212.16
0.03−0.28
3.42
1.360.16
−0.11
0.3−0.48
3.951.6
−0.83
3.4−1.59
Teoria, geral
Cressie (1993), Cressie and Wikle (2011) e Gaetan and Guyon (2010)
Distribuição condicional
Sem nos preocuparmos com a questão de estimação de parâmetros, assuma que todosos parâmetros do processo são conhecidos; além disso, para cada coleção de pontoss0, s1, . . . , sn, assuma que o vetor Yt = (Y (s0),Y (s1), . . . ,Y (sn)) tem distribuição
Y ∼ N((
µ0µ
),
(τ2
0 + σ2 Σt0
Σ0 Σ
)).
Então
Z (s0)|Y1, . . . ,Yn = yn ∼ N(µ0 + Σt
0Σ−1(yn − µ), τ20 −Σt
0Σ−1Σ0).
O problema de interpolação
−4
−3
−2
−1
−1
0
0
1
1
2
2
2
3
3
4
0 5 10 15 20
05
1015
20
0 5 10 15 20
05
1015
20
sX
sY
−0.89
2.26
0.2
3.31
−0.95
−3.07
4.44
−1.261.71
−1.75
−0.733.93
1.22
−0.19
1.8
1.95
−1.08
5.46
3.48
−0.92
O problema de interpolação (grid aleatório)## [using ordinary kriging]
ordinary kriging predictions
[−2.665,−1.215](−1.215,0.2363](0.2363,1.687](1.687,3.138](3.138,4.589]
O problema de interpolação (grid regular)## [using ordinary kriging]
ordinary kriging predictions
[−1.201,−0.1414](−0.1414,0.9185](0.9185,1.978](1.978,3.038](3.038,4.098]
Dados espaciais: volume de chuvaChuva na Suíça, durante o período de passagem da nuvem radioativa de Chernobyl (c.1986), tamanho corresponde ao volume. Fonte: geoR:sic.100.
0 50 100 150 200 250 300 350
−50
050
100
150
200
250
X Coord
Y C
oord
O problema de regressão
I Na prática, o efeito espacial pode representar algo como variáveis que não foramcoletadas, por exemplo. Considere um modelo do tipo
y(si ) = βtx(si ) + η(si ) + εi ,
onde η é o chamado efeito espacial.I Para experimentos planejados, podemos escolher blocos de tamanho relacionado ao
alcance da dependência do processo. Dentro de cada nível do bloco, as observaçõesdevem estar sob condições homogêneas. Aleatorização + Blocagem é suficientepara removermos o efeito espacial de um experimento bem planejado.
I Para estudos observacionais (análise de regressão), não temos essa opção. Paratentar remediar as coisas, o efeito espacial é incluído como um efeito aleatório, comestrutura de dependência espacial.
Exemplo: soja em Wisconsin
●●
●
●●
●
●●
●
●●
●
●●
●
●●●
●●
●
●●●
●●
●
●●
●●
●●
●
●●
●●
●
●●
●
●
●●
●●
●●
●
●
●●
●●
●
●●
●
●
●
●●
●●
●●
●
●
●
●●
●●
●
●●
●
●
●
●
●●
●●
●
●●●●
●●●
●
●
●●
●
●
●●
●
●
●●
●●●
●
●●
●●●●
●●●●●●●●●●
●●●●●●
●
●●
●●
●●
●
●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●●
●●●●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●●
●●● ●●
●●
●●
●●
●●
●●
●
●●●●●
●●
●●
●●
●●●●
●●
●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●
●●
●●●
●●
●●●●
●
●
●
●
●●
●●
●
●
●●●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●●●●
●
●
●
●
●●
●●
●
●
●●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●●
●
●
●
●●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●●
●●
●
●
●
●
●●●●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
● ●●●
●●
●●
●●
●●●●
●●
●●
●●
●●
●●
●●●●●
●●
●●
●●
●●
●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●● ●
●●
●
●
●
●●
●
●
●
●
●●●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●●
●
●
●
●
●●
●●
●
●
●
●●●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●●
●●
●
●
●●
●
●
●●
●●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●●
●●
●●
●
●●
●●
●
●●●
●●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●●●
●●
●●
●
●●
●●
●●●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●●●
●●
●●●
●●
●●●●●●●●●●●●●●
●●●●●●●
●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●
●●●●
●●
●●
●●
●●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●●●
●●●
●●
●●
●
●
●●
●●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●●●
●●●
●●
●●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●●●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●●
●●
●● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●●●
●●●
●●
●●●
●●
●
●●
●
●●●●
●
●●●
●
●●
●●●
●
●●
●
●●●●
●
●●
●●
●●●●●
●●
●●
●●●●
●●
●●●●
●
●●
●●
●●●
●
●●●●●●●
●●
●●
●●
●●●●
●●
●●●●●
●●
●
●●●●
●
●●●●●
●●●
●●
●
●●●●●●●
●●
●●
●●
●●●●●●
●
●●●
●●●●
●
●●
●
●●●●
●
●●
●●
●●●
●●●
●●
●●
●●●
●
●●
●●
●
●●
●
●●●●
●
●●
●●
●●
●●
●●
●●
●
●●
●●
●
●●
●
●●●●
●
●●
●●
●●
●●
●●●●
●
●●
●●
●
●●
●
●●●●
●
●●
●●
●●●●
●●●
●
●
●●
●●
●●
●●●●
●●
●●
●●
●
●●
●●
●●●●
●●●●
●●
●●
●●
●
●●
●●●●●●●●
●●
●●●
●●
●●●●
●●
●●●●
●●●●
●●
●●
●●
●
●
●●
●●
●
●
●●
●●
●●
●●
●●●
●●●●
●●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●●
●●
●●
●●
●●
●●●
●●●●
●●●●●●
●●
●
●●
●
●●
●●
●●●
●●●●
●
●●●●●
●
●●
●●
●●●●
●●
●●●●
●●●●●
●●
●
●●
●●
●
●●
●
●●●●
●
●●
●●
●●●
●●
● ●●
●●●●
●●
●●
●●
●●●●
●●
●●
●
●●
●
●●
●
●●●●
●
●●
●●
●●●●●●
●●
●●
●●
●●
●●
●
●●●
●●●
●●
●
●●●●
●
●●
●●
●●●●●●●●●
●
●●
●●
●●
●●
●●
●●●●
●●
●
●●●●
●
●●
●●
●●●●●●
●●●●
●
●
●●
●
●●
●●
●
●●
●
●●
●●
●
●●
●●
●●●●●●
●
●●●●
●●●
●
●●
●
●
●●
●●●●
●●
●
●●●●
●
●●
●●
●●●●
●
●●●
●●
●●
●
●
●●
●
●
●●
●
●●●●
●●
●●●●
●
●●
●●
●●
●●●●
●
●●
●●●●
●
●
●●
●
●
●●
●●
●●
●●
●●●●
●●
●●
●●
●●
●●●
●
●●●●
●●●
●●
●●
●●
●●
●
●●
●●
●
●●●●
●●
●●
●●
●●
●
●●●●
●●●●
●
●
●●
●●●●
●●●
●●
●
●●●●
●
●
●●
●
●●
●●●●
●●
●●
●●
●●●
●
●
●
●●
●
●●
●●●●
●●●
●●●●
●
●●
●●
●●
●●
●
●●●●
●●
●●
●●
●● ●●
●
●
●●
●●●
●●
●
●●
●●
●●●●
●●●●
●
●
●●●
●●
●●
●
●●●●
●●
●●
●●●●
●●
●●
●
●
●●
●
●●
●
●●
●●●
●●●
●●
●
●●●●
●●
●●
●●
●●●
●●
●
●
●●
●●
●●
●●●
●●
●
●●
●●
●
●
●
●
●●
●●●
●
●
●●●●●●
●●● ●●
●●
●
●●
●●
●
●●
●●●●
● ●●●
●
●●
●● ●
●●
●
●●
42.551
42.552
42.553
42.554
42.555
42.556
−89.985 −89.980 −89.975 −89.970lon
lat
Yield●
●
●
●
(29.1,56.5]
(56.5,60.4]
(60.4,63.9]
(63.9,83.9]
Figure 1:
Dados de Smidt et al. (2016).
Exemplo: soja em Wisconsin
●●●●●●
●●●●●●
●●●●●●
●●●●●●
●●●●●●●
●●●●●●●●
●●●●●●●●
●●●●●●●●●
●●●●●●●●●
●●●●●
●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●●●●●●●●●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●●●●
●●●●●●●
●●●●●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●
●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●
●
●●
42.551
42.552
42.553
42.554
42.555
42.556
−89.985 −89.980 −89.975 −89.970lon
lat
920
940
960
Value
Elevation (feet)
●●●●●●
●●●●●●
●●●●●●
●●●●●●
●●●●●●●
●●●●●●●●
●●●●●●●●
●●●●●●●●●
●●●●●●●●●
●●●●●
●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●●●●●●●●●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●●●●
●●●●●●●
●●●●●●●●●
●●●●●●●●●●●
●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●
●●●●●●●
●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●
●
●●
42.551
42.552
42.553
42.554
42.555
42.556
−89.985 −89.980 −89.975 −89.970lon
lat
Value●
●
●
100
140
180
Seeding Rate (seeds/ha)
Figure 2: Covariáveis com estrutura espacial
Exemplo: soja em Wisconsin
42.552
42.554
42.556
−89.985 −89.980 −89.975 −89.970x
y
−20
−10
0
10
Residuals
Figure 3: Resíduos do ajuste de quadrados mínimos
Modelos espaço-temporaisOs maiores desafios de estatística espacial modernos são os modelos espaço-temporais,em particular pela sua conexão com questões de mudança climática. Temperatura dasuperfície do oceano, fonte: https://ourocean.jpl.nasa.gov/
Figure 4: Fonte: https://ourocean.jpl.nasa.gov/
Introdução a dados areais
Lattice data engloba problemas indexados num espaço discreto, com D sendotradicionalmente Z2 (espacial). Porém, a teoria de lattice se estende a dados areais, istoé, o processo Xs está definido em um número discreto de células s com alguma noção deadjacência entre elas.
Campos aleatórios no Z2
Figure 5: Modelo de Ising; copiei a figura de Gaetan and Guyon (2010)
Dados areais
Percentage with blood group A in Eire
under 27.9127.91 − 29.2629.26 − 31.02over 31.02
Dados areais: adjacencia
Introdução a processos pontuais
Um processo pontual é um modelo estocástico para padrões de pontos indistinguíveis(point patterns) em uma região. Uma realização de um processo pontual é uma coleçãode pontos x = {x1, . . . , xN} em uma região S. Note que tanto o número de pontos Nquanto a localização dos pontos xi , i = 1, . . . ,N são variáveis aleatórias.
Nos exemplos e aplicações, consideramos apenas S = R2, mas os processos existem emoutros espaços (Rd , superfície de esferas, etc).
Fenômenos que podem ser modelados com processos pontuais incluem configurações deárvores, células, terremotos e galáxias, entre outros (Illian et al., 2008).
Interesses de pesquisa
I Dependência dos pontos entre si: como caracterizar independência, repulsão eagrupamento.
I Estatísticas de resumo do processo pontual: número esperado de pontos,intensidade, etc.
I Dependência dos pontos em relação a efeitos ambientais (covariáveis). Emparticular, como caracterizar a dependência entre os pontos e covariáveis.
I Exemplos e parte do código usa o pacote spatstat (Baddeley et al., 2005)
História
Figure 6: Peter Guttorp, 31o. CBM: https://www.youtube.com/watch?v=2gNIpiSKzTQ
Teoria, processos pontuais
Daley and Vere-Jones (2003), Møller and Waagepetersen (2003) e Illian et al. (2008)
Exemplo: árvores tropicais
Beilschmiedia pendula
Árvores do tipo Beilschmiedia pendula, na ilha de Barro Colorado (Panamá). São 3605árvores em uma janela de 1000× 500m2. Fonte: spatstat::bei.
Exemplo: árvores tropicais
0.05
0.1
0.15
0.2
0.25
0.3
Beilschmiedia pendula + Slope gradient
Sobreposição das árvores à covariável correspondente à inclinação do terreno (efeitoambiental).
Chorley and South Ribble, UK
Câncer em Chorley−Ribble
PulmãoLaringeIncinerador
Função de intensidade
I Suponha que B ⊂ S = R2. Seja n(x) a cardinalidade de x. Então x é localmentefinito se n(xB) <∞ quando |B| <∞, onde xB = x ∩ B. Em outras palavras,quando olhamos o processo em uma caixa B, nós estamos interessados apenas emconfigurações de pontos finitas.
I Defina a variável aleatória N(X ∩ B) = n(XB), e a medida de intensidade Λ por
Λ(B) = E(N(X ∩ B)).
A função de intensidade λ é dada por
Λ(B) =∫
Bλ(s)ds,
e se λ(s) = λ para todo s, o processo é chamado de homogêneo.
Processo de Poisson
Seja µ uma medida difusa e localmente finita, tal que
µ(B) =∫
Bρ(s)ds.
Um processo de Poisson no R2 pode ser caracterizado como
1. Para qualquer B ⊂ R2 com µ(B) <∞, N(B) ∼ Poisson(µ(B)).2. Se B1,B2 ⊂ R2 são disjuntos, então N(B1),N(B2) são independentes.
Equivalente:
2.’ Seja f uma função de densidade, f = ρ/∫ρ, x1, . . . , xn condicionado a N = n tem
densidade conjunta
fn(x1, . . . , xn|N = n) =n∏
i=1f (xi )
Processo de Poisson simulado na caixa [0, 1]2
PP Poisson homogêneo, ρ = 100 Não−homogêneo, ρ(u) = exp(2 + 4u1)
Complete Spatial RandomnessUm dos primeiros testes χ2 foi implementado para testar homogeneidade espacial
library(spatstat)set.seed(1)X <- rpoispp(100, win = owin(c(0,1), c(0,1)))f <- function(x,y) exp(2+4*x)Y <- rpoispp(f, win = owin(c(0,1), c(0,1)))Test.A <- quadrat.test(X, 3, 3); Test.A$p.value
## [1] 0.841937
Test.B <- quadrat.test(Y, 3, 3); Test.B$p.value
## [1] 5.306599e-16
Complete Spatial Randomness
7 8 13
11 14 15
8 11 6
10.3 10.3 10.3
10.3 10.3 10.3
10.3 10.3 10.3
−1 −0.73 0.83
0.21 1.1 1.5
−0.73 0.21 −1.3
Teste quando PPP homogêneo, ρ = 100
1 13 29
2 5 22
0 6 27
11.7 11.7 11.7
11.7 11.7 11.7
11.7 11.7 11.7
−3.1 0.39 5.1
−2.8 −2 3
−3.4 −1.7 4.5
Teste quando PPPNH, ρ(u) = exp(2 + 4u1)
Interações de segunda ordem, caso não-Poisson: atração e repulsão
Processo Hardcore (repulsivo) Processo de Poisson Processo de Thomas (atrativo)
Agora, a parte burocrática...
Avaliação, parte comum
I A presença mínima no curso deve ser de 75%. Em outras palavras, 7 ou menosfaltas ok, 8 ou mais resultará em reprovação. A Unicamp só abona faltas em casosmuito específicos, justificados em até 15 dias da falta e dentro do período do curso(acabamos no 15/02), veja o regulamento.
I Uma prova no dia 25/01, com peso 40%. O material de ME907 está contido emMI418; a prova será somente dos tópicos de ME907 (isto é, paramos antes deestatística espaço-temporal). Tanto alunos de graduação quanto pós-graduaçãodevem fazer a prova.
I A segunda parte da nota no curso será diferente para os alunos de graduação epós-graduação. Ambos terão que fazer um trabalho, e deverão informar acaracterística do trabalho até dia 14/01 (segunda-feira da semana que vem).
Avaliação, graduação
I Os alunos de graduação e alunos especiais devem preparar uma apresentação de 40minutos sobre uma análise de dados espaciais e/ou espaço temporais, em qualquertópico do curso. Os dados devem ser diferentes para cada aluno, e devem serbaseados em problemas reais, de preferência brasileiros. A análise deve mostrardomínio sobre o assunto da disciplina, explicando a metodologia na prática.
I O aluno pode optar por fazer uma leitura de artigo, como na pós-graduação.I A apresentação tem peso 60% na nota do aluno de graduação.I O aluno de graduação tem direito a um exame (dia 18/02), se tiver nota no curso
maior que 2.5, mas menor que 5. Se o aluno tiver nota maior que 5 e quiser tentaraumentá-la com um exame, deve me informar antes (até dia 15, no máximo).
I Não haverá exame se nenhum aluno precisar (i.e. estiver sob risco de reprovação).
Avaliação, pós graduação
I Os alunos de pós-graduação deverão preparar uma apresentação de 40 minutossobre um artigo científico envolvendo estatística espacial, publicado recentementeem revista de alta qualidade. A apresentação deve explicar as idéias principais doartigo, e oferecer uma visão crítica sobre o conteúdo.
I O artigo deve ter sido publicado após 2015. O artigo deve ser de revista de altaqualidade (A1 ou similar, e.g. Annals of Statistics, JASA, JRSS, etc.) ou emrevistas específicas de estatística espacial de alta qualidade (Spatial Statistics,Environmetrics, etc.). Tragam duas ou mais opções de artigos, caso alguém escolhaum mesmo artigo e a gente precise mudar.
I Cada apresentação deverá ser comentada por um segundo aluno, no estilo da ASA;o segundo aluno terá 10 minutos para fazer observações, comentários, discussão,etc.
Referências IBaddeley, A., Turner, R., et al. (2005). Spatstat: an r package for analyzing spatialpoint patterns. Journal of statistical software, 12(6):1–42.
Cressie, N. (1993). Statistics for Spatial Data, 2nd edition. Wiley, New York.Cressie, N. and Wikle, C. K. (2011). Statistics for Spatio-Temporal Data. Wiley, NewYork.
Daley, D. J. and Vere-Jones, D. (2003). An Introduction to the Theory of PointProcesses, vol. 1. Springer, New York.
Gaetan, C. and Guyon, X. (2010). Spatial Statistics and Modeling. Springer, New York.Illian, J., Penttinen, A., Stoyan, H., and Stoyan, D. (2008). Statistical Analysis andModelling of Spatial Point Patterns, volume 70. John Wiley & Sons.
Møller, J. and Waagepetersen, R. P. (2003). Statistical Inference and Simulation forSpatial Point Processes. Chapman & Hall, Baton Rouge.
Smidt, E. R., Conley, S. P., Zhu, J., and Arriaga, F. J. (2016). Identifying fieldattributes that predict soybean yield using random forest analysis. Agronomy Journal,108(2):637–646.