26
SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS Bárbara Maria Giaccom Ribeiro RELATÓRIO DE ATIVIDADES LABORATÓRIO Nº 1: ANÁLISE DE PADRÕES DE PONTOS INPE São José dos Campos 2008

SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS

Bárbara Maria Giaccom Ribeiro

RELATÓRIO DE ATIVIDADES LABORATÓRIO Nº 1: ANÁLISE DE PADRÕES DE PONTOS

INPE São José dos Campos

2008

Page 2: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

1

1 INTRODUÇÃO

O Laboratório 1 teve como objetivo ilustrar as várias formas de analisar padrão de

pontos, a partir de alguns conjuntos de dados. As ferramentas de análise disponíveis no

SPRING são: o Interpolador Kernel, o Método do Vizinho Mais Próximo e a Função K.

A análise de dados espaciais consiste na observação de dados disponíveis no

espaço e na descrição e explicação do comportamento do processo espacial e de suas

relações com algum outro fenômeno espacial.

No caso da análise de "padrões pontuais" os dados são pontos relacionados a algum

evento, como por exemplo, ocorrência de mortes (por homicídio, acidente de trânsito, etc).

Em análise de padrões de pontos, somente a localização dos pontos é considerada, ao

contrário da geoestatística, onde os atributos relacionados à amostra, ponto, são

importantes.

O objetivo básico da análise de padrões pontuais é verificar se os eventos

observados em uma dada região de estudo apresentam comportamento sistemático,

como por exemplo, agrupamento, regularidade ou aleatoriedade.

2 DADOS

Os dados disponíveis dividiam-se em dois bancos de dados distintos:

• Bairros de São Paulo: percentual de idosos (mais que 70 anos) na cidade de São

Paulo, agregados por bairros.

• Porto Alegre – RS: violência por homicídios, acidentes de transporte e suicídios,

na cidade de Porto Alegre – RS.

3 DESENVOLVIMENTO

O Laboratório 1 foi dividido em duas etapas: na primeira, o Estimador de Densidade por

Kernel foi aplicado nos dados dos dois bancos (Porto Alegre e São Paulo); na segunda,

foi realizada uma Análise Univariada de Pontos somente nos dados de Porto Alegre.

A. Estimador de Densidade por Kernel

A-1. aplicação do Kernel para os dados de Porto Alegre (eventos)

A-2. aplicação do Kernel para os dados de São Paulo (área)

Page 3: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

2

B. Análise Univariada de Pontos aplicado aos dados de Porto Alegre

B-1. análise do vizinho mais próximo

B-2. análise do vizinho mais próximo com simulação

B-3. análise da função L

B-4. análise da função L com simulação

A. Estimador de Densidade por Kernel

A-1. Porto Alegre – dados de eventos (mortalidade)

A interpolação – geração uma grade numérica de superfície a partir de dados

pontuais – da intensidade de eventos de mortalidade no município de Porto Alegre foi

realizada por meio da aplicação da estimativa Kernel. O estimador de Kernel é uma

medida de um suavizador de pontos (número de eventos por unidade de área), conforme

definido abaixo:

(1)

onde : hi é a distância do ponto s e a localização si ; τ é a largura da banda, sendo que

quanto menor esta for, menos suave é o efeito.

Nesta fase do laboratório, foi utilizado o banco de dados Porto Alegre, e o projeto

de mesmo nome, com projeção UTM/SAD69, determinado pelas seguintes coordenadas:

62º 23’ 9,93” O e 75º 2’ 28,18” S; 61º 15’ 22,20” O e 74º 37’ 46,09” S.

Figura A1 – ativação do banco de dados

Porto Alegre. Figura A2 – ativação do projeto Porto Alegre dentro

do banco de dados Porto Alegre.

Inicialmente ativou-se o Banco de Dados e o Projeto com os respectivos dados. Os

dados pontuais correspondentes aos eventos de homicídios, suicídios e acidentes de trânsito

puderam ser visualizados, e então se procedeu a fase da aplicação do método de Kernel.

Page 4: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

3

Figura A3 – visualização dos PIs: Limites (categoria: Recorte) e Município (categoria: Eventos_Mortalidade).

No menu “Análise” acessou-se “Estatística Espacial” e posteriormente “Estimador

de Densidade por Kernel”. Na interface apresentada, seleciona-se o tipo de dado (neste

caso, ponto – associado ao PI “Eventos_Mortalidade”), define-se a largura da banda (τ =

2500) e seleciona-se a categoria e o PI de saída (o qual será MNT / PI Numérico).

Figura A4 – Análise >> Estatística Espacial >> Estimador de Densidade por Kernel >> tela de configuração

dos parâmetros para realização do Kernel.

Page 5: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

4

Figura A5 – grade numérica resultante da realização do Kernel.

Para melhor visualização e interpretação do resultado, é mais comum a utilização da

imagem (superfície) gerada a partir da grade numérica. Isto pode ser realizado, fazendo-

se uma transformação do tipo Grade → Imagem (Figura A6).

Figura A6 – MNT >> Geração de Imagem >> Geração de Imagem MNT.

Page 6: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

5

Figura A7 – imagem gerada a partir da grade numérica resultante da realização do Kernel.

Para uma melhor apresentação visual do resultado obtido, pode-se efetuar o

recorte na imagem gerada. Isto é realizado através de um programa escrito em linguagem

LEGAL:

Figura 8 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para recorte da imagem

(Im_Kernel_2500) segundo os limites do município de Porto Alegre (Categoria: Recorte, PI: Limites).

Page 7: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

6

Figura A9 – imagem recortada relativa à superfície da grade numérica resultante da realização do Kernel.

Em seguida, a grade gerada a partir do método de Kernel foi fatiada em cinco

classes (por meio de programa em LEGAL): baixa, baixa-média, média, média-alta e alta,

considerando um intervalo fixo determinado a partir da diferença entre a cota mínima e a

cota máxima, em ambos os valores da banda do Kernel. A figura A11 demonstra as

diferenças após o fatiamento da grade.

Figura A10 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para fatiamento da

grade numérica (Kernel_2500) em cinco classes.

Page 8: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

7

Figura A11 – fatiamento da grade numérica resultante da realização do Kernel.

Novamente, para uma melhor apresentação visual da imagem fatiada, foi realizado

um recorte segundo os limites do município de Porto Alegre (figura A13).

Figura A12 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para recorte da

imagem fatiada (Fat_Kernel_2500) segundo os limites do município de Porto Alegre.

Page 9: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

8

Figura A13 – imagem fatiada da grade numérica (Kernel, τ = 2500) recortada segundo limites do município.

Para efeito de comparação foram realizadas outras três interpolações Kernel

utilizando diferentes larguras de bandas (τ), 500, 1500, e 5000 metros, de modo a verificar

seus efeitos e resultados. As etapas desenvolvidas anteriormente, para geração da

imagem final relativa ao Kernel τ = 2500 foram repetidas para cada um dos três casos. Os

resultados são mostrados a seguir:

Figura A14 – imagem fatiada de grades numéricas produzidas a partir da aplicação do

Estimador de Densidade por Kernel, com as seguintes larguras de banda,

respectivamente: τ = 500m, τ = 1500m, τ = 2500m e τ = 5000m.

Por meio da figura A14, com os resultados de cada interpolação, é possível

verificar o crescente efeito de suavização, não só das bordas entre as classes, como da

τ = 500 τ = 1500 τ = 2500 τ = 5000

Page 10: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

9

intensidade de eventos de mortalidade, com o aumento da largura de banda de 500 a

5000 metros. Isso ocorre porque para o cálculo da intensidade em cada ponto da

superfície a largura da banda ao quadrado entra na equação como um fator de divisão.

A-2. São Paulo – dados de atributos (idosos)

O segundo exercício abordou a aplicação do Kernel considerando o valor do

atributo e foi realizado utilizando o banco de dados Bairros_SP. Os dados contidos neste

banco referem-se somente aos bairros da região central e leste da cidade de São Paulo.

O atributo a ser analisado é o percentual de idosos (pessoas com mais que 70 anos).

Diferente do exemplo anterior, agora o Kernel refere-se à medida da quantidade total do

atributo por unidade de área (ver fórmula 2). O tipo de dado de que se está tratando agora é

do tipo área; isto é, o PI Mapa_Bairros é cadastral e possui polígonos (áreas) associados.

(2)

Para realizar este cálculo, o estimador assume que cada observação de área yi

deve ser associado a um evento sj, como por exemplo, o centróide dessa área. Assim, a

estimativa para um novo ponto s considera o número de si presentes conforme a largura

da banda (τ). O mesmo raciocínio de suavização para bandas mais largas é válido

também nesse exercício. Pode-se perceber, na figura A23, que a estimativa Kernel é mais

suave quando se utiliza bandas mais largas.

O banco de dados utilizado foi o Bairros_SP, e o projeto de mesmo nome, com

projeção UTM/SAD69, determinado pelas seguintes coordenadas: 46º 47’ 37,90”O, 23º

37’ 50,10”S; 46º 21’ 38,54”O e 23º 26’ 11,77”S.

Figura A15 – ativação do banco de dados

Bairros_SP. Figura A16 – ativação do projeto Bairros_SP dentro

do banco de dados Bairros_SP.

Page 11: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

10

Figura A17 – visualização dos PIs: Limites (categoria: Recorte) e Mapa_Bairros (categoria: Mapa_Cadastral),

com a tabela de atributos relativa a cada objeto (bairro)

Figura A18 – Análise >> Estatística Espacial >> Estimador de Densidade por Kernel >> tela de configuração

dos parâmetros para realização do Kernel.

Page 12: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

11

No menu “Análise” acessou-se “Estatística Espacial” e posteriormente “Estimador

de Densidade por Kernel”. Na interface apresentada, seleciona-se o tipo de dado (neste

caso, área – associado ao atributo “PERIDOSO”), define-se a largura da banda (τ = 3500)

e seleciona-se a categoria e o PI de saída (o qual será MNT / PI Numérico) (figura A18).

As figuras A19 e A20 mostram o resultado do Kernel aplicado aos bairros da cidade

de São Paulo e relativo ao atributo PERIDOSO (Percentual de Idosos / Bairro), em grade

numérica e em imagem (relativa à grade numérica) recortada conforme os limites da área

de estudo.

Figura A19 – grade numérica resultante da realização do Kernel.

Figura A20 – imagem recortada relativa à superfície da grade numérica resultante da realização do Kernel.

Page 13: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

12

O fatiamento da grade oriunda do Kernel e o recorte da imagem temática são

realizados utilizando um programa em LEGAL (figura A21). O resultado do fatiamento é

exibido na figura A22:

Figura A21 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para fatiamento da

grade numérica (Kernel_Peridoso_3500)e recorte da imagem (Im_Kernel_Peridoso_3500) segundo os limites

da área de estudo (Categoria: Recorte, PI: Limites).

Figura A22 – imagem fatiada da grade numérica (Kernel, τ = 3500) recortada segundo limites da área de estudo.

Para efeito de comparação foram realizadas outras três interpolações Kernel

utilizando diferentes larguras de bandas (τ), 1500, 2500, e 5000 metros, de modo a

Page 14: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

13

verificar seus efeitos e resultados. As etapas desenvolvidas anteriormente, para geração

da imagem final relativa ao Kernel τ = 3500 foram repetidas para cada um dos três casos.

Os resultados são mostrados a seguir:

Figura A23 – imagem fatiada de grades numéricas produzidas a partir da aplicação do

Estimador de Densidade por Kernel, com as seguintes larguras de banda, respectivamente:

τ = 1500m, τ = 2500m, τ = 3500m e τ = 5000m.

A análise do método de Kernel de acordo com o valor do atributo considerando

amostras de áreas apresenta resultados semelhantes ao exercício anterior. Por meio da

figura A23, que exibe os resultados de cada interpolação, é possível verificar o crescente

efeito de suavização, não só das bordas entre as classes, como da intensidade de

eventos de mortalidade, com o aumento da largura de banda de 1500 a 5000 metros. Isso

ocorre porque, quanto menor a largura da banda utilizada, mais detalhado é o resultado

final. No entanto, a banda com maior largura apresenta uma suavização maior dos dados,

generalizando as superfícies de áreas estudadas.

τ = 1500 τ = 2500

τ = 3500 τ = 5000

Page 15: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

14

B. Análise Univariada de Pontos aplicado aos dados de Porto Alegre

Na etapa B do Laboratório 1, foi retomado o banco da cidade de Porto Alegre com

dados relativos à mortalidade. A partir dos resultados gerados na etapa A, prosseguiu-se

a análise dos resultados obtidos pela aplicação do Estimador de Densidade por Kernel,

realizando-a de quatro maneiras:

B-1. análise do vizinho mais próximo

B-2. análise do vizinho mais próximo com simulação

B-3. análise da função L (derivada da Função K)

B-4. análise da função L com simulação

Análises espaciais de dados envolvem métodos que podem ser divididos entre os

relacionados à visualização dos dados (métodos exploratórios) e aqueles centralizados na

especificação do modelo estatístico e na estimativa de parâmetros.

O SPRING apresenta dois procedimentos para a análise de padrões pontuais

univariados: o método da Distância ao Vizinho Mais Próximo e o da Função L. Os dois

métodos analisam propriedades dos dados, conhecidas como de segunda ordem ou

dependência espacial. A componente de segunda ordem é responsável pelos desvios

estocásticos em relação à média e, ao invés de assumir esses desvios espacialmente

independentes, considera uma estrutura de covariância espacial ou dependência espacial

no processo. Essa componente de segunda ordem é modelada como um processo

espacial estacionário e isotrópico.

Um processo espacial {Y(s), s∈R} é estacionário ou homogêneo se suas

propriedades estatísticas, média e variância, são constantes na região R e, portanto, não

dependem da localização, s. A estacionaridade também sugere que a matriz de

covariância, entre valores de quaisquer dois lugares si e sj, depende exclusivamente da

direção e distância entre eles e não de seus valores absolutos. Se, além disso, a matriz

de covariância do processo for independente da direção, então tem-se um processo

estacionário isotrópico. Em um processo isotrópico, existe uma relação estreita entre a

distribuição das distâncias entre eventos e as propriedades de segunda ordem.

A distância ao vizinho mais próximo é uma medida que leva em consideração

propriedades de segunda ordem. O grau de dependência espacial em um padrão de

pontos pode ser verificado observando-se o comportamento da distribuição acumulada

dessas distâncias.

Page 16: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

15

B-1. Análise do Vizinho Mais Próximo

O método do Vizinho Mais Próximo considera a estimativa de G(w), como a distribuição

acumulada da distância entre qualquer evento escolhido aleatoriamente e o evento

vizinho mais próximo. Para a análise univariada, a estimativa do vizinho mais próximo é

reduzida a:

n

wwwG i )(#

)(ˆ ≤= (3)

onde: n é o número de eventos, wi são as faixas de distâncias (distância medida entre

eventos) e w, a distância de análise (distância de comparação escolhida pelo usuário).

A técnica de análise pelo método do Vizinho Mais Próximo produz um gráfico da

freqüência acumulada da distância de cada ponto (evento) ao seu vizinho mais próximo:

Figura B1 – gráfico típico resultante da aplicação do método Vizinho Mais Próximo.

Os gráficos dos resultados empíricos de G(w) versus w podem ser utilizados como

método para inferir se há alguma evidência de interação entre os eventos. Se o gráfico

mostra uma função com brusca elevação no início, pode sugerir um agrupamento na

escala considerada. Por outro lado, se a elevação ocorre a intervalos de distâncias

maiores, mais para o final da curva, sugere-se repulsão ou regularidade entre os eventos.

Caso essa elevação seja constante, com inclinação próxima a 45º, sugere-se

aleatoriedade.

O exercício foi iniciado reativando-se o banco de dados e o projeto referente aos

dados de eventos da cidade de Porto Alegre. Para realização desta análise, no menu

“Análise” selecionou-se “Estatística Espacial” e logo, “Análise Univariada de Pontos”. Na

interface apresentada, a análise escolhida foi a do “Vizinho Mais Próximo”, e foram

inseridos os seguintes parâmetros: distância mínima = 0, número de intervalos = 10 e

distância máxima = 2500 (figura B3).

w

wi

1

0 w

)(ˆ wG

Page 17: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

16

Figura B2 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos

parâmetros para realização da análise pelo método do Vizinho Mais Próximo. Gráfico resultante da aplicação do método Vizinho Mais Próximo (distância máxima = 2500m).

Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido

modificada somente as distâncias máximas para os valores de: 500m, 1500m e 5000m.

Na figura B3 podem ser observados os gráficos resultantes de cada uma das análises.

Figura B3 – gráficos resultantes da aplicação do método Vizinho Mais Próximo, para as distâncias máximas

de 500m, 1500m, 2500m e 5000m, respectivamente.

No primeiro caso utilizou-se uma distância máxima de 500m, e o gráfico obtido

apresentou uma curva mais suave, com uma elevação menos brusca em relação aos

demais. Esse caso define, segundo a interpretação do gráfico, uma elevação próxima a

Page 18: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

17

ser constante (45°), indicando aleatoriedade dos da dos.

O segundo e o terceiro resultados são intermediários entre o primeiro e o último

gráfico. Há evidências mais consistentes da existência de clusters para a escala de

distancia de 2500 que para a de 1500. Porém, para as duas distâncias pode-se assumir a

existência de agrupamentos, pois a elevação da curva supera o ângulo de 45º e com

brusca elevação no início.

O gráfico resultante da distância máxima de 5000m mostra uma elevação brusca,

sugerindo uma forte evidência de agrupamentos. Desta forma, é possível dizer que,

quanto maior a distância considerada entre os eventos, maior é a evidência de

agrupamento dos dados na escala que foi considerada.

Para este exercício, as distâncias máximas foram estabelecidas segundo aquelas

determinadas para a realização do exercício de aplicação do Estimador de Densidade por

Kernel (etapa A). A definição da distância a ser adotada é estabelecida de acordo com o

objetivo e geometria dos dados, além da escala de trabalho. Percebe-se que este tipo de

análise tem o resultado fortemente dependente da escala.

B-2. Análise do Vizinho Mais Próximo com Simulação

O Vizinho Mais Próximo pode ser usado como método formal para comparação

estatística da distribuição observada dos eventos, com o que seria esperado sob a

hipótese de Aleatoriedade Espacial Completa (CSR - Complete Spatial Randomness).

Este caso corresponde à opção de Vizinho Mais Próximo com Simulação.

O modelo espacial padrão para Aleatoriedade Espacial Completa é aquele em que

os eventos seguem um processo homogêneo de Poisson na região de estudo. Isto

significa que no processo espacial pontual descrito, considera-se Y(Ai) e Y(Aj) variáveis

aleatórias independentes para qualquer escolha de Ai e Aj e que a distribuição de

probabilidade de Y(A) obedece à distribuição de Poisson com média λA, onde A é a área

de A e λ, o número médio de eventos por unidade de área. Além disso, considerando o

número total de eventos em R, eventos são independentes e uniformemente distribuídos

em R. Isto significa que qualquer evento tem a mesma probabilidade de ocorrer em

qualquer posição e que a posição de qualquer evento é independente da posição do

outro, não havendo interação entre eventos. Pode-se então simular n eventos com

distribuição uniforme dentro da região, e formular a hipótese para testar se os padrões

observados estão agrupados, aleatórios ou regulares.

Page 19: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

18

Esse método permite a comparação da função acumulada das amostras com a de

dados gerados aleatoriamente (envelopes de simulação superior e inferior).

Envelope Superior: (m é número de simulações).

Envelope Inferior:

O método consiste em simular "envelopes" para a distribuição CSR para avaliar a

significância dos dados de saída. A simulação estimada para G(w) sob a hipótese CSR é:

m

wG

wG

m

ii∑

== 1

)(ˆ

)( (4)

onde Ĝi (w), i=1,...n são as funções distribuição estimadas sem correção de borda. Cada

uma das n funções estimadas corresponde a uma simulação e para cada simulação são

gerados m eventos independentes com distribuição uniforme.

Figura B4 – gráficos típicos resultantes da análise pelo método Vizinho Mais Próximo com Simulação.

Se os dados são compatíveis com CSR (se as amostras estiverem distribuídas

aleatoriamente), o resultado a ser obtido ao se plotar a função simulada (w) versus a

função acumulada adquirida a partir das observações, Ĝ(w), deverá ser uma função

próxima de uma linear a 45º. Se existir agrupamento, a função observada Ĝ(w) deverá estar

acima da reta de 45º; na presença de regularidade, Ĝ(w) ficará abaixo da reta (figura B4).

Para realização desta análise, no menu “Análise” selecionou-se “Estatística

Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a análise

escolhida foi a do “Vizinho Mais Próximo com Simulação”, e foram inseridos os seguintes

parâmetros: distância mínima = 0, número de intervalos = 10, distância máxima = 2500 e

número de simulações = 10 (figura B5).

miwGwU i ,...,3,2,1)},(ˆmax{)( ==

miwGwI i ,...,3,2,1)},(ˆmin{)( ==

Inferior

Superior

Ĝ(w)

G (w)

Estimada

Inferior Superior

Ĝ(w)

G (w)

Estimada

G

Page 20: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

19

Figura B5 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos

parâmetros para realização da análise pelo método do Vizinho Mais Próximo com Simulação. Gráfico resultante da aplicação do método VMP com Simulação (distância máxima = 2500m).

Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido

modificada somente as distâncias máximas para os valores de: 1500m, 5000m e 10000m.

Na figura B6 podem ser observados os gráficos resultantes de cada uma das análises.

Figura B6 – gráficos resultantes da aplicação do método Vizinho Mais Próximo com Simulação, para as

distâncias máximas de 1500m, 2500m, 5000m e 10000m, respectivamente.

(1500) (2500)

(5000) (10.000)

Page 21: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

20

Nos três primeiros gráficos da figura B6, cujas distâncias máximas adotadas foram,

respectivamente, 1500m, 2500m e 5000m, a função se destacou acima de uma reta de

45°, demonstrando o agrupamento dos dados de acordo com a escala. No último gráfico

(distância máxima = 10.000m), a função obtida está próxima de uma linear a 45º, o que

indica que as amostras podem estar distribuídas aleatoriamente.

B-3. Análise da Função L (derivada da Função K)

O método do Vizinho Mais Próximo baseia-se em distâncias aos eventos mais

próximos e, portanto, consideram as escalas menores do padrão. Para obter informações

mais efetivas de um padrão espacial abrangendo grandes intervalos de escala, o melhor

método é a Função L, que proporciona uma descrição mais efetiva da dependência

espacial em um intervalo mais largo de escalas e está relacionada com propriedades de

segunda ordem de um processo isotrópico.

O gráfico da Função K não é tão intuitivo quanto ao gráfico do Vizinho Mais

Próximo. Portanto utiliza-se uma função auxiliar L, para facilitar a interpretação. O

estimador da Função L é:

hhK

hL −=π

)(ˆ)(ˆ (5)

No gráfico de )(ˆ hL contra h, picos positivos indicam atração espacial ou

agrupamento e picos negativos indicam repulsão ou regularidade.

Figura B7 – gráfico típico resultante da análise pelo método Função L. h

0

extremos positivos

agregação espacial

em torno de zero: aleatório

extremos negativos

ordenação regular

)(ˆ hL

Page 22: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

21

No gráfico da Função L, os extremos positivos correspondem às distâncias (h) onde há

evidências de agregação na distribuição espacial dos eventos; em torno de zero, diz-se

que os eventos apresentam um tipo de distribuição espacial aleatória; nos extremos

negativos, há evidências de ordenação regular na distribuição espacial dos eventos.

O método da Função L tem, portanto, vantagens em relação à abordagem do

Vizinho Mais Próximo: apresenta informação em diversas escalas de padrões, envolve o

uso da localização precisa do evento e inclui todas as distâncias evento-evento. Outro

motivo para seu uso é que a forma teórica de K(h) é conhecida para vários modelos de

pontos. Portanto, )(ˆ hK não é utilizado apenas para explorar a dependência espacial, mas

na sugestão de modelos que representem essa dependência e na estimativa de

parâmetros do modelo.

Para realização desta análise por Função L, no menu “Análise” selecionou-se

“Estatística Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a

análise escolhida foi a da “Função L”, e foram inseridos os seguintes parâmetros:

distância mínima = 0, número de intervalos = 10, distância máxima = 2500 (figura B8).

Figura B8 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos

parâmetros para realização da análise pelo método do Função L. Gráfico resultante da aplicação do método Função L (distância máxima = 2500m).

Para efeito de comparação, a operação foi realizada mais oito vezes, tendo sido

modificada somente as distâncias máximas para os valores de: 100, 500, 1500, 5000,

8000, 10.000, 15.000 e 20.000. Na figura B9 podem ser observados os gráficos

resultantes de cada uma das análises.

Page 23: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

22

Figura B9 – gráficos resultantes da aplicação do método Função L, para as distâncias máximas de 100, 500,

1500, 2500, 5000, 8000, 10.000, 15.000 e 20.000, respectivamente.

Os resultados sugerem haver agrupamento na distribuição dos pontos analisados

utilizando as distâncias máximas de 8000, 10.000 e 15.000. A análise destes gráficos,

juntamente com o relativo à distância máxima de 20.000, sugere que o agrupamento está

em torno dos 7.500m, distância esta maior do que as que retornaram evidência de

agrupamento no método por Vizinho Mais Próximo (2500 e 5000m).

No caso do último gráfico, observa-se que os dados com distancia de 20.000m

possuem evidências de ordenação regular na distribuição espacial dos eventos (pois este

trecho da curva caminha em direção a seu extremo negativo).

Embora as curvas dos gráficos relativos às distâncias de 500, 1500, 2500 e 5000

não “atinjam” o pico, pode-se dizer que esses resultados sugerem agregação dos dados

espacialmente, uma vez que essas curvas tendem aos extremos positivos.

Dessa forma, verifica-se que o método da Função L é mais adequado para escalas

geográficas menores.

(100) (500) (1500)

(2500) (5000) (8000)

(10.000) (15.000) (20.000)

Page 24: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

23

B-4. Análise da Função L com Simulação

No caso da Função L com Simulação, assim como no caso Vizinho Mais Próximo

com Simulação, são construídos envelopes superiores e inferiores para m simulações de n

eventos na região, sob hipótese de Aleatoriedade Espacial Completa, CSR, e as

estimativas associadas de )(ˆ hL . Os envelopes são incluídos no gráfico da Função L

versus h.

Por meio desta abordagem, pode se estimar a significância dos desvios da

distribuição )(ˆ hL em relação à aleatoriedade (CSR - Complete Spatial Randomness). São

realizadas simulações CSR sobre a região R e computam-se os envelopes superior e

inferior.

Figura B10 – gráfico típico resultante da análise pelo método Função L com Simulação.

No gráfico da Função Estimada L e envelopes versus distância são verificados

valores positivos para )(ˆ hL , localizados acima dos envelopes, o que caracteriza

agrupamento nesta escala de distância. O agrupamento é mais forte para as distâncias

que correspondem aos extremos da curva de )(ˆ hL . Extremos negativos, abaixo dos

envelopes, representam regularidade para as respectivas distâncias.

Para realização desta análise, no menu “Análise” selecionou-se “Estatística

Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a análise

escolhida foi a da “Função L com Simulação”, e foram inseridos os seguintes parâmetros:

distância mínima = 0, número de intervalos = 50, distância máxima = 10.000 e número de

simulações = 10 (figura B11).

mihLhUpper i ,...,3,2,1)},(ˆ{max)( ==

mihLhLower i ,...,3,2,1)},(ˆ{min)( ==

Upper (h)

Lower (h)

aleatório

)(ˆ hL

h

Estimada

Page 25: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

24

Figura B11 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos

parâmetros para realização da análise pelo método do Função L com Simulação. Gráfico resultante da aplicação do método Função L com Simulação (distância máxima = 10.000m).

Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido

modificada somente as distâncias máximas para os valores de: 5000, 15.000 e 20.000.

Na figura B12 podem ser observados os gráficos resultantes de cada uma das análises.

Figura B12 – gráficos resultantes da aplicação do método Função L com Simulação, para as distâncias

máximas de 5000, 10.000, 15.000 e 20.000, respectivamente.

Os resultados exibidos por meio dos gráficos da figura B12 indicam que, para todas

distâncias máximas testadas, há indicação de agrupamento entre as amostras. Isto é, os

valores estimados foram superiores ao envelope de aleatoriedade da distribuição dos

(15.000) (20.000)

(5.000) (10.000)

Page 26: SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOSwiki.dpi.inpe.br › lib › ...relatorio_anespacial-lab01.pdf · relações com algum outro fenômeno espacial. No caso da análise

25

pontos. De modo semelhante aos resultados obtidos com a aplicação do método da

Função L, a curva estimada possui seu pico em torno de 7.500m, evidência de maior

agregação dos dados.

4 CONCLUSÃO

Por meio deste Laboratório 1, foi possível obter conhecimentos de análise estatística

espacial, aplicando-os no software SPRING e analisando os seus resultados a partir das

imagens e gráficos gerados.