22
Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Embed Size (px)

Citation preview

Page 1: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Climatologia II – ACA226Prof. Humberto Rocha

ESTATÍSTICA BÁSICA – Revisão

Séries Temporais – introdução

Page 2: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Referências sugeridas: 1- Estatística, P.L. Costa Neto, Ed. Edgard Blucher2 - Statistical methods in the atmospheric sciences, D. Wilks (2ª ed. Elsevier 2006)

Universo

Amostra

Definições

Variáveis aleatórias (v.a.): aquelas às quais existe um número Real associado a cada evento (ou possibilidade de ocorrência);

Série temporal : uma série de eventos discretos, ordenados no tempo.

Universo (ou população): conjunto de todos os elementos (ou dados) com uma certa característica comum;

Amostra: subconjunto do universo;

Climatologia II - ACA226 (Iag/USP)

Page 3: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Procedimentos básico para iniciar uma análise de séries temporais quanto à qualidade dos dados e interpretação de padrões gerais

Detecção de erros (grosseiros, sistemáticos, aleatórios); Inspeção visual; dispersão dos dados

Distribuição de Frequência (histogramas)

Medidas de posição : Amplitude, Média, Mediana, Moda

Medidas de Dispersão: Variância ; Desvio padrão ; Coef. variação

Alguns métodos Estatísticos análise de séries temporaisRegressão Linear

Determinísticos Componentes PrincipaisAnálise Espectral

Estocásticos (AR, MA, ARIMA ...)

evidência de erros ?

Climatologia II - ACA226 (Iag/USP)

Page 4: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Inspeção VisualDispersão dos dados

0

51015

2025

3035

4045

50

0 10 20 30 40 50

05

10

1520

2530

354045

50

0 20 40 60 80 100

Outlier

Série temporal de uma v.a. Eventos discretos

Periódica !?

Média estacionária !?

Variância não-estacionária !?

Amplitude de variação da série temporal Relação

entre duas v.a. Y e X

Climatologia II - ACA226 (Iag/USP)

Y

X

Page 5: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Distribuição de Frequências

Amostra: temperatura média durante 11 dias em SPDia Tmed (C) 1 22,02 23,53 23,94 22,55 23,76 24,67 24,18 23,29 22,810 23,411 24,2

N=11

Max = 24,6 C

Min = 22,0 C

Tendo-se uma amostra de v.a., deve-se identificar inicialmente:

N = no de dados (domínio, ou período se for série temporal)Máximo e mínimoClasse = subintervalos no domínio da amostra

Define-se a amplitude da classe:Por ex arbitrar igual a 0,5 C (homogênea)

Climatologia II - ACA226 (Iag/USP)

Page 6: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

i Classe i fi P(fi) fac Pac(%)1 22,0-22,4 1 1/11=0,091 1 1/11=9,12 22,5-22,9 2 2/11=0,183 3 3/11=27,33 23,0-23,4 2 2/11=0,185 5 5/11=45,54 23,5-23,9 3 3/11=0,278 8 8/11=72,74 24,0-24,4 2 2/11=0,181 10 10/11=90,95 24,5-24,9 1 1/11=0,091 11 11/11=100

22 23 24

30

20

10

0

100

75

50

25

0

P(fi)% (fi)

fac Pac(%)

classeClimatologia II - ACA226 (Iag/USP)

Page 7: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

(Prop) Área sob a curva da frequência relativa é:

NotasDefinição das classes

Homogênea: no de classes mínimo ~ 5.log n (sugestão inicial)

Heterogênea: quando há desproporcionalidade. Exemplo = precipitação diária (mm dia-1)

amplitudenn

amplitudefn

amplitudenfretângulos ii

i i

i amplitude

nffP i

i

aheterogênehomogênea

16

75 4

1 0,1 0,7 2,5 4,0

1ª Classe = 1 mm d-1 (por ex suprimindo os eventos de dias sem chuva)Climatologia II - ACA226 (Iag/USP)

Page 8: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

À uma v.a. x pode-se associar uma função f(x) proporcional à probabilidade de ocorrência de x tal que

F(x) será uma

A probabilidadede de x ocorrer entre (a,b) é

Se (a,b) = (-, +) P=1

Função Densidade de Probabilidade (fdp)

1)( dxxffdp

curvadaabaixo

hachuradaáreadxxfbaxP

Nb

a

)(,

f(x)

xa b

Climatologia II - ACA226 (Iag/USP)

Page 9: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Média (também chamada de primeiro momento)

(Prop.1) Somando-se algebricamente uma constante c a uma v.a. xi, a média altera-se igualmente pela soma algébrica de c

(Prop.2) multiplicando-se uma constante c a xi, a média fica multiplicada por c

n

iixn

X1

1Medidas de Posição

Z

X

CXZ ii

iX

deslocamento da média, mantendo-se o padrão de variação

Climatologia II - ACA226 (Iag/USP)

Page 10: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Mediana : ordenando-se os n valores de uma v.a. xi em ordem crescente, a mediana (md) será igual

Moda : é o valor de máxima frequência

parnsenenordemdevaloresdosmédiaà

ímparnsenordemdevalorao

,122

,2

1

0;000

2

2

mxmx dxyd

dxdy

Exemplo de distribuição bimodal

m0

Climatologia II - ACA226 (Iag/USP)

Page 11: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Histograma (exemplo anterior)

22 23 240

10

20

30

0.0

20.0

40.0

60.0

80.0

100.0

22 23

Pac

25

P(fi)

244,23x

75,230 m 5,23md

Mediana é o valor de X que corresponde a 50% de probabilidade de ocorrência do evento

50%

I II

Mediana divide o histograma em áreas iguais

III AA

Climatologia II - ACA226 (Iag/USP)

Page 12: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Assimetria de histogramas

xmd0m x md 0m

mdmx 0

f(x)

x

x x

f(x) f(x)

Simétrico

superiores valoresdos viésx

Assimetria positiva: predominam valores abaixo da média

Assimetria negativa: predominam valores acima da média

aa

constante

a

axfaxf

inferiores valoresdos viésx

Climatologia II - ACA226 (Iag/USP)

Page 13: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Assimetria da fdp

Assimetria definida como

n

iia xx

na

1

31

áreaI )( II0)( áreaaa

Climatologia II - ACA226 (Iag/USP)

dxxfdxxfIIPIPIII

Page 14: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Quantis: divide o histograma em área iguais (chamados também de percentis ou fractis), ex: tercil, quartil...

I II III IV

Quartil

41 adeProbabilid

IVIIIIII AAAA

Climatologia II - ACA226 (Iag/USP)

Page 15: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Medidas de Dispersão

1) Desvio da média

2) Amplitude

3) Variância: é o desvio quadrático médio (σ2 para universo, s2 para amostra)

4) Desvio-Padrão:

5) Coeficiente de variação: Adimensional

xxd i

minmax xxR

22

11

i

i xxn

s

2ss

2xUnidade

xUnidade

xsvc ..

s2 baixa s2 alta

Achatamento do histograma

Climatologia II - ACA226 (Iag/USP)

Page 16: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução
Page 17: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

• É um processo estocástico cuja distribuição de probabilidade não se altera quando deslocada no tempo, ou no espaço.

Consequentemente, parâmetros como média, variância, não se alteram em uma série temporal.

ex: Tendência linear indica alteração da média da série histórica;

Salto da série indica dois segmentos distintos de tempo, com médias distintas entre si.

Processo Estacionário

Page 18: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

A distribuição Normal

x

2)(

Sx de padrão desviox x demédia

21 2

2

x

exfNormalfdp

Climatologia II - ACA226 (Iag/USP)

quando média =0 desvio-padrão = 1 então

chama-se distribuição Normal padrão (ou padronizada)

Page 19: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Normalização ou Variável Normalizada

Obedece à seguinte transformação na v.a. Xi

Também chamada variável reduzida ou padronizada (standardized)

(Prop.) Média de Z é zero.

Transformações Normalizantes

s

XXZ ii

Climatologia II - ACA226 (Iag/USP)

xyxy

xy

lnlim que se- tem,1 b)

te)insuficienser pode simples, (mais ln a)

0

4,0.....1,0

Page 20: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

fdp(z)

zi

Simétrica

aa

Propriedades da Normalização (e vantagens)

zi

t

xi

t

x

s2

s2

s

s

extremos no período

Mesmo padrão de oscilação

Variação positiva ou negativa em multiplos do desvio-padrão

Conceito de anomalia da média

Climatologia II - ACA226 (Iag/USP)

Page 21: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Aderência de Dados : como a distribuição de uma amostra ajusta-se à uma distribuição teórica

Ex: Precipitação diária geralmente não se ajusta à Normalou se ajusta mais da log-Normal

Nota: quantifica-se a aderência com testes específicos (como o teste do qui-quadrado, por exemplo, após aulas de Reg. Linear)

2

2

2))((

21log

xLn

ex

xfNormalfdp

Climatologia II - ACA226 (Iag/USP)

(quando a distribuição de Ln(x) é Normal)

Page 22: Climatologia II – ACA226 Prof. Humberto Rocha ESTATÍSTICA BÁSICA – Revisão Séries Temporais – introdução

Como duas v.a. variam simultaneamente ?

Covariância de x,y (def): '

1'1 '

'''11,cov yxyxn

yyxxn

yxn

ii

y

i

n

i x

i

ii

i

x

y

x y

0'x

0'x

Climatologia II - ACA226 (Iag/USP)

0'y 0'y

Covariância alta (distante de zero)

(e neste caso positiva)

Covariância baixa

(aproxima-se de zero)

y

xy

x