&RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author:...

Preview:

Citation preview

TESTE DE KOLMOGOROV-SMIRNOV

Professor Ewaldo SantanaUniversidade Estadual do Maranhão - UEMA

Conteúdo

Teste de Kolmogorov-Smirnov Introdução

Teste de Kolmogorov-Smirnov

2 Ewaldo Santana

3 Ewaldo Santana

Testes estatísticos paramétricos, tais como o teste-t e Análise de

Variância, são baseados em particular suposições, ou parâmetros.

Introdução

Estes parâmetros são que os dados são aleatoriamente retirados

de uma população normal, consistem em amostras independentes, são

medidos usando uma escala intervalar ou de razão e as amostras devem

ter variâncias aproximadamente iguais.

Se os dados amostrais violam uma ou mais dessas suposições,

deve-se considerar usar os métodos não paramétricos

Testes de Normalidade

4 Ewaldo Santana

Definição: dados n observações de uma variável

quantitativa e um número x real qualquer, indicar-se-á por N(x)

o número de observações menores ou iguais a x, e chamar-se-á

de função de distribuição empírica (f.d.e.) a função Fe(x)

Introdução

Testes de Normalidade

5 Ewaldo Santana

Ex. Seja a tabela abaixo que consta o número de filhos

de 20 funcionários de uma Companhia.

Introdução

Nº de filhos Quantidade de funcionários

0 4

1 5

2 7

3 3

5 1

TOTAL 20

Testes de Normalidade

6 Ewaldo Santana

Da tabela podemos obter sua f.d.e.

Introdução

Nº de filhos

Quantidade de funcionários

f.d.e

0 4 0,20

1 5 0,45

2 7 0,80

3 3 0,95

5 1 1

Testes de Normalidade

7 Ewaldo Santana

Introdução

Testes de Normalidade

Testes de Normalidade8 Ewaldo Santana

O teste de Kolmogorov-Smirnov de uma amostra é baseado

na diferença entre a função de distribuição cumulativa F0(x) e a

função de distribuição empírica da Amostra Fe(x).

Teste de Kolmogorov-Smirnov

Suponha que tenhamos uma amostra X1, ..., Xn de uma

população P, sobre a qual estamos considerando uma v.a. X.

Designemos por f(x) a função densidade e por F(x) a função de

distribuição acumulada (f.d.a) de X. Estimar f(x) é equivalente a estimar

F(x). Nosso objetivo é testar se a amostra observada veio de uma

distribuição de probabilidade especificada.

Testes de Normalidade9 Ewaldo Santana

Nossa hipótese nula será:

Teste de Kolmogorov-Smirnov

Vamos considerar a função de distribuição empírica (f.d.e),

Fe(x), como um estimador de F(x), para todo valor x real.

Testes de Normalidade10 Ewaldo Santana

Observe a figura abaixo

Teste de Kolmogorov-Smirnov

Se Fe(x) for

um bom

estimador

de F(x) as

duas

curvas

devem

estar

próximas

F(x)

Fe(x)

Testes de Normalidade11 Ewaldo Santana

Teste de Kolmogorov-Smirnov Seja Dn a diferença

entre Fe(xn) e F(xn)

Dn = F(x(n)) - Fe(x(n))

x(n)

Dn

Testes de Normalidade12 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Kolmogorov e Smirnov propuseram tomar o máximo dos

valores absolutos dos Dn como estatística do teste.

O valor encontrado deve ser comparado com um valor

crítico, obtido da tabela da distribuição de Kolmogorov-Smirnov,

fixado um nível de significância do teste. Se for maior que o

valor tabelado, rejeitamos H0.

Testes de Normalidade13 Ewaldo Santana

Distribuição de Kolmogorov-Smirnov DO corpo da tabela dá os valores Dc tais que

P(|D| ≥ Dc) = p

(n) 0,20 0,15 0,10 0,05 0,01

1 0,900 0,925 0,950 0,975 0,995

2 0,684 0,726 0,776 0,842 0,929

3 0,565 0,597 0,642 0,708 0,828

4 0,494 0,525 0,564 0,624 0,733

5 0,446 0,474 0,510 0,565 0,669

6 0,410 0,436 0,470 0,521 0,618

7 0,381 0,405 0,438 0,486 0,577

8 0,358 0,381 0,411 0,457 0,543

9 0,339 0,360 0,388 0,432 0,514

10 0,322 0,342 0,368 0,410 0,490

11 0,307 0,326 0,352 0,391 0,468

12 0,295 0,313 0,338 0,375 0,450

13 0,284 0,302 0,325 0,361 0,433

14 0,274 0,292 0,314 0,349 0,418

Testes de Normalidade14 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Ex. Considere os dados abaixo, que supostamente são

uma amostra de tamanho n = 30 de uma distribuição normal, de

média µ = 10 e variância 2 = 25. Verifique a veracidade

desta afirmação a um nível = 0,05.

1,04 1,73 3,93 4,44 6,37 6,51

7,61 7,64 8,18 8,48 8,57 8,65

9,71 9,87 9,95 10,01 10,52 10,69

11,72 12,17 12,61 12,98 13,03 13,16

14,11 14,60 14,64 14,75 16,68 22,14

Testes de Normalidade15 Ewaldo Santana

Teste de Kolmogorov-Smirnov

A hipótese a ser testada pode ser escrita na forma

onde F0(x) é a f.d.a. da v.a. X N(10; 25)

Dc = 0,242.

1,04 1,73 3,93 4,44 6,37 6,51

7,61 7,64 8,18 8,48 8,57 8,65

9,71 9,87 9,95 10,01 10,52 10,69

11,72 12,17 12,61 12,98 13,03 13,16

14,11 14,60 14,64 14,75 16,68 22,14

Testes de Normalidade16 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Para calcular a f.d.e. considera-se que os 30 resultados são

igualmente prováveis, desta forma, a P(xi) = 1/30 = 0,0333.

Assim, teremos:

Fe(1,04) = 0,0333

Fe(1,73) = 2/30 = 0,0667

Fe(3,93) = 3/30 = 0,1000 etc.

Testes de Normalidade17 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Para calcular a f.d.a. sob a suposição da hipótese nula, X N

(10; 25),tem-se, para cada valor de xi:

Testes de Normalidade18 Ewaldo Santana

Teste de Kolmogorov-SmirnovD = |F(xi) - Fe(xi)|

xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D

1,04 ,0366 ,0333 ,00323 8,57 ,3874 ,3667 ,02077 12,61 ,6992 ,7000 ,00083

1,73 ,0491 ,0667 ,01760 8,65 ,3836 ,4000 ,00642 12,98 ,7244 ,7333 ,00892

3,93 ,1124 ,1000 ,01237 9,71 ,4769 ,4333 ,04354 13,03 ,7277 ,7667 ,03892

4,44 ,1331 ,1333 ,00026 9,87 ,4896 ,4667 ,02296 13,16 ,7363 ,8000 ,06369

6,37 ,2340 ,1667 ,06725 9,95 ,4960 ,5000 ,00399 14,11 ,7945 ,8333 ,03887

6,51 ,2426 ,2000 ,04259 10,01 ,5008 ,5333 ,03253 14,60 ,8212 ,8667 ,04545

7,61 ,3163 ,2333 ,08299 10,52 ,5414 ,5667 ,02525 14,64 ,8233 ,9000 ,07670

7,64 ,3185 ,2667 ,05180 10,69 ,5549 ,6000 ,04512 14,75 ,8289 ,9333 ,10439

8,18 ,3579 ,3000 ,05793 11,72 ,6346 ,6333 ,00124 16,68 ,9092 ,9667 ,05744

8,48 ,3806 ,3333 ,04723 12,17 ,6679 ,6667 ,00119 22,14 ,9924 1,000 ,07591

maior D

Testes de Normalidade19 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Da tabela anterior, vemos que o valor máximo dos valores

absolutos das diferenças é D = 0,104.

Como D = 0,104 < Dc = 0,242, Não rejeitamos H0.

Ou seja, sob um erro de 5%, podemos afirmar que aamostra foi retirada de uma população N(10; 25)

Testes de Normalidade20 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Podemos comparar os quantis (empíricos) dos dados com

os quantis da normal, por meio de um gráfico q x q, com o

objetivo de verificar se os pontos se distribuem ao redor de uma

reta.

Para isso, sob a veracidade de H0, calculamos os quantis

desejados de N(; 2) e da amostra calculamos os quantis

amostrais

Testes de Normalidade21 Ewaldo Santana

Recommended