21
TESTE DE KOLMOGOROV-SMIRNOV Professor Ewaldo Santana Universidade Estadual do Maranhão - UEMA

&RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

TESTE DE KOLMOGOROV-SMIRNOV

Professor Ewaldo SantanaUniversidade Estadual do Maranhão - UEMA

Page 2: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Conteúdo

Teste de Kolmogorov-Smirnov Introdução

Teste de Kolmogorov-Smirnov

2 Ewaldo Santana

Page 3: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

3 Ewaldo Santana

Testes estatísticos paramétricos, tais como o teste-t e Análise de

Variância, são baseados em particular suposições, ou parâmetros.

Introdução

Estes parâmetros são que os dados são aleatoriamente retirados

de uma população normal, consistem em amostras independentes, são

medidos usando uma escala intervalar ou de razão e as amostras devem

ter variâncias aproximadamente iguais.

Se os dados amostrais violam uma ou mais dessas suposições,

deve-se considerar usar os métodos não paramétricos

Testes de Normalidade

Page 4: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

4 Ewaldo Santana

Definição: dados n observações de uma variável

quantitativa e um número x real qualquer, indicar-se-á por N(x)

o número de observações menores ou iguais a x, e chamar-se-á

de função de distribuição empírica (f.d.e.) a função Fe(x)

Introdução

Testes de Normalidade

Page 5: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

5 Ewaldo Santana

Ex. Seja a tabela abaixo que consta o número de filhos

de 20 funcionários de uma Companhia.

Introdução

Nº de filhos Quantidade de funcionários

0 4

1 5

2 7

3 3

5 1

TOTAL 20

Testes de Normalidade

Page 6: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

6 Ewaldo Santana

Da tabela podemos obter sua f.d.e.

Introdução

Nº de filhos

Quantidade de funcionários

f.d.e

0 4 0,20

1 5 0,45

2 7 0,80

3 3 0,95

5 1 1

Testes de Normalidade

Page 7: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

7 Ewaldo Santana

Introdução

Testes de Normalidade

Page 8: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade8 Ewaldo Santana

O teste de Kolmogorov-Smirnov de uma amostra é baseado

na diferença entre a função de distribuição cumulativa F0(x) e a

função de distribuição empírica da Amostra Fe(x).

Teste de Kolmogorov-Smirnov

Suponha que tenhamos uma amostra X1, ..., Xn de uma

população P, sobre a qual estamos considerando uma v.a. X.

Designemos por f(x) a função densidade e por F(x) a função de

distribuição acumulada (f.d.a) de X. Estimar f(x) é equivalente a estimar

F(x). Nosso objetivo é testar se a amostra observada veio de uma

distribuição de probabilidade especificada.

Page 9: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade9 Ewaldo Santana

Nossa hipótese nula será:

Teste de Kolmogorov-Smirnov

Vamos considerar a função de distribuição empírica (f.d.e),

Fe(x), como um estimador de F(x), para todo valor x real.

Page 10: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade10 Ewaldo Santana

Observe a figura abaixo

Teste de Kolmogorov-Smirnov

Se Fe(x) for

um bom

estimador

de F(x) as

duas

curvas

devem

estar

próximas

F(x)

Fe(x)

Page 11: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade11 Ewaldo Santana

Teste de Kolmogorov-Smirnov Seja Dn a diferença

entre Fe(xn) e F(xn)

Dn = F(x(n)) - Fe(x(n))

x(n)

Dn

Page 12: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade12 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Kolmogorov e Smirnov propuseram tomar o máximo dos

valores absolutos dos Dn como estatística do teste.

O valor encontrado deve ser comparado com um valor

crítico, obtido da tabela da distribuição de Kolmogorov-Smirnov,

fixado um nível de significância do teste. Se for maior que o

valor tabelado, rejeitamos H0.

Page 13: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade13 Ewaldo Santana

Distribuição de Kolmogorov-Smirnov DO corpo da tabela dá os valores Dc tais que

P(|D| ≥ Dc) = p

(n) 0,20 0,15 0,10 0,05 0,01

1 0,900 0,925 0,950 0,975 0,995

2 0,684 0,726 0,776 0,842 0,929

3 0,565 0,597 0,642 0,708 0,828

4 0,494 0,525 0,564 0,624 0,733

5 0,446 0,474 0,510 0,565 0,669

6 0,410 0,436 0,470 0,521 0,618

7 0,381 0,405 0,438 0,486 0,577

8 0,358 0,381 0,411 0,457 0,543

9 0,339 0,360 0,388 0,432 0,514

10 0,322 0,342 0,368 0,410 0,490

11 0,307 0,326 0,352 0,391 0,468

12 0,295 0,313 0,338 0,375 0,450

13 0,284 0,302 0,325 0,361 0,433

14 0,274 0,292 0,314 0,349 0,418

Page 14: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade14 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Ex. Considere os dados abaixo, que supostamente são

uma amostra de tamanho n = 30 de uma distribuição normal, de

média µ = 10 e variância 2 = 25. Verifique a veracidade

desta afirmação a um nível = 0,05.

1,04 1,73 3,93 4,44 6,37 6,51

7,61 7,64 8,18 8,48 8,57 8,65

9,71 9,87 9,95 10,01 10,52 10,69

11,72 12,17 12,61 12,98 13,03 13,16

14,11 14,60 14,64 14,75 16,68 22,14

Page 15: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade15 Ewaldo Santana

Teste de Kolmogorov-Smirnov

A hipótese a ser testada pode ser escrita na forma

onde F0(x) é a f.d.a. da v.a. X N(10; 25)

Dc = 0,242.

Page 16: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

1,04 1,73 3,93 4,44 6,37 6,51

7,61 7,64 8,18 8,48 8,57 8,65

9,71 9,87 9,95 10,01 10,52 10,69

11,72 12,17 12,61 12,98 13,03 13,16

14,11 14,60 14,64 14,75 16,68 22,14

Testes de Normalidade16 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Para calcular a f.d.e. considera-se que os 30 resultados são

igualmente prováveis, desta forma, a P(xi) = 1/30 = 0,0333.

Assim, teremos:

Fe(1,04) = 0,0333

Fe(1,73) = 2/30 = 0,0667

Fe(3,93) = 3/30 = 0,1000 etc.

Page 17: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade17 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Para calcular a f.d.a. sob a suposição da hipótese nula, X N

(10; 25),tem-se, para cada valor de xi:

Page 18: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade18 Ewaldo Santana

Teste de Kolmogorov-SmirnovD = |F(xi) - Fe(xi)|

xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D

1,04 ,0366 ,0333 ,00323 8,57 ,3874 ,3667 ,02077 12,61 ,6992 ,7000 ,00083

1,73 ,0491 ,0667 ,01760 8,65 ,3836 ,4000 ,00642 12,98 ,7244 ,7333 ,00892

3,93 ,1124 ,1000 ,01237 9,71 ,4769 ,4333 ,04354 13,03 ,7277 ,7667 ,03892

4,44 ,1331 ,1333 ,00026 9,87 ,4896 ,4667 ,02296 13,16 ,7363 ,8000 ,06369

6,37 ,2340 ,1667 ,06725 9,95 ,4960 ,5000 ,00399 14,11 ,7945 ,8333 ,03887

6,51 ,2426 ,2000 ,04259 10,01 ,5008 ,5333 ,03253 14,60 ,8212 ,8667 ,04545

7,61 ,3163 ,2333 ,08299 10,52 ,5414 ,5667 ,02525 14,64 ,8233 ,9000 ,07670

7,64 ,3185 ,2667 ,05180 10,69 ,5549 ,6000 ,04512 14,75 ,8289 ,9333 ,10439

8,18 ,3579 ,3000 ,05793 11,72 ,6346 ,6333 ,00124 16,68 ,9092 ,9667 ,05744

8,48 ,3806 ,3333 ,04723 12,17 ,6679 ,6667 ,00119 22,14 ,9924 1,000 ,07591

maior D

Page 19: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade19 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Da tabela anterior, vemos que o valor máximo dos valores

absolutos das diferenças é D = 0,104.

Como D = 0,104 < Dc = 0,242, Não rejeitamos H0.

Ou seja, sob um erro de 5%, podemos afirmar que aamostra foi retirada de uma população N(10; 25)

Page 20: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade20 Ewaldo Santana

Teste de Kolmogorov-Smirnov

Podemos comparar os quantis (empíricos) dos dados com

os quantis da normal, por meio de um gráfico q x q, com o

objetivo de verificar se os pontos se distribuem ao redor de uma

reta.

Para isso, sob a veracidade de H0, calculamos os quantis

desejados de N(; 2) e da amostra calculamos os quantis

amostrais

Page 21: &RQWH~GR - WordPress.com · Microsoft PowerPoint - 14-TESTE-DE-KOLMOGOROV-SMIRNOV Author: Cicero Created Date: 11/22/2018 8:33:11 PM

Testes de Normalidade21 Ewaldo Santana