View
1
Download
0
Category
Preview:
Citation preview
TESTE DE KOLMOGOROV-SMIRNOV
Professor Ewaldo SantanaUniversidade Estadual do Maranhão - UEMA
Conteúdo
Teste de Kolmogorov-Smirnov Introdução
Teste de Kolmogorov-Smirnov
2 Ewaldo Santana
3 Ewaldo Santana
Testes estatísticos paramétricos, tais como o teste-t e Análise de
Variância, são baseados em particular suposições, ou parâmetros.
Introdução
Estes parâmetros são que os dados são aleatoriamente retirados
de uma população normal, consistem em amostras independentes, são
medidos usando uma escala intervalar ou de razão e as amostras devem
ter variâncias aproximadamente iguais.
Se os dados amostrais violam uma ou mais dessas suposições,
deve-se considerar usar os métodos não paramétricos
Testes de Normalidade
4 Ewaldo Santana
Definição: dados n observações de uma variável
quantitativa e um número x real qualquer, indicar-se-á por N(x)
o número de observações menores ou iguais a x, e chamar-se-á
de função de distribuição empírica (f.d.e.) a função Fe(x)
Introdução
Testes de Normalidade
5 Ewaldo Santana
Ex. Seja a tabela abaixo que consta o número de filhos
de 20 funcionários de uma Companhia.
Introdução
Nº de filhos Quantidade de funcionários
0 4
1 5
2 7
3 3
5 1
TOTAL 20
Testes de Normalidade
6 Ewaldo Santana
Da tabela podemos obter sua f.d.e.
Introdução
Nº de filhos
Quantidade de funcionários
f.d.e
0 4 0,20
1 5 0,45
2 7 0,80
3 3 0,95
5 1 1
Testes de Normalidade
7 Ewaldo Santana
Introdução
Testes de Normalidade
Testes de Normalidade8 Ewaldo Santana
O teste de Kolmogorov-Smirnov de uma amostra é baseado
na diferença entre a função de distribuição cumulativa F0(x) e a
função de distribuição empírica da Amostra Fe(x).
Teste de Kolmogorov-Smirnov
Suponha que tenhamos uma amostra X1, ..., Xn de uma
população P, sobre a qual estamos considerando uma v.a. X.
Designemos por f(x) a função densidade e por F(x) a função de
distribuição acumulada (f.d.a) de X. Estimar f(x) é equivalente a estimar
F(x). Nosso objetivo é testar se a amostra observada veio de uma
distribuição de probabilidade especificada.
Testes de Normalidade9 Ewaldo Santana
Nossa hipótese nula será:
Teste de Kolmogorov-Smirnov
Vamos considerar a função de distribuição empírica (f.d.e),
Fe(x), como um estimador de F(x), para todo valor x real.
Testes de Normalidade10 Ewaldo Santana
Observe a figura abaixo
Teste de Kolmogorov-Smirnov
Se Fe(x) for
um bom
estimador
de F(x) as
duas
curvas
devem
estar
próximas
F(x)
Fe(x)
Testes de Normalidade11 Ewaldo Santana
Teste de Kolmogorov-Smirnov Seja Dn a diferença
entre Fe(xn) e F(xn)
Dn = F(x(n)) - Fe(x(n))
x(n)
Dn
Testes de Normalidade12 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Kolmogorov e Smirnov propuseram tomar o máximo dos
valores absolutos dos Dn como estatística do teste.
O valor encontrado deve ser comparado com um valor
crítico, obtido da tabela da distribuição de Kolmogorov-Smirnov,
fixado um nível de significância do teste. Se for maior que o
valor tabelado, rejeitamos H0.
Testes de Normalidade13 Ewaldo Santana
Distribuição de Kolmogorov-Smirnov DO corpo da tabela dá os valores Dc tais que
P(|D| ≥ Dc) = p
(n) 0,20 0,15 0,10 0,05 0,01
1 0,900 0,925 0,950 0,975 0,995
2 0,684 0,726 0,776 0,842 0,929
3 0,565 0,597 0,642 0,708 0,828
4 0,494 0,525 0,564 0,624 0,733
5 0,446 0,474 0,510 0,565 0,669
6 0,410 0,436 0,470 0,521 0,618
7 0,381 0,405 0,438 0,486 0,577
8 0,358 0,381 0,411 0,457 0,543
9 0,339 0,360 0,388 0,432 0,514
10 0,322 0,342 0,368 0,410 0,490
11 0,307 0,326 0,352 0,391 0,468
12 0,295 0,313 0,338 0,375 0,450
13 0,284 0,302 0,325 0,361 0,433
14 0,274 0,292 0,314 0,349 0,418
Testes de Normalidade14 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Ex. Considere os dados abaixo, que supostamente são
uma amostra de tamanho n = 30 de uma distribuição normal, de
média µ = 10 e variância 2 = 25. Verifique a veracidade
desta afirmação a um nível = 0,05.
1,04 1,73 3,93 4,44 6,37 6,51
7,61 7,64 8,18 8,48 8,57 8,65
9,71 9,87 9,95 10,01 10,52 10,69
11,72 12,17 12,61 12,98 13,03 13,16
14,11 14,60 14,64 14,75 16,68 22,14
Testes de Normalidade15 Ewaldo Santana
Teste de Kolmogorov-Smirnov
A hipótese a ser testada pode ser escrita na forma
onde F0(x) é a f.d.a. da v.a. X N(10; 25)
Dc = 0,242.
1,04 1,73 3,93 4,44 6,37 6,51
7,61 7,64 8,18 8,48 8,57 8,65
9,71 9,87 9,95 10,01 10,52 10,69
11,72 12,17 12,61 12,98 13,03 13,16
14,11 14,60 14,64 14,75 16,68 22,14
Testes de Normalidade16 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Para calcular a f.d.e. considera-se que os 30 resultados são
igualmente prováveis, desta forma, a P(xi) = 1/30 = 0,0333.
Assim, teremos:
Fe(1,04) = 0,0333
Fe(1,73) = 2/30 = 0,0667
Fe(3,93) = 3/30 = 0,1000 etc.
Testes de Normalidade17 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Para calcular a f.d.a. sob a suposição da hipótese nula, X N
(10; 25),tem-se, para cada valor de xi:
Testes de Normalidade18 Ewaldo Santana
Teste de Kolmogorov-SmirnovD = |F(xi) - Fe(xi)|
xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D xi F(xi) Fe(xi) D
1,04 ,0366 ,0333 ,00323 8,57 ,3874 ,3667 ,02077 12,61 ,6992 ,7000 ,00083
1,73 ,0491 ,0667 ,01760 8,65 ,3836 ,4000 ,00642 12,98 ,7244 ,7333 ,00892
3,93 ,1124 ,1000 ,01237 9,71 ,4769 ,4333 ,04354 13,03 ,7277 ,7667 ,03892
4,44 ,1331 ,1333 ,00026 9,87 ,4896 ,4667 ,02296 13,16 ,7363 ,8000 ,06369
6,37 ,2340 ,1667 ,06725 9,95 ,4960 ,5000 ,00399 14,11 ,7945 ,8333 ,03887
6,51 ,2426 ,2000 ,04259 10,01 ,5008 ,5333 ,03253 14,60 ,8212 ,8667 ,04545
7,61 ,3163 ,2333 ,08299 10,52 ,5414 ,5667 ,02525 14,64 ,8233 ,9000 ,07670
7,64 ,3185 ,2667 ,05180 10,69 ,5549 ,6000 ,04512 14,75 ,8289 ,9333 ,10439
8,18 ,3579 ,3000 ,05793 11,72 ,6346 ,6333 ,00124 16,68 ,9092 ,9667 ,05744
8,48 ,3806 ,3333 ,04723 12,17 ,6679 ,6667 ,00119 22,14 ,9924 1,000 ,07591
maior D
Testes de Normalidade19 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Da tabela anterior, vemos que o valor máximo dos valores
absolutos das diferenças é D = 0,104.
Como D = 0,104 < Dc = 0,242, Não rejeitamos H0.
Ou seja, sob um erro de 5%, podemos afirmar que aamostra foi retirada de uma população N(10; 25)
Testes de Normalidade20 Ewaldo Santana
Teste de Kolmogorov-Smirnov
Podemos comparar os quantis (empíricos) dos dados com
os quantis da normal, por meio de um gráfico q x q, com o
objetivo de verificar se os pontos se distribuem ao redor de uma
reta.
Para isso, sob a veracidade de H0, calculamos os quantis
desejados de N(; 2) e da amostra calculamos os quantis
amostrais
Testes de Normalidade21 Ewaldo Santana
Recommended