Upload
dangkien
View
213
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE FEDERALDA PARAÍBA
Modelos de Probabilidade e Inferência Estatística
Departamento de EstatísticaLuiz Medeiros
Análise de Variância – Parte 2
Estimação dos parâmetros e diagnóstico do modelo
Estimativas da média geral e dos efeitos dos tratamentos:
..i.i
..
yyτ
yµ
−=
=)
yτµ µ =+=
Estimativa pontual de µi: dado µi= µ+ τi, temos:
i.ii yτµ µ =+=
Verificar se as pressuposições básicas do modelo são válidas.
Isso é realizado através de uma análise de resíduos. Define-se
o resíduo da ij-ésima observação como:
ijijij yye −=
modelo. pelo preditos valores yτµy onde i.iij →=+=
TESTES NÃO-PLANEJADOS PARA
COMPARAÇÃO DE MÉDIAS
� Se o teste realizado na ANOVA é significante, a única certezaé a de que existe no mínimo um par de médias diferente, masnão se sabe quantas e, pior ainda, quais.
� Para se determinar qual(is) o(s) par(es) de médias diferentesapós a realização da ANOVA, é realizado o que se denominateste não-planejado, teste a posteriori ou teste pos hoc. Osteste não-planejado, teste a posteriori ou teste pos hoc. Osmais conhecidas são:
• Teste de Scheffé – Para comparações múltiplas• Teste de Bonferroni – Comparar médias duas a duas (Dados balanceados eou
não balanceados)
• Teste de Tukey (HSD) – Comparar médias duas a duas• Teste de Duncan – Comparar médias duas a duas
• Teste de Dunnet – Quando se quer comparar as médias do tratamentoapenas com a média do controle.
TESTE DE TUKEY (HSD)
� É um dos testes de comparação de média mais utilizado, por serbastante rigoroso e de fácil aplicação;
� É um teste exato em que, para a família de todas as comparaçõesduas a duas, a taxa de erro da família dos testes é exatamente α (e ointervalo de confiança é exatamente 1-α). Métodos de comparaçõesmúltiplas exatos são raros;múltiplas exatos são raros;
� Não permite comparar grupos de tratamentos entre si;
� É utilizado para testar toda e qualquer diferença entre duas médiasde tratamento;
� É aplicado quando o teste “F” para tratamentos da ANOVA (análisede variância) for significativo.
TESTE DE TUKEY (HSD)DADOS BALANCEADOS
� O teste de Tukey tem como base a DMS (diferença mínima significativa). Para dados
balanceados é calculado da seguinte forma:
Em que n é o número de réplicas do tratamento (nível), qα
é um valor tabelado
(Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.
n
QMErrogNgqDMS ),( −= α
(Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.
� Rejeita-se a igualdade da média de dois tratamentos (i e l) se:
� Um intervalo de confiança de 100(1-α)% para a diferença entre todos os pares de
médias é dado por:
... TSDyy li >−
n
QMErrogNgqyy li ),(.. −±− α
Exemplo - O experimento de absorbância
Tabela da análise de variância dos valores de absorbância.
Causas de
variação
Soma de
quadrados
Graus de
liberdade
Quadrados
médios
Fcalc
Entre
solventes
0,5413 4 0,1353 212,806
(P<0,0001)
Erro 0,0127 20 0,0006 F =4,43
Erro 0,0127 20 0,0006
Total 0,5540 24
F(0,01;4;20)=4,43
Rejeita-se H0, e concluímos que as médias de tratamentos diferem entre si; os
solventes afetam significativamente as médias de absorbância.
Comparações entre Pares de Médias
., os todospara ,µµ:H li0 li=
Número de comparações: g(g-1)/2.
Devem ser realizadas após o teste F da análise de
variância rejeitar a hipótese nula
Teste de Tukey
Exemplo: Dados de absorbância. O valor da Diferença Mínima Significativa é:
0479,05
00064,023,4)20;5(05,0 ===
n
QMErroqDMS
>=−=−
<=−=−
31
21
(0,0479) DMS 0,08970,44960,5393y
(0,0479) DMS 0,02760,56690,5393y
y
y
=−
=−
=−
=−
=−
=−
>=−=−
>=−=−
>=−=−
54
53
43
52
42
32
51
41
31
y
y
y
y
y
y
(0,0479) DMS 0,34250,19680,5393y
(0,0479) DMS 0,06850,60780,5393y
(0,0479) DMS 0,08970,44960,5393y
y
y
y
y
y
y
y
y
y
E70 = 0,6363 A
EAW = 0,5669 A B
E50 = 0,5393 B
MAW = 0,4496 C
M1M = 0,1968 D
Médias seguidas de mesma letra, em uma mesma coluna, nãoMédias seguidas de mesma letra, em uma mesma coluna, não
apresentam diferenças significantes, ao nível de significância de 5%,
pelo teste de Tukey.
Conclusão: pelo teste de Tukey, ao nível de significância de 5%, as médias
dos tratamentos E50 e EAW, assim como as médias dos tratamentos EAW e
E70 não apresentam diferenças significantes. As médias dos tratamentos
E50 e E70 apresentam diferença significante. As médias dos tratamentos
MAW e M1M apresentam diferença significativa de todos os tratamentos.
EXEMPLO: 3 GRUPOS DE CRIANÇAS RECEBERAM DIFERENTES
NÍVIES DE MOTIVAÇÃO PARA A MATEMÁTICA. DEPOIS SE FEZ UM
EXAME. HÁ DIFERENÇAS SIGNIFICATIVAS ENTRE OS 3 NÍVEIS DE
MOTIVAÇÃO (BAIXA, MÉDIA E ALTA)?
Grupo 1 Grupo 2 Grupo 3
4 16 12 144 1 1
5 25 8 64 3 9
4 16 10 100 4 164 16 10 100 4 16
3 9 5 25 6 36
6 36 7 49 8 64
10 100 9 81 5 25
1 1 14 196 3 9
8 64 9 81 2 4
5 25 4 16 2 4
X1 X12 X2 X2
2 X3 X32
Média = 5,11 Média = 8,67 Média = 3,78
Tabela da análise de variância dos níveis de motivação.
Causas de
variação
Soma de
quadrados
Graus de
liberdade
Quadrados
médios
Fcalc
Entre
solventes
114,96 2 57,48 7,82
Erro 176,45 24 7,35
Ftab (g-1; N-g; 1-α) = Ftab (2; 24; 0,05) = 3,403
Concluindo, Fcalc > Ftab , portanto, rejeita-se H0.
Total 291,40 26
� Conclui-se, através do teste, que pelo menos uma médiase difere das demais.
� Em quais tratamentos ocorreram essa diferença?
� Utilize o teste de Tukey (α=0,05) para encontrar as� Utilize o teste de Tukey (α=0,05) para encontrar asdiferenças entre a média dos tratamentos.
EXEMPLO 1
InsectSprays # ver o banco de dados
boxplot(count ~ spray, data = InsectSprays, col = "lightgray") # gerar o boxplotentre count e spray
anava <- aov(count~spray,data=InsectSprays) # gerar a anova
summary(anava) # resultado da anova
ep = as.vector(rstandard(anava)) # resíduo padronizado
shapiro.test(ep) # teste de normalidade
library(lmtest) # biblioteca para utilizar o teste dwtest
dwtest(anava) # teste de independência - Durbin Watson
bartlett.test(count ~ spray, data = InsectSprays) # teste de homocedasticidade
EXEMPLO 2ex2 <- read.csv("banco1.txt",header=T,dec=".",sep="") ## ler o banco
attach(ex2)
names (ex2)
boxplot(nm ~ trat, data = ex2, col = "red") # gerar o boxplot entre count e spray
anava <- aov(nm~trat,data=ex2) # gerar a anova
summary(anava) # resultado da anova
ep = as.vector(rstandard(anava))
shapiro.test(ep) # teste de normalidade
dwtest(anava) # teste de independência - Durbin Watson
bartlett.test(nm ~ trat, data = ex2) # teste de homocedasticidade
Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey
Tukey # resultado do teste
plot(Tukey) # gerar IC das diferenças
EXEMPLO 3x <- rchisq(10, df = 9)
y<- rgamma(10, 10, 2)
z<- rbeta(10, 1, 2)
vr<-c(x,y,z)
tr<-c(rep(1,10),rep(2,10),rep(3,10))
ex3<-cbind(vr,tr)
ex3 # ver o banco de dadosex3 # ver o banco de dados
boxplot(vr ~ tr, col = "red") # gerar o boxplot
anava <- aov(vr~tr) # gerar a anova
summary(anava) # resultado da anova
ep = as.vector(rstandard(anava))
shapiro.test(ep) # teste de normalidade
dwtest(anava) # teste de independência - Durbin Watson
bartlett.test(vr ~ tr) # teste de homocedasticidade
EXEMPLO 4x <- rnorm(20, 5, 1)
y<- rnorm(20, 15, 1)
z<- rnorm(20, 25, 1)
vr<-c(x,y,z)
tr<-c(rep(1,20),rep(2,20),rep(3,20))
ex4<-cbind(vr,tr)
boxplot(vr ~ tr, col = "red") # gerar o boxplot
anava <- aov(vr~tr) # gerar a anova
summary(anava) # resultado da anova
ep = as.vector(rstandard(anava))
shapiro.test(ep) # teste de normalidade
dwtest(anava) # teste de independência - Durbin Watson
bartlett.test(vr ~ tr) # teste de homocedasticidade
Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey
Tukey # resultado do teste
plot(Tukey) # gerar IC das diferenças