Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
3. Experimentos a um unico fator: Analise deVariancia (ANOVA)
3.4 Estimacao dos parametros do modelo deefeitos
Yij = µ+ τi + εij,
{i = 1,2, ..., aj = 1,2, ..., n
εij ∼ NID(0, σ2)
Ja vimos que um estimador nao viciado paraσ2 e dado por QMRes = SQRes
a(n−1).
De fato, Yij ∼ N(µ+ τi, σ2), j = 1,2, ..., n,
Yi. ∼ N(µ+ τi, σ2/n), i = 1,2, ..., a.
QMRes = SQResN−a , Yi. e QMRes independentes
SQRes =a∑
i=1
n∑j=1
(Yij−Yi.)2 =a∑
i=1
n∑j=1
Y 2ij−n
a∑i=1
Y 2i.
1
E[Y 2ij ] = Var(Yij) + E[Yij]
2 = σ2 + (µ+ τi)2
E[Y 2i. ] = Var(Yi.) + E[Yi.]
2 = σ2
n + (µ+ τi)2
Logo,
E[SQRes] = Nσ2 + n
a∑i=1
(µ + τi)2 − aσ2 − n
a∑i=1
(µ + τi)2 =
(N − a)σ2 → E[QMRes] = σ2.
Provaremos agora que os estimadores
µ = Y.. e τi = Yi. − Y..,
para µ e τi, i = 1,2, ..., a, apresentam boas pro-
priedades.
De fato, alem de intuitivos correspondem aos
estimadores de mınimos quadrados quando a-
dota-se a restricaoa∑
i=1
τi = 0.
2
A soma de quadrados dos erros e dada por
Q =a∑
i=1
n∑j=1
ε2ij =a∑
i=1
n∑j=1
(yij − µ− τi)2
O metodo consiste em escolher valores de µ
e τi, µ e τi, i = 1,2, ..., a, que mimimizam
Q. Os valores apropriados serao solucoes das
seguintes a+ 1 equacoes simultaneas
δQδµ = 0 δQ
δτi= 0, i = 1,2, ..., a
3
As equacoes resultantes sao
Nµ+ nτ1+ ...+ nτa = y..nµ+ nτ1 = y1.nµ+ nτ2+ = y2.
... = ...nµ+ nτa = ya.
Observe que estas equacoes nao sao linear-mente independentes e, por esta razao, naoexiste uma solucao unica (a primeira linha eigual a soma das demais).
Os efeitos no modelo estao superparametriza-dos. Este problema pode ser superado de di-versas formas. Uma possıvel solucao e res-
tringira∑
i=1
τi = 0, uma vez que definimos os
efeitos de tratamento como desvios da mediaglobal.
Usando esta restricao, obtemos
µ = y.. e τi = yi. − y.., i = 1,2, ..., a
4
Ou seja, a media global e estimada pela media
de todas as N = an observacoes (y..), en-
quanto cada efeito individual e estimado pela
diferenca entre a media amostral do tratamen-
to e a media de todas as observacoes (yi.− y..).
Outra escolha possıvel de restricao e consi-
derar a media global uma constante, por e-
xemplo µ = 0. Isto resultara na solucao
µ = 0 e τi = yi., i = 1,2, ..., a.
Ainda, uma terceira escolha e τa = 0. Isto
resultara na solucao
µ = ya e τi = yi − ya, i = 1,2, ..., a− 1, τa = 0.
5
Existem infinitas possibilidades que poderiamresolver as equacoes normais. Felizmente, naoimporta qual delas vamos usar. Para qualqueruma das tres alternativas apresentadas, de fatopara qualquer solucao possıvel das equacoesnormais, teremos
µi = µ+ τi = yi., i = 1,2, ..., a.
Ou seja, o estimador de mınimos quadradosda media do i-esimo nıvel do fator sera sem-pre a media da amostra correspondente as ob-servacoes deste nıvel. Assim, mesmo que naopossamos obter estimativas unicas para os pa-rametros no modelo de efeitos, nos podemosobter estimadores unicos de uma funcao destesparametros na qual estamos interessados.
Esta e a ideia de funcoes estimaveis. Qual-quer funcao dos parametros do modelo quepode ser univocamente estimada, sem olhara restricao adotada para resolver as equacoesnormais, e uma funcao estimavel.
6
Que funcoes sao estimaveis?
Pode ser mostrado que o valor esperado dequalquer observacao e estimavel.
E[Yij] = µ+ τi = µi
e ja vimos que a media do i-esimo nıvel dofator e estimavel.
Qualquer funcao que e uma combinacao li-near do lado esquerdo das equacoes normaise tambem estimavel.
Por exemplo, subtraia a segunda equacao nor-mal da (a+1)-esima, produzindo τ1−τa. Logo,a diferenca entre quaisquer dois efeitos de trata-mento e estimavel.
Em geral, qualquer contraste dos efeitos de
tratamento, a saber,a∑
i=1
ciτi, coma∑
i=1
ci = 0
(para planos balanceados) e estimavel.
7
Observe que os parametros individuais µ, τ1,
τ2, ...,τa nao sao estimaveis, pois nao existe
combinacao linear das equacoes normais que
produzam estes parametros separadamente.
Porem, isto nao e um problema em geral, pois
as funcoes estimaveis dos parametros do mo-
delo correspondem as funcoes que sao de in-
teresse na analise do modelo ANOVA basico.
Uma sugestao para saber mais sobre funcoes
estimaveis: texto de Myers e Milton (1991): A
First Course in the Theory of the Linear Model.
8
3.5 Intervalos de Confianca para µi, i = 1,2, .., a
Vimos que independentemente da restricao ado-tada sobre os parametros do modelo de efeitosque o estimador de mınimos quadrados de µi eYi., a media das n replicacoes correspondentesao i-esimo tratamento.
Como estamos supondo que Yij ∼ NID(µi, σ2),
j = 1,2, ..., n para cada i, segue que
Yi. ∼ NID(µi, σ2/n).
Se σ2 for conhecido, podemos construir o in-tervalo usando a distribuicao normal. Casocontrario, usamos a distribuicao t com N − agraus de liberdade tal que
IC(µi,1− α) : Yi. ± t(1−α/2),N−a√QMResn ,
pois QMRes = SQResN−a ∼ σ2χ2
N−a e e indepen-dente de Yi..
9
Outros intervalos de confianca de interesse,
quando rejeitamos a hipotese nula de que as
medias sao iguais, sao os intervalos corres-
pondentes a uma diferenca entre duas medias.
Como Yi. ∼ NID(µi, σ2/n), i = 1,2, ..., a segue
que Yr. − Ys. ∼ N(µr − µs,2σ2/n).
Logo, se σ2 e conhecido, usamos a distribuicao
normal para obter o IC ou, caso contrario, u-
samos a distribuicao t com N−a graus de liber-
dade tal que
IC(µr − µs,1− α) : Yr. − Ys. ± t(1−α/2),N−a
√2QMRes
n
10
No caso do exemplo 3.1, trabalhado na aula
anterior, temos as seguintes estimativas para
os parametros:
µ = 617,75 = y..
τ1 = 551,20− 617,75 = −66,55
τ2 = 587,40− 617,75 = −30,35
τ3 = 625,40− 617,75 = 7,65
τ4 = 707,00− 617,75 = 89,25
IC(µ4,0,95) : 707,00±17,32 : [689,68 , 724,32]
No R, a funcao model.tables(ajuste) fornece
as estimativas dos efeitos de tratamento.
11
Executando a ANOVA via R do exemplo 3.1.
dados=read.table(“g://dox//gravacao.txt”,header=T)
ajuste=aov(dados$velocidade ∼ as.factor(dados$potencia))
summary(ajuste)
F.V. g.l. SQ QM F0 p-valordados$potencia 3 66871 22290.2 66.797 2.883e-09Resıduo 16 5339 333.7
model.tables(ajuste)
Tables of effects
as.factor(dados$potencia)
160 180 200 220-66.55 -30.35 7.65 89.25
12
3.5.1 Intervalos de Confianca Simultaneos
As expressoes apresentadas para os interva-
los de confianca correspondem a intervalos se-
parados. Isto e, se obtivermos intervalos de
100(1−α)% para µ1 e para µ2, o nıvel de con-
fianca conjunto nao sera mais 100(1 − α)%.
Ou seja, estes intervalos aplicam-se somente
para uma estimativa particular. Porem, em
muitos problemas, o experimentador pode de-
sejar calcular varios intervalos de confianca,
por exemplo, para cada media de tratamento
ou para cada par de diferenca de medias de
tratamento.
Se existem r intervalos de interesse, a proba-
bilidade de que os r intervalos estejam simul-
taneamente corretos e de pelo menos 1− rα.
A probabilidade rα costuma ser chamada taxa
de erro “racional” do experimento.
13
Se r = 5 e α = 0,05, 1− rα = 0,75.
Se r = 10 e α = 0,05, 1− rα = 0,5.
Uma estrategia para assegurar que o nıvel de
confianca simultaneo nao seja tao pequeno e
substituir α/2 nas expressoes para os intervalos
separados por α/(2r). Este metodo e chamado
metodo de Bonferroni, e ele permite que o ex-
perimentador construa um conjunto de r inter-
valos de confianca simultaneos sobre medias de
tratamento ou diferenca de medias com con-
fianca global de pelo menos 1− α.
Quando r nao e muito grande este metodo e
simples e pratico.
14
O metodo anterior leva o nome de Bonferroni
devido a desigualdades estudadas em Probabi-
lidade que levam o nome de desigualdades de
Bonferroni. Uma delas e dada por:
sejam A1, A2, ..., Ar eventos associados a um
experimento, tais que
P (Ai) = 1− αi, i = 1,2, ..., r.
Entao
P (∩ri=1Ai) ≥ 1−r∑
i=1
P (Aci) = 1−r∑
i=1
αi.
Se αi = α, ∀ i, P (∩ri=1Ai) ≥ 1− rα.
15
3.5.2 Amostras de tamanhos desiguais
Na teoria apresentada consideramos o numero
de replicacoes igual para cada tratamento (caso
balanceado). No entanto, nem sempre os da-
dos serao dessa forma. Neste ultimo caso dize-
mos que as amostras sao de tamanhos desi-
guais (caso desbalanceado).
No modelo so muda a variacao do ındice j:
Yij = µ+ τi + εij,
{i = 1,2, ..., aj = 1,2, ..., ni
tal que N =a∑
i=1
ni.
ni representa o numero de replicacoes para o
i-esimo tratamento, i = 1,2, ..., a.
16
Neste caso, temos
SQTot =a∑
i=1
ni∑j=1
Y 2ij −
Y 2..
N
e
SQTrat =a∑
i=1
Y 2i.
ni−Y 2..
N.
Observe que as expressoes para os interva-los separados, no caso de tamanhos desiguais,tornam-se
IC(µi, γ = 1− α) : Yi. ± t(1−α/2),N−a
√QMResni
,
i = 1,2, ..., a
IC(µr−µs, γ = 1−α) : Yr.−Ys.±t(1−α/2),N−a
√QMRes
(1nr
+ 1ns
),
r, s ∈ {1,2, ..., a}, r 6= s
17
Nenhuma outra alteracao e necessaria no caso
de amostras de tamanhos desiguais na ANOVA.
Existem duas vantagens no uso de amostras
de tamanhos iguais.
Primeiro, a estatıstica de teste e relativamente
insensıvel para pequenos desvios da suposicao
de variancias iguais para os a tratamentos se
as amostras tem o mesmo tamanho. Este nao
e o caso para amostras de tamanhos desiguais.
Segundo, o poder do teste e maximizado se as
amostras sao de tamanhos iguais.
18
3.6 Verificacao da Adequacao do Modelo
Verificar a validade das suposicoes e impor-
tante.
Normalidade
Independencia
Variancia constante
Ajustamos o modelo “correto”?
Algumas estrategias de acao serao sugeridas
se algumas destas suposicoes nao sao validas.
19
3.6.1 Verificacao da Suposicao de Normalidade
Aqui sugere-se construir um grafico de proba-
bilidade normal dos resıduos rij dados por
rij = yij − µ− τi, i = 1,2, ..., a, j = 1,2, ..., n.
Em geral recomenda-se usar os resıduos stu-
dentizados, isto e, r∗ij = (rij − r..)/sr, em que
sr e o desvio-padrao amostral dos resıduos.
No caso do exemplo 3.1 este grafico sugere
que a suposicao de normalidade e razoavel.
20
21
3.6.2 Verificacao de Independencia
O grafico dos resıduos na ordem temporal em
que os dados foram coletados pode ser util na
deteccao de correlacoes entre resıduos. Sob
independencia, esperamos que os resıduos os-
cilem aleatoriamente em torno de zero com
sinais positivos e negativos. Uma estrutura
aparente no grafico implica que a suposicao
de independencia dos erros foi violada.
Este problema e grave e difıcil de corrigir. Por-
tanto, e fundamental prevenir-se dele se possı-
vel, quando os dados sao coletados. Aleato-
rizacao apropriada do experimento e um passo
importante na obtencao de independencia.
22
23
3.6.3 Grafico dos resıduos versus valores ajus-
tados
Este grafico e util na deteccao da hipotese
de variancia constante. Por exemplo, se os
resıduos apresentam valores menos dispersos
numa ponta do grafico em relacao a outra, isto
e um indicativo de que a hipotese de variancias
iguais esta sendo violada.
A figura a seguir mostra o grafico dos resıduos
na sequencia temporal em que foram obtidos
os dados. Nao ha razao para suspeitar que
as hipoteses de independencia e de variancia
constante nao sejam validas.
24
25
3.6.3 Equacao estrutural do modelo
O modelo esta “bom”?
Se o modelo esta correto e as suposicoes sao
satisfeitas, os resıduos nao devem apresentar
nenhuma estrutura; em particular, eles nao de-
vem ser relacionados a qualquer outra variavel
incluindo a variavel resposta ajustada.
Uma verificacao simples e construir o grafico
dos resıduos studentizados r∗ij versus valores
ajustados
yij = µ+τi = yi., i = 1,2, ..., a, j = 1,2, ..., n.
A figura a seguir indica que o modelo ajustado
ao dados do exemplo 3.1 parece bom.
26
27
Um problema que geralmente aparece no grafi-
co resıduos versus valores ajustados e o de
variancias desiguais. Algumas vezes a variancia
das observacoes cresce na medida em que a
magnitude das observacoes cresce.
Se a suposicao de homogeneidade das varian-
cias e violada, o teste F e somente pouco afe-
tado nos modelos de efeitos fixos balancea-
dos (amostras de tamanhos iguais). Porem,
no caso de tamanhos desiguais ou em casos
nos quais uma variancia e muito maior do que
as demais, o problema e mais serio.
A recomendacao e usar, sempre que possıvel,
tamanhos iguais.
No caso em que as variancias sao desiguais
recomenda-se usar uma transformacao estabi-
lizadora da variancia e, entao, realizar a analise
de variancia dos dados transformados.28
Por exemplo, se as observacoes seguem a dis-
tribuicao de Poisson, recomenda-se a trans-
formacao y∗ =√y ou y∗ =
√1 + y.
Se os dados seguem uma distribuicao lognor-
mal, uma tranformacao logaritmica e apropri-
ada y∗ = log y.
Se os dados sao binomiais, a transformacao
y∗ = arc sen√y e util.
Quando nao ha uma transformacao obvia, o
experimentador devera buscar empiricamente
uma transformacao que equilibre as variancias
sem olhar o valor da media.
29
3.6.4 Teste para a igualdade de variancias
Apesar dos graficos de resıduos serem muito
usados para diagnosticar a nao homogeneidade
das variancias, existem varios testes com esse
fim.
Considere as hipoteses
{H0 : σ2
1 = σ22 = ... = σ2
aH1 : pelo menos um dos σ2
i e diferente dos demais.
Um teste conhecido como teste de Bartlett en-
volve calcular uma estatıstica cuja distribuicao
amostral aproxima-se de uma distribuicao de
qui-quadrado com a − 1 graus de liberdade,
quando a amostras aleatorias de populacoes
normais foram sorteadas.
30
Teste de Bartlett das hipoteses
{H0 : σ2
1 = σ22 = ... = σ2
aH1 : pelo menos um dos σ2
i e diferente dos demais.
Estatıstica de teste: χ20 = 2,3026
q
c
com q = (N − a) log10 S2p −
a∑i=1
(ni−1) log10 S2i ,
c = 1 +1
3(a− 1)
a∑i=1
(ni − 1)−1 − (N − a)−1
S2p =
a∑i=1
(ni − 1)S2i
N − ae
S2i = 1
ni−1
ni∑j=1
(yij − yi.)2.
31
A quantidade q e maior quando as variancias
amostrais S2i diferem muito e e nula quando
todas as variancias amostrais sao iguais.
Portanto, devemos rejeitar H0 para valores gran-
des de χ20. De fato rejeitamos H0, ao nıvel de
significancia α, quando
χ20 ≥ χ
2(1−α),a−1
com χ2(1−α),a−1 representando o quantil acu-
mulado de 1 − α de uma distribuicao de qui-
quadrado com a− 1 graus de liberdade.
Aqui podemos tambem avaliar o p-valor do
teste.
Lembre que a distribuicao neste teste nao e e-
xata e, portanto, o ideal e ter amostras mode-
radas a grandes.
32
No R esta disponıvel a funcao bartlett.test:
bartlett.test(dados$velocidade,as.factor(dados$potencia))
Bartlett test of homogeneity of variances
data: dados$velocidade by as.factor(dados$potencia)
Bartlett’s K-squared = 0.4335, df = 3, p-value = 0.9332
Logo, nao rejeitamos a hipotese nula de homogeneidade das variancias.
33
O teste de Bartlett e muito sensıvel a desviosda normalidade. Consequentemente, quandoa validade desta suposicao e questionavel, elenao deve ser usado.
Um teste alternativo, robusto a desvios da nor-malidade, que pode ser util e o teste modifi-cado de Levene.
Para testar a hipotese de variancias iguais emtodos os tratamentos, este teste usa os desviosabsolutos das observacoes da mediana de trata-mento. Defina yi como a mediana do i-esimotratamento. Entao os desvios absolutos seraodados por
dij = |yij − yi|, i = 1,2, ..., a, j = 1,2, ..., ni.
O teste modificado de Levene prossegue entaofazendo uma ANOVA dos desvios absolutos.Se nao rejeitarmos a hipotese de que as mediasdos desvios sao iguais e por que a suposicaode homogeneidade das variancias e razoavel.
34
Para usar o teste de Levene via R e necessario
instalar e carregar o pacote lawstat.
levene.test(dados$velocidade,as.factor(dados$potencia))
modified robust Brown-Forsythe Levene-type test based on the ab-solute deviations from the median
data: dados$velocidade
Test Statistic = 0.1959, p-value = 0.8977
Logo, nao rejeitamos a hipotese de homogeneidade das variancias.
35
3.6.5 Interpretacoes praticas dos resulta-
dos
Depois de conduzir o experimento, realizar a
analise estatıstica e investigar as suposicoes,
o experimentador esta pronto para tirar con-
clusoes praticas sobre o problema em estudo.
Os fatores envolvidos num experimento podem
ser tanto qualitativos como quantitativos.
Na ANOVA eles sao tratados como qualita-
tivos. No entanto, quando os nıveis dos fatores
sao quantitativos, o experimentador pode estar
interessado, por exemplo, em prever a variavel
resposta dado que o nıvel do fator assume um
valor intermediario entre dois nıveis considera-
dos na analise.
36
Isto equivale a realizar uma interpolacao de al-
gum modelo empırico (Analise de Regressao).
Em geral, busca-se o polinomio de menor grau
que descreve adequadamente o processo. No
exemplo considerado, o polinomio de segundo
grau parece se ajustar melhor aos dados do
que o polinomio do primeiro grau tal que a
complexidade extra (termo quadratico) e jus-
tificada.
Neste exemplo, o modelo empırico pode ser
usado para prever a velocidade de gravacao
para certos nıveis de potencia dentro da regiao
de valores considerado na conducao do expe-
rimento.
Em outros casos, o modelo empırico pode ser
usado para processo de otimizacao, isto e, en-
contrar os nıveis dos fatores que resultam nos
melhores valores da resposta.
37
Modelos ajustados
xy
xy
527,262,137ˆ
10
+=
++= εββ
2
210
028375,02555,877,1147ˆ xxy
xxy
+−=
+++= εβββ
38
Exercıcio do capıtulo 3 para entregar na aula
do dia 6/10.
aluno nome exercıcios1 Aline 82 Andre 213 Carolina 224 Felipe 195 Fernanda 166 Igor 237 Laura 258 Mariana 139 Michele 20
10 Pedro 1411 Sandra 1812 Veronica 2413 Priscila 1214 Dimas 1115 Thaıs 5
39