Vari^ancia (ANOVA) Y NID QM Y N QMflavia/mad476/dox_aula05_2015_2.pdf · Existem in nitas possibilidades que poderiam resolver as equa˘c~oes normais. Felizmente, n~ao importa qual

3. Experimentos a um unico fator: Analise deVariancia (ANOVA)

3.4 Estimacao dos parametros do modelo deefeitos

Yij = µ+ τi + εij,

{i = 1,2, ..., aj = 1,2, ..., n

εij ∼ NID(0, σ2)

Ja vimos que um estimador nao viciado paraσ2 e dado por QMRes = SQRes

a(n−1).

De fato, Yij ∼ N(µ+ τi, σ2), j = 1,2, ..., n,

Yi. ∼ N(µ+ τi, σ2/n), i = 1,2, ..., a.

QMRes = SQResN−a , Yi. e QMRes independentes

SQRes =a∑

i=1

n∑j=1

(Yij−Yi.)2 =a∑

i=1

n∑j=1

Y 2ij−n

a∑i=1

Y 2i.

1

E[Y 2ij ] = Var(Yij) + E[Yij]

2 = σ2 + (µ+ τi)2

E[Y 2i. ] = Var(Yi.) + E[Yi.]

2 = σ2

n + (µ+ τi)2

Logo,

E[SQRes] = Nσ2 + n

a∑i=1

(µ + τi)2 − aσ2 − n

a∑i=1

(µ + τi)2 =

(N − a)σ2 → E[QMRes] = σ2.

Provaremos agora que os estimadores

µ = Y.. e τi = Yi. − Y..,

para µ e τi, i = 1,2, ..., a, apresentam boas pro-

priedades.

De fato, alem de intuitivos correspondem aos

estimadores de mınimos quadrados quando a-

dota-se a restricaoa∑

i=1

τi = 0.

2

A soma de quadrados dos erros e dada por

Q =a∑

i=1

n∑j=1

ε2ij =a∑

i=1

n∑j=1

(yij − µ− τi)2

O metodo consiste em escolher valores de µ

e τi, µ e τi, i = 1,2, ..., a, que mimimizam

Q. Os valores apropriados serao solucoes das

seguintes a+ 1 equacoes simultaneas

δQδµ = 0 δQ

δτi= 0, i = 1,2, ..., a

3

As equacoes resultantes sao

Nµ+ nτ1+ ...+ nτa = y..nµ+ nτ1 = y1.nµ+ nτ2+ = y2.

... = ...nµ+ nτa = ya.

Observe que estas equacoes nao sao linear-mente independentes e, por esta razao, naoexiste uma solucao unica (a primeira linha eigual a soma das demais).

Os efeitos no modelo estao superparametriza-dos. Este problema pode ser superado de di-versas formas. Uma possıvel solucao e res-

tringira∑

i=1

τi = 0, uma vez que definimos os

efeitos de tratamento como desvios da mediaglobal.

Usando esta restricao, obtemos

µ = y.. e τi = yi. − y.., i = 1,2, ..., a

4

Ou seja, a media global e estimada pela media

de todas as N = an observacoes (y..), en-

quanto cada efeito individual e estimado pela

diferenca entre a media amostral do tratamen-

to e a media de todas as observacoes (yi.− y..).

Outra escolha possıvel de restricao e consi-

derar a media global uma constante, por e-

xemplo µ = 0. Isto resultara na solucao

µ = 0 e τi = yi., i = 1,2, ..., a.

Ainda, uma terceira escolha e τa = 0. Isto

resultara na solucao

µ = ya e τi = yi − ya, i = 1,2, ..., a− 1, τa = 0.

5

Existem infinitas possibilidades que poderiamresolver as equacoes normais. Felizmente, naoimporta qual delas vamos usar. Para qualqueruma das tres alternativas apresentadas, de fatopara qualquer solucao possıvel das equacoesnormais, teremos

µi = µ+ τi = yi., i = 1,2, ..., a.

Ou seja, o estimador de mınimos quadradosda media do i-esimo nıvel do fator sera sem-pre a media da amostra correspondente as ob-servacoes deste nıvel. Assim, mesmo que naopossamos obter estimativas unicas para os pa-rametros no modelo de efeitos, nos podemosobter estimadores unicos de uma funcao destesparametros na qual estamos interessados.

Esta e a ideia de funcoes estimaveis. Qual-quer funcao dos parametros do modelo quepode ser univocamente estimada, sem olhara restricao adotada para resolver as equacoesnormais, e uma funcao estimavel.

6

Que funcoes sao estimaveis?

Pode ser mostrado que o valor esperado dequalquer observacao e estimavel.

E[Yij] = µ+ τi = µi

e ja vimos que a media do i-esimo nıvel dofator e estimavel.

Qualquer funcao que e uma combinacao li-near do lado esquerdo das equacoes normaise tambem estimavel.

Por exemplo, subtraia a segunda equacao nor-mal da (a+1)-esima, produzindo τ1−τa. Logo,a diferenca entre quaisquer dois efeitos de trata-mento e estimavel.

Em geral, qualquer contraste dos efeitos de

tratamento, a saber,a∑

i=1

ciτi, coma∑

i=1

ci = 0

(para planos balanceados) e estimavel.

7

Observe que os parametros individuais µ, τ1,

τ2, ...,τa nao sao estimaveis, pois nao existe

combinacao linear das equacoes normais que

produzam estes parametros separadamente.

Porem, isto nao e um problema em geral, pois

as funcoes estimaveis dos parametros do mo-

delo correspondem as funcoes que sao de in-

teresse na analise do modelo ANOVA basico.

Uma sugestao para saber mais sobre funcoes

estimaveis: texto de Myers e Milton (1991): A

First Course in the Theory of the Linear Model.

8

3.5 Intervalos de Confianca para µi, i = 1,2, .., a

Vimos que independentemente da restricao ado-tada sobre os parametros do modelo de efeitosque o estimador de mınimos quadrados de µi eYi., a media das n replicacoes correspondentesao i-esimo tratamento.

Como estamos supondo que Yij ∼ NID(µi, σ2),

j = 1,2, ..., n para cada i, segue que

Yi. ∼ NID(µi, σ2/n).

Se σ2 for conhecido, podemos construir o in-tervalo usando a distribuicao normal. Casocontrario, usamos a distribuicao t com N − agraus de liberdade tal que

IC(µi,1− α) : Yi. ± t(1−α/2),N−a√QMResn ,

pois QMRes = SQResN−a ∼ σ2χ2

N−a e e indepen-dente de Yi..

9

Outros intervalos de confianca de interesse,

quando rejeitamos a hipotese nula de que as

medias sao iguais, sao os intervalos corres-

pondentes a uma diferenca entre duas medias.

Como Yi. ∼ NID(µi, σ2/n), i = 1,2, ..., a segue

que Yr. − Ys. ∼ N(µr − µs,2σ2/n).

Logo, se σ2 e conhecido, usamos a distribuicao

normal para obter o IC ou, caso contrario, u-

samos a distribuicao t com N−a graus de liber-

dade tal que

IC(µr − µs,1− α) : Yr. − Ys. ± t(1−α/2),N−a

√2QMRes

n

10

No caso do exemplo 3.1, trabalhado na aula

anterior, temos as seguintes estimativas para

os parametros:

µ = 617,75 = y..

τ1 = 551,20− 617,75 = −66,55

τ2 = 587,40− 617,75 = −30,35

τ3 = 625,40− 617,75 = 7,65

τ4 = 707,00− 617,75 = 89,25

IC(µ4,0,95) : 707,00±17,32 : [689,68 , 724,32]

No R, a funcao model.tables(ajuste) fornece

as estimativas dos efeitos de tratamento.

11

Executando a ANOVA via R do exemplo 3.1.

dados=read.table(“g://dox//gravacao.txt”,header=T)

ajuste=aov(dados$velocidade ∼ as.factor(dados$potencia))

summary(ajuste)

F.V. g.l. SQ QM F0 p-valordados$potencia 3 66871 22290.2 66.797 2.883e-09Resıduo 16 5339 333.7

model.tables(ajuste)

Tables of effects

as.factor(dados$potencia)

160 180 200 220-66.55 -30.35 7.65 89.25

12

3.5.1 Intervalos de Confianca Simultaneos

As expressoes apresentadas para os interva-

los de confianca correspondem a intervalos se-

parados. Isto e, se obtivermos intervalos de

100(1−α)% para µ1 e para µ2, o nıvel de con-

fianca conjunto nao sera mais 100(1 − α)%.

Ou seja, estes intervalos aplicam-se somente

para uma estimativa particular. Porem, em

muitos problemas, o experimentador pode de-

sejar calcular varios intervalos de confianca,

por exemplo, para cada media de tratamento

ou para cada par de diferenca de medias de

tratamento.

Se existem r intervalos de interesse, a proba-

bilidade de que os r intervalos estejam simul-

taneamente corretos e de pelo menos 1− rα.

A probabilidade rα costuma ser chamada taxa

de erro “racional” do experimento.

13

Se r = 5 e α = 0,05, 1− rα = 0,75.

Se r = 10 e α = 0,05, 1− rα = 0,5.

Uma estrategia para assegurar que o nıvel de

confianca simultaneo nao seja tao pequeno e

substituir α/2 nas expressoes para os intervalos

separados por α/(2r). Este metodo e chamado

metodo de Bonferroni, e ele permite que o ex-

perimentador construa um conjunto de r inter-

valos de confianca simultaneos sobre medias de

tratamento ou diferenca de medias com con-

fianca global de pelo menos 1− α.

Quando r nao e muito grande este metodo e

simples e pratico.

14

O metodo anterior leva o nome de Bonferroni

devido a desigualdades estudadas em Probabi-

lidade que levam o nome de desigualdades de

Bonferroni. Uma delas e dada por:

sejam A1, A2, ..., Ar eventos associados a um

experimento, tais que

P (Ai) = 1− αi, i = 1,2, ..., r.

Entao

P (∩ri=1Ai) ≥ 1−r∑

i=1

P (Aci) = 1−r∑

i=1

αi.

Se αi = α, ∀ i, P (∩ri=1Ai) ≥ 1− rα.

15

3.5.2 Amostras de tamanhos desiguais

Na teoria apresentada consideramos o numero

de replicacoes igual para cada tratamento (caso

balanceado). No entanto, nem sempre os da-

dos serao dessa forma. Neste ultimo caso dize-

mos que as amostras sao de tamanhos desi-

guais (caso desbalanceado).

No modelo so muda a variacao do ındice j:

Yij = µ+ τi + εij,

{i = 1,2, ..., aj = 1,2, ..., ni

tal que N =a∑

i=1

ni.

ni representa o numero de replicacoes para o

i-esimo tratamento, i = 1,2, ..., a.

16

Neste caso, temos

SQTot =a∑

i=1

ni∑j=1

Y 2ij −

Y 2..

N

e

SQTrat =a∑

i=1

Y 2i.

ni−Y 2..

N.

Observe que as expressoes para os interva-los separados, no caso de tamanhos desiguais,tornam-se

IC(µi, γ = 1− α) : Yi. ± t(1−α/2),N−a

√QMResni

,

i = 1,2, ..., a

IC(µr−µs, γ = 1−α) : Yr.−Ys.±t(1−α/2),N−a

√QMRes

(1nr

+ 1ns

),

r, s ∈ {1,2, ..., a}, r 6= s

17

Nenhuma outra alteracao e necessaria no caso

de amostras de tamanhos desiguais na ANOVA.

Existem duas vantagens no uso de amostras

de tamanhos iguais.

Primeiro, a estatıstica de teste e relativamente

insensıvel para pequenos desvios da suposicao

de variancias iguais para os a tratamentos se

as amostras tem o mesmo tamanho. Este nao

e o caso para amostras de tamanhos desiguais.

Segundo, o poder do teste e maximizado se as

amostras sao de tamanhos iguais.

18

3.6 Verificacao da Adequacao do Modelo

Verificar a validade das suposicoes e impor-

tante.

Normalidade

Independencia

Variancia constante

Ajustamos o modelo “correto”?

Algumas estrategias de acao serao sugeridas

se algumas destas suposicoes nao sao validas.

19

3.6.1 Verificacao da Suposicao de Normalidade

Aqui sugere-se construir um grafico de proba-

bilidade normal dos resıduos rij dados por

rij = yij − µ− τi, i = 1,2, ..., a, j = 1,2, ..., n.

Em geral recomenda-se usar os resıduos stu-

dentizados, isto e, r∗ij = (rij − r..)/sr, em que

sr e o desvio-padrao amostral dos resıduos.

No caso do exemplo 3.1 este grafico sugere

que a suposicao de normalidade e razoavel.

20

21

3.6.2 Verificacao de Independencia

O grafico dos resıduos na ordem temporal em

que os dados foram coletados pode ser util na

deteccao de correlacoes entre resıduos. Sob

independencia, esperamos que os resıduos os-

cilem aleatoriamente em torno de zero com

sinais positivos e negativos. Uma estrutura

aparente no grafico implica que a suposicao

de independencia dos erros foi violada.

Este problema e grave e difıcil de corrigir. Por-

tanto, e fundamental prevenir-se dele se possı-

vel, quando os dados sao coletados. Aleato-

rizacao apropriada do experimento e um passo

importante na obtencao de independencia.

22

23

3.6.3 Grafico dos resıduos versus valores ajus-

tados

Este grafico e util na deteccao da hipotese

de variancia constante. Por exemplo, se os

resıduos apresentam valores menos dispersos

numa ponta do grafico em relacao a outra, isto

e um indicativo de que a hipotese de variancias

iguais esta sendo violada.

A figura a seguir mostra o grafico dos resıduos

na sequencia temporal em que foram obtidos

os dados. Nao ha razao para suspeitar que

as hipoteses de independencia e de variancia

constante nao sejam validas.

24

25

3.6.3 Equacao estrutural do modelo

O modelo esta “bom”?

Se o modelo esta correto e as suposicoes sao

satisfeitas, os resıduos nao devem apresentar

nenhuma estrutura; em particular, eles nao de-

vem ser relacionados a qualquer outra variavel

incluindo a variavel resposta ajustada.

Uma verificacao simples e construir o grafico

dos resıduos studentizados r∗ij versus valores

ajustados

yij = µ+τi = yi., i = 1,2, ..., a, j = 1,2, ..., n.

A figura a seguir indica que o modelo ajustado

ao dados do exemplo 3.1 parece bom.

26

27

Um problema que geralmente aparece no grafi-

co resıduos versus valores ajustados e o de

variancias desiguais. Algumas vezes a variancia

das observacoes cresce na medida em que a

magnitude das observacoes cresce.

Se a suposicao de homogeneidade das varian-

cias e violada, o teste F e somente pouco afe-

tado nos modelos de efeitos fixos balancea-

dos (amostras de tamanhos iguais). Porem,

no caso de tamanhos desiguais ou em casos

nos quais uma variancia e muito maior do que

as demais, o problema e mais serio.

A recomendacao e usar, sempre que possıvel,

tamanhos iguais.

No caso em que as variancias sao desiguais

recomenda-se usar uma transformacao estabi-

lizadora da variancia e, entao, realizar a analise

de variancia dos dados transformados.28

Por exemplo, se as observacoes seguem a dis-

tribuicao de Poisson, recomenda-se a trans-

formacao y∗ =√y ou y∗ =

√1 + y.

Se os dados seguem uma distribuicao lognor-

mal, uma tranformacao logaritmica e apropri-

ada y∗ = log y.

Se os dados sao binomiais, a transformacao

y∗ = arc sen√y e util.

Quando nao ha uma transformacao obvia, o

experimentador devera buscar empiricamente

uma transformacao que equilibre as variancias

sem olhar o valor da media.

29

3.6.4 Teste para a igualdade de variancias

Apesar dos graficos de resıduos serem muito

usados para diagnosticar a nao homogeneidade

das variancias, existem varios testes com esse

fim.

Considere as hipoteses

{H0 : σ2

1 = σ22 = ... = σ2

aH1 : pelo menos um dos σ2

i e diferente dos demais.

Um teste conhecido como teste de Bartlett en-

volve calcular uma estatıstica cuja distribuicao

amostral aproxima-se de uma distribuicao de

qui-quadrado com a − 1 graus de liberdade,

quando a amostras aleatorias de populacoes

normais foram sorteadas.

30

Teste de Bartlett das hipoteses

{H0 : σ2

1 = σ22 = ... = σ2

aH1 : pelo menos um dos σ2

i e diferente dos demais.

Estatıstica de teste: χ20 = 2,3026

q

c

com q = (N − a) log10 S2p −

a∑i=1

(ni−1) log10 S2i ,

c = 1 +1

3(a− 1)

a∑i=1

(ni − 1)−1 − (N − a)−1

S2p =

a∑i=1

(ni − 1)S2i

N − ae

S2i = 1

ni−1

ni∑j=1

(yij − yi.)2.

31

A quantidade q e maior quando as variancias

amostrais S2i diferem muito e e nula quando

todas as variancias amostrais sao iguais.

Portanto, devemos rejeitar H0 para valores gran-

des de χ20. De fato rejeitamos H0, ao nıvel de

significancia α, quando

χ20 ≥ χ

2(1−α),a−1

com χ2(1−α),a−1 representando o quantil acu-

mulado de 1 − α de uma distribuicao de qui-

quadrado com a− 1 graus de liberdade.

Aqui podemos tambem avaliar o p-valor do

teste.

Lembre que a distribuicao neste teste nao e e-

xata e, portanto, o ideal e ter amostras mode-

radas a grandes.

32

No R esta disponıvel a funcao bartlett.test:

bartlett.test(dados$velocidade,as.factor(dados$potencia))

Bartlett test of homogeneity of variances

data: dados$velocidade by as.factor(dados$potencia)

Bartlett’s K-squared = 0.4335, df = 3, p-value = 0.9332

Logo, nao rejeitamos a hipotese nula de homogeneidade das variancias.

33

O teste de Bartlett e muito sensıvel a desviosda normalidade. Consequentemente, quandoa validade desta suposicao e questionavel, elenao deve ser usado.

Um teste alternativo, robusto a desvios da nor-malidade, que pode ser util e o teste modifi-cado de Levene.

Para testar a hipotese de variancias iguais emtodos os tratamentos, este teste usa os desviosabsolutos das observacoes da mediana de trata-mento. Defina yi como a mediana do i-esimotratamento. Entao os desvios absolutos seraodados por

dij = |yij − yi|, i = 1,2, ..., a, j = 1,2, ..., ni.

O teste modificado de Levene prossegue entaofazendo uma ANOVA dos desvios absolutos.Se nao rejeitarmos a hipotese de que as mediasdos desvios sao iguais e por que a suposicaode homogeneidade das variancias e razoavel.

34

Para usar o teste de Levene via R e necessario

instalar e carregar o pacote lawstat.

levene.test(dados$velocidade,as.factor(dados$potencia))

modified robust Brown-Forsythe Levene-type test based on the ab-solute deviations from the median

data: dados$velocidade

Test Statistic = 0.1959, p-value = 0.8977

Logo, nao rejeitamos a hipotese de homogeneidade das variancias.

35

3.6.5 Interpretacoes praticas dos resulta-

dos

Depois de conduzir o experimento, realizar a

analise estatıstica e investigar as suposicoes,

o experimentador esta pronto para tirar con-

clusoes praticas sobre o problema em estudo.

Os fatores envolvidos num experimento podem

ser tanto qualitativos como quantitativos.

Na ANOVA eles sao tratados como qualita-

tivos. No entanto, quando os nıveis dos fatores

sao quantitativos, o experimentador pode estar

interessado, por exemplo, em prever a variavel

resposta dado que o nıvel do fator assume um

valor intermediario entre dois nıveis considera-

dos na analise.

36

Isto equivale a realizar uma interpolacao de al-

gum modelo empırico (Analise de Regressao).

Em geral, busca-se o polinomio de menor grau

que descreve adequadamente o processo. No

exemplo considerado, o polinomio de segundo

grau parece se ajustar melhor aos dados do

que o polinomio do primeiro grau tal que a

complexidade extra (termo quadratico) e jus-

tificada.

Neste exemplo, o modelo empırico pode ser

usado para prever a velocidade de gravacao

para certos nıveis de potencia dentro da regiao

de valores considerado na conducao do expe-

rimento.

Em outros casos, o modelo empırico pode ser

usado para processo de otimizacao, isto e, en-

contrar os nıveis dos fatores que resultam nos

melhores valores da resposta.

37

Modelos ajustados

xy

xy

527,262,137ˆ

10

+=

++= εββ

2

210

028375,02555,877,1147ˆ xxy

xxy

+−=

+++= εβββ

38

Exercıcio do capıtulo 3 para entregar na aula

do dia 6/10.

aluno nome exercıcios1 Aline 82 Andre 213 Carolina 224 Felipe 195 Fernanda 166 Igor 237 Laura 258 Mariana 139 Michele 20

10 Pedro 1411 Sandra 1812 Veronica 2413 Priscila 1214 Dimas 1115 Thaıs 5

39

Documents

Vari^ancia (ANOVA) Y NID QM Y N QMflavia/mad476/dox_aula05_2015_2.pdf · Existem in nitas possibilidades que poderiam resolver as equa˘c~oes normais. Felizmente, n~ao importa qual