MATERIAL DIDÁTICO
Parte II
Estatística Experimental – Medicina Veterinária
Faculadade de Ciências Agrárias e Veterinárias
Campus de Jaboticabal – SP
Gener Tadeu Pereira
2º SEMESTRE DE 2017
ÍNDICE
AULA 7 DELINEAMENTO QUADRADO LATINO (DQL). 123
7º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 138
AULA 8 EXPERIMENTOS FATORIAIS 140
8º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 152
AULA 9 EXPERIMENTOS FATORIAIS: ANALISANDO UM FATORIAL A X B 158
9º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 170
AULA 10 EXPERIMENTOS EM PARCELA SUBDIVIDIDA 172
10º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 184
AULA 11 EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS - ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO. 186
AULA 12 TRANSFORMAÇÃO DE DADOS 190
123
Estatística Experimental
Aula 7 Delineamento Quadrado Latino (DQL). 1 Introdução
No delineamento Quadrado Latino os tratamentos são designados aos blocos de duas maneiras diferentes, geralmente designados por colunas e linhas. Cada coluna e cada linha é um bloco completo de todos os tratamentos. Portanto, em um DQL, três fontes de variação explicáveis são identificáveis: linhas, colunas e tratamentos. Um particular tratamento é designado somente uma vez em cada linha e cada coluna. Geralmente um dos blocos corresponde aos animais e o outro ao período. Cada animal receberá todos os tratamentos em diferentes períodos. O número de tratamentos (k) é igual ao número de linhas e colunas. O número total de observações é igual k2. Se os tratamentos são designados por letras maiúsculas (A, B, C e D, etc.), então exemplos de Quadrados Latinos 3 x 3 e 4 x 4 são:
A C B C A B A B D C C D B A B A C A B C C A B D D B A C C B A B C A B D C A B A C D D C A B A C D B
Considere a seguinte situação (baseado em VIEIRA, 2006, pág. 18): Um veterinário pretende comparar o efeito de três drogas no combate a uma doença em suínos. Os animais disponíveis são, no entanto, diferentes em raças e em pesos. Para fazer o experimento, o veterinário deve, primeiro organizar blocos de animais de mesma raça (em coluna) e depois organizar em peso (em linha). Na Figura abaixo: a raça está representada pela tonalidade da cor preta e o peso pelo tamanho. Então foram construídos blocos em “colunas” e “linhas”
Construído o quadrado latino, sorteiam-se os tratamentos, mas cada
tratamento só deve aparecer uma vez em cada “coluna” e uma vez em cada “linha”. Assim o sorteio dos tratamentos tem duas restrições: “dentro” de linhas e dentro de “colunas”
Os DQL não são comuns na prática devido às restrições do
delineamento. Notem, por exemplo, que linhas, colunas e tratamentos são, necessariamente, iguais em números. Mais ainda, o nº de observações é igual ao quadrado do nº de tratamentos.
Considere este outro exemplo, extraído de Rao, P.V. Statistical research methods in the life science, pg 727: Em um estudo para comparar as
124
Estatística Experimental
tolerâncias de gatos a quatro substâncias cardíacas (A, B, C, D) foi conduzida utilizando-se um DQL, no qual as linhas representavam quatro combinações de dois períodos (A.M. , P.M.) e duas técnicas (I e II) e as colunas representam os dias nos quais as medidas foram feitas. A cada um dos 16 gatos foi administrada uma substância cardíaca a uma taxa fixada e a dose (taxa de infusão x tempo) na qual o efeito especificado foi observado foi anotado. Abaixo temos que mostra as respostas medidas em 10log(dose em μg).
1 2 3 4 ..iY iY
I,AM ︶︵11 DY
3,26
︶︵12 BY
4,15
︶︵13 AY
3,02
︶︵14 CY
3,67 1Y
14,10 1Y
I,PM ︶︵21 BY
2,73
︶︵22 DY
3,38
︶︵23 CY
3,29
︶︵24 AY
4,50 2Y
13,90 2Y
II,AM ︶︵31 AY
3,45 ︶︵32 CY
4,09
︶︵33 BY
2,66
︶︵34 DY
3,51 3Y
13,71 3Y
II,PM ︶︵41 CY
3,20
︶︵42 AY
3,14
︶︵43 DY
3,48
︶︵44 BY
3,40 4Y
13,22 4Y
jY 1Y
12,64 2Y
14,76 3Y
12,45 4Y
15,08 Y
54,93
jY 1Y
2Y
3Y
4Y
Y
Totais dos tratamentos: 11,1414,345,350,402,3︶︵︶︵︶︵︶︵︶︵ 42312413 AYAYAYAYAY94,1240,366,273,215,4︶︵︶︵︶︵︶︵︶︵ 44332112 BYBYBYBYBY25,1420,309,429,367,3︶︵︶︵︶︵︶︵︶︵ 41322314 CYCYCYCYCY63,1348,351,338,326,3︶︵︶︵︶︵︶︵︶︵ 43342211 DYDYDYDYDY
Notação: iY = soma das observações da i-ésima linha (i = 1, 2,..., k);
iY = soma das observações da j-ésima coluna (j=1,2, ..., k);
)( tY = soma das observações do t-ésimo tratamento Organização dos arquivos:
No excel: ex1.xls No bloco de notas: ex1.txt linha coluna trat y
TI_AM DIA1 D 3.26 TI_AM DIA2 B 4.15 TI_AM DIA3 A 3.02 TI_AM DIA4 C 3.67 TI_PM DIA1 B 2.73 TI_PM DIA2 D 3.38 TI_PM DIA3 C 3.29 TI_PM DIA4 A 4.50 TII_AM DIA1 A 3.45 TII_AM DIA2 C 4.09 TII_AM DIA3 B 2.66 TII_AM DIA4 D 3.51 TII_PM DIA1 C 3.20 TII_PM DIA2 A 3.14 TII_PM DIA3 D 3.48 TII_PM DIA4 B 3.40
linha coluna trat y TI_AM DIA1 D 3,26 TI_AM DIA2 B 4,15 TI_AM DIA3 A 3,02 TI_AM DIA4 C 3,67 TI_PM DIA1 B 2,73 TI_PM DIA2 D 3,38 TI_PM DIA3 C 3,29 TI_PM DIA4 A 4,50 TII_AM DIA1 A 3,45 TII_AM DIA2 C 4,09 TII_AM DIA3 B 2,66 TII_AM DIA4 D 3,51 TII_PM DIA1 C 3,20 TII_PM DIA2 A 3,14 TII_PM DIA3 D 3,48 TII_PM DIA4 B 3,40
Dias
Combinações de tempo e técnicas
125
Estatística Experimental
2 Modelo matemático
colunaésimajelinhaésimainausadotratamentodoçãoidentificadeindiceoék
rjeriCLY kijkjikij
,,,,,,,
︶︵︶︵
2121
sendo:
.
;,
;;
;;
,︶︵
︶︵
aleatórioerrodoefeitooé
etratamentoésimotdofixoefeitoécolunaésimajdaefeitoéClinhaésimaidaefeitooéL
sobservaçõeastodasacomumgeralmédiaécolunaésimajnae
linhaésimainatratamentoésimokorecebeuqueobservaçãoay
kij
tkk
j
j
kij
0
3 Suposições do modelo
Neste modelo, supõem-se que: ︶;,0︵
2Lj NtesindependensãoL
; ︶,0︵
2Cj NtesindependensãoC
︶,︵︶︵
20 Ntesindependensãokij
jikij CeL ,,
︶︵
são mutuamente independentes.
4 Hipótese estatística Podemos testar
00
1
0
t
k
ostodosnemHH
:
,:, ou jiparaH
Hji
t
:...:
1
210
Geralmente os testes de hipóteses com relação aos efeitos de linhas e colunas não são feitos por dois motivos: primeiro o interesse principal é testar os efeitos de tratamento, e o propósito usual de linhas e colunas é eliminar fontes estranhas de variação.
5 Participação da soma de quadrados Do quadro de representação das observações no DQL, podemos notar os seguintes desvios:
Podemos identificar os seguintes desvios: yy kij ︶︵
, como o desvio de uma observação em relação à média
geral; yy kij ︶︵
, como o desvio da média do t-ésimo tratamento em
relação à média geral; yy i , como o desvio da média da i-ésimo linha em relação á
média geral; yy j como o desvio da média da j-ésima coluna em relação á
média geral; Então, podemos escrever a igualdade:
126
Estatística Experimental
︶︵︶︵︶︵︶︵︶︵ ︶︵︶︵ YYYYYYYYYYYYY kjikijkjikij 2 a qual
representa a “ a variação de uma observação em relação à média geral amostral como uma soma da variação da média da i-ésima linha em relação à média geral, com a variação da média da j-ésima coluna em relação à média geral, com a variação da média da j-ésima coluna em relação à média geral, com a variação da média do k-ésima tratamento em relação à média geral, e com a variação do erro experimental “. Elevando-se ao quadrado os dois membros da identidade acima e somando em relação aos índices i e j, obtemos:
, ︶︵
︶︵︶︵︶︵︶︵
︶︵
︶︵
k
i
k
j
k
tkjikij
k
tk
k
jj
k
ii
k
i
k
jkij
YYYYY
YYYYYYYY
1 1 1
2
1
2
1
2
1
2
1 1
2
2
ou seja, a Soma de Quadrados do Total (SQT) é igual à Soma de Quadrados do efeito colocado nas linhas (SQL), mais a Soma de Quadrados do efeito colocado nas colunas (SQC), mais a Soma de Quadrados dos Tratamentos (SQTr), mais a Soma de Quadrados dos resíduos (SQR). Notem que existem k2 observações, então a SQT tem (k2 -1) graus de liberdade. Existe k – linhas, k – colunas e k – tratamentos, tal que cada uma das três soma de quadrados SQL, SQC e SQTr tem k-1 graus de liberdade. Finalmente, os graus de liberdade para SQR pode ser calculado pela diferença entre os graus de liberdade entre a SQT e soma dos graus de liberdade para linhas, colunas e tratamentos. ((k2-1)-(k-1)-k-1)-(k-1)=(k-1)(k-2)).
Assim, os graus de liberdade associados a cada membro da equação acima fica:
Total Linhas Colunas Tratamentos Resíduo ( k2 -1) = (k-1) + (k-1) + (k-1) + (k-1)(k-2)
6 Quadrados médios Dividindo a SQL, SQC, SQTr e SQR pelos correspondentes graus de
liberdade, obtemos, respectivamente o Quadrado Médio das Linhas (QML), o Quadrado Médio das Colunas (QMC) , o Quadrado Médio de Tratamentos (QMTr) e o Quadrado Médio Resíduo (QMR), isto é,
︶2︶ ︵1︵11,1
kk
SQRQMRekSQTrQMTre
kSQCQMC
kSQLQML
7 Estatística e região crítica do teste A estatística para o teste é
QMRQMTrFc ,
a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem, sob H0 distribuição F – Snedecor com (k -1) e (k-1)(k-2) graus de liberdade no numerador e no denominador, respectivamente.
Resumidamente, indicamos:
0︶︶,2︶ ︵1︵,1︵
,~ HsobFF kkkc .
Rejeitamos H0 para o nível de significância se
)),)((,( 2k1k1kc FF ,
127
Estatística Experimental
sendo, )),)((,( 2k1k1kF o quantil de ordem )( 1 da distribuição F-Snedecor
com (k -1) e (k-1)(k-2) graus de liberdade no numerador e no denominador.
8 Quadro da análise de variância (ANOVA) Dispomos as expressões necessárias ao teste na Tabela abaixo,
denominada de Quadro de Análise de Variância (ANOVA). Fonte de variação gl SQ QM F
Linhas
k - 1 2
2
1
2
kY
k
yk
i
jkij
︶︵︶︵
1k
SQL
Colunas
k – 1 2
2
1
1
2
kY
k
yk
j
ikij ︶︵︶︵
1k
SQC
Tratamentos
k - 1 2
2
1
2
kY
k
yk
t
ikij ︶︵︶︵
1k
SQTr
QMRQMTr
Resíduo
(k-1)(k-2)
︶︶ ︵︵ 21 kkSQR
TOTAL
K2 – 1
k
i
k
Jkij k
YY1 1
2
22 ︶︵
︶︵
Pode-se provar que: 2QMRE )( , ou seja, QMR é um estimador não viesado da
variância 2 ;
k
iik
rQMTrE1
2
︶1︵
︶︵ , ou seja, QMTr é um estimador não
viesado da variância 2 se a hipótese 0H k210 ...: é
verdadeira.
9 Detalhes computacionais Apresentaremos alguns passos que facilitam os cálculos das somas de
quadrados da ANOVA.
Calcule a correção para a média 2
2
kyCM ︶︵ ;
Calcule a Soma de Quadrados dos Totais (SQT)
CMySQTk
i
k
jkij
1 1
2
︶︵
;
Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)
CMk
ySQTr
k
t
ikij
1
2
︶︵
;
128
Estatística Experimental
Calcule a Soma de Quadrados das Linhas (SQL)
CMk
ySQL
k
i
jkij
1
2
︶︵
;
Calcule a Soma de Quadrados de Colunas (SQC)
CMk
ySQC
k
j
ikij
1
1
2
︶︵
;
Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é, SQTrSQCSQLSQTSQR ;
Calcule os Quadrados Médios Entre os Tratamentos (QMTr) e o Quadrado Médio Residual (QMR)
︶2︶ ︵1︵1,
1,1
kk
SQRQMRekSQTrQMTr
kSQCQMC
kSQLQML
Calcule Fc para tratamentos, linhas e colunas, ou seja,
QMRQMCFe
QMRQMLF
QMRQMTrF CLcTr ,
10 Exemplo 1: Vamos considerar os dados do exemplo apresentado no item1. Os cálculos para montar-mos o quadro da ANOVA são:
k = 4, e k2 = N =16. Então Graus de liberdade:
8242k1ks
e3141kColunas3141kLinhas
3141kTrat151161N1kTotal 2
))(())((Re
,
.;
5816,18816
︶94,54︵
2
CM
6055,35816,1881871,192
︶40,3︵...︶15,4︵︶26,3︵
222
CMSQT
2331,05816,1888147,188
4
︶63,13︵
4
︶25,14︵
4
︶94,12︵
4
︶11,14︵
2222
CMSQTr
1065,05816,1886881,188
4
︶22,13︵
4
︶71,13︵
4
︶90,13︵
4
︶10,14︵
2222
CMSQL
4274,15816,1880090,190
4
︶08,15︵
4
︶45,12︵
4
︶76,14︵
4
︶64,12︵
2222
CMSQC
8384,14274,11065,02331,06055,3 SQCSQLSQTrSQTSQR
129
Estatística Experimental
3015,0
68094,1
4758,034274,1,0355,0
31065,0,0771,0
32331,0
QMRe
QMCQMLQMTr
5530,13064,04758,0
1159,03016,00355,02899,0
3064,008741,0
QMRQMCF
QMRQMLFe
QMRQMTrF
cC
cLcTr
Organizando estes resultados no Quadro da ANOVA, temos: Fonte de variação gl SQ QM F
Linhas 3 0,1065 0,0355
Colunas 3 1,4274 0,4758
Tratamentos 3 0,2331 0,08741 0,2899
Resíduo 6 1,8384 0,3015
TOTAL 15 3,6055
Das tabelas das distribuições F, temos que 789Fe764F 0106305063 ,, ),,,(),,,( . O valor FcTr = 0,2899 é menor do que estes
valores tabelados, então não rejeitamos a hipótese nula H0 para um nível %,, 5ou050 de probabilidade e concluímos que os dados não evidenciam
uma diferença significativa entre as quatros drogas. Os dados também não evidenciam uma variação significativa entre os efeitos colocados nas linhas (p=0,946) e nas colunas (p=0,290). Seguindo o que alguns pesquisadores sugerem não consideraríamos os efeitos de linhas e colunas em futuros experimentos, tendo em vista que o valor do nível de significância para linhas e colunas é superior a 0,25.
Script no R para a obtenção dos resultados acima # entrando com os dados pelo comando read.table( ) dados.ex1 <- read.table("ex1dql.txt",header=TRUE,dec=",") # imprimindo as 6 primeiras linhas do arquivo head(dados.ex1) # anexando o objeto dados.ex1 no caminho de procura attach(dados. ex1) # estatísticas resumo de cada nível dos tratamentos e.desc<- tapply(tx.inf,trat,summary) e.desc # gráfico Box-plot para cada nível de trat boxplot(tx.inf~trat,col=2,xlab="Tratamentos")
# quadro da anova
130
Estatística Experimental
tx.inf.av<-aov(tx.inf~factor(linha)+factor(coluna)+factor(trat)) summary(tx.inf)
# obtendo o residuo residuo <- resid(tx.inf.av) # teste de normalidade dos resíduos shapiro.test(residuo) # teste de homogeneidade das variâncias bartlett.test(tx.inf~factor(linha)+factor(coluna)+factor(trat))
# requerendo o pacote ExpDes require(ExpDes) # quadro da anova pelo ExpDes latsd(trat,linha,coluna,tx.inf,quali=T) # retirando o objeto dados.ex1 do caminho de procura detach(dados.ex1)
Exemplo 2. Com o objetivo de estudar o efeito da idade da castração no desenvolvimento e produção de suínos, foi utilizado um delineamento em quadrado latino com 4 tratamentos envolvendo a castração aos 7 dias (C); aos 21 dias (D); aos 56 dias (A) e suínos inteiros (B). A variação existente entre as leitegadas foi controlada pelas linhas do quadrado e a variação dos pesos dos leitões dentro das leitegadas foi isolada pelas colunas. Os ganhos de peso, em kg, ao final do experimento (252 dias) estão apresentados no quadro a seguir:
Leitegada Classe de pesos dos leitões dentro das leitegadas
1 2 3 4 Totais 1 93,0 (A) 108,6 (B) 118,9 (C) 102 (D) 412,5 2 115,4 (B) 96,5 (D) 77,9 (A) 120,2 (C) 390,0 3 122,1 (C) 90,9 (A) 116,9 (D) 106,0 (B) 409,9 4 117,6 (D) 124,1 (C) 118,7 (B) 95,6 (A) 448,0
Totais 428,1 414,1 422,4 395,8 1660,4 Quadro da ANOVA
Fonte de variação gl SQ QM F
Leitegadas 3 436,55 49,65 0,72
Classe 3 148,95 145,52 2,11
Tratamentos 3 913,57 304,52 4,42
Resíduo 6 413,00 68,83
TOTAL 15 1912,07
Das tabelas das distribuições F, temos que
789Fe764F 0106305063 ,, ),,,(),,,( . O valor FcTr = 4,42 é menor do que estes
valores tabelados, então não rejeitamos a hipótese nula H0 para um nível
131
Estatística Experimental
%,, 5ou050 de probabilidade e concluímos que a hipótese de que os efeitos de tratamento são todos nulos não é rejeitada, ou seja, os ganhos de peso dos leitões submetidos às diferentes idades de castração são todos iguais a 103,78.
Script no R para a obtenção destes resultados # leitura dos dados pelo read.table dados.ex2 <- read.table("ex2dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex2) # anexando o objeto dados.ex3 no caminho de procura attach(dados.ex2) # estatísticas resumo dos dados do arquivo dados.ex2 e.desc<- tapply(peso,trat,summary) e.desc # gráfico Box-plot para cada nível de trat boxplot(peso~trat,col=2,xlab="Tratamentos") # fazendo a análise diretamente pelo ExpDes # requerendo o ExpDes require(ExpDes) # quadro da anova latsd(trat,leitegada,classe,peso,quali=T,mcomp="tukey") # retirando o objeto dados.ex2 do caminho de procura detach(dados.ex2) 11 Como contornar o problema do pequeno número de graus de liberdade do resíduo?
Um problema que surge quando usamos o delineamento em quadrado latino com um número pequeno de tratamentos, é que o resíduo passa a ser estimado com um número pequeno de graus de liberdade. No quadro a seguir, apresentamos o número de graus de liberdade do resíduo no DQL para diferentes números de tratamentos:
Número de tratamentos g.l. do resíduo 3 2 4 6 5 12 6 20 7 30 8 42
RESPOSTA: Planejar mais de uma repetição do quadrado latino para
conseguir um número satisfatório de graus de liberdade para o resíduo. Por exemplo, se k = 4 tratamentos e queremos um número de g.l. para o resíduo superior a 12, devemos fazer pelo menos r = 2 repetições do Q.L. original.
Solução 1: usar as mesmas linhas e mesmas colunas;
132
Estatística Experimental
QL1 C1 C2 C3 C4
QL2 C1 C2 C3 C4
L1 A B C D L1 D A B C L2 B C D A L2 C D A B L3 C D A B L3 B C D A L4 D A B C L4 A B C D
Quadro da ANOVA resultante
Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas k – 1 = 3 Colunas k – 1 = 3 Resíduo (k – 1)[ r (k + 1) – 3] = 21 Total r k2 – 1 = 31
Solução 2: usar as mesmas linhas com as colunas diferentes (ou
mesmas colunas com linhas diferentes); QL1 C1 C2 C3 C4
QL2 C5 C6 C7 C8
L1 A B C D L1 D A B C L2 B C D A L2 C D A B L3 C D A B L3 B C D A L4 D A B C L4 A B C D
Quadro da ANOVA resultante
Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas k – 1 = 3 Colunas (QL) r ( k – 1 ) = 6 Resíduo (k – 1)(r k – 2 )= 18 Total r k2 – 1 = 31
Solução 3: usar linhas e colunas diferentes.
QL1 C1 C2 C3 C4
QL2 C5 C6 C7 C8
L1 A B C D L5 D A B C L2 B C D A L6 C D A B L3 C D A B L7 B C D A L4 D A B C L8 A B C D
Quadro da ANOVA resultante
Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas (QL)* r ( k - 1) = 6 Colunas (QL)** r ( k - 1) = 6 Resíduo (k – 1) [ k (k – 1) –1]=15 Total r k2 – 1 = 31
(*) lê-se “Efeito de linhas dentro de quadrado latino” (**) lê-se “Efeito de colunas dentro de quadrado latino”
133
Estatística Experimental
Suponha que um experimentador esteja interessado em estudar os efeitos da atividade da estimulação hormonal folicular (follicle-stimulation hormone - FSH). Em vacas é medido em bio ensaios pesando-se o ovário (mg) de ratos imaturos. Duas variáveis conhecidas que influenciam no peso de ovários de ratos são: a constituição genética e o peso corporal. Acredita-se que o peso corporal é independente das diferenças genéticas, assim o delineamento quadrado latino (DQL) é adequado. Dois quadrados latinos 4 x 4 foram usados com as linhas = ninhadas de ratos e colunas = classes de peso corporal. O pesquisador considerou a diferença nos pesos corporais nos dois quadrados para preservar os graus de liberdade do erro experimental, dado que a amplitude do peso corporal era consistente de ninhada para ninhada, ou seja, o pesquisador repetiu o experimento considerando as mesmas classes de peso corporal.
(Solução 2).
QL1 C1 C2 C3 C4Totais
QL2 C1 C2 C3 C4 Totais
L1 (D) 44 (C) 39 (B) 52 (A) 73 208 L5 (B) 51 (C) 74 (A) 74 (D) 82 281
L2 (B) 26 (A) 45 (D) 49 (C) 58 178 L6 (D) 62 (A) 74 (C) 75 (B) 79 290
L3 (C) 67 (D) 71 (A) 81 (B) 76 295 L7 (A) 71 (D) 67 (B) 60 (C) 74 272
L4 (A) 77 (B) 74 (C) 88 (D) 100 339 L8 (C) 49 (B) 47 (D) 58 (A) 68 222
Totais 214 229 270 307 1020 233 251 267 303 1065
Totais dos tratamentos: 563 (A), 465 (B), 524 (C), 533 (D) Cálculos:
69489132
10651020
4
222178208SQL
2222
,)(...
;
;,)()(...)(
09181932
10651020
8
303307233214SQC
222
;,)(...
5963132
10651020
8
533563SQTr
222
;,)(
... 22778832
106510206844SQT
222
;,56382SQLSQCSQTrSQTSQR O quadro da ANOVA fica
Causas de variação gl SQ QM F P
QL 1 63,28 63,28
Tratamentos 3 631,59 210,53 9,91 0,0004
Linhas (QL) 6 4891,69 815,28 38,26
Colunas 3 1819,09 606,36 28,53
Resíduo 18 292 16,22
Total 31 7730
Das tabelas das distribuições F, temos que 095Fe163F 010186050183 ,, ),,,(),,,( . O valor Fctr = 9,91 é maior que estes
valores tabelados, então rejeitamos a hipótese nula H0 para um nível %,, 1ou010 de probabilidade e concluímos que a hipótese de que os
efeitos de tratamento são todos nulos é rejeitada, ou seja, nos pesos dos ovários de ratos imaturos (bio-ensaio para vacas) existe pelo menos dois tratamentos que diferem entre si quanto ao peso de ovários.
134
Estatística Experimental
Podemos usar o teste de Tukey para compararmos as médias dos tratamentos (note que temos 4 tratamentos e cada um deles aparece 8 vezes). Então,
51,6825,21
997,3... )05,0,18,4( rk
QMRqsmd
Drogas Peso médio*
(mg) A 70,37 a D 66,63 a C 65,50 a B 58,13 b
(* Médias seguidas pelas mesmas letras na coluna não diferem entre si pelo teste de Tukey a 5%).
Com base nos resultados apresentados na tabela anterior pode-se afirmar que os pesos de ovários tratados com as drogas A, D e C não diferem entre si e os pesos dos ovários tratados com as drogas C e B também não diferem entre si. As diferenças nos pesos de ovários estão entre as drogas A, D e C quando comparadas, individualmente, com a droga B.
Organizando o arquivo de dados no Excel e no bloco de notas Arquivo de dados .xls (peso.xls) Arquivo de dados . txt (peso.txt)
ql linha coluna trat put
q1 l1 c1 D 44
q1 l2 c1 B 26
q1 l3 c1 C 67
q1 l4 c1 A 77
q1 l1 c2 C 39
q1 l2 c2 A 45
q1 l3 c2 D 71
q1 l4 c2 B 74
q1 l1 c3 B 52
q1 l2 c3 D 49
q1 l3 c3 A 81
q1 l4 c3 C 88
q1 l1 c4 A 73
q1 l2 c4 C 58
q1 l3 c4 B 76
q1 l4 c4 D 100
q2 l5 c1 B 51
q2 l6 c1 D 62
q2 l7 c1 A 71
q2 l8 c1 C 49
q2 l5 c2 C 74
q2 l6 c2 A 74
q2 l7 c2 D 67
q2 l8 c2 B 47
q2 l5 c3 A 74
q2 l6 c3 C 75
q2 l7 c3 B 60
q2 l8 c3 D 58
ql linha coluna trat put q1 l1 c1 D 44 q1 l2 c1 B 26 q1 l3 c1 C 67 q1 l4 c1 A 77 q1 l1 c2 C 39 q1 l2 c2 A 45 q1 l3 c2 D 71 q1 l4 c2 B 74 q1 l1 c3 B 52 q1 l2 c3 D 49 q1 l3 c3 A 81 q1 l4 c3 C 88 q1 l1 c4 A 73 q1 l2 c4 C 58 q1 l3 c4 B 76 q1 l4 c4 D 100 q2 l5 c1 B 51 q2 l6 c1 D 62 q2 l7 c1 A 71 q2 l8 c1 C 49 q2 l5 c2 C 74 q2 l6 c2 A 74 q2 l7 c2 D 67 q2 l8 c2 B 47 q2 l5 c3 A 74 q2 l6 c3 C 75 q2 l7 c3 B 60 q2 l8 c3 D 58 q2 l5 c4 D 82 q2 l6 c4 B 79 q2 l7 c4 C 74 q2 l8 c4 A 68
135
Estatística Experimental
q2 l5 c4 D 82
q2 l6 c4 B 79
q2 l7 c4 C 74
q2 l8 c4 A 68
Script no R para a obgtenção dos resultados acima
# leitura dos dados pelo read.table dados.ex3 <- read.table("ex2dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex3) # anexando o objeto dados.ex3 no caminho de procura attach(dados.ex3) # gráfico Box-plot para cada nível de trat boxplot(peso~trat,col=2,xlab="Tratamentos") # quadro da anova put.av <-aov(put~factor(ql)+factor(linha)+factor(coluna)+factor(trat)) summary(put.av) # usando os recursos do pacote agricolae require(agricolae) put.tu <-HSD.test(put.av,"trat") # gráfico de barras com as letras do teste de Tukey bar.group(put.tu,ylim=c(0,90),density=20, col="brown", xlab="Tratamentos",ylab="Peso do Utero", main="Teste de Tukey") # retirando o objeto dados.ex3 do caminho de procura detach(dados.ex3) 12 Casualização dos tratamentos
Suponha que queremos dispor os tratamentos A, B, C, e D sobre um quadrado latino 4 x 4
escolhemos aleatoriamente um dos quadrados padrões de
tamanho 4. Suponha
1 2 3 4 1 A B C D 2 B C D A 3 C D A B 4 D A B C
selecionemos uma das permutações de 1, 2, 3, e 4. suponha 2, 4,
1, 3. Então
136
Estatística Experimental
1 2 3 4 2 B C D A 4 D A B C 1 A B C D 3 C D A B
selecionemos uma outra das permutações de 1, 2, 3, e 4. suponha
1, 3, 4, 2. Então
1 3 4 2 2 B D A C 4 D B C A 1 A C D B 3 C A B D
Este é o delineamento escolhido.
13 Exemplos em qua as unidades experimentais são animais
Neste tipo de experimento os próprios animais servem como um critério de classificação (linhas) e o tempo (colunas) é o outro, ou seja, medidas repetidas não aleatórias são obtidas de cada animal (pessoa) distribuídos a uma seqüência de tratamentos. Exemplo 4 O objetivo deste experimento foi testar o efeito de quatro diferentes suplementos (A, B, C, D) adicionados ao feno na engorda de novilhos. O experimento foi delineado em um experimento Quadrado Latino com quatro animais em quatro períodos de 20 dias. As ovelhas foram mantidas isoladas individualmente. Cada período consistia de 10 dias de adaptação e de 10 de medidas. Os dados apresentados abaixo são as médias de 10 dias.
Novilhos Período N1 N2 N3 N4
1 10,0 (B) 10,2 (C) 8,5 (D) 11,8 (A) 2 9,0 (C) 11,3 (A) 11,2 (B) 11,4 (C) 3 11,1 (C) 11,2 (B) 12,8 (A) 11,7 (D) 4 10,8 (A) 11,0(D) 11,0 (C) 11,0 (B)
Script no R para resolver este exemplo # leitura dos dados pelo read.table dados.ex4 <- read.table("ex4dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex4) # anexando o objeto dados.ex4 no caminho de procura attach(dados.ex4) # estatísticas resumo dos tratamentos do arquivo dados.ex4 e.desc<- tapply(peso,trat,summary) e.desc # gráfico Box-plot para cada nível de trat
137
Estatística Experimental
boxplot(peso~trat,col=2,xlab="Tratamentos") # fazendo a análise diretamente pelo ExpDes # requerendo o ExpDes require(ExpDes) # quadro da anova latsd(trat,periodo,novilho,peso,quali=T,mcomp="tukey") # retirando o objeto dados.ex4 do caminho de procura detach(dados.ex4)
RESUMO:
138
Estatística Experimental
7º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL
1) Nos experimentos que tratam da produção de vacas leiteiras, a enorme variação entre os indivíduos exige um grande número de animais para a avaliação de diferenças moderadas. Qualquer esforço de aplicar vários tratamentos sucessivamente numa mesma vaca se complica pela diminuição do fluxo de leite, pela forma da curva de lactação e por uma correlação entre os erros eijk. Estas dificuldades são controladas com o uso de vários pares de quadrados latinos ortogonais onde as colunas representam as vacas e as linhas os períodos sucessivos da lactação, e os tratamentos são aplicados as vacas nos vários estágios. Num experimento procurou-se verificar o efeito de diferentes tipos de tratamentos, e é apresentado somente um quadrado latino, sem nos preocuparmos com os efeitos correlacionados. Os tratamentos (1,0 kg para cada 3,0 kg de leite produzido) foram os seguintes: A = Ração comum B = 75% de ração comum + 25% de rolão de milho. C = 50% de ração comum + 50% de rolão de milho. D = 75% de ração comum + 25% de farelo de soja. E = 25% de ração comum + 75% de farelo de soja. Os valores da tabela correspondem a produção de leite (kg) por um período de seis semanas.
Linhas Colunas (Vacas) Total (Período) 1 2 3 4 5
1 B 318 E 416 A 420 C 424 D 330 1908 2 D 325 A 435 E 418 B 438 C 333 1949 3 E 342 B 441 C 395 D 418 A 380 1976 4 A 353 C 403 D 410 E 395 B 375 1936 5 C 310 D 381 B 422 A 432 E 314 1859
Total 1648 2076 2065 2107 1732 9628 a) Formule as hipóteses estatísticas para os tratamentos e monte o quadro da análise de variância de acordo com um delineamento quadrado latino e conclua b) Aplique o teste de Tukey para localizar as diferenças entre as médias dos tratamentos. Represente as diferenças com as médias (média±se), seguidas de letras. d) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos. e) Defina os contrastes abaixo e teste-os através da técnica de decomposição dos graus de liberdade dos tratamentos (teste F planejado) e complemente o quadro da anova do item b) com estes contrastes:
c1) Existe efeito dos complementos adicionados à ração comum?; c2) Qual complemento adicionado à ração comum é melhor: rolão de milho ou farelo de
soja?; c3) Qual percentual de rolão de milho é melhor ?; c4) Qual percentual de farelo de soja é melhor ?;
f) Calcular e interpretar os coeficiente de variação (CV) do experimento e o de determinação R2 do experimento. g) Com base nestas observações e nos resultados do item a) a utilização do delineamento em DQL é plenamente justificada?
139
Estatística Experimental
2) Avaliação do efeito de anestésicos sobre o metabolismo animal é imprescindível ao cirurgião. Neste experimento são considerados 5 anestésicos e analisar variáveis como: frequência cardíaca,respiratória, pressão sanguínea, tempo efetivo de anestesia. Estas variáveis são muito instáveis com c.v. > 35,0 %. Existe uma reação muito diferente de animal para animal o que exigiria um número muito grande destes ( de 13 a 49 animais) para cada anestésico. Por outro lado estas respostas são de fluxo contínuo. Podemos testar todos os anestésicos, em ocasiões diferentes com intervalos de 2 a 3 dias, no mesmo animal. Se um animal recebe todos os anestésicos, em sequência controlada, todos os demais deverão também recebê-los, mas cada um dos cachorros deverá estar submetido a um anestésico diferente, de modo que, em um mesmo dia, todos os cães e todos os anestésicos estejam sendo testados. Com este procedimento, o eventual efeito de dia poderá estar controlado. A maneira mais simples de se controlar o efeito de dia de experimentação (ou período) e o efeito de cães, é o efeito de controle local (blocos). Uma solução prática que leva em conta os dois tipos de blocagem (período e animal) é o croqui do delineamento quadrado latino (DQL) onde as letras representam um anestésico específico com os seguintes resultados sobre tempo efetivo de anestesia:
Período Animal I II III IV V
1 A(8,92) E(4,77) B(6,29) D(9,99) C(6,93) 2 D(4,88) B(7,53) A(12,29) C(8,95) E(8,51) 3 C(7,32) A(10,16) E(8,50) B(4,83) D(7,08) 4 E(6,67) C(5,00) D(5,40) A(11,54) B(8,62) 5 B(4,40) D(7,15) C(8,95) E(7,85) A(13,68)
a) Formule as hipóteses estatísticas para os tratamentos e monte o quadro da análise de variância de acordo com um delineamento quadrado latino e conclua b) Aplique o teste de Tukey para localizar as diferenças entre as médias dos tratamentos. Represente as diferenças com as médias (média±se), seguidas de letras. d) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos. e) Calcular e interpretar os coeficiente de variação (CV) do experimento e o de determinação R2 do experimento. f) Com base nestas observações e nos resultados do item a) a utilização do delineamento em DQL é plenamente justificada?
140
Estatística Experimental
Aula 8 Experimentos fatoriais 1 Introdução
Nos experimentos mais simples comparamos tratamentos ou níveis de um único fator, considerando que todos os demais fatores que possam interferir nos resultados obtidos se mantenham constantes. Por exemplo: quando comparamos tipos de drogas em animais experimentais, os demais fatores, como raça, idade, sexo etc., se mantêm constantes, isto é, devem ser os mesmos para todas as drogas estudadas. Entretanto, existem diversos casos em que vários fatores devem ser estudados simultaneamente. Nesses casos, utilizamo-nos dos experimentos fatoriais, que “são aqueles nos quais são estudados, ao mesmo tempo, os efeitos de dois ou mais tipos de fatores ou tratamentos”. Entenda-se por fator “uma variável independente cujos valores (níveis do fator) são controlados pelo experimentador”. Cada subdivisão de um fator é denominada de nível do fator e os tratamentos nos experimentos fatoriais consistem de todas as combinações possíveis entre os diversos fatores nos seus diferentes níveis.
Por exemplo: num experimento fatorial podemos combinar 2 doses de um antibiótico com 3 diferentes níveis de vitamina B12. Neste caso teremos um fatorial 2 x 3, com os fatores Antibióticos (A) e Vitamina (V), que ocorrem em 2 níveis (A1 e A2) e 3 níveis (V1, V2 e V3), respectivamente, e os 2 x 3 = 6 tratamentos são:
A1V1 A1V2 A1V3
A2V1 A2V2 A2V3 Outro exemplo: num experimento fatorial 3 x 2 podemos combinar 3
Doses de uma droga (D1, D2 e D3), 2 Idades (I1 e I2) e teremos 3x2 = 6 tratamentos, que resultam de todas as combinações possíveis dos níveis dos 3 fatores, ou seja,
D1I1 D1I2 D2I1 D2I2 D3I1 D3I2
Os experimentos fatoriais não constituem um delineamento experimental e sim um esquema orientado de desdobramento de graus de liberdade de tratamentos e podem ser instalados em qualquer um dos delineamentos experimentais já estudados (DIC, DBC e DQL, por exemplo).
Em um experimento fatorial nos podemos estudar não somente os efeitos dos fatores individuais, mas também, se o experimento foi bem conduzido, a interação entre os fatores. Para ilustrar o conceito de interação vamos considerar os seguintes exemplos:
Suponha que as médias dos 3 x 2 = 6 tratamentos deste último exemplo são apresentadas na tabela abaixo:
Fator B - Idade
Fator A-(Dose da Droga) I0 I1 D0 5 10 D1 10 15 D2 15 25
141
Estatística Experimental
Os seguintes aspectos importantes dos dados na Tabela acima devem
ser destacados: Para ambos os níveis do fator B, a diferença entre as médias para
quaisquer níveis do fator A é a mesma; Para todos os níveis do fator A, a diferença entre as médias para
os dois níveis de B é a mesma; Uma terceira característica é notada por meio do gráfico. Notamos
que as curvas correspondentes aos diferentes níveis de um fator são todas paralelas.
Quando os dados da população possuem estas três características listadas acima, dizemos que não existe interação presente entre os fatores. A presença de interação entre os fatores pode afetar as características dos dados de várias formas dependendo da natureza da interação. Vamos ilustrar o efeito de um tipo de interação modificando os dados da tabela apresentada anteriormente
Fator B: Idade Fator A: Dose da Droga I0 I1
D0 5 15 D1 10 10 D2 20 5
Os seguintes aspectos importantes dos dados na Tabela acima devem ser destacados:
A diferença entre as médias para qualquer dos dois níveis de A não é a mesma para ambos os níveis de B;
A diferença entre as médias para ambos os níveis do fator B não é o mesmo nos níveis do fator A;
As curvas dos fatores não são paralelas, como é mostrado nos gráficos abaixo;
142
Estatística Experimental
Quando os dados da população exibem as características acima, dizemos que existe interação entre os dois fatores. Enfatizamos que o tipo de interação ilustrada acima é somente uma das dos muitos tipos de interação que podem ocorrer entre dois fatores.
Em resumo, podemos afirmar que “existe interação entre dois fatores se uma modificação em um dos fatores produz uma modificação na resposta em um dos níveis do outro fator diferente dos produzidos nos outros níveis deste fator”.
As vantagens de um experimento fatorial são: A interação dos fatores pode ser estudada; Existe uma economia de tempo e de esforço. Nos experimentos
fatoriais todas as observações podem ser usadas para estudar o efeito de cada um dos fatores investigados. A alternativa, quando dois fatores são investigados, seria o de conduzir dois diferentes experimentos, cada um para estudar cada um dos dois fatores. Se isto é feito, as observações somente produzirão informações sobre um dos fatores, e o outro experimento somente fornecerá informação sobre o outro fator. Para se obter o nível de precisão dos experimentos fatoriais, mais unidades experimentais seriam necessárias se os fatores fossem estudados por meio de dois experimentos. Isto mostra que 1 experimento com dois fatores é mais econômico que 2 experimentos com 1 fator cada um.
Visto que os vários fatores são combinados em um experimento, os resultados têm uma grande amplitude de aplicação.
2 Definições iniciais
Vamos considerar um experimento fatorial 2x2, com os fatores Antibiótico (A) e Vitamina B12 (B) nos níveis: a0 (sem antibiótico) e a1 (com antibiótico); b0 (sem Vitamina B12) e b1 (com vitamina B12), respectivamente, adicionados a uma dieta básica e os seguintes valores médios de ganho de peso (g) para os 2x2 = 4 tratamentos:
Fator B: Vitamina B12
Fator A: Dose do antibiótico b0 b1 Médias
a0 14 23 18,5
a1 32 53 42,5
Médias 23,0 38,0 30,5
A representação gráfica fica:
143
Estatística Experimental
Definições: Efeito simples de um fator: como a medida da variação que
ocorre com a característica em estudo (ganho de peso, neste exemplo) correspondente às variações nos níveis desse fator, em cada um dos níveis do outro fator.
Efeito simples do antibiótico no nível 0 de vitamina B12 : 1814320001︶︵ 0
babaA bdedentro
Efeito simples do antibiótico no nível 1 de vitamina B12: 3023531011︶︵ 1
babaA bdedentro
Efeito simples da vitamina B12 no nível 0 de antibiótico : 1914230010︶︵ 0
babaB adedentro
Efeito simples da vitamina B12 no nível 1 de antibiótico : 2132530011︶︵ 1
babaB adedentro
Efeito principal de um fator: é uma medida da variação que
ocorre com a característica em estudo, correspondente às variações nos níveis desse fator, em média, de todos os níveis do outro fator.
152
219
2
BBBdeprincipalEfeito
242
3018
2
AAAdeprincipalEfeito
10
10
adedentroadedentro
bdedentrobdedentro
)()(
)()(
Efeito da interação entre os dois fatores: é uma medida da
variação média que ocorre com a característica em estudo, correspondente às variações nos níveis de um fator, ao passar de um nível a outro do outro fator.
,62921
2int
,,621830
2int
︶︵︶︵
︶︵︶︵
01
01
adedentroadedentro
bdedentrobdedentro
BBAxBdeeraçãodaEfeito
aindaouAA
BxAeraçãodaEfeito
isto é, tanto faz calcular a interação A x B como a interação B x A As principais desvantagens dos experimentos fatoriais são:
O número de tratamentos aumenta muito com o aumento do número de níveis e de fatores, tornando praticamente impossível distribuí-los em blocos casualizados, devido à exigência de homogeneidade das parcelas dentro de cada bloco.
A análise estatística é mais trabalhosa (efeitos principais e interação de todos os fatores) e a interpretação dos resultados se torna mais difícil à medida que aumentamos o número de níveis e de fatores no experimento.
3 O modelo matemático
O modelo de um experimento fatorial com dois fatores, num delineamento inteiramente casualizado com r repetições, pode ser escrito como:
ijkijjiijky ︶︵
Sendo:
144
Estatística Experimental
;
fatordonível
ésimojoefatordonívelésimoiorecebeuquerespostaésimakaéyikj
;)(tan sobservaçõeastodasacomummédiateconsumaé
;..,., a1icomfatordonívelésimoidoefeitooéi
;...,,1 bjcomfatordonívelésimojdoefeitooéj
;
int
fatordonívelésimoj
doefeitoocomfatordonívelésimoidoeraçãodaefeitooéij
r1kcomyobservaçãoàassociadoerimentalerrooé ijkijk ...,,exp
4 Suposições do modelo As suposições associadas ao modelo;
As observações de cada célula ab constituem uma amostra aleatória de tamanho r retirada de uma população definida pela particular combinação dos níveis dos dois fatores;
Cada uma das ab populações é normalmente distribuída; Todas as populações têm a mesma variância; ),(~ 2
ijk oN ;
.0︶︵︶︵0
︶︵,
1111
b
jij
a
iij
b
jj
a
ii
ijji
e
condiçõesassatisfazemeparâmetrosose
Vale observar que “a” é o número de níveis do fator A, “b” é o número de níveis do fator B e “r” é o número de repetições de cada um dos “ab” tratamentos. No total temos “abr” unidades experimentais.
5 Hipóteses estatísticas
As seguintes hipóteses podem ser testadas nos experimentos fatoriais. A hipótese de que não existe ou existe interação AB é equivalente
às hipóteses b1jea1icom0Hvs0H ijAB1ijAB0 ...,,...,,)(:)(: ;
De maneira análoga as hipóteses de que não existe efeito principal do fator A e B é a mesma que as hipóteses
b1jcom0Hvs0H
a1icom0Hvs0H
jB1jB0
iA1iA0
...,,::
...,,::
,
respectivamente. 6 Detalhes computacionais
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA.
O quadro abaixo mostra um possível arranjo dos dados de um experimento com os tratamentos em um arranjo fatorial 2 x 2
145
Estatística Experimental
a1 a2
b1 b2 b1 b2
111y 121y 211y
221y
112y 122y
212y 222y
.
.
.
.
.
.
. . .
.
.
r11y r12y
r21y r22y
Pode-se montar o seguinte quadro auxiliar dos totais
(r) b1 b2 Totais
a1 11Y 12Y 1Y
a2 21Y 22Y 2Y
TOTAL 1Y 2Y Y
Assim os cálculos do quadro da análise de variância são dados pelas
seguintes expressões:
Soma de Quadrados do Total (SQT)
;,)(
,)(
2be2asendoabr
YCMsendo
abrY
YSQT22r
1k
a
1i
b
1j
2ijk
Soma de Quadrados do fator A, SQ(A) CMYbr
ASQa
ii
1
21)( ;
Soma de Quadrados do fator, B SQ(B) CMYar
BSQb
jj
1
21)( ;
Soma de Quadrados da interação AxB, SQ(AxB)=SQ(A,B)-SQ(A)-
SQ(B) ou CMYr
1AxBSQ
a
1i
b
11j
2ij
)( , sendo a SQ(A,B) a soma de
quadrado conjunta, que nos fatoriais com dois fatores é igual à SQTr;
Soma de Quadrados do Resíduo (SQR) SQR=SQT-SQ(A)-SQ(B)-
SQ(AxB) ou
r
1k
2ij
r
1k
a
1i
b
1j
2ijk YYSQR
7 Quadro da anova Calculadas as SQ podemos montar o seguinte Quadro da ANOVA: Fonte de Variação g.l. SQ QM F
Fator A a-1 SQ(A) QM(A)=SQ(A)/(a-1) QM(A)/QMR
Fator B b-1 SQ(B) QM(B)=SQ(B)/(b-1) QM(B)/QMR
Int A xB (a-1)(b-1) SQ(AxB) QM(A)=SQ(AxB)/(a-1)(b-1) QM(AxB)/QMR
Tratamentos ab-1 SQTr QMTr=SQTr/(ab-1) QMTr/QMR
Resíduo ab(r-1) SQR QMR+SQR/ab(r-1)
TOTAL abr-1 SQT
146
Estatística Experimental
8 Estatística e região crítica do teste As estatísticas para os testes F da ANOVA são
QMR
AxBQMFe
QMR
BQMF
QMR
AQMF cABcBcA
)()(,
)( ,
a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa estatística são uma indicação de que H0 é falsa. A teoria nos assegura que FcA tem, sob H0 distribuição F – Snedecor com (a -1) e ab(r-1)) graus de liberdade no numerador e no denominador, respectivamente. Resumidamente, indicamos:
01rab1acA HsobFF ,~ )),(,( .
Rejeitamos H0 para o nível de significância se
)),(,( 1rab1acA FF ,
sendo, )),(,( 1rab1aF o quantil de ordem )( 1 da distribuição F-Snedecor
com (a -1) e ab(r-1) graus de liberdade no numerador e no denominador. De modo análogo temos FcB . Para a interação A x B a
01rab1b1acAB HsobFF ,~ )),(,))(((
e rejeitamos H0 para o nível de significância se ,)),(,))((( 1rab1b1acAB FF ,
sendo, )),(,))((( 1rab1b1aF o quantil de ordem )( 1 da distribuição F-
Snedecor com (a -1)(b-1) e ab(r-1) graus de liberdade no numerador e no denominador respectivamente.
9 Exemplo 1 Considere o esquema fatorial 2 x 2 ( dois níveis de antibiótico, dois níveis de vitamina B12) para estudar o aumento de peso (Kg) diário em suínos.
a0 – sem antibiótico; a1 – com 40 g de antibiótico
b0 – sem vitamina B12 ; b1 – com 5 mg de vitamina B12
Repetiçãoa0 a1
b0 b1 b0 b1 1 1,30 1,26 1,05 1,52 2 1,19 1,21 1,00 1,56 3 1,08 1,19 1,05 1,55
Totais 3,57 3,66 3,10 4,63 Formato do arquivo .txt Formato no Excel anti vitb12 trat g.peso ao b0 t1 1.30 ao b0 t1 1.19 ao b0 t1 1.08 ao b1 t2 1.26 ao b1 t2 1.21 ao b1 t2 1.19 a1 b0 t3 1.05 a1 b0 t3 1.00 a1 b0 t3 1.05 a1 b1 t4 1.52 a1 b1 t4 1.56 a1 b1 t4 1.55
anti vitb12 trat g.peso
ao b0 t1 1.30
ao b0 t1 1.19
ao b0 t1 1.08
ao b1 t2 1.26
ao b1 t2 1.21
ao b1 t2 1.19
a1 b0 t3 1.05
a1 b0 t3 1.00
a1 b0 t3 1.05
a1 b1 t4 1.52
a1 b1 t4 1.56
a1 b1 t4 1.55
147
Estatística Experimental
Notem que neste caso o delineamento experimental foi o inteiramente casualizado com os tratamentos num esquema fatorial 2 x 2, com 3 repetições
Outra forma de apresentação dos dados Trat. Repetição Totais
a0b0 1,30 1,19 1,08 3,57 a0b1 1,26 1,21 1,19 3,66 a1b0 1,05 1,00 1,05 3,10 a2b2 1,52 1,56 1,55 4,63
Calculo das Soma de Quadrados:
e então, podemos construir um primeiro quadro de análise de variância:
Fonte de variação gl SQ QM F
Tratamentos 3 0,4124 0,1398 38,13
Resíduo 8 0,0293 0,003667
TOTAL 11 0,4417
Como 597F 01083 ,).;,( podemos concluir que pelo menos duas médias
de tratamentos diferem significativamente (p<0,01) entre si quanto ao ganho de peso diário de suínos. A continuação da análise pode envolver a comparação das médias dos tratamentos por meio de um dos procedimentos de comparações múltiplas conhecidos, como os testes de Tukey, Duncan, t-Student, Scheffé etc.
Uma alternativa de análise mais simples e mais informativa, está baseada no esquema fatorial dos tratamentos. Utilizando o quadro com os totais das combinações dos níveis dos fatores A e B e as fórmulas apresentadas anteriormente, podemos construir um novo quadro de análise de variância que permitirá testar se existe interação entre os dois fatores e se cada um dos fatores tem efeito significativo sobre o desenvolvimento dos suínos.
Quadro auxiliar com os totais das combinações dos níveis de antibióticos (a0, a1)e vitamina B12
b0 b1 Totais a0 3.57 3,66 7,23 a1 3,10 4,63 7,73
Totais 6,67 8,29 14,96 Assim,
.1728,02187,00208,04124,0︶︵
;2187,0
︶3︵496,14
︶3︵229,8
︶3︵267,6
︶︵
;0208,0
︶3. ︵496,14
︶3. ︵273,7
︶3. ︵223,7
︶︵
22
222
AxBSQ
BSQ
ASQ
,,,,
;,))()((
),(,,,,
;,),(
))()((),...,(
),...,(
029304124044180SQTrSQTSQR
41240322
96143634
3103
3613
3573
SQTr
44170129614
322551301
551301SQT
22222
2222
148
Estatística Experimental
Notem que SQTr = SQ(A) + SQ(B) + SQ(AxB) e que as somas de quadrados associadas ao total e ao resíduo permanecem inalteradas.
O novo quadro da ANOVA fica: Fonte de variação gl SQ QM F
Antibótico (A) 1 0,0208 0,0208 5,68
Vitamina B12 (B) 1 0,2187 0,2187 59,65
Int. AxB 1 0,1728 0,1728 47,13
Tratamentos (3) 0,4124 0,137 37,33
Resíduo 8 0,0293 0,00367
TOTAL 11 0,4417
Da tabela apropriada, temos F(3, 8; 0,01) = 7,59; F(1, 8, 0,05) = 5,32 ; F(1, 8 ;
0,01) = 11,26 Comparando os valores calculados das estatísticas F, podemos concluir que:
o teste para a interação AxB foi significativo (p < 0,01), indicando que o efeito da vitamina B12 na presença ou ausência de antibiótico é significativamente diferente.
Como a interação AxB resultou significativa (veja o gráfico apresentado
acima), as interpretações da significância dos testes dos efeitos simples de Antibiótico (A) e de Vitamina B12 (B) perdem o significado. Precisamos estudar a interação fazendo os seguintes desdobramentos:
a) Desdobramento da interação AxB para estudar o comportamento dos fator A dentro de cada nível de vitamina B12 (b0 e b1) :
1568,0
︶3︵2
︶29,8︵︶63,466,3︵31
︶︵2︶︵
1
︶︵
,0368,0
︶3︵2
︶67,6︵︶10,357,3︵31
︶︵2︶︵
1
︶︵
222
222
22212
222
212
21211
1
0
rYYY
rASQ
rYYY
rASQ
bdedentro
bdedentro
149
Estatística Experimental
Assim, monta-se a seguinte análise de variância do desdobramento dos graus de liberdade da interação A x B para se estudar o efeito do antibiótico no ganho de peso diário de suínos na ausência e na presença da vitamina B12.
F.V. G.L. S.Q. Q.M. F Pr.Fc
0bdedentroA 1 0,0368 0,0368 10,04 0.0132
1bdedentroA 1 0,1568 0,1568 42,76 2e-04
Residuo 8 0,0293 0,00367
A linha do resíduo é a mesma da ANOVA anterior. Comparando os valores calculados da estatística F com o valor tabelado
311Fe325F 0108105081 ,, ),;,(),;,( , conclui-se que o efeito do fator antibiótico
no peso diário de suínos no nível b0 de vitamina B12 é significativo (p<0,05) e significativo (p<0,01) no nível b1 da vitamina B12. Ou então, que:
Quando se utiliza a dose b0 de vitamina B12 existe uma diferença no peso diário dos suínos. A estimativa desta diferença é dado por
KgbabaA bdedentro 16,019,103,10001)( 0 , e ela é
significativa pelo teste F da ANOVA do desdobramento, indicando que somente o efeito do antibiótico prejudica o peso diário dos suínos, em média de 0,16 kg.
Quando se utiliza a dose b1 de vitamina B12 existe uma diferença no peso diário dos suínos. A estimativa desta diferença é dada por
KgbabaA bdedentro 32,022,154,11011)( 1
é significativa pelo teste F da ANOVA do desdobramento, indicando que a combinação dos níveis a1 do antibiótico e b1 da vitamina B12, favorece em média 0,32 kg o peso diário dos suínos.
b) Desdobramento da interação AxB para estudar o comportamento dos fator B dentro de cada nível de antibiótico A (a0 e a1) (como exercício preencher os espaços)
2
212
122
11adedentro
3
1
r2
YYY
r
1BSQ
0
)()(
)()()(
2
222
222
21adedentro
3
1
r2
YYY
r
1BSQ
1
)()(
)()()(
Assim, monta-se a seguinte análise de variância do desdobramento dos graus de liberdade da interação A x B para se estudar o efeito da vitamina B12
no ganho de peso diário de suínos na ausência e na presença de antibiótico: F.V. G.L. S.Q. Q.M. F
0adedentroB 1 0,00135 0,00135 0,3682
1adedentroB 1 0,39015 0,39015 106,4045
Residuo 8 0,0293 0,00367
(Concluir como no desdobramento anterior)
150
Estatística Experimental
Podemos comparar as médias de peso diário de suínos dos antibióticos, para cada uma dos níveis de vitamina B12, utilizando o Teste de Tukey (5%). Para tanto, calculamos:
114003
0,00367 263
3
QMRq
r
QMRqdms 05082050resíduodogla ,,),;,(),:,(
Quadro auxiliar com as médias dos antibióticos para cada um dos níveis da vitamina B12,
b0 b1 a0 1,19 A 1,22 A a1 1,03 B 1,54 B
Obs.: médias seguidas pelas mesmas letras maiúsculas, nas colunas, não diferem entre si a 5% de probabilidade, pelo Teste de Tukey
(fazer como exercício o teste de Tukey a 5%, para as linhas) Notação geral dos totais de um esquema fatorial 2 x 2 organizados em
uma tabela 2x2, do tipo: (r) b0 b1 Totais
a0 11Y 12Y 1Y
a1 21Y 22Y 2Y
TOTAL 1Y 2Y Y
As fórmulas das Somas de Quadrados podem ser escritas de uma forma geral:
)()()(
;))()((
)()()(
))()((
)()()(
;))()((
)()(
))()(()...(
BSQASQSQTrBxASQ
rba
YYY
r2
1BSQ
rba
YYY
r2
1ASQ
rba
YYYYY
r
1SQTr
rba
YYYSQT
222
21
22
22
1
22
222
212
122
11
22
2222
111
Script no r para obter os resultados acima # entrada dos dados pelo comando read.table( ) dados.ex1 <- read.table("ex1fat.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1 head(dados.ex1) # anexando o objeto dados.ex1 no caminho de procura attach(dados.ex1) # calculo das interações - Quadros dos totais int.total <- tapply(g.peso, list(anti, vitb12), sum) int.total # calculo dos totais marginais do fator vitamina B12 total.vitb12<- tapply(g.peso,vitb12,sum) total.vitb12
151
Estatística Experimental
# calculo dos totais marginais do fator antibiótico total.anti<- tapply(g.peso,anti,sum) total.anti # calculo das interações - Quadros das médias int.media <- tapply(g.peso, list(anti, vitb12), mean) int.media # calculo das médias marginais do fator vitamina B12 media.vitb12<- tapply(g.peso,vitb12,mean)# calculo das médias do fator vitamina b12ibiótico media.vitb12 # calculo das médias marginais do fator antibiótico media.anti<- tapply(g.peso,anti,mean)# calculo das médias do fator vitb12 media.anti # anova sem o desdobramento do fatorial gpeso.av <- aov(g.peso~trat) summary(gpeso.av) # quadro da anova no esquema fatorial gpesofat.av <- aov(g.peso~anti+vitb12+anti*vitb12) summary(gpesofat.av) # gráfico da interação interaction.plot(vitb12, anti, g.peso,col=2,lwd=2, ylab="médias",xlab="Vitamina B12", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) fat2.crd(anti, vitb12, g.peso, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Antibiótico", "Vitamina B12")) # dms do teste de tukey para antibiótico dentro de cada nível da vitamina dms<- qtukey(0.95,2,8)*sqrt(anova(gpesofat.av)[4,3]/3) dms # retirando o objeto dados.ex1 do caminho de procura detach(dados.ex1)
152
Estatística Experimental
8º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL
1) Num experimento fatorial 22 ou 2 x 2, no delineamento inteiramente casualizado, com 6 repetições, foram estudadas as influências de 2 fatores (A: Antibiótico e B: Vitamina B12) sobre o ganho de peso diário em suínos. Os tratamentos utilizados foram:
1- a0v0 - Testemunha = sem antibiótico e sem vitamina B12
2- a1v0 - 40 g de antibiótico 3- a0v1 - 5 mg de vitamina B12 4- a1v1 - 40 g de antibiótico + 5 mg de vitamina B12.
Os resultados do ganho de peso diários, em gramas, foram os seguintes: Tratamentos 1ª Rep. 2ª Rep. 3ª Rep. 4ª Rep. 5ª Rep. 6ª Rep.
a0v0 590 540 491 532 545 544 a1v0 476 454 476 481 464 463 a0v1 572 549 540 558 563 562 a1v1 690 708 703 712 691 721
a) Escreva o modelo matemático deste experimento. Usando o programa R, pede-se: Quadro dos Totais Quadro das Médias
b0 b1 Totais b0 b1 Médias a0 a0 a1 a1
Totais Médias b) Formule as hipóteses estatísticas para os fatores do fatorial e monte o quadro da análise de variância com desdobramento dos graus de liberdade dos tratamentos de acordo com o esquema fatorial 2 x 2 e preencha os espaços das fórmulas abaixo:
Complete o quadro da anova abaixo: F. V. gl SQ QM F p
Antibótico (A)
Vitamina B12 (B)
Int. AxB
Tratamentos
Resíduo
TOTAL
Conclusões:
153
Estatística Experimental
Preencha as fórmulas abaixo com os seus respectivos valores
22
22
1i
2
j
6
1kijk
abrY
abr
y
CM)...()(
abr
yySQT
2r
1k
a
1i
b
1j
2ijk
)(
222
i CMybr1
ASQ )()()(
222
︶︵︶︵
1
︶︵ CMyar
BSQ j
22
222
221
212
211
...︶︵
︶︵
1
︶,︵︶︵︶︵
CMyyyr
SQTr
sendoBSQASQSQTrBxASQ
)(AxBSQSQBSQASQTSQR
)1)(1(
)()(;
1;
1
ba
AxBSQAxBQM
b
SQBQMB
a
SQAQMA
pdevalorQMRQMA
F
ababrSQR
QMR
A
pdevalorQMR
QMBFB
pdevalorQMR
AxBQMFAB
)(
154
Estatística Experimental
c) Caso a interação seja significativa, fazer o desdobramento da interação, estimando testando os efeitos simples dos efeitos dos antibióticos dentro de vitaminas e da vitamina dentro de antibióticos (teste da análise de variância), ou seja, preencha as fórmulas abaixo e o quadro da anova
F.V. G.L. S.Q. Q.M. F p
0bdedentroA
1bdedentroA
Resíduo
Conclusões: Mostre como foi obtido os valores do quadro acima:
Monte o quadro da anova abaixo e escreva as fórmulas para o desdobramento de Bdentro de ao e Bdentro de a1,
F.V. G.L. S.Q. Q.M. F p
0adedentroB
1adedentroB
Residuo
Conclusões:
)(
)()()(
)()(
1)(
222
212
212110 rb
yyy
rASQ bdedentro
)(
)()(
)()()(
)(
22
222
22212bdedentro
2
1 r2
yyy
r
1ASQ
155
Estatística Experimental
2
212
12211
︶︵︶︵
︶︵︶︵
1
︶︵ 0 rayyy
rBSQ adedentro
2
222
222211
1
︶︵︶︵
︶︵︶︵︶︵ ra
yyyr
BSQ adedentro
d) Ainda com relação ao item c), dê uma estimativa dos efeitos simples de antibióticos e de vitaminas e conclua se eles são significativos. Aplique o teste de Tukey para localizar as diferenças entre as médias dos antibióticos dentro de vitaminas e das médias das vitaminas dentro de antibióticos Represente as diferenças com as médias, seguidas de letras. Tire as conclusões práticas para este ensaio. Esboce o gráfico da interação.
r
QMRqdms resíduodogla )05,0:,(
b0 b1 Médias a0 a1
Médias Conclusões: Esboce o gráfico da interação
156
Estatística Experimental
a) Dê uma estimativa dos efeitos simples de antibióticos e de vitaminas.
b) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos.
g) Calcular os coeficientes de determinação (R2) e o de variação do experimento (CV).
(escrever um script no R para resolver esta questão) 2) Num experimento fatorial 2 x 4 , no delineamento em blocos casualizados, com 2 repetições (2 Blocos), foram estudadas as influências da primeira alimentação de colostro no nível de imunoglobulina em vacas leiteiras. O fator A foi a quantidade de comida (0,5 e 1,5 kg) e o fator B foi o tempo da primeira alimentação (1, 2, 6, ou 12 horas depois do nascimento). Os valores observados são unidades de “turbidimetric” relativas ao sulfato de bário padrão de 20 quando o sangue foi amostrado 48 horas após o nascimento. O colostro foi misturado para eliminar a variação entre as vacas.
Tempo da 1ª alimentação Bloco Quantidade
de comida (kg)
1
2
6
12
I 0,5 7,9 10,2 6,1 2,3 1,5 11,7 10,7 9,9 5,4
II 0,5 9,5 6,0 7,8 7,1 1,5 15,0 11,7 9,4 7,2
Responder aos mesmos itens do exercício 1) (Atenção este é um fatorial 2 x 3) 3) Um experimento foi realizado para estudar a influência no tempo de hemorragia do período, fator A, e um composto estrogênio, fator B , em plasma de sangue em ovelhas. Cinco ovelhas foram sorteadas para cada um dos quatros tratamentos: a1b1 – de manhã e sem estrogênio; a1b2 – de manhã com estrogênio; a2b1 – de tarde e sem estrogênio; a2b2 – de tarde com estrogênio
Tratamentos Rep. 1 Rep. 2 Rep. 3 Rep. 4 Rep. 5 a0 b0 8,53 20,53 12,53 14,00 10,80 a0 b1 17,53 21,07 20,80 17,33 20,07 a1 b0 39,14 26,20 31,33 45,80 40,20 a1 b1 32,00 23,80 28,87 25,06 29,33
Responder aos mesmos itens do ecercício 1) 4) Um experimento para verificar o peso aos 180 dias de suínos com as raças Landrace e Large White, utilizou-se de 480 suínos, machos e fêmeas, sendo estes distribuídos em três suínoculturas. a) Quais os fatores que podem influenciar a resposta medida. b) Estabeleça um modelo matemático para o experimento. c) Faça um esquema da análise de variância (F.V. e g.l.) para o experimento.
157
Estatística Experimental
5) Em um experimento realizado na Fazenda Experimental Iguatemi da Fundação Universidade Estadual de Maringá, para verificar o efeito de diferentes tipos de instalações durante o inverno e verão sobre o ganho de peso e conversão alimentar de coelhos da raça Nova Zelândia, aos 40 e 70 dias de idade, foram utilizados 3 tipos de instalações, gaiolas ao ar livre, gaiolas de arame galvanizado em galpão aberto e gaiolas de arame galvanizado em galpão fechado. Utilizou-se 178 animais machos e fêmeas para a obtenção dos dados. a) Quais os fatores que podem influenciar a resposta medida. b) Estabeleça um modelo matemático para o experimento. c) Faça um esquema de análise de variância para o experimento.
158
Estatística Experimental
Aula 9 Experimentos fatoriais: analisando um fatorial A x B O método de análise de um experimento fatorial 2 x 2 pode, de uma maneira geral, ser
estendido a qualquer experimento fatorial A x B. A estratégia para analisar um experimento fatorial a x b é a mesma utilizada para os experimentos fatoriais 2 x 2.
teste a interação entre os dois fatores. se a interação é significativa, então analisamos os efeitos simples
dos dois fatores. se a interação é não significativa, então analisamos os efeitos
principais de cada fator
Exemplo 1 Casualização dos tratamentos de um esquema fatorial 2 x 3 em DBC com 4 repetições:
Tratamentos
b1 a1b1
a1 b2 a1b2
b3 a1b3
b1 a2b1
a2 b2 a2b2
b3 a2b3
Com o seguinte esquema da ANOVA
Fonte de Variação g l Fator A a - 1 Fator B b - 1 Int. A x B (a – 1)(b – 1) Tratamentos ab - 1 Blocos r -1 Resíduo (ab -1)(r – 1) Total abr - 1
De uma maneira geral as somas de quadrados são dadas por:
︶︵︶︵︶︵︶,︵︶︵︶,︵︶︵
;...︶︵
;...︶︵
;...
︶...︵
2.
222
21
2222
21
22212
211
222
111
BSQASQSQTrAxBSQouBSQASQBASQAxBSQabrY
arY
arY
arYBSQ
abrY
brY
brY
brYASQ
abrY
rY
rY
rYSQTr
abrYYYSQT
j
i
ab
abk
Como dissemos na aula passada: nos fatoriais A x B a Soma de
Quadrados Conjunta SQ(A,B) é igual à Soma de Quadrados dos Tratamentos SQTr.
Bloco I Bloco II Bloco III Bloco IV a2b1 a2b3 a1b2 a1b1 a1b2 a2b2 a2b1 a1b3 a2b2 a1b1 a2b2 a2b1 a2b3 a2b1 a1b3 a2b2 a1b1 a1b2 a2b3 a1b2 a1b3 a1b3 a1b1 a2b3
159
Estatística Experimental
Quadro da ANOVA no DIC F.V. G.L. S.Q. Q.M. F
A a-1 S.Q.(A) Q.M.(A) FA
B b-1 S.Q.(B) Q.M.(B) FB
Interação A x B (a-1)(b-1) S.Q.(AB) Q.M.(AB) FAB
Tratamentos ab-1 S.Q. Trat. Q.M. Trat. FTr
Resíduo ab (r-1) S.Q. Res. Q.M. Res. Total abr-1 S.Q. Total
Exemplo 1. Fatorial 2 x 3 (com interação não significativa): O crescimento do conteúdo de água em tecidos de lesmas sob 6
diferentes condições experimentais foi avaliada. As 6 condições foram obtidas combinado-se os dois níveis de temperatura (fator A) com três níveis de umidade (fator B) com. Foram feitas 4 repetições para cada combinação de tratamento. Os resultados, em porcentagem, foram :
Fator A (Temperatura ºC)
Fator B – Umidade (%) 45 75 100
20
76 64 72 82 100 96 79 71 86 86 92 100
30
72 72 72 75 100 94 64 70 82 84 98 99
Formato no Excel (.xls) Formato no Bloco de notas (.txt) Temp umi trat ca
20 45 t1 76 20 45 t1 64 20 45 t1 79 20 45 t1 71 20 75 t2 72 20 75 t2 82 20 75 t2 86 20 75 t2 86 20 100 t3 100 20 100 t3 96 20 100 t3 92 20 100 t3 100 30 45 t4 72 30 45 t4 72 30 45 t4 64 30 45 t4 70 30 75 t5 72 30 75 t5 75 30 75 t5 82 30 75 t5 84 30 100 t6 100 30 100 t6 94 30 100 t6 98 30 100 t6 99
temp umi trat ca 20 45 t1 76 20 45 t1 64 20 45 t1 79 20 45 t1 71 20 75 t2 72 20 75 t2 82 20 75 t2 86 20 75 t2 86 20 100 t3 100 20 100 t3 96 20 100 t3 92 20 100 t3 100 30 45 t4 72 30 45 t4 72 30 45 t4 64 30 45 t4 70 30 75 t5 72 30 75 t5 75 30 75 t5 82 30 75 t5 84 30 100 t6 100 30 100 t6 94 30 100 t6 98 30 100 t6 99
Os totais das 4 repetições para o fatorial A x B = (2)(3)= 6 tratamentos
são os seguintes:
160
Estatística Experimental
(4) Níveis de A
(Temperatura ºC))
Níveis de B (Umidade (%))
b1 = 45 % b2 = 75 % b3 = 100 % Total
a1 = 20 ºC 290 326 388 1004
a2 = 30 ºC 278 313 391 982
Total 568 639 779 1986
Cálculos das soma de quadrados:
08,2075,288117,200,2922︶︵︶︵︶*︵
;75,2881
︶4︶ ︵3︶ ︵2︵
1986︶4︶ ︵2︵
779...
︶4︶ ︵2︵
568
︶︵
;17,20
︶4︶ ︵3︶ ︵2︵
1986
︶4︶ ︵3︵982
︶4︶ ︵3︵
1004
︶︵
;0,2922
︶4︶ ︵3︶ ︵2︵
19864
491...4
3264
290
5,3386
︶4︶ ︵3︶ ︵2︵
1986
︶99...76︵
222
222
2222
222
BSQASQSQTrBASQ
BSQ
ASQ
SQTr
SQT
Quadro da anova F.V. G.L. S.Q. Q.M. F Pr>(Fc)
Temperatura (A) 1 20,17 20,17 0,78ns 0.388 Umidade (B) 2 2881,75 1440,88 55,85** 1.91e-08 Interação A x B 2 20,08 10,04 0,39ns 0.683 Tratamentos (5) 2922,0 584,40 22,65* 3.48e-07 Resíduo 18 464,5 25,81 Total 23 3386,5
F(1, 18; 0,05) = 4,41 ; F(1, 18, 0,01)= 8,29; F(2, 18; 0,05)= 3,55; F(2, 18, 0,01)= 6,01 F(5, 18; 0,05) = 2,77; F(5, 18, 0,01)= 4,25 Do quadro acima, observamos que o teste da interação entre a
temperatura e umidade não é significativa (p>0,05), e concluímos que os dados não suportam a hipótese de uma interação entre temperatura e umidade. Dado que a interação não foi significativa, a análise prossegue analisando-se os efeitos principais da temperatura e da umidade isoladamente. Isto pode ser feito analisando-se os dois tipos de diferenças:
as diferenças entre os conteúdos médios da água nos tecidos nos dois níveis de A (temperatura).
as diferenças entre os conteúdos médios da água nos tecidos nos três níveis de B (umidade).
O teste F para o efeito principal A é não significativo (p>0,05), e portanto não existe evidências suficientes para concluir que os valores médios do conteúdo da água nos tecidos são diferentes nos dois níveis de temperatura, entretanto, o teste F para o efeito principal da umidade é altamente significativo (p<0,01), o que implica que os dados suportam a conclusão de que os valores médios do conteúdo da água nos tecidos não são os mesmos nos três níveis da umidade.
Isto pode ser visualizado na tabela de médias abaixo (última linha):
161
Estatística Experimental
Quadro de médias dos tratamentos (4)
(Temperatura ºC)) Níveis de B ( Umidade (%) )
b1 = 45 % b2 = 75 % b3 = 100 % Médias a1 = 20 ºC 72,50 81,50 97,00 83,67 A
a2 = 30 ºC 69,50 78,25 97,75 81,83 A
Médias 71,00 c 79,88 b 97,38 a 82,75
Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5% Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5%
Fazendo o gráfico da interação (níveis de b no eixo x e níveis de a em y)
Cálculos do teste de Tukey:
para o efeito principal A (temperatura):
36412
8125972dms
972q
A
050182
,,
,
,),;,(
para o efeito principal de B (Umidade):
48688125
9o63dms
6093q
B
050183
,,
,
,),;,(
Gráfico das médias dos tratamentos
Interação A x B
Umidade (%)
Méd
ia o
bser
vada
do
cont
eúdo
da
água
(%
)
66
72
78
84
90
96
102
45 75 100
20 º C 30 º Média
O gráfico das médias dos tratamentos fornece um conveniente método
de mostrar os resultados. As linhas sólidas no gráfico da interação são
162
Estatística Experimental
praticamente paralelas, isto confirma o resultado do teste F para a interação entre temperatura e umidade. Mais ainda, a proximidade das duas linhas sólidas indica que as diferenças entre as respostas médias observadas nas duas temperaturas são não significativas; esta conclusão é confirmada pelo teste F do efeito principal da temperatura. Uma checagem gráfica para presença do efeito principal da umidade é dada pela orientação da linha pontilhada. Se o efeito principal de tal efeito não estivesse presente, então a linha pontilhada deveria estar paralela ao eixo x. O gráfico mostra que não é este o caso. O teste F para o efeito principal de B (umidade) suporta esta conclusão.
Outra forma de explicar a significância do fator B é por meio da regressão polinomial, ou seja, as diferenças entre as médias do fator umidade são explicadas por equação do segundo grau
Gráfico das médias do fator B
Equação ajustada
y=82.471-0.585*x+0.007*x^2+eps
Umidade (%)
Méd
ias
dos
cont
eúdo
da
água
(%
)
68
72
76
80
84
88
92
96
100
40 45 50 55 60 65 70 75 80 85 90 95 100 105
Script no R para obter os resultados do exemplo 1
# entrada dos dados pelo comando read.table( ) dados.ex1_9 <- read.table("ex1fat_9.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_9 head(dados.ex1_9) # anexando o objeto dados.ex1_9 no caminho de procura attach(dados.ex1_9) # calculo das interações - Quadros dos totais int.total <- tapply(ca, list(temp, umi), sum) int.total # calculo dos totais marginais do fator temperatura total.temp<- tapply(ca,temp,sum) total.temp # calculo dos totais marginais do fator umidade total.umi<- tapply(ca,umi,sum) total.umi # calculo das interações - Quadros das médias int.media <- tapply(ca, list(temp, umi), mean)
163
Estatística Experimental
int.media # calculo das médias marginais do fator temp media.temp<- tapply(ca,temp,mean) media.temp # calculo das médias marginais do fator antibiótico media.umi<- tapply(ca,umi,mean) media.umi # anova sem o desdobramento do fatorial ca.av <- aov(ca~trat) summary(ca.av) # quadro da anova no esquema fatorial cafat.av <- aov(ca~factor(temp)+factor(umi)+factor(temp)*factor(umi)) summary(cafat.av) # gráfico da interação interaction.plot(umi, temp, ca,col=2,lwd=2, ylab="médias de ca",xlab="níveis da umidade", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) fat2.crd(factor(temp), factor(umi),log( ca+1), quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Temperatura", "Umidade")) # dms do teste de tukey para fator temperatura dmsa<- qtukey(0.95,2,18)*sqrt(anova(cafat.av)[4,3]/12) dmsa # dms do teste de tukey para fator umidade dmsb<- qtukey(0.95,3,18)*sqrt(anova(cafat.av)[4,3]/8) dmsb # Regressão Linear # Definição de x e y x <- c(45,75,100) ca.media <- tapply(ca,umi,mean) #c(71.0, 79.88, 97.38) ca.media #ajuste da equação linear reg.lin <- lm(ca.media~um ) reg.lin plot(um,ca.media,pch=16,xlab="umidade") abline(reg.lin,col=2,lwd=2) # análise de variância para testar se o coef angular é significativo anova(reg.lin)
164
Estatística Experimental
# ajuste de uma equação quadrática reg.quad <- lm(ca.media ~ um + I(um^2)) reg.quad # desenhando a curva ajustada e adicionado ao gráfico curve(82.488636 -0.585985*x+0.007348*x*x, 40,100, lwd=2,col=4,add=T) # retirando o objeto dados.ex1_9 do caminho de procura detach(dados.ex1_9) Exemplo 2: Análise e interpretação de um experimento fatorial com três fatores Esquema fatorial 2 x 2 x 2 = 23 em um delineamento em blocos casualizados (DBC)para estudar a produção de leite de vacas holandezas arranjadas em 6 lotes com a mesma idade.
idade) de classes 6 ( Blocos 6
B vitamina de mg 5 : c2
B vitamina de mg 0 : c1
milho de rolão de kg 1,0 : b2
milho de rolão de kg 0,5 : b1
B tipo ração de kg 0,5 : a2
Atipo ração de kg 0,5 : a1
:.
12
12
2222
12212
2122
12211
2
2212
12112
2112
11111
1
cbac
cbacb
cbac
cbacb
a
cbac
cbacb
cbac
cbacb
a
sendoTrat
Dados Níveis dos
fatores BLOCOS
A B C I II III IV V VI Total 1 1 1 3,029 3,857 2,448 2,448 3,543 4,314 19,639 1 1 2 2,438 3,086 3,771 4,657 1,962 3,210 19,124 1 2 1 3,448 3,600 3,895 4,267 3,086 3,657 21,953 1 2 2 3,533 5,048 3,467 4,095 1,876 2,895 20,914 2 1 1 3,362 3,714 3,429 3,190 2,686 4,038 20,419 2 1 2 4,905 6,295 4,924 4,952 5,381 5,543 32,000 2 2 1 4,171 3,114 4,124 3,981 3,038 3,590 22,018 2 2 2 4,476 4,752 4,848 4,676 6,829 3,771 29,352
Total 29,362 33,466 30,906 32,266 28,401 31,018 185,419
Para calcular as somas de quadrados dos efeitos A, B e C, inicialmente devemos organizar quadros auxiliares, que relacionam os níveis dos fatores 2 a 2, o que dá 3 quadros A com B, A com C e B com C.
Exemplo: Quadro I (A x B) totais de : a1b1 = a1b1c1 + a1b1c2 = 19,639 + 19,124 = 38,763 a1b2 = a1b2c1 + a1b2c2 = 21,953 + 20,914 = 42,867 a2b1 = a2b1c1 + a2b1c2 = 20,419 + 32,000 = 52,419 a2b2 = a2b2c1 + a2b2c2 = 22,018 + 29,352 = 51,370
165
Estatística Experimental
Quadro I (totais da interação A x B)
(12) Níveis de A
(Qtde de ração)
Níveis de B (Rolão de milho kg)
b1 = 0,5 kg b2 = 1,0 kg Total
a1 = 0,5 kg de A 38,763 42,867 81,630 a2 = 0,5 kg de B 52,419 51,370 103,789
Total 91,182 94,237 185,419
Quadro II (totais da interação A x C)
(12) Níveis de A
(Qtde de ração)
Níveis de C (Dose de vit. B12 mg)
c1 = 0,0 mg c2 = 5,0 mg Total a1 = 0,5 kg de A 41,592 40,038 81,630 a2 = 0,5 kg de B 42,437 61,352 103,789
Total 84,029 101,390 185,419
Quadro III (totais da interação B x C)
(12) Níveis de B
Níveis de C (Dose de vit. B12 mg) c1 = 0,0 mg c2 = 5,0 mg Total
b1 = 0,5 kg 40,058 51,124 91,182 b2 = 1,0 kg 43,971 50,266 94,237
Total 84,029 101,390 185,419
Somas de quadrados da ANOVA preliminar:
;,))()()((
,
))((
,
))((
,)(
;,))()()((
,
))((
,
))((
,)(
;,))()()(())((
,
))((
,)(
,
;,
))()()((
,),...,(
;,))()()((
,,...
,
;,))()()((
,),...,(
27966222
419185
122
390101
122
02984CSQ
19406222
419185
122
23794
122
18291BSQ
230106222
185419
122
789103
122
63081ASQ
96320SQBlSQTrSQTSQR
1342
6222
4191850183136229
8
1SQBl
748266222
419185
6
35229
6
45919SQTr
845496222
41918531440293SQT
222
222
222
222
222
222
Para o cálculo das soma de quadrados das interações precisamos calcular as somas de quadrados conjuntas. Para a interação AxB, temos:
568019402301019210BSQASQBASQAxBQS
992106222
4191853705176338
12
1BASQ
222
,,,,)()(),()(.
,))()()((
,),...,(),(
Para a interação AxC, temos:
166
Estatística Experimental
729,8279,6230,10238,25︶︵
358,25
︶6︶ ︵2︶ ︵2︶ ︵2︵
419,185
︶352,61...592,41︵121
︶,︵
222
AxCSQ
CASQ
Para a interação BxC, temos:
4750279619409486BxCSQ
94866222
4191852665005840
12
1CBSQ
222
,,,,)(
,))()()((
,),...,(),(
2890BxCSQAxCSQAxBSQ
CSQBSQASQSQTrAxBxCSQ
,)()()(
)()()()(
Fonte de variação Gl S.Q. Q.M. F Ração (A) 1 10,230 10,230 17,078**
Rolão (B) 1 0,194 0,194 0,324ns
Vitamina B12 (C) 1 6,279 6,279 10,482**
Int.( AxB) 1 0,568 0,568 0,948ns
Int. (AxC) 1 8,729 8,729 14,573**
Int. ( BxC) 1 0,475 0,475 0,793ns
Int. (AxBxC) 1 0,289 0,289 0,482ns
Tratamentos (7) 26,748 3,821 6,380**
Blocos 5 2,134 0,427 0,713ns
Resíduo 35 20,963 0,599 Total 47 48,845
F(5, 35; 0,05) = 2,49 F(3, 35; 0,01) = 3,61 F(1, 35; 0,05) = 4,13 F(1, 35; 0,01) = 7,44
Conclusões:
a interação AxBxC é não significativa (p>0,05), indicando a possibilidade de independência entre os fatores conjuntamente.
os testes F das interações duplas indicam que somente a interação AxC é significativa (p<0,01), ou seja, os dados suportam uma conclusão de que os tipos de rações interagem com a dose de vitamina B12 na produção de leite.
Desdobramento da interação AxC: estudo dos efeitos simples do fator
ração (A) nos níveis das doses de vitamina B12 (C) Cálculo da SQ do efeito da ração na ausência da vitamina B12
030024
029844374259241
12
1ASQ
222
Cdentro 1,
,),,()(
Cálculo da SQ do efeito da ração na presença da vitamina B12
9291824
3901013526103840
12
1ASQ
222
Cdedentro 2,
,),,()(
Quadro da ANOVA do desdobramento: Fonte de variação gl. SQ QM F
1CdedentroA 1 0,030 0,030 0,0497*
2deCdentroA 1 18,929 18,929 31,601**
Resíduo 35 20,963 0,599
167
Estatística Experimental
Conclusão: as rações produzem efeito significativo (p<0,05) na ausência da vitamina B12, enquanto que na presença da vitamina B12 as rações têm efeito significativo (p<0,01) diferenciado.
Desdobramento da interação AxC: estudo dos efeitos simples do fator vitamina (C) nos níveis das Rações (A)
Cálculo da SQ do efeito da vitamina no nível a1 da ração
1026,024029,84
︶038,40592,41︵121
︶︵
222
1 adentroCSQ
Cálculo da SQ do efeito da vitamina no nível a2 da ração
9074,1424789,103
︶352,61437,42︵121
︶︵2
222
adedentroCSQ
Quadro da ANOVA do desdobramento: Fonte de variação gl. SQ QM F
1adedentroC 1 0,1006 0,1006 0,168NS
2deadentroC 1 14,9074 14,9074 24,88**
Resíduo 35 20,963 0,599 Conclusão: as vitaminas não produzem efeito significativo (p>0,05) na
ração tipo A, enquanto que na ração tipo B a vitamina B12 tem efeito significativo (p<0,01) diferenciado.
Exemplo 4 Análise de um fatorial 3 x 4 : experimento sobre a qualidade do ovo, em unidades Haugh, segundo 3 embalagens e 4 tempos de armazenamento de estocagem.
Embalagem Tempo Blocos Ai Bj I II III IV 1 1 66 52 57 68 1 2 47 47 32 43 1 3 43 50 39 40 1 4 20 23 43 41 2 1 81 68 60 55 2 2 62 34 44 45 2 3 43 41 47 54 2 4 51 32 29 34 3 1 81 82 80 78 3 2 84 68 66 65 3 3 58 43 37 57 3 4 75 45 59 48
Quadro da anova F.V. G.L. S.Q. Q.M. F
Embalagem (A) 2 3427,125 1713,562 24,586**
Tempo (B) 3 5186,229 1728,748 24,803**
Interação A x B 6 768,708 128,118 1,838ns
Tratamentos (11) 9382,06 852,91 12,24**
Blocos 3 829,729 276,576 3,968*
Resíduo 33 2300,021 69,697 Total 47 12511,812
Conclusões:
o efeito da interação A x B é não significativo (p>0,05), ou seja, existe uma independência entre os fatores.
efeito do fator embalagem (A) é significativo (p<0,05).
168
Estatística Experimental
efeito do fator tempo (B) é significativo (p<0,05). Teste de Tukey para o fator A
2871669769
493dms
493q
A
050333
,,
,
,),,,(
Teste de Tukey para o fator B
2891269769
853dms
853q
B
050334
,,
,
,),,,(
Quadro dos valores médios observados
(4) B1 B2 B3 B4 iY
A1 60,75 42,25 43,00 31,75 44,44 B A2 66,00 46,25 46,25 36,50 48,75 B A3 80,25 70,75 48,75 56,75 64,12 A
jY 69,00 a 53,08 b 46,00 bc 41,67 c 52,44
Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5% Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5%
Exemplo 5 Em um experimento de substituição do farelo de soja pelo farelo de girassol na ração de suínos, montou-se um experimento fatorial 2x5, com os fatores Sexo (machos e fêmeas) e Ração com substituição de farelo de soja por farelo de girassol (0%, 25%, 50%, 75% e 100%), utilizando-se 30 suínos (15 machos e 15 fêmeas) castrados da raça Duroc-Jersey, num delineamento em blocos casualizados com 3 repetições, de acordo com os grupos de pesos iniciais. Os resultados de ganho de peso dos animais aos 112 dias de experimento estão apresentados na tabela a seguir:
Bloco
Machos Fêmeas
G0 G25 G50 G75 G100 G0 G25 G50 G75 G100
1 85,0 94,5 99,5 93,0 83,0 77,9 71,5 67,5 71,5 89,5
2 86,0 96,0 98,0 96,0 80,0 83,2 73,5 63,5 70,8 91,8
3 84,0 95,8 104,0 90,5 78,5 83,5 70,5 65,0 72,5 92,9
Total 255,0 286,3 301,5 279,5 241,5 244,6 215,5 196,0 214,8 274,2
Pede-se:
Montar os quadros auxiliares dos totais e das médias, da Análise de Variância e fazer um estudo do desdobramento da interação entre os fatores os testes convenientes;
Construir gráficos da interação para ilustrar o comportamento das respostas médias dos fatores Sexo e Ração.
169
Estatística Experimental
Quadros auxiliares
Sexo Ração
Total G0 G25 G50 G75 G100
1 255,0 286,3 301,5 279,5 241,5 1363,8 2 244,6 215,5 196,0 214,8 274,2 1145,1
Total 499,6 501,8 497,5 494,3 515,7 2508,9
Bloco B1 B2 B3 Total Total 832,9 838,8 837,2 2508,9
(Resolver os exemplos 4) e 5) no R)
170
Estatística Experimental
9º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL
1) Num experimento fatorial 32 = 3 x 3, com os fatores A e B, no delineamento em blocos ao acaso, com 4 repetições, para se estudar uma determinada característica, foram obtidos os seguintes resultados
Tratamentos 1º Bloco 2º Bloco 3º Bloco 4º Bloco a0b0 25,3 24,2 24,3 33.0 a0 b1 31,6 29,7 30,6 32,2 a0 b2 19,7 18,2 16,0 17,0 a1 b0 24,7 34,7 28,9 27,6 a1 b1 28,4 44,4 41,1 38,4 a1 b2 30,8 42,4 33,6 35,1 a2 b0 37,2 47,6 38,6 40,6 a2 b1 42,6 45,8 38,4 43,4 a2 b2 56,0 58,8 57,0 55,0
Os resultados da análise de variância preliminar foram: FV G.L. S. Q. Q. M. F P
Blocos 3 150,3 50,1 4,2 0,016
Tratamentos 8 3967,3 495,9 41,8 0,000
Resíduo 24 284,3 11,8
Total 35 4401,9 a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a análise de
variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e concluir.
b) No desdobramento da interação fazer a análise de variância do desdobramento e aplicar o teste de Tukey (5%) valores médios do fator A nos níveis do fator B e vice versa.
c) Calcular os coeficientes de determinação e de variação do experimento. 2) Um experimento fatorial 2 x 5, com os fatores Sexo (A) e Ração (B) , em um delineamento em blocos ao acaso, com 3 repetições, foi realizado para se estudar a “Substituição do farelo de soja pelo farelo de girassol em ração de suínos” (Kronka,1969)- BIA, n.26 pg 147-154. Os dados abaixo referem-se ao ganho de peso (kg) em 112 dias de experimento. Descrição dos fatores : Sexo a1 : Machos; a2 : Fêmeas Rações: b1 : Ração Básica (RB) + farelo de soja (100%); b2 : RB + farelo de soja (75%) + farelo de girassol (25%); b3 : RB + farelo de soja (50%) + farelo de girassol (50%); b4 : RB + farelo de soja (25%) + farelo de girassol (75%); b5 : RB + farelo de girassol (100%);
Tratamentos 1º Bloco 2º Bloco 3º Bloco a1 b1 95,0 86,0 94,0 a1 b2 91.5 99,0 94,0 a1 b3 94,5 93,0 94,0 a1 b4 89,0 86,0 90,5 a1 b5 93,0 80,0 78,0 a2 b1 87,0 79,0 84,0 a2 b2 91,0 93,5 103,5 a2 b3 77,5 68,5 70,0 a2 b4 82,5 80,5 82,5 a2 b5 64,5 65,5 60,5
Resultados da anava preliminar
F.V. G.L. S.Q. Q.M. F Blocos 2 60,02 30,01 1,56ns
Trat. 9 2994,54 332,73 17,34**
Res. 18 345,48 19,19 Total 29 3400,04
171
Estatística Experimental
a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a análise de variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e concluir. b) Fazer a análise de variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e teste a significância da interação entre os efeitos. Se a interação for significativa teste a diferença média dos ganhos de peso do efeito de sexo para cada ração e as diferenças entre os valores médios das rações para cada sexo. c) Calcular os coeficientes de determinação e de variação do experimento.
172
Estatística Experimental
Aula 10 Experimentos em parcela subdividida 1 Introdução
Nos experimentos fatoriais ou esquemas fatoriais os tratamentos gerados pelas combinações dos níveis dos fatores são designados às unidades experimentais de acordo com o procedimento de aleatorização do delineamento inteiramente casualizado (DIC), ou do delineamento em blocos casualizados (DBC), ou do delineamento em quadrado latino (DQL). Entretanto, outros tipos de aleatorização são possíveis. Uma dessas aleatorizações alternativas dá origem aos experimentos em parcelas subdivididas, os quais são um caso especial de blocos incompletos. O princípio básico deste delineamento é que parcelas principais que recebem níveis de um fator são subdivididas em subparcelas ou subunidades, as quais recebem os níveis de um outro fator. Assim cada parcela funciona como um bloco para as subparcelas. Os níveis do fator sorteado nas parcelas são denominados de tratamentos principais e os níveis do fator sorteados nas subparcelas são denominados de tratamentos secundários. O delineamento em parcela subdividida teve sua origem na experimentação agronômica, com as parcelas, quase sempre, sendo grandes áreas de solo e as subparcelas sendo áreas menores de solo dentro das grandes áreas. Os tratamentos principais são distribuídos às parcelas de acordo com um delineamento especificado (DIC, DBC, DQL etc.) e os tratamentos secundários são distribuídos aleatoriamente às subparcelas dentro de cada parcela.
A seguir apresentamos um possível croqui de um experimento em parcelas subdivididas com o Fator A, com 2 níveis (tratamentos principais) aplicados às parcelas de acordo com um delineamento em blocos casualizados com 3 repetições e o Fator B, com 3 níveis (tratamentos secundários) aplicados às subparcelas. Vale notar que os níveis de A são sorteados entre as duas parcelas de cada bloco e os níveis de B são sorteados entre as três subparcelas de cada parcela.
BLOCO 1 BLOCO 2 BLOCO 3
Parcelas A1 A2 A2 A1 A2 A1
Subparcelas B1 B2 B3 B2 B1 B2
B3 B3 B2 B3 B3 B3 B2 B1 B1 B1 B2 B1
Se os tratamentos estivessem num esquema fatorial, o croqui poderia
ser: BLOCO 1 BLOCO 2 BLOCO 3
A1B1 A1B2 A1B3 A2B2 A1B1 A2B2 A2B3 A1B3 A2B2 A1B3 A2B3 A1B3 A2B2 A2B1 A2B1 A1B1 A1B2 A2B1
ou seja, o delineamento em parcelas subdivididas representa uma restrição à casualização completa existente em um ensaio fatorial envolvendo o mesmo número de fatores e de níveis.
Na análise estatística desses experimentos, as Fontes de Variação que fazem parte da variação entre as parcelas (Fator-A e Blocos, por exemplo) são usualmente agrupadas separadamente daquelas que fazem parte da variação dentro das parcelas ou entre as subparcelas (Fator-B e interação AxB). Neste caso, temos dois resíduos distintos: um referente às parcelas e outro referente às subparcelas.
173
Estatística Experimental
2 Análise de variância
No quadro a seguir, apresentaremos a partição dos graus de liberdade de um experimento em parcelas subdivididas com “a” tratamentos primários, “b” tratamentos secundários, “r” repetições em diferentes delineamentos para os tratamentos aplicados às parcelas.
3 Modelo matemático e suposições Considerando um experimento em parcelas subdivididas envolvendo “a”
tratamentos primários arranjados em um DIC com “r” repetições e “b” tratamentos secundários, o modelo pode ser descrito como:
b1ja1ir1k
comY ijkijjikiijk
,...,;,...,;,...,
,)(
).(),(~
);)((),(~
;)(
;
;
:
berro0Naleatórioerrodoefeito
aerro0NAdenívelésimoiorecebendoparcelaésimakdaefeito
BdenívelésimojeAdenívelésimoidoconjuntoefeitooe
subparcelanaBdenívelésimojdoefeitoo
principalparcelanaAdenívelésimoidoefeitoogeralmédiaa
sendo
2ijk
2ik
ij
j
i
Um esquema de análise de variância para este modelo é Parcelas Sub-divididas no D.I.C. (“r” repetições)
Fonte de Variação g.l.
A (a-1)
Resíduo (a) a(r-1)
(Parcelas) (ar-1)
B (b-1)
AxB (a-1)(b-1)
Resíduo (b) a(r-1)(b-1)
Total abr-1
Considerando agora, um experimento em parcelas subdivididas
envolvendo “a” tratamentos primários arranjados em “r” blocos casualizados e “b” tratamentos secundários, o modelo pode ser escrito como:
b1ja1ir1k
comY ijkijjikikijk
,...,;,...,;,...,
,)(
174
Estatística Experimental
),(~
);,(~
;
;
)(;,
,;
:
2ijk
2ik
ik
k
ijj
i
0Naleatórioerrodoefeito
0Ne
blocoésimoknoprincipalparcelanaAdenívelésimoidoconjuntoefeitoo
blocoésimokdoefeitoo
BdenívelésimojeAdenívelésimoi
deconjuntoefeitooesubparcelanaBdenívelésimojdoefeitoo
principalparcelanaAdenívelésimoidoefeitoogeralmédiaa
sendo
Um esquema de análise de variância para este modelo é
Parcela Subdivida no D.B.C.(“r” blocos)
Fonte de Variação g.l.
Blocos (r-1)
A (a-1)
Resíduo (a) (a-1)(r-1)
(Parcelas) (ar-1)
B (b-1)
AxB (a-1)(b-1)
Resíduo (b) a(r-1)(b-1)
Total abr-1
4 Hipótese estatística
As seguintes hipóteses podem ser testadas nos experimentos em parcelas subdivididas.
A hipótese de que não existe ou existe interação AB é equivalente
às hipóteses estatísticas b1jea1icom0H
0H
ij11
ij01
...,,...,,)(:
)(:
e para testá-las, usamos a estatística
;);Re..;int..(~)(Re bsdolgeraçãodalg01 F
bsQMQMAB
F ,
a qual sob H0, tem distribuição F-Snedecor com graus de liberdade da interação no numerador e graus de liberdade do resíduo (b) no denominador.
No DIC temos ));)(();)((( 1b1ra1b1aF , no DBC temos ));)(();)((( 1b1ra1b1aF .
A hipótese de que não existe ou existe efeito principal do fator A é
a1icom0H
0H
i12
i02
...,,:
:
,
e para testá-las, usamos a estatística
;);Re..;..(~)(Re asdolgAfatordolg02 F
asQMQMA
F ,
a qual sob H0, tem distribuição F-Snedecor com graus de liberdade do fator A no numerador e graus de liberdade do resíduo (a) no denominador.
175
Estatística Experimental
No DIC temos ));1();1(( raaF , no DBC temos ));1)(1();1(( raaF .
as hipóteses de que não existe ou existe efeito principal do fator B
é bjcomH
H
j
j
...,,10:
0:
13
03
,
e para testá-las, usamos a estatística
;);Re..;..(03 ~)(Re bsdolgBfatordolgF
bsQM
QMBF .
que sob H0, tem distribuição F-Snedecor com graus de liberdade do fator B no numerador e graus de liberdade do resíduo (b) no denominador.
No DIC temos ));)(();(( 1b1ra1bF , no DBC temos ));)((();(( 1b1ra1bF .
5 Detalhes computacionais
Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA.
No DIC: Soma de Quadrados do Total (SQT)
;)(
,)(
abrY
Csendoabr
YYSQT
22r
1k
a
1i
b
1j
2ijk
Soma de Quadrados do fator A, SQ(A) CYbr1
ASQa
1i
2i
)( ;
Soma de Quadrados da Parcelas, SQ(Parc)
CYb
1ParcSQ
ba
ji
2ij
,
,
)( ;
SQRes(a) = SQ(Parc) – SQ(A);
Soma de Quadrados do fator B, SQ(B) CYar
1BSQ
b
1j
2j
)( ;
Soma de Quadrados da interação AxB, SQ(AxB)=SQ(A,B)-SQ(A)-
SQ(B) ou CYr
1AxBSQ
a
1i
b
1j
2ij
)( , sendo a SQ(A,B) a soma de
quadrado conjunta, a qual nos fatoriais a x b é igual à soma de quadrados dos tratamentos (SQTr).
SQRes(b) = SQ(Parc) – SQ(B)-SQ(AB);
Para calcular os coeficientes de variação para as parcelas e para as subparcelas usamos, respectivamente:
100xY
asQMaCV
)(Re
)( 100xY
bsQMbCV
)(Re
)(
)()()(, AxBSQBSQParcSQSQModeloquesendo100xSQT
SQModeloR2
Dos testes de hipóteses sugeridos anteriormente, se ocorrer interação AxB significativa, torna-se imprescindível fazer o desdobramento
)(iAdedentroBSQ , para i = 1, 2, ..., a ou )(
jBdedentroASQ , para j = 1, 2, ..., b. Para
176
Estatística Experimental
testar se “as médias de B são iguais, dentro de cada nível de A” usaremos como denominador da estatística F, bE = QMRes(b), com seus a(r-1)(b-1)
graus de liberdade. Comparações de duas médias de A, no mesmo ou em diferentes níveis
de B, envolve o efeito principal de A e a interação AB, ou seja, elas são ambas, comparações das parcelas e das subparcelas. Neste caso é apropriado usar uma média ponderada dos erros Ea e Eb , definida como:
ba EbEb
sQM )1((1
(*)Re
Para tais comparações a razão da diferença dos tratamentos pelo seu erro padrão não segue uma distribuição t-student . Uma aproximação para testar se “as médias de A são iguais, dentro de cada nível de B” usaremos como denominador da estatística t, o valor obtido de
ba E1bEb1
sQM )(((*)Re , que tem n* graus de liberdade, o qual é
calculado pela Fórmula de Sattertwait:
.
),(Re),(Re,
)(
)(*
subparceladaliberdadedegrausosn
eparceladaerrodoliberdadedegrausosn
bsQMEasQMEsendo
n
E1b
n
E
E1bEn
b
a
ba
b
2b
a
2a
2ba
6 Comparações múltiplas entre médias de tratamentos
Após tirarmos as conclusões sobre os testes de hipóteses da Análise de Variância, poderemos estar interessados em comparar as médias dos tratamentos primários (A), dos secundários (B) ou da interação (AxB). Daí, o problema consiste em usar a estimativa da variância (2) apropriada. A seguir, apresentaremos esses problemas para os casos mais freqüentes. Aqui consideraremos a notação )(Re),(Re bsQMEasQME ba
1º Caso: entre médias do tratamento primário
Para testar um contraste escolhido a priori,
aa2211 cccY ... , sendo )...,,,( a21ii as médias dos
tratamentos primários, ou seja, 0YH0 : , usamos a estatística
)(2i
~
c r
ˆaEdogl
i
a
i tE
Yt
, sendo
)( aEdoglt o quantil de ordem )2
1(
da distribuição t-student com
graus de liberdade do Ea. Para testar um contraste entre duas médias de A, ,iiY , ou
seja, 0YH0 : usamos a estatística
177
Estatística Experimental
)(~ˆ
aEdogl
a
t
brE2
Yt , sendo
)( aEdoglt o quantil de ordem )(2
1
da distribuição t-student com
graus de liberdade do Res(a). Para os testes de Tukey e de Duncan usamos, respectivamente,
br
Eqdms a
EdoglaA a );( e br
Ezdms a
EdoglaA a );(
Sendo, que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan.
2o Caso: entre médias do tratamento secundário
Para testar um contraste escolhido a priori,
bb2211 cccY ... , sendo )...,,,( b21jj as médias dos
tratamentos secundários, ou seja, 0YH0 : , usamos a estatística
)(2i
~
c ar
ˆbEdogl
i
b
i tE
Yt
, sendo
)( bEdoglt o quantil de ordem )(2
1
da distribuição t-student com
graus de liberdade do Eb. Para testar um contraste entre duas médias de B, ,iiY ,
usamos a estatística
)(~ˆ
bEdogl
b
t
Ear2
Yt , sendo
)( bEdoglt o quantil de ordem )(2
1
da distribuição t-student com
graus de liberdade do Eb. Para os testes de Tukey e de Duncan usamos, respectivamente,
arE
qdms bdoEglbB b );(
ar
Ezdms b
EglbB b );(
Sendo que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan.
3o Caso: entre médias do tratamento secundário num mesmo nível de i de A
Para testar um contraste escolhido a priori,
ibb2i21i1 cccY ... , sendo )...,,,( b21jij as médias dos
tratamentos secundários num mesmo nível “i” de A, ou seja, 0YH0 : , usamos a estatística
178
Estatística Experimental
)(2i
~
c r
ˆbEdogl
i
b
i tE
Yt
, sendo
)( bEdoglt o quantil de ordem )(2
1
da distribuição t-student com graus
de liberdade do Eb. Para testar um contraste entre duas médias de B num mesmo nível
de A, ,ijijY , usamos a estatística
)(~ˆ
bEdogl
b
t
rE2
Yt , sendo
)( bEdoglt o quantil de ordem )(2
1
da distribuição t-student com
graus de liberdade do Eb. Para os testes de Tukey e de Duncan usamos, respectivamente
r
Eqdms b
Eglb b );( r
Ezdms b
Edoglb b );(
Sendo que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan.
4o Caso: entre médias do tratamento primário num mesmo nível de B
Para testar um contraste escolhido a priori,
ajaj22j11l cccY ... , sendo a21iij ...,,, as médias dos
tratamentos primários num mesmo nível “j” de B, usamos a
estatística )(
2i
ba
**
c br
1)E-(b E
ˆn
i
i tmenteaproximadaY
t
,
Sendo n* os graus de liberdade calculados pela Fórmula de Sattertwait (o asterisco indica que esta razão não tem uma distribuição t-student).
Para testar um contraste entre duas médias de A num mesmo nível
de B, ,ijijlY , usamos a estatística aproximada
*
1)E-(b Ebr
ˆ
ba
*
ni tmenteaproximada
2
Yt
com n* os graus de liberdade calculados pela Fórmula de Sattertwait
179
Estatística Experimental
Correspondentemente uma aproximação para o teste de Tukey temos:
s(b) (b-1)QMReQMRes(a) br1
qdmsnb
),( * e ,
sendo os valores de “q” e “z” correspondem a “b” tratamentos e n* graus de liberdade para o resíduo (calculados pela Fórmula de Sattertwait) e são encontrados em tabelas próprias.
EXEMPLO 1: Supor um experimento com três rações A, B e C em seis blocos casualizados, sendo cada parcela constituída de dois bovinos de corte. Em uma determinada fase do experimento, os bovinos dentro de cada parcela, passaram a receber, por sorteio, um dos dois tipos de suplementos minerais M e P. A variável dependente é o ganho de peso no final do experimento.
Um possível croqui deste experimento em parcelas subdivididas no delineamento em blocos casualizados:
B A C
P M M P P M
A C B P M M P P M
B C A
P M M P M P
A B C
M P M P P M
C A B
P M M P P M
C B A
M P M P P M
1ª letra fator ração e 2ª letra fator suplemento mineral
BLOCOS
I II III IV V VI
BP AM BP AM CP CM
BM AP BM AP CM CP
AM CM CM BM AM BM
AP CP CP BP AP BP
CP BP AM CP BP AP
CM BM AP CM BM AM
Bloco I
Bloco III
Bloco IV
Bloco V
Bloco VI
Bloco II
180
Estatística Experimental
Esquema da análise de variância
Causas da variação g.l.
Blocos 5
Ração (Trat. principal) A 2
Erro (a) 10
Parcelas (17)
Suplemento mineral (Trat. Secundário) B 1
Ração x Suplemento 2
Erro (b) 15
Total 35
Os ganhos individuais ao final do experimento foram: Blocos Ração A Ração B Ração C Total
M P M P M P I 107 89 116 101 90 96 599 II 117 101 136 110 112 89 665 III 122 98 130 104 99 92 645 IV 111 101 122 91 105 78 608 V 90 95 117 100 110 90 602 VI 116 90 114 94 114 93 621
Total 663 574 735 600 630 538 3.740 (Veja estrutura do arquivo na última página)
Quadro de Totais I Blocos ( 2 )* Ração A Ração B Ração C Total
I 196 217 186 599 II 218 246 201 665 II 220 234 191 645 IV 212 213 183 608 V 185 217 200 602 VI 206 208 207 621
Total 1.237 (12) 1.335 (12) 1.168 (12) 3.740 (*) Os números entre parênteses representam o total de parcelas somadas para se obter os valores observados da tabela.
Cálculos para montar o quadro da anova:
44388544623
37409389107SQT
2222 ,
))()(()...(
22582623
3740621665599
6
1SQBl
2222 ,
))()(()...(
Para obtermos a soma de quadrados das parcelas usamos o quadro auxiliar I com os totais de cada parcela. Como temos duas subparcelas em cada parcela a soma de quadrados das parcelas fica
562377623
3740207217196
2
1SQParcelas
2222 ,
))()(()...(
Para as demais SQ, organizamos o seguinte quadro de totais II que relaciona os níveis dos dois fatores entre si:
(6) SUPLEMENTOS
RAÇÃO Totais A B C
M 663 735 630 2028
P 574 600 538 1712 Totais 1237 1335 1168 3740
Cálculos do quadro da ANOVA
181
Estatística Experimental
731173623
3740116813351237
121
SQRações2
222 ,))()((
)(
6162173117322582562377
SQRaçõesSQBlSQParcelasasSQ
,,,,
)(Re
782773623
374017122028
18
1SQSupl
222 ,
))()(()(
894057623
3740538574663
6
1SRSQ
2222 ,
))()(()...(),(
38110782773731173894057
SSQRSQSRSQRxSSQ
,,,,
)()(),()(
84799
RxCSQSQSuplSQParcelasSQTbsSQ
,
)()(Re
Quadro da anova Causas da variação g.l. S.Q. QM F
Blocos 5 582,22 116,44 1,87ns
Ração (Trat. Principal) A 2 1173,73 586,86 9,44**
Erro (a) 10 621,61 62,16
Parcelas (17) 2377,56
Suplemento (Trat. Secundário) B 1 2773,78 2773,78 52,02**
Ração x Suplemento 2 110,38 55,19 1,04ns
Erro (b) 15 799,84 53,32
Total 35 6061,56
Obs. Os efeitos das rações e dos blocos são testados usando o resíduo (a). Os efeitos dos suplementos e da interação são testados usando o resíduo b. F(5,10; 0,05)=3,33 ; F(5,10; 0,01)= 5,64; F(2,10; 0,05)= 4,10; F(2,10; 0,01)= 7,56; F(1,15; 0,05)= 4,54 F(1,15; 0,01)= 8,86; F(2,15; 0,05)= 3,68; F(2,15; 0,01)= 6,36
Conclusão: como a interação não foi significativa (p>0,05) devemos
interpretar as diferenças significativas dos efeitos principais da ração e do suplemento.
Teste de Tukey:
duas médias de A )(Re,).;..,( asQMEsendorb
E2qdms A
AElgaA a
441212
32124883dmsA ,
,,
duas médias de B )(Re,).;..,( bsQMEsendora
E2qdms b
bElgbB b
33718
64106013dmsB ,
,,
182
Estatística Experimental
Quadro de médias (6) SUPLEMENTOS
RAÇÃO Totais A B C
M 110,5 122,5 105,0 112,7 A
P 95,7 100,0 89,7 95,1 B Totais 103,1 ab 111,3 a 97,3 b 103,9
Médias seguidas pela mesma letra minúsculas na linha não diferem entre si pelo teste de Tukey a 5% Médias seguidas pela mesma letra maiúsculas na coluna não diferem entre si pelo teste de Tukey a 5%
Coeficientes de variações
%,,
,)(Re..)( 597
89103
1662
Y
asMQCV a
%,,
,)(Re..)( 037
89103
3253
Y
bsMQCV b
Script no R para obter os resultados acima # entrada dos dados pelo comando read.table( ) dados.ex1_10 <- read.table("ex1ps_10.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_10 head(dados.ex1_10) # anexando o objeto dados.ex1_10 no caminho de procura attach(dados.ex1_10) # calculo das interações - Quadros dos totais int.total <- tapply(gp, list(suplemento, racao), sum) int.total # calculo dos totais marginais do fator suplemento total.supl<- tapply(gp,suplemento,sum) total.supl # calculo dos totais marginais do fator racao total.racao<- tapply(gp,racao,sum) total.racao # calculo das interações - Quadros das médias int.media <- tapply(gp, list(suplemento, racao), mean) round(int.media,1) # calculo das médias marginais do fator suplemento media.supl<- tapply(gp,suplemento,mean) round(media.supl,1) # calculo das médias marginais do fator antibiótico media.racao<- tapply(gp,racao,mean) round(media.racao,1) # quadro da anova no esquema pelo comando aov() gpps.av <- aov(gp~factor(bloco)+factor(racao)+factor(suplemento)+ factor(racao):factor(suplemento)+Error(bloco/racao))
183
Estatística Experimental
summary(gpps.av) # gráfico da interação interaction.plot(racao,suplemento,gp,col=2,lwd=2, ylab="médias de ganho de peso",xlab="rações", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) split2.rbd(racao, suplemento, bloco, gp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Ração", "Suplemento")) # retirando o objeto dados.ex1_10 do caminho de procura detach(dados.ex1_10) O uso do delineamento em parcelas subdivididas é desejável quando:
O experimento pode ser usado quando um fator adicional tem de ser incorporado em um experimento para aumentar a sua amplitude.
Pode-se saber que as maiores diferenças podem ser esperadas de ocorrer entre os níveis de um fator do que nos níveis do outro fator. Neste caso, as combinações dos tratamentos em que as grandes diferenças são esperadas podem ser atribuídas aleatoriamente às parcelas principais simplesmente por conveniência.
O experimento é usado quando grande precisão é desejada para comparações entre os níveis de um fator do que em níveis do outro fator.
Em resumo, dado que nos experimentos em parcelas subdivididas a variação entre as subparcelas é esperada ser menor do que a variação entre as parcelas principais, o fator que requerer menor quantidade de material experimental, ou que é mais importante, ou que é esperado apresentar menores diferenças, ou sobre o qual é desejado maior precisão por qualquer motivo, são atribuídos ás subparcelas.
184
Estatística Experimental
10º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL
Num experimento em parcelas subdivididas para se estudar o ganho de peso médio diário em suínos foram utilizados quatro tratamentos principais ( A ) e dois secundários ( B ), no delineamento em blocos casualizados com cinco repetições. Os tratamentos principais, rações A1, A2, A3, e A4 foram aplicadas as parcelas constituídas de seis suínos cada uma logo após a desmama. Decorridos trinta dias, três suínos de cada parcela passaram a receber por sorteio uma suplementação alimentar, com dois tipos de vitaminas B1 e B2 . Ao final do experimento os aumentos de peso médio dos três animais por subparcela em quilogramas estão dados na tabela abaixo:
Tratamentos 1º Bloco 2º Bloco 3º Bloco 4º Bloco 5º Bloco Total A1 B1 1,30 1,35 1,28 1,25 1,32 6,50 B2 1,32 1,35 1,29 1,31 1,35 6,62 A2 B1 1,10 1,15 1,12 1,18 1,11 5,66 B2 1,20 1,21 1,15 1,18 1,20 5,94 A3 B1 1,45 1,48 1,45 1,44 1,46 7,28 B2 1,48 1,45 1,47 1,50 1,41 7,31 A4 B1 1,22 1,24 1,24 1,30 1,22 6,22 B2 1,24 1,23 1,25 1,28 1,26 6,26 Total 10,31 10,46 10,25 10,44 10,33 51,79
Obs.
4
1i
2
1j
2ijy 67.56730 Usar 5 casas decimais para os cálculos.
a) Estabelecer as hipóteses estatísticas, reproduza os resultados do quadro abaixo, o gráfico da interação, fazer a análise de variância e concluir. Caso haja interação fazer os desdobramentos necessários e os testes de comparações múltiplas. b) Calcule as médias dos tratamentos principais, os erros padrões e compare-as pelo teste de Tukey a 5% de probabilidade. c) Calcule os coeficientes de variação ( C.V. ) e de determinação ( R2 ) do experimento. Quadros auxiliares: 1)
(2) I II III IV V Total A1 2,62 2,70 2,57 2,56 2,67 13,12 A2 2,30 2,36 2,27 2,36 2,31 11,60 A3 2,93 2,93 2,92 2,94 2,87 14,59 A4 2,46 2,47 2,49 2,58 2,48 12,48 Total 10,31 10,46 10,25 10,44 10,33 51,79
2) (5) A1 A1 A1 A1 Total B1 6,50 5,66 7,28 6,22 25,66 B2 6,62 5,29 7,31 6,26 26,13 Total 13,12 11,60 14,59 12,48
2) Cinco jumentos foram utilizados, dentro do manejo regular de colheita de sêmem com o qual já estavam acostumados, para testar sobre o primeiro ejaculado, três diferentes diluentes e após as diluições, três diferentes tempo de conservação do material (5ºC). A resposta medida foi a motilidade observada no sêmem em função daqueles fatores. Para cada jumento, o primeiro ejaculado foi divido em três alíquotas, diluídas cada uma em um dos diluentes e este volume novamente dividido em outras três alíquotas, uma para cada tempo de conservação. Percebe-se que a parcela é definida pelo diluente e dentro dele, as três subparcelas correspondentes aos tempos. Trata-se portanto de um delineamento em parcelas subdivididas , em que cada jumento assume o papel de um bloco, já que pela utilização de alíquotas todos os tratamentos (diluentes) provêm de um mesmo ejaculado.
185
Estatística Experimental
DILUENTE A B C
ANIMAL T1 T2 T3 T1 T2 T3 T1 T2 T3 1 75 73 66 214 81 75 62 218 68 61 50 179 2 65 60 61 186 69 62 51 182 60 55 50 165 3 78 83 70 231 79 76 60 215 72 68 61 201 4 68 61 51 180 76 66 51 193 61 57 53 171 5 44 43 37 124 55 51 41 147 34 24 21 79
Total 330 320 285 935 360 330 265 955 295 265 235 795
3I2I1IiLinear
3
1I
3
1jij
3
1I
3
1j
2ij 101Y2685Y169173Y )()()(; )(
a) Checar os resultados das fórmulas acima e preencher os quadros auxiliares abaixo. b) Estabelecer as hipóteses estatísticas e fazer a análise de variância e concluir. c) No gráfico abaixo teste a significância da tendência linear dos valores médios da motilidade em cada diluente. d) Calcule os coeficientes de variação do experimento. Quadros auxiliares: 1)
Jumentos (Blocos)
( ) I II III IV V Total A B C Total
2) ( ) T1 T2 T3 Média A B C Média
A
B
C
Motilidade observada em sêmem de jumentos segundo o diluidor e o tempo
Tempo
Mot
ilid
ade
44
50
56
62
68
74
6 10 14 18 22 26 30 34 38
186
Estatística Experimental
Aula 11 Experimentos em parcelas subdivididas - Análise de medidas repetidas no tempo.
Como nos experimentos em parcelas subdvididas, experimentos utilizando delineamentos de medidas repetidas no tempo têm estruturas que envolvem mais de um tamanho de unidade experimental. Por exemplo, um animal pode ser observado durante certo período de tempo, onde tempo é um dos fatores na estrutura de tratamentos do experimento. Tais dados são análogos aos dados de um experimento em parcela subdividida em muitos aspectos e sua análise é frequentemente conduzida tal como um experimento em parcela subdividida e denominado como parcela subdividida no tempo, ou análise de medidas repetidas no tempo.
Exemplo: um experimento envolvendo 3 drogas foi conduzido para estudar cada efeito de droga no batimento cardíaco dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos.
DA DB DCAnimais T5 T10 T15 T20 T5 T10 T15 T20 T5 T10 T15 T20
1 78 86 81 77 85 86 83 80 69 73 72 74 2 71 83 88 81 82 86 80 84 66 62 67 73 3 72 82 81 75 71 78 70 75 84 90 88 87 4 72 83 83 69 83 88 79 81 80 81 77 72 5 66 79 77 66 86 85 76 76 72 72 69 70 6 74 83 84 77 85 82 83 80 65 62 65 61 7 62 73 78 70 79 83 80 81 75 69 69 68 8 69 75 76 70 83 84 78 81 71 70 65 65
Quadro auxiliar 1) Totais das parcelas
Animais Total DA 322 323 310 307 288 318 283 290 2441 DB 334 332 294 331 323 330 323 326 2593 DC 288 268 349 310 283 253 281 271 2303
Total 944 923 953 948 894 901 887 887 7337 Quadro auxiliar 2) Totais dos fatores
T5 T10 T15 T20 Total DA 564 644 648 585 2441 DB 654 672 629 638 2593 DC 582 579 572 570 2303
Total 1800 1895 1849 1793 7337 Cálculo das somas de quadrados do quadro da ANOVA:
))()((
)...(843
7337658678SQT
2222
Do QUADRO I, temos
243604843
7337271323322
4
1SQ
2222
Parcelas ,))()((
)...(
081315843
733723032441
32
1SQ
222
Droga ,))()((
)...(
162289081315243604DrogaQSparcelasQSSQ aErro ,,,....)(
Do QUADRO II, temos
187
Estatística Experimental
61282543
7337179318951800
24
1SQ
2222
Tempo ,))()((
)...(
862128843
7337570644564
8
1SQ
2222
Conjunta ,))()((
)...(
17531
61282081315862128
SQSQSQTempoxDrogaSQ TempoDrogaConjunta
,
,,,
)(
474891753161282243604494907
TempoxDrogaSQSQSQSQTSQ TempoParcelasbErro
,,,,,
)()(
Quadro da ANOVA F.V. G.L. S.Q. Q.M. F p
DROGA 2 1315,08 657,54 6,03** 0.008512 Erro(a) 21 2289,16 109,01
PARCELAS 23 3604,24 156,71 20,15** TEMPO 3 282,81 94,27 12,12** 2.315e-06
DROGA x TEMPO 6 531,17 88,53 11,39** 1.381e-08 Erro(b) 63 489,47 7,78 TOTAL 95 4907,49
F(2, 21; 0,05) = 3,47 F(2, 21; 0,01) = 5,78 F(3, 63; 0,05) = 2,76 F(3, 63; 0,01) = 4,13 F(6, 63; 0,05) = 2,25 F(6, 63; 0,01) = 3,12 Conclusão: existe uma interação tempo*droga significativa (p<0,01);
então devemos comparar os tempos em cada droga e drogas em cada tempo. Script no R para os cálculos acima
# entrada dos dados pelo comando read.table( ) dados.ex1_11 <- read.table("ex1mr_11.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_10 head(dados.ex1_11) # anexando o objeto dados.ex1_11 no caminho de procura attach(dados.ex1_11) # calculo das interações - Quadros dos totais int.total <- tapply(fc, list(droga,tempo), sum) int.total # calculo dos totais marginais do fator suplemento total.droga<- tapply(fc,droga,sum) total.droga # calculo dos totais marginais do fator racao total.tempo<- tapply(fc,tempo,sum) total.tempo # calculo das interações - Quadros das médias int.media <- tapply(fc, list(droga, tempo), mean) round(int.media,1) # calculo das médias marginais do fator suplemento
188
Estatística Experimental
media.droga<- tapply(fc,droga,mean) round(media.droga,1) # calculo das médias marginais do fator antibiótico media.tempo<- tapply(fc,tempo,mean) round(media.tempo,1) # quadro da anova no esquema pelo comando aov() fc.av <- aov(fc~factor(droga)+factor(tempo)+ factor(droga):factor(tempo)+Error(droga:animal)) summary(fc.av) # gráfico da interação interaction.plot(tempo,droga,fc,col=2,lwd=2, ylab="médias da frequência cardíaca",xlab="tempo", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) split2.crd(droga, tempo, animal, fc, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Droga", "Tempo")) # retirando o objeto dados.ex1_11 do caminho de procura detach(dados.ex1_11)
Para comparar tempo em cada droga, o erro padrão da diferença de duas médias é
3918
7872
r
E2YYES b
ilij ,),(
).(.)(
.. ,
e o teste de tukey é dado por 734391393YYESqdms ilij050633 .),)(,().(. ..),;,(
Do quadro auxiliar das médias temos, T5 T10 T15 T20
DA 70,50b 80,50ª 81,00a 73,13b DB 81,75a 84,00a 78,63a 79,75a DC 72,75b 72,38b 71,50b 71,25b
Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5%.
Assim do quadro auxiliar das médias temos, T5 T10 T15 T20
DA 70,50bB 80,50aA 81,00aA 73,13abB DB 81,75aA 84,00aA 78,63aA 79,75aA DC 72,75aB 72,38aB 71,50aB 71,25aB
Médias com a mesma letra minúscula nas colunas não diferem entre si pelo teste de Tukey a 5%. Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5%.
Dado que os níveis do fator tempo são quantitativos e igualmente espaçados, polinômios ortogonais podem ser usados para checar a tendência linear e quadrática na resposta de cada droga
189
Estatística Experimental
A tendência linear para a Droga B (DB) é definida pelo contraste
371175793637810084175813
Y3Y1Y1Y3Y 24232221Linear
,),)((),)((),)((),)((
ˆ
com erro padrão do contraste dado por:
4148
7873113S 2222
YLinear,
,))()((ˆ
A estatística t-student correspondente é
5824143711
SY
tLinearY
LinearCalc ,
,,ˆ
ˆ.
,
o valor tabelado é t(63; 0,05) = 2,00. Concluímos, então, que a tendência linear negativa observada no gráfico para a Droga B (DB) é significativa (p<0,05) pelo teste t-student.
A tendência quadrática para a Droga a (DA) pode ser definida pelo contraste
14131211Quad 1111Y .
o qual é estimado por
8717Y1Y1Y1Y1Y 14131211Quad ,ˆ
com erro padrão do contraste dada por:
9718
7871111S 2222
Yuad,
,))()((
.
a estatística t-student correspondente é
079971
8717
YES
Yt
Quad
QuadCalc ,
,
,
)ˆ.(.
ˆ
.
.
o valor tabelado é t(63; 0,05) = 2,00. Concluímos, então que a forte tendência quadrática observada no gráfico para a Droga A (DA) é significativa (p<0,05) pelo teste t-student.
190
Estatística Experimental
Aula 12 Transformação de dados 1 Introdução
Existem duas maneiras nas quais as hipóteses da ANOVA podem ser violadas. Primeiro, os dados podem consistir de medidas em uma escala ordinal ou nominal; neste caso métodos mais apropriados para dados ordinais e nominais são necessários. Segundo, os dados, embora medidos em escala contínua, podem não satisfazer pelo menos uma das três hipóteses requeridas pela análise de variância:
Como vimos anteriormente, as hipóteses da análise de variância são: os termos dos erros são aleatóriamente, independentemente e
normalmente distribuídos ),(~ 2ij 0Ne
a variância de diferentes amostras são homogêneas; variâncias e médias de diferentes amostras não são correlacionadas;
os efeitos dos tratamentos são aditivos.
Nestes casos, duas opções se oferecem para analisar os dados. Uma é reduzir o intervalo dos dados para dados medidos em uma escala nominal ou ordinal apropiada e fazer uma análise para este tipo de dado. A outra possibilidade é ver se os dados podem ser transformados para satisfazer as hipóteses da ANOVA. Se tal transformação é encontrada, os dados transformados podem então serem analisados pelos métodos da ANOVA. A hipótese de variâncias iguais é essencial para a realização da análise de variância. Em muitos casos a transformação que torna as variâncias mais homogêneas, também tornam os dados mais próximos de uma distribuição normal.
Considere o exemplo, no qual os pesos, em “pounds”, de animais, em um DBC, foram observados. Os tratamentos estão em um esquema fatorial 3 x 2, três espécies de animais e dois grupos, um tratado com uma nova vitamina e outro contrôle, em 4 blocos
Bloco Tratamentos I II III IV mice contrôle 0.18 0.30 0.28 0.44 mice vitamina 0.32 0.40 0.42 0.46 galinha controle 2.0 3.0 1.8 2.8 galinha vitamina 2.5 3.3 2.5 3.3 ovelha controle 108.0 140.0 135.0 165.0ovelha vitamina 127.0 153.0 148.0 176.0
O quadro da anova dos dados deste experimento mostra os seguintes
resultados Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 984 328 2.631 0.0881 . factor(fatorA) 2 108321 54161 434.507 5.28e-14 *** factor(fatorB) 1 142 142 1.140 0.3025 factor(fatorA):factor(fatorB) 2 250 125 1.004 0.3896 Residuals 15 1870 125 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
191
Estatística Experimental
A alta significância entre as espécies (fatorA) não é surpreendente para o pesquisador. O que parece estranho é que não foi detectada diferença significativa devido a vitamina (fatorB), tendo em vista que todo animal em todas as replicações que receberam vitamina mostraram um peso maior do que o correspondente animal contrôle. Parece estranho também que não foi encontrado evidências de interação entre os efeitos de vitamina e espécies, dado que a resposta aparente a vitamina é tão diferente nas diferentes espécies. Tudo que podemos concluir é que mice, galinhas e ovelhas diferem em peso.
Vamos olhar estes dados com as supsições da anova em mente e ver o que podemos fazer se uma das suposições não é atendida.
O gráfico de resíduos vs valores preditos mostra claramente uma
heterogeneidade de variâncias e o QQ-plot mostra um comportamento dos dados que não é muito convicente da distribuição normal. A mensagem parece clara, entretanto, podemos ainda fazer testes para verificar o desvio dos pressupostos.
Teste de normalidade de normalidade de Shapiro-Wilk no R # teste de normalidade shapiro.test(pesotrat.av$res)
Saída fornecida pelo R:
Shapiro-Wilk normality test data: pesotrat.av$res W = 0.9536, p-value = 0.3236
Este teste mostra o teste é não significativo (p=0,3236), portanto não rejeitamos ),(~: 2
ij0 0NH , ou seja, os resíduos e por conseguinte os dados
deste experimento suportam a suposição de normalidade. Assim, a primeira suposição é prenchida.
192
Estatística Experimental
Agora vamos examinar a suposição de homogeneidade das variâncias. Vamos aplicar o teste de Bartlett usando o R.
# teste da homogeneidade das variâncias dos tratamentos bartlett.test(peso~factor(trat)) Saída do teste de Bartlett no R: Bartlett test of homogeneity of variances data: peso by factor(trat) Bartlett's K-squared = 81.8698, df = 5, p-value = 3.408e-16
O teste é significativo (p=3.408e-16), rejeitamos 2
6210H ...: , ou
seja, as variâncias dos tratamentos não são homocedásticas (homogêneas). Logo, a segunda suposição não é observada nos dados deste experimento.
Para tentar contornar o problema vamos usar a transformação Box-Cox, que consiste em transformar os dados de acordo com a expressão
sendo um parâmetro a ser estimado dos dados. Se a equação acima se reduz a sendo ln é o logaritmo neperiano. Uma vez obtido o valor de encontramos os valores dos dados transformados conforme a equação acima e utilizamos estes dados transformados para efetuar as análises. A função boxcox() do pacote MASS calcula a verossimilhanca perfilhada deste parâmetro. Devemos escolher o valor que maximiza esta função. Nos comandos a seguir começamos carregando o pacote MASS e depois obtemos o gráfico da verossimilhanca perfilhada no R: # requerendo o pacote MASS require(MASS) boxcox(peso ~ factor(trat),plotit = T) Estes comandos fornecem o gráfico da verossimilhança perfilada
Como estamos interessados no máximo da função vamos dar um zoom
no gráfico com o comando
1yy
'
0
)ln(' yy
193
Estatística Experimental
# zoom no gráfico par maiores detalhes do valor do parâmetro boxcox(a_peso ~ racoes, lam = seq(1,2, 1/10))
O gráfico mostra que o valor que maximiza a função é aproximadamente
0,1. Assim, próximo passo é obter os dados transformados e depois fazer as analise utilizando estes novos dados. # obtenção dos dados transformados lambda<-0.1 peso.trans <- (peso^(lambda) - 1)/lambda
# fazendo a análise de variância dos dados transformados peso.avtrans <- aov(peso.trans ~ factor(trat) summary(peso.avtrans) plot(peso.avt)
O quadro da anova dos dados transformados mostra o seguinte quadro da anova
Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.85 0.28 18.244 2.88e-05 *** factor(fatorA) 2 237.35 118.68 7678.808 < 2e-16 *** factor(fatorB) 1 0.31 0.31 19.879 0.00046 *** factor(fatorA):factor(fatorB) 2 0.02 0.01 0.502 0.61518 Residuals 15 0.23 0.02 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Este quadro mostra um resultado mais satisfatório do que a análise dos
dados sem transformação. Nesta análise, também é mostrado uma significância do fator B (p=0,00046). Mesmo assim, o resultado do teste da significância da interação (p = 0,61518) permaneceu não significativo. NOTA: No gráfico da verossimilhança perfilhada notamos que é mostrado um intervalo de confiança para e que o valor 0 está contido neste intervalo. Isto indica que podemos utilizar a transformação logaritímica dos dados e os resultados da anova serão bem próximos dos obtidos com a transformação com 10, , préviamente adotada.
194
Estatística Experimental
# quadro da anova dos dados transformados pesolog.av <-aov(log(peso+1)~factor(bloco)+factor(fatorA)+factor(fatorB)+ factor(fatorA):factor(fatorB)) summary(pesolog.av) Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.22 0.07 12.85 0.000201 *** factor(fatorA) 2 96.89 48.44 8573.72 < 2e-16 *** factor(fatorB) 1 0.07 0.07 12.11 0.003361 ** factor(fatorA):factor(fatorB) 2 0.00 0.00 0.41 0.670832 Residuals 15 0.08 0.01 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Reparem que os resultados desta anova estão bem próximos dos resultados da anova dos dados originais.
Teste de normalidade de Shapiro-Wilk nos resíduos dos dados transformados # teste da normalidade shapiro.test(pesolog.av$res)
Shapiro-Wilk normality test data: pesofattrans.av$res W = 0.9803, p-value = 0.9014 Teste de da homogeneidade das variâncias dos tratamentos
# teste de bartlett bartlett.test(log(peso+1)~factor(trat))
O resultado do teste de Bartlett para os dados transformados é Bartlett test of homogeneity of variances
data: log(peso + 1) by factor(trat) Bartlett's K-squared = 5.5714, df = 5, p-value = 0.3502 Agora temos confiança de que a nova análise de variância é válida, dado
que dados transformados satisfazem as duas suposições da análise de variância. Com os dados originais a homogeneidade das variâncias não era atendida.