1
Disegno del modello di analisi di dati sperimentali
Lezione 5:modelli MISTIanova annidati
disegno split-plot
2
disegno a blocchi casuali
• Tutti i Trattamenti sono assegnati a tutte le singole unità sperimentali
• Trattamenti sono assegnati in modo ”random”
B C B
A B D
D A A
C D C
blocchi (b = 3)
Trattamenti (a = 4)
3
Dy1
Trattamenti
paziente
A B C D Average
1
2
3
Average
Cy1
Ay2
Ay3
Cy2By2 Dy2
By3 Cy3 Dy3
Ay By
1y
2y
3y
Cy Dy y
55443322110 xxxxxy
blocchi (pazienti) Trattamenti (farmaci )
Ay1 By1
4
An alternative way di writing a GLM
jiijy
Risposta del paziente j ricevente il farmaco i
OverTutti i mean Effect di farmaco i
Effect di paziente j
Residual
αi = μi - μ
βj = μj - μ
5
jiijy ˆˆˆˆ
valori predetti di y
αi = μi - μ
βj = μj - μ
yyyii
yy jj Risposta del paziente j ricevente il farmaco i
6
Trattamenti
paziente
A B C D
1 5.17 5.21 4.91 4.74 5.008
2 6.23 7.34 6.18 6.31 6.515
3 4.93 4.55 4.64 4.61 4.683
5.443 5.700 5.243 5.220 5.402iy
jy
402.5ˆ y042.0402.5443.5ˆ yyAA298.0402.5700.5ˆ yyBB
158.0402.5243.5ˆ yyCC182.0402.5220.5ˆ yyDD
0ˆ i
i
7
Trattamenti
paziente
A B C D
1 5.17 5.21 4.91 4.74 5.008
2 6.23 7.34 6.18 6.31 6.515
3 4.93 4.55 4.64 4.61 4.683
5.443 5.700 5.243 5.220 5.402iy
jy
402.5ˆ y
394.0402.5008.5ˆ11 yy
113.1402.5515.6ˆ22 yy
719.0402.5683.4ˆ33 yy
0ˆ j
j
8
402.5ˆ y042.0402.5443.5ˆ yyAA298.0402.5700.5ˆ yyBB
158.0402.5243.5ˆ yyCC182.0402.5220.5ˆ yyDD
394.0402.5008.5ˆ11 yy
113.1402.5515.6ˆ22 yy
719.0402.5683.4ˆ33 yy
Effetti dei farmaci
Effetti dei pazienti
Es: paziente 2 ricevente il trattamento C:
357.6113.1158.0402.5ˆˆˆ 22 CC yy
9
Considera le due questioni:
• sono i tre pazienti differenti?
• sono pazienti in general differenti?
• Nel primo caso , ”pazienti ” è considerato fattore fisso
• Nel secondo caso , ”pazienti ” è considerato fattore random
10
”pazienti” è un effetto casuale :
jiy
βj è assunta come iid ND(0,σb2)
0
Value of
Pro
babi
lity
di β
Se pazienti sono scelti ”random”, βj è una variabile stocastica
i.e. independentemente , identicamente e normalmente distribute con media zero e Varianza σ²b
11
V(y) = V(μ + αi + βj + ε) = V(μ)+ V(αi)+ V( βj)+ V(ε)
= σa2 + σb
2 + σ2
Varianze
Varianza dovuta a farmaco (fattore a) Varianza dovuta a paziente
(fattore b)
Varianza Residua
12
Entrambi i fattori sono fissi
V(y) = V(μ + αi + βj + ε) = V(μ)+ V(αi)+ V( βj)+ V(ε)
= σa2 + σb
2 + σ2
V(y) = σ2
banyVyV
2
/)()(
Varianza di una singola osservazione:
Varianza di una media:
13
”pazienti ” è un fattore casuale (MISTI anova)
V(y) = V(μ + αi + βj + ε) = V(μ)+ V(αi)+ V( βj)+ V(ε)
= σa2 + σb
2 + σ2
V(y) = σb2 + σ2 Varianza di una singola osservazione:
Varianza di una media: baabab
yV bb
/)( 22
22
14
Entrambi i fattori sono random
V(y) = V(μ + αi + βj + ε) = V(μ)+ V(αi)+ V( βj)+ V(ε)
= σa2 + σb
2 + σ2
V(y) = σa2 +σb
2 + σ2 Varianza di una singola osservazione:
Varianza di una media:
baabbaba
yV baba
/)( 222
222
15
Source df MS E[MS] F
farmaci
pazienti
Error
a-1
b-1
(a-1)(b-1)
MSa
MSb
MSe
Total ab-1
Means Squares Expected
16
Expected Mean Squares
E[MSa] = bσa2 + σ2
E[MSb] = aσb2 + σ2
E[MSe] = σ2
df = a-1
df = b-1
df = (a-1)(b-1)
H0: αA = αB = αC = αD = 0 → σa2 = 0 →
e
a
MS
MSF
H0: β1 = β2 = β3 = 0 → σb2 = 0 →
e
b
MS
MSF
17
Source df MS E[MS] F
farmaci
pazienti
Error
a-1
b-1
(a-1)(b-1)
MSa
MSb
MSe
bσa2 + σ2
aσb2 + σ2
σ2
MSa/Mse
MSb/MSe
Total ab-1
18
Source df MS E[MS] F
farmaci
pazienti
Error
3
2
6
0.149
3.824
0.117
bσa2 + σ2
aσb2 + σ2
σ2
MSa/Mse
MSb/MSe
Total 11
19
Hvis ”pazienti ” è a fattore random , σb2 è stimato da
E[MSb] = aσb2 + σ2 →
a
MSMS
a
sMSs ebb
b
22
927.04
117.0824.32
bs
V(y) = σb2 + σ2 = 0.927+0.117 = 1.044
Varianza di una singola osservazione:
Varianza di una media:
0.3190.0100.30912
117.0
3
927.0)(
22
bab
yV b
20
Come fare questo con SAS
21
DATA eks5_1;
INPUT pat $ treat $ y; /* indlæser data */
CARDS; /* her kommer data. Kan også indlæses fra en fil */
1 A 5.17
2 A 6.23
3 A 4.93
1 B 5.21
2 B 7.34
3 B 4.55
1 C 4.91
2 C 6.18
3 C 4.64
1 D 4.74
2 D 6.31
3 D 4.61
;
PROC GLM; /* procedure General Linear modelli */
TITLE 'Eksempel 5.1'; /* medtages hvis der ønskes en titel */
CLASS pat treat; /* pat og treat er klasse (kvalitative) variabile */
MODEL y = pat treat;
RANDOM pat; /* paziente er er en tilfældig faktor */
RUN;
22
Eksempel 5.1 8 13:18 Monday, November 5, 2001 General Linear modelli Procedure Dependent variabile: Y Source DF Sum di Squares Mean Square F Value Pr > F Model 5 8.09475000 1.61895000 13.80 0.0031 Error 6 0.70401667 0.11733611 Corrected Total 11 8.79876667 R-Square C.V. Root MSE Y Mean 0.919987 6.341443 0.34254359 5.40166667 Source DF tipo I SS Mean Square F Value Pr > F PAT 2 7.64831667 3.82415833 32.59 0.0006TREAT 3 0.44643333 0.14881111 1.27 0.3666 Source DF tipo III SS Mean Square F Value Pr > F PAT 2 7.64831667 3.82415833 32.59 0.0006TREAT 3 0.44643333 0.14881111 1.27 0.3666
MSb
MSa
MSe
23
Eksempel 5.1 18
09:00 Friday, November 16, 2001
General Linear models Procedure
Source tipo III Expected Mean Square
PAT Var(Error) + 4 Var(PAT)
TREAT Var(Error) + Q(TREAT)
24
disegno annidati
25
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3 1 2 3
A B C Dfattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijijjiijky )()(
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
A B C Dfattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijjiiijky )()(
1 2 3 1 2 3 1 2 3 1 2 3
paziente j è the same for Tutti i farmaci
paziente j è not the same for Tutti i farmaci
pazienti sono said to be annidati within farmaci
Replicates can also be regarded as annidatiwithin farmaci and pazienti
26
Rules for finding the EMS(after Dunn and Clark)
1. For each effect, write down every possible Varianza component containing every letter di the effect name. For example, in a two way disegno with r replicates per cell, the EMS for fattore A includes σa
2, σab2 and σ(ab)e
2, but not σb2
2. For any annidati fattore add in parentheses to the effect name the name(s) di the fattore within it è annidati e.g if B è annidati in A, σ(a)b
2 è the Varianza di β(i)j.
3. For the coefficient di each Varianza component, use Tutti i letters not in the subscripts di the Varianza component
4. For each Varianza component, look at any subscripts outside parentheses that sono not in the effect name; if any di these letters corresponds to a fissi effect, omit that Varianza component
27
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
anova a due vie(A and B fissi )fattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijijjiijky )()(
Interazione tra farmaco and paziente
Residual di the kth replicate annidati within farmaco i and paziente j
28
Model: kijijjiijky )()(
0i
i 0j
j i j
ij 0)(
(1) For each effect, write down every possible Varianza component containing every letter di the effect name. For example, in a two way disegno with r replicates per cell, the EMS for fattore A includes σa
2, σab2 and σ(ab)e
2, but not σb2
σa2 + σab
2 + σ(ab)e 2fattore A:
σb2 + σab
2 + σ(ab)e 2fattore B:
σab2 + σ(ab)e 2fattore AB:
σ(ab)e 2Residual:
29
Model: kijijjiijky )()(
0i
i 0j
j i j
ij 0)(
σa2 + σab
2 + σ(ab)e 2
σb2 + σab
2 + σ(ab)e 2
σab2 + σ(ab)e 2
fattore A:
fattore B:
fattore AB:
(2) For any annidati fattore add in parentheses to the effect name the name(s) di the fattore within it è annidati e.g if B è annidati in A, σ(a)b
2 è the Varianza di β(i)j.
σ(ab)e 2Residual:
30
Model: kijijjiijky )()(
0i
i 0j
j i j
ij 0)(
brσa2 + rσab
2 + σ(ab)e 2fattore A:
arσb2 + rσab
2 + σ(ab)e 2fattore B:
rσab2 + σ(ab)e 2fattore AB:
(3) For the coefficient di each Varianza component, use Tutti i letters not in the subscripts di the Varianza component
σ(ab)e 2Residual:
31
Model: kijijjiijky )()(
0i
i 0j
j i j
ij 0)(
brσa2 + rσab
2 + σ(ab)e 2
arσb2 + rσab
2 + σ(ab)e 2
rσab2 + σ(ab)e 2
fattore A:
fattore B:
fattore AB:
(4) For each Varianza component, look at any subscripts outside parentheses that sono not in the effect name; if any di these letters corresponds to a fissi effect, omit that Varianza component
σ(ab)e 2Residual:
32
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
anova a due vie(A and B fissi )fattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijijjiijky )()(
0i
i 0j
j i j
ij 0)(
2)(
222)ˆ( rababbayV abryV 2)(
Source df MS E[MS] F
A
B
AB
Error
a-1
b-1
(a-1)(b-1)
ab(r-1)
MSa
MSb
MSab
MSe
brσa2 +r σab
2+ σ2
arσb2 + r σab
2+ σ2
r σab2+ σ2
σ2
MSa/MSe
MSb/MSe
MSab/MSe
33
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
anova a due vie (A fissi , B random)fattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijijjiijky )()(
0i
i
2)(
222)ˆ( rababbayV
Source df MS E[MS] F
A
B
AB
Error
a-1
b-1
(a-1)(b-1)
ab(r-1)
MSa
MSb
MSab
MSe
brσa2 +r σab
2+ σ2
arσb2 + r σab
2+ σ2
r σab2+ σ2
σ2
MSa/MSab
MSb/MSe
MSab/MSe
i
ij 0)( βj è ND(0, σb2) (αβ)ij è ND(0; σab
2(1-1/a))
abrarabrb
yV bb /)( 22
22
NB!
34
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
anova a due vie(A and B random)fattore A:
fattore B:
Replicate
Model: kijijjiijky )()(
2)(
222)ˆ( rababbayV
Source df MS E[MS] F
A
B
AB
Error
a-1
b-1
(a-1)(b-1)
ab(r-1)
MSa
MSb
MSab
MSe
brσa2 +r σab
2+ σ2
arσb2 + r σab
2+ σ2
r σab2+ σ2
σ2
MSa/MSab
MSb/MSab
MSab/MSe
βi è ND(0, σb2) (αβ)ij è ND(0; σab
2)αi è ND(0, σa2)
abrrarbryV abba /)( 2222
35
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
A B C D
anova annidati (A fissi , B random)fattore A (farmaco)
fattore B (paziente )
Replicate
Model: kijjiiijky )()(
2)(
2)(
2)ˆ( rabbaayV
Source df MS E[MS] F
A
B(A)
Error
a-1
a(b-1)
ab(r-1)
MSa
MS(a)b
MSe
brσa2 +r σ(a)b
2+ σ2
rσ(a)b2 + σ2
σ2
MSa/MS(a)b
MS(a)b/MSe
MSe
β(i)j è ND(0, σ(a)b2)
1 2 3 1 2 3 1 2 3 1 2 3
0i
i
abrrabrab
yV baba /)( 22
)(
22)(
36
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
A B C D
annidati anova (A and B random)fattore A (doctor)
fattore B (paziente )
Replicate
Model: kijjiiijky )()(
2)(
2)(
2)ˆ( rabbaayV
Source df MS E[MS] F
A
B(A)
Error
a-1
a(b-1)
ab(r-1)
MSa
MS(a)b
MSe
brσa2 +r σ(a)b
2+ σ2
rσ(a)b2 + σ2
σ2
MSa/MS(a)b
MS(a)b/MSe
MSe
β(i)j è ND(0, σ(a)b2)
abrrbrabraba
yV baabaa /)( 22
)(2
22)(
2
αi è ND(0, σa2)
1 2 3 1 2 3 1 2 3 1 2 3
37
40% 20% 0% Four level annidati anova
Tree (b = 2 )
Replicate (r = 2)
Model: rijkkijjiiijky )()()(
2)(
2)(
2)(
2)ˆ( rabccabbaayV
β(i)j è ND(0, σ(a)b2)
abcrrcrabcrabcab
yV cabbacabba /)( 22
)(2
)(
22)(
2)(
Leaf (c = 3 )
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
trattamento (a = 3)
γ(ij)k è ND(0, σ(ab)c2)0
ii
38
Sourcec df MS E[MS] F
Trattamenti
Trees
Leaves
Error
a-1
a(b-1)
ab(c-1)
abc(r-1)
MSa
MS(a)b
MS(ab)c
MSe
bcrσa2 +cr σ(a)b
2+ r σ(ab)c2 +σ2
cr σ(a)b2+ r σ(ab)c
2 +σ2 r σ(ab)c
2 +σ2
σ2
MSa/MS(a)b
MS(a)b/MS(ab)c
MS(ab)c/MSe
MSe
MS(ab)c = rs(ab)c2 + s2 →
r
MSMSs ecab
cab
)(2
)(
MS(a)b = cr s(a)b2+ r s(ab)c
2 +s2 = cr s(a)b2 + MS(ab)c
→cr
MSMSs cabba
ba)()(2
)(
MSa = bcrsa2 +cr s(a)b
2+ r s(ab)c2 +s2 = bcrsa
2 +MS(a)b →bcr
MSMSs baa
a)(2
2
)(2
)(2
)(2)ˆ( rabccabbaayV
22)(
2)(
2)ˆ( ssssyV cabbaa
39
How do it with SAS
40
PROC GLM;
CLASS treat tree leaf disc;
MODEL Nitro = treat tree(treat) leaf(tree treat);
/* trattamento è a fattori fissi , while trees and leaves sono random */
RANDOM tree(treat) leaf(tree treat);
/* gives the expected means squares */
RUN;
DATA annidati; /* annidati anova (eks 6-4 in the lecture notes) */
INFILE 'H:\lin-mod\eks6x.prn' firstobs =2 ;
INPUT treat $ tree $ leaf $ disc $ Nitro ;
41
General Linear modelli Procedure
Dependent variabile: NITRO
Source DF Sum di Squares Mean Square F Value Pr > F
Model 17 134.04000000 7.88470588 8.00 0.0001
Error 18 17.75000000 0.98611111
Corrected Total 35 151.79000000
R-Square C.V. Root MSE NITRO Mean
0.883062 3.271932 0.99303127 30.35000000
Source DF tipo I SS Mean Square F Value Pr > F
TREAT 2 71.78000000 35.89000000 36.40 0.0001
TREE(TREAT) 3 36.04666667 12.01555556 12.18 0.0001
LEAF(TREAT*TREE) 12 26.21333333 2.18444444 2.22 0.0618
Source DF tipo III SS Mean Square F Value Pr > F
TREAT 2 71.78000000 35.89000000 36.40 0.0001
TREE(TREAT) 3 36.04666667 12.01555556 12.18 0.0001
LEAF(TREAT*TREE) 12 26.21333333 2.18444444 2.22 0.0618
NB!These values sono based on MSe as the error term, which è wrong!
42
PROC GLM;
CLASS treat tree leaf disc;
MODEL Nitro = treat tree(treat) leaf(tree treat);
/* trattamento è a fattori fissi , while trees and leaves sono random */
RANDOM tree(treat) leaf(tree treat);
/* gives the expected means squares */
RUN;
DATA annidati; /* annidati anova (eks 6-4 in the lecture notes) */
INFILE 'H:\lin-mod\eks6x.prn' firstobs =2 ;
INPUT treat $ tree $ leaf $ disc $ Nitro ;
43
General Linear modelli Procedure
Source tipo III Expected Mean Square
TREAT Var(Error) + 2 Var(LEAF(TREAT*TREE)) + 6 Var(TREE(TREAT))
+ Q(TREAT)
TREE(TREAT) Var(Error) + 2 Var(LEAF(TREAT*TREE)) + 6 Var(TREE(TREAT))
LEAF(TREAT*TREE) Var(Error) + 2 Var(LEAF(TREAT*TREE))
44
PROC GLM;
CLASS treat tree leaf disc;
MODEL Nitro = treat tree(treat) leaf(tree treat);
/* trattamento è a fattori fissi , while trees and leaves sono random */
RANDOM tree(treat) leaf(tree treat);
/* gives the expected means squares */
TEST h=treat e= tree(treat);
/* tests for the difference between Trattamenti with MS for tree(treat) as denominator */
TEST h= tree(treat) e=leaf(tree treat);
/* tests for the difference between trees with MS for leaf(tree treat) as denominator*/
45
General Linear modelli Procedure
Dependent variabile: NITRO
Tests di Hypotheses using the tipo III MS for TREE(TREAT) as an error term
Source DF tipo III SS Mean Square F Value Pr > F
TREAT 2 71.78000000 35.89000000 2.99 0.1933
Tests di Hypotheses using the tipo III MS for LEAF(TREAT*TREE) as an error term
Source DF tipo III SS Mean Square F Value Pr > F
TREE(TREAT) 3 36.04666667 12.01555556 5.50 0.0130
46
PROC GLM;
CLASS treat tree leaf disc;
MODEL Nitro = treat tree(treat) leaf(tree treat);
/* trattamento è a fattori fissi , while trees and leaves sono random */
RANDOM tree(treat) leaf(tree treat);
/* gives the expected means squares */
TEST h=treat e= tree(treat);
/* tests for the difference between Trattamenti with MS for tree(treat) as denominator */
TEST h= tree(treat) e=leaf(tree treat);
/* tests for the difference between trees with MS for leaf(tree treat) as denominator*/
MEANS treat / Tukey Dunnett('Control') e= tree(treat) cldiff;
/* finds possible significant differences between Trattamenti and the control and the other Trattamenti */
RUN;
47
Tukey's Studentized Range (HSD) Test for variabile: NITRO
NOTE: This test controls the tipo I experimentwise error rate.
Alpha= 0.05 Confidence= 0.95 df= 3 MSE= 12.01556
Critical Value di Studentized Range= 5.910
Minimum Significant Difference= 5.9134
Comparisons significant at the 0.05 level sono indicated by '***'.
Simultaneous Simultaneous
Lower Difference Upper
TREAT Confidence Between Confidence
Comparison Limit Means Limit
20% - 40% -3.663 2.250 8.163
20% - Control -2.513 3.400 9.313
40% - 20% -8.163 -2.250 3.663
40% - Control -4.763 1.150 7.063
Control - 20% -9.313 -3.400 2.513
Control - 40% -7.063 -1.150 4.763
48
Dunnett's T tests for variabile: NITRO
NOTE: This tests controls the tipo I experimentwise error for
comparisons di Tutti i Trattamenti against a control.
Alpha= 0.05 Confidence= 0.95 df= 3 MSE= 12.01556
Critical Value di Dunnett's T= 3.866
Minimum Significant Difference= 5.4714
Comparisons significant at the 0.05 level sono indicated by '***'.
Simultaneous Simultaneous
Lower Difference Upper
TREAT Confidence Between Confidence
Comparison Limit Means Limit
20% - Control -2.071 3.400 8.871
40% - Control -4.321 1.150 6.621
49
PROC annidati;
CLASS treat tree leaf;
VAR Nitro;
RUN;
50
Coefficients di Expected Mean Squares
Source TREAT TREE LEAF ERROR
TREAT 12 6 2 1
TREE 0 6 2 1
LEAF 0 0 2 1
ERROR 0 0 0 1
Sourcec df MS E[MS] F
Trattamenti
Trees
Leaves
Error
a-1
a(b-1)
ab(c-1)
abc(r-1)
MSa
MS(a)b
MS(ab)c
MSe
bcrσa2 +cr σ(a)b
2+ r σ(ab)c2 +σ2
cr σ(a)b2+ r σ(ab)c
2 +σ2 r σ(ab)c
2 +σ2
σ2
MSa/MS(a)b
MS(a)b/MS(ab)c
MS(ab)c/MSe
MSe
51
annidati effetto casuale s Analisi di Varianza for variabile NITRO
Degrees
Varianza di Sum di Error
Source Freedom Squares F Value Pr > F Term
TOTAL 35 151.790000
TREAT 2 71.780000 2.987 0.1933 TREE
TREE 3 36.046667 5.501 0.0130 LEAF
LEAF 12 26.213333 2.215 0.0618 ERROR
ERROR 18 17.750000
Varianza Varianza Percent
Source Mean Square Component di Total
TOTAL 4.336857 5.213333 100.0000
TREAT 35.890000 1.989537 38.1625
TREE 12.015556 1.638519 31.4294
LEAF 2.184444 0.599167 11.4930
ERROR 0.986111 0.986111 18.9152
Mean 30.35000000
Standard error di mean 0.99847105
r
MSMSs ecab
cab
)(2
)(
cr
MSMSs cabba
ba)()(2
)(
bcr
MSMSs baa
a)(2
52
The problem di pseudoreplication
53
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 2 3 1 2 3 1 2 3
A B C
anova a due vie(A fissi , B random)
fattore A (farmaco)
fattore B (paziente )
Replicate
18 measurements
If we want to increase the power di the Analisi , we may e.g. double thenumber di measurements
But be careful about what you do!
54
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 2 3 1 2 3 1 2 3
A B C
1 2
1
1 2
2
1 2
3
1 2
4
1 2
5
1 2
6
A
1 2
1
1 2
2
1 2
3
1 2
4
1 2
5
1 2
6
1 2
1
1 2
2
1 2
3
1 2
4
1 2
5
1 2
6
CB
disegno 1
disegno 2
Entrambi experiments have 36 measurements
3 experimental unità/trattamento
6 experimental unità/trattamento
Pseudoreplicates
disegno 2 è best because it uses 6 experimental unità/trattamento
55
40% 20% 0%
Four level annidati anova
Tree (b = 2 )
Replicate (r = 2)
Leaf (c = 3 )
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
1 2 1 2 1 2
1
1 2 3
1 2 1 2 1 2
2
1 2 3
trattamento (a = 3)
Trees sono the experimental unità(2 replicates/trattamento )Pseudoreplicates
56
Split-plot disegnos
• Tre tipi di fertilizers
• Two tipi di soil trattamento
• Interactions between fertilizers and soil trattamento
57
A1
A2
Block 3
A2
A1
Block 1
A2
A1
Block 4
A1
A2
Block 2
2 whole-plots within each block
Soil Trattamenti
58
A1
A2
Block 3
A2
A1
Block 1
A2
A1
Block 4
A1
A2
Block 2
Fertilizer Trattamenti
3 sub- plots within each whole-plot
59
Analisi di intero-disegno
fattore df MS E[MS] FSoil trattamento
(A)
Block (B)
Soil*Block (AB)
Error
a-1 = 1
b-1 =3
(a-1)(b-1) = 3
0
MSa
MSb
MSab
bσa2+σab
2
aσb2+ σab
2
σab2
MSa/MSab
MSb/MSab
Total ab-1 = 7
kijijjiijky )()(
0i
i βj è ND(0, σb2)
Effect di soil treatInterazione tra soil and block
Effect di block
Interaction term serves as error term
60
Analisi di sub-plots
fattore df MS E[MS] FWhole plots
Fertilizer (C)
Soil*Fertilizer (AC)
Block*Fert. (BC)
Soil*Block*Fert. (ABC)
Error
ab-1 = 7
c-1 = 2
(a-1)( c-1) = 2
(b-1)(c-1) = 6
(a-1)(b-1)(c-1) = 6
0
MSc
MSac
MSbc
MSabc
abσc2+σabc
2
bσac2+ σabc
2
aσbc2+ σabc
2
σabc2
MSc/MSabc
MSac/MSabc
MSbc/MSabc
Total abc-1 = 23
0k
k (βγ)jk è ND(0, σbc2(1-1/c))
jkikkijjiijky )()()(ˆ
0)( i k
ik
Effect di fertilizer
Interazione tra soil trattamento and fertilizer
Interazione tra block and fertilizer
61
Analisi di sub-plots
fattore df MS E[MS] FWhole plots
Fertilizer (C)
Soil*Fertilizer (AC)
Block*Fert. (BC)
Soil*Block*Fert. (ABC)
Error
ab-1 = 7
c-1 =2
(a-1)( c-1) =2
(b-1)(c-1) = 6
(a-1)(b-1)(c-1) = 6
0
MSc
MSac
MSbc
MSabc
abσc2+σ2
bσac2+ σ2
bσbc2+ σ2
σ2
MSc/MSe
MSac/MSe
MSbc/MSe
Total abc-1 = 23
0k
k (βγ)jk è ND(0, σbc2(1-1/c))
jkikkijjiijky )()()(ˆ
0)( i k
ik
62
Analisi di sub-plots
fattore df MS E[MS] FWhole plots
Fertilizer (C)
Soil*Fertilizer (AC)
Block*Fert. (BC)
Soil*Block*Fert. (ABC)
Error
ab-1 = 7
c-1 =2
(a-1)( c-1) =2
(b-1)(c-1) = 6
(a-1)(b-1)(c-1) = 6
0
MSc
MSac
MSbc
MSabc
abσc2+σ2
bσac2+ σ2
σ2
MSc/MSe
MSac/MSe
Total abc-1 = 23
0k
k (βγ)jk è ND(0, σbc2(1-1/c))
jkikkijjiijky )()()(ˆ
0)( i k
ik
63
How do it with SAS
64
DATA SplitPlt;
/* Example 6-8 in the lecture notes */
/* block = block effect (fattore random ) */
/* soil = effect di soil trattamento (whole-plot effect) */
/* fert = effect di fertilizer (subplot effect) */
/* yield = dependent variabile */
INFILE 'h:\lin-mod\eks6-8.prn';
INPUT soil $ block $ fert $ yield;
PROC GLM;
TITLE 'Split plot - full model';
CLASS block soil fert;
MODEL yield= block soil block*soil fert soil*fert block*fert ;
RANDOM block; /* declare block as a effetto casuale */
TEST h = soil e = block*soil; /* tests effect di wholeplot */
TEST h = block e = block*soil; /* tests effect di blocchi */
RUN;
65
Split plot - full model
The GLM ProcedureDependent variabile: yield Sum of Source DF Squares Mean Square F Value Pr > F Model 17 32796.58333 1929.21078 3.24 0.0764 Error 6 3575.41667 595.90278 Corrected Total 23 36372.00000 R-Square Coeff Var Root MSE yield Mean 0.901699 15.02223 24.41112 162.5000 Source DF tipo III SS Mean Square F Value Pr > F block 3 588.33333 196.11111 0.33 0.8050 soil 1 7848.16667 7848.16667 13.17 0.0110 block*soil 3 3740.83333 1246.94444 2.09 0.2027 fert 2 10950.75000 5475.37500 9.19 0.0149 soil*fert 2 462.58333 231.29167 0.39 0.6942 block*fert 6 9205.91667 1534.31944 2.57 0.1373 Tests di Hypotheses Using the tipo III MS for block*soil as an Error Term Source DF tipo III SS Mean Square F Value Pr > F soil 1 7848.166667 7848.166667 6.29 0.0870 block 3 588.333333 196.111111 0.16 0.9185
Sub-plot effects
NB! These P-values cannot be used!
Instead use these whole-plot results
Whole-plot effects
66
PROC GLM;
TITLE 'Split plot - reduced model
block*fert omitted';
CLASS block soil fert;
MODEL yield= block soil block*soil fert soil*fert;
RANDOM block;
TEST h = soil e = block*soil; /* tests effect di wholeplot */
TEST h = block e = block*soil; /* tests effect di blocchi */
RUN;
67
Split plot - reduced modelblock*fert omitted
The GLM Procedure Dependent variabile: yield Sum of Source DF Squares Mean Square F Value Pr > F Model 11 23590.66667 2144.60606 2.01 0.1224 Error 12 12781.33333 1065.11111 Corrected Total 23 36372.00000 R-Square Coeff Var Root MSE yield Mean 0.648594 20.08372 32.63604 162.5000 Source DF tipo III SS Mean Square F Value Pr > F block 3 588.33333 196.11111 0.18 0.9051 soil 1 7848.16667 7848.16667 7.37 0.0188 block*soil 3 3740.83333 1246.94444 1.17 0.3615 fert 2 10950.75000 5475.37500 5.14 0.0244 soil*fert 2 462.58333 231.29167 0.22 0.8079
68
PROC GLM;
TITLE 'Split plot - reduced model
block*fert and soil*fert omitted';
CLASS block soil fert;
MODEL yield= block soil block*soil fert;
RANDOM block;
TEST h = soil e = block*soil; /* tests effect di wholeplot */
TEST h = block e = block*soil; /* tests effect di blocchi */
MEANS soil /TUKEY e= block*soil CLM CLDIFF; /* confidence limits for wholeplot effects */
MEANS fert /TUKEY CLM CLDIFF; /* confidence limits for subplot effects */
RUN;
69
Split plot - reduced model block*fert and soil*fert omitted
97Dependent variabile: yield Sum of Source DF Squares Mean Square F Value Pr > F Model 9 23128.08333 2569.78704 2.72 0.0457 Error 14 13243.91667 945.99405 Corrected Total 23 36372.00000 R-Square Coeff Var Root MSE yield Mean 0.635876 18.92739 30.75702 162.5000 Source DF tipo III SS Mean Square F Value Pr > F block 3 588.33333 196.11111 0.21 0.8896 soil 1 7848.16667 7848.16667 8.30 0.0121 block*soil 3 3740.83333 1246.94444 1.32 0.3079 fert 2 10950.75000 5475.37500 5.79 0.0147
70
The GLM Procedure Tukey's Studentized Range (HSD) Test for yield NOTE: This test controls the tipo I experimentwise error rate. Alpha 0.05 Error Degrees di Freedom 3 Error Mean Square 1246.944 Critical Value di Studentized Range 4.50067 Minimum Significant Difference 45.879 Comparisons significant at the 0.05 level sono indicated by ***. Difference Simultaneous soil Between 95% Confidence Comparison Means Limits 2 - 1 36.17 -9.71 82.05 1 - 2 -36.17 -82.05 9.71
71
The GLM Procedure Tukey's Studentized Range (HSD) Test for yield NOTE: This test controls the tipo I experimentwise error rate. Alpha 0.05 Error Degrees di Freedom 14 Error Mean Square 945.994 Critical Value di Studentized Range 3.70139 Minimum Significant Difference 40.25 Comparisons significant at the 0.05 level sono indicated by ***. Difference Simultaneous fert Between 95% Confidence Comparison Means Limits 3 - 2 15.38 -24.87 55.62 3 - 1 51.00 10.75 91.25 *** 2 - 3 -15.38 -55.62 24.87 2 - 1 35.63 -4.62 75.87 1 - 3 -51.00 -91.25 -10.75 *** 1 - 2 -35.63 -75.87 4.62