View
46
Download
4
Category
Preview:
DESCRIPTION
Analýza rozptylu. Karel Zvára. Jednoduché třídění. one-way analysis of variance k nezávislých výběrů z N( i , 2 ) (různé populační průměry, stejné rozptyly) rozhodovat o shodě (populačních) průměrů, tj. o hypotéze rozšíření dvouvýběrového t -testu ( k = 2) - PowerPoint PPT Presentation
Citation preview
Analýza rozptylu
Karel Zvára
Jednoduché třídění
• one-way analysis of variance
• k nezávislých výběrů z N(i,2) (různé populační průměry, stejné rozptyly)
• rozhodovat o shodě (populačních) průměrů, tj. o hypotéze• rozšíření dvouvýběrového t-testu (k = 2)• rozklad variability vysvětlované proměnné
)k (21
• celková = mezi výběry + uvnitř výběrů• celková variabilita předpokládá stejné
populační průměry• mezi výběry – variabilita průměrů vážená
velikostí výběrů (vysvětlená variabilita)• uvnitř výběrů – sečti součty čtverců
odchylek od individuálních průměrů (nevysvětlená variabilita, reziduální)
• hodnocení v tabulce analýzy rozptylu
příklad
• koncentrace kyseliny listové v červených krvinkách po 24 hodinách ventilace (v každé skupině jiné složení dýchané směsi)
skupina rozsah průměr sm. odch.
1. 8 316,5 41,2
2. 9 256,4 37,1
3. 5 275,6 35,9
příklad
1.0 1.5 2.0 2.5 3.0
20
02
50
30
03
50
Skupina
kyse
lin
a +
++
tabulka analýzy rozptylu
variabilita SS df MS F p
skupiny 15 663,5 2 7 831,7 5,3005 0,0148
reziduální 28 073,3 19 1 477,5
celková 43 736,8 21
• na 5% hladině prokázán rozdíl (průkazný rozdíl)
• ověření předpokladů (stejně v regresi)
klasický zápis modelu
• - společná úroveň všech výběrů
• i – efekt i-tého ošetření (součet = 0)
• ij – náhodná složka N(0, 2)
• hypotéza: efekty i všechny nulové
• výhoda: lze zapsat složitější strukturu
kinjy iijiij ,,1,,,1,
Rezidua
• základ diagnostiky (ověření předpokladů, použitelnosti modelu)• obecně: pozorování – předpověď• zde: pozorování – průměr v dané skupině
• Se - reziduální součet čtverců = součet čtverců reziduí = variabilita uvnitř výběrů iijij yyu
Stabilita rozptylu
1.0 1.5 2.0 2.5 3.0
-40
-20
02
04
06
0
skupina
resid
(a)
Bartlettův test B = 0,118, tj. p = 94,3 %
Ukázka nestabilního rozptylu
1.0 1.5 2.0 2.5 3.0
-50
05
01
00
skupina
uu
Bartlettův test B = 7,67, tj. p = 2,2 %
Hodnocení normálního rozdělení
-2 -1 0 1 2
-40
-20
02
04
06
0Normal Q-Q Plot
Theoretical Quantiles
Sa
mp
le Q
ua
ntile
s
Shapirův-Wilkův test W = 0,9255, p = 9,9 %
Když nelze předpokládat normální rozdělení
• pořadový test (Kruskal-Wallis)• transformace vysvětlované proměnné (často
logaritmická, někdy odmocninová)• někdy lze po transformaci hodnotit i četnosti• pro četnosti s Poissonovým rozdělením často
odmocninová tranformace
83 xy
Mnohonásobná porovnání
• nelze provést k (k – 1)/2 t-testů (hladina!)• Bonferroni: použít hladinu tolikrát menší, kolik
je porovnání, a to v modifikovaném dvouvýběrovém t-testu
knS
s
nns
yyt e
ri
riir
2
2
,11
náš příklad
13,3
91
81
5,1477
4,2566,31612
t
0767,0,87,1 1313 pt
0167,03/05,00041,012 p
3828,0,89,0 2323 pt
průkazný jen rozdíl mezi 1. a 2. skupinou
Kruskalův-Wallisův test
• když nelze předpokládat normální rozdělení• podobně jako Wilcoxonův test – pořadí• určit pořadí bez ohledu na skupiny• není-li mezi skupinami rozdíl, měla by být průměrná pořadí ve
skupinách podobná• test hodnotí variabilitu průměrných pořadí• příklad: 16,125, 8,2221 10
Kruskalův-Wallisův test II
• 2 = 6,62 srovnej s 20,95(2) = 5,99
• prokázán rozdíl i takto, p = 3,7 %• méně vadí i nestejné rozptyly, nejen nenormalita• není třeba znát samotná měření, stačí jejich
pořadí
Náhodné bloky
• příklad – váhové přírůstky myší
dieta 1.vrh 2. vrh 3. vrh 4. vrh 5. vrh průměr
I 6,6 10,1 5,8 12,1 8,2 8,56
II 5,2 11,4 4,2 10,7 8,8 8,06
III 7,4 13,0 9,5 11,9 9,6 10,28
IV 9,1 12,6 8,8 13,0 9,4 10,58
průměr 7,075 11,775 7,075 11,925 9,000 9,370
tabulka analýzy rozptylu
variabilita SS df MS F p
dieta 23,332 3 7,774 7,53 0,004
vrh 91,932 4 22,983 22,26 <0,001
reziduální 12,388 12 1,032
celková 127,642 19
bez přihlédnutí k vrhům by bylo reziduální MS a F :
193,152,6774,7
,52,6412932,91388,12
F
Náhodné bloky II
• kdybychom (nesprávně!) hodnotili jen diety (jednoduché třídění), neprokážeme rozdíl (p = 34 %)
• musíme vzít v úvahu rozdíly mezi vrhy• vysvětlíme tak část variability, nevysvětlená (reziduální)
variabilita klesne• podobně (místo vrhů) při opakovaných měřeních na
stejných objektech
Recommended