19
Analýza rozptylu Karel Zvára

Analýza rozptylu

Embed Size (px)

DESCRIPTION

Analýza rozptylu. Karel Zvára. Jednoduché třídění. one-way analysis of variance k nezávislých výběrů z N(  i ,  2 ) (různé populační průměry, stejné rozptyly) rozhodovat o shodě (populačních) průměrů, tj. o hypotéze rozšíření dvouvýběrového t -testu ( k = 2) - PowerPoint PPT Presentation

Citation preview

Page 1: Analýza rozptylu

Analýza rozptylu

Karel Zvára

Page 2: Analýza rozptylu

Jednoduché třídění

• one-way analysis of variance

• k nezávislých výběrů z N(i,2) (různé populační průměry, stejné rozptyly)

• rozhodovat o shodě (populačních) průměrů, tj. o hypotéze• rozšíření dvouvýběrového t-testu (k = 2)• rozklad variability vysvětlované proměnné

)k (21

Page 3: Analýza rozptylu

• celková = mezi výběry + uvnitř výběrů• celková variabilita předpokládá stejné

populační průměry• mezi výběry – variabilita průměrů vážená

velikostí výběrů (vysvětlená variabilita)• uvnitř výběrů – sečti součty čtverců

odchylek od individuálních průměrů (nevysvětlená variabilita, reziduální)

• hodnocení v tabulce analýzy rozptylu

Page 4: Analýza rozptylu

příklad

• koncentrace kyseliny listové v červených krvinkách po 24 hodinách ventilace (v každé skupině jiné složení dýchané směsi)

skupina rozsah průměr sm. odch.

1. 8 316,5 41,2

2. 9 256,4 37,1

3. 5 275,6 35,9

Page 5: Analýza rozptylu

příklad

1.0 1.5 2.0 2.5 3.0

20

02

50

30

03

50

Skupina

kyse

lin

a +

++

Page 6: Analýza rozptylu

tabulka analýzy rozptylu

variabilita SS df MS F p

skupiny 15 663,5 2 7 831,7 5,3005 0,0148

reziduální 28 073,3 19 1 477,5

celková 43 736,8 21

• na 5% hladině prokázán rozdíl (průkazný rozdíl)

• ověření předpokladů (stejně v regresi)

Page 7: Analýza rozptylu

klasický zápis modelu

• - společná úroveň všech výběrů

• i – efekt i-tého ošetření (součet = 0)

• ij – náhodná složka N(0, 2)

• hypotéza: efekty i všechny nulové

• výhoda: lze zapsat složitější strukturu

kinjy iijiij ,,1,,,1,

Page 8: Analýza rozptylu

Rezidua

• základ diagnostiky (ověření předpokladů, použitelnosti modelu)• obecně: pozorování – předpověď• zde: pozorování – průměr v dané skupině

• Se - reziduální součet čtverců = součet čtverců reziduí = variabilita uvnitř výběrů iijij yyu

Page 9: Analýza rozptylu

Stabilita rozptylu

1.0 1.5 2.0 2.5 3.0

-40

-20

02

04

06

0

skupina

resid

(a)

Bartlettův test B = 0,118, tj. p = 94,3 %

Page 10: Analýza rozptylu

Ukázka nestabilního rozptylu

1.0 1.5 2.0 2.5 3.0

-50

05

01

00

skupina

uu

Bartlettův test B = 7,67, tj. p = 2,2 %

Page 11: Analýza rozptylu

Hodnocení normálního rozdělení

-2 -1 0 1 2

-40

-20

02

04

06

0Normal Q-Q Plot

Theoretical Quantiles

Sa

mp

le Q

ua

ntile

s

Shapirův-Wilkův test W = 0,9255, p = 9,9 %

Page 12: Analýza rozptylu

Když nelze předpokládat normální rozdělení

• pořadový test (Kruskal-Wallis)• transformace vysvětlované proměnné (často

logaritmická, někdy odmocninová)• někdy lze po transformaci hodnotit i četnosti• pro četnosti s Poissonovým rozdělením často

odmocninová tranformace

83 xy

Page 13: Analýza rozptylu

Mnohonásobná porovnání

• nelze provést k (k – 1)/2 t-testů (hladina!)• Bonferroni: použít hladinu tolikrát menší, kolik

je porovnání, a to v modifikovaném dvouvýběrovém t-testu

knS

s

nns

yyt e

ri

riir

2

2

,11

Page 14: Analýza rozptylu

náš příklad

13,3

91

81

5,1477

4,2566,31612

t

0767,0,87,1 1313 pt

0167,03/05,00041,012 p

3828,0,89,0 2323 pt

průkazný jen rozdíl mezi 1. a 2. skupinou

Page 15: Analýza rozptylu

Kruskalův-Wallisův test

• když nelze předpokládat normální rozdělení• podobně jako Wilcoxonův test – pořadí• určit pořadí bez ohledu na skupiny• není-li mezi skupinami rozdíl, měla by být průměrná pořadí ve

skupinách podobná• test hodnotí variabilitu průměrných pořadí• příklad: 16,125, 8,2221 10

Page 16: Analýza rozptylu

Kruskalův-Wallisův test II

• 2 = 6,62 srovnej s 20,95(2) = 5,99

• prokázán rozdíl i takto, p = 3,7 %• méně vadí i nestejné rozptyly, nejen nenormalita• není třeba znát samotná měření, stačí jejich

pořadí

Page 17: Analýza rozptylu

Náhodné bloky

• příklad – váhové přírůstky myší

dieta 1.vrh 2. vrh 3. vrh 4. vrh 5. vrh průměr

I 6,6 10,1 5,8 12,1 8,2 8,56

II 5,2 11,4 4,2 10,7 8,8 8,06

III 7,4 13,0 9,5 11,9 9,6 10,28

IV 9,1 12,6 8,8 13,0 9,4 10,58

průměr 7,075 11,775 7,075 11,925 9,000 9,370

Page 18: Analýza rozptylu

tabulka analýzy rozptylu

variabilita SS df MS F p

dieta 23,332 3 7,774 7,53 0,004

vrh 91,932 4 22,983 22,26 <0,001

reziduální 12,388 12 1,032

celková 127,642 19

bez přihlédnutí k vrhům by bylo reziduální MS a F :

193,152,6774,7

,52,6412932,91388,12

F

Page 19: Analýza rozptylu

Náhodné bloky II

• kdybychom (nesprávně!) hodnotili jen diety (jednoduché třídění), neprokážeme rozdíl (p = 34 %)

• musíme vzít v úvahu rozdíly mezi vrhy• vysvětlíme tak část variability, nevysvětlená (reziduální)

variabilita klesne• podobně (místo vrhů) při opakovaných měřeních na

stejných objektech