13
Varianciaanalízis 12. gyakorlat

Varianciaanalízis

Embed Size (px)

DESCRIPTION

Varianciaanalízis. 12. gyakorlat. ANOVA: ANalysis Of VAriance Neve félrevezető: nem varianciák, hanem átlagok összevetésére dolgozták ki Lényegében a kétmintás t-próba kiterjesztése kettőnél több alapsokaság ismeretlen várható értékének az összehasonlítására. - PowerPoint PPT Presentation

Citation preview

Page 1: Varianciaanalízis

Varianciaanalízis

12. gyakorlat

Page 2: Varianciaanalízis

• ANOVA: ANalysis Of VAriance

• Neve félrevezető: nem varianciák, hanem átlagok összevetésére dolgozták ki

• Lényegében a kétmintás t-próba kiterjesztése kettőnél több alapsokaság ismeretlen várható értékének az összehasonlítására.

Page 3: Varianciaanalízis

• Mit vizsgálunk az ANOVA-val:egy folytonos változónak vajon eltérőek-e a várható értékei egy nominális változó különböző kategóriáiban, avagy több nominális változó kategóriáiból képezhető kategória-kombinációkban.

Folytonos változó: függő változóNominális változó(k): magyarázó változók

Faktor (tényező), a kategóriák csoportok.

B faktor

  B csop 1 B csop 2 B csop 3

A faktorA csop 1 A1B1 A1B2 A1B3

A csop 2 A2B1 A2B2 A2B3

Page 4: Varianciaanalízis

• A faktorok számától függően beszélhetünk– egyfaktoros (egytényezős, egy szempontos, egy utas,

one-way ANOVA) – többfaktoros (többtényezős, több szempontos, több

utas, multi-way ANOVA) varianciaelemzésről.

• A csoportokban levő mintavételi objektumok száma ha– azonos minden csoportban → kiegyensúlyozott

(balanced) elrendezésű ANOVA– eltérő a csoportokban → kiegyensúlyozatlan

(unbalanced) elrendezésű ANOVA

Page 5: Varianciaanalízis

• A varianciaanalízis munkamenete:– megvizsgáljuk, hogy van-e hatása a

faktoroknak (F-próba)– ellenőrizzük, hogy az adatainkra illesztett

ANOVA modell teljesíti-e az alkalmazhatósági feltételeket

– ha a modellünk megfelel a feltételeknek, akkor ún. post-hoc teszteket alkalmazva megvizsgáljuk azt, hogy mely csoportok átlagai különböznek egymástól.

Page 6: Varianciaanalízis

Egyfaktoros ANOVA kiegyensúlyozott elrendezéssel

• A módszer alapgondolata:– A függő változó teljes varianciája additív

módon felbontható két részre:• csoportok közötti varianciára

(between group variance) - a csoportátlagoknak az összevont Y adatok átlaga (ún. főátlag) körüli variációja;a magyarázó változó hatását foglalja magába

• csoporton belüli varianciára(within group variance) - az egyedi yi megfigyeléseknek az adott csoportjuk átlaga körüli ingadozásából eredő variáció;a véletlen eseti hibát foglalja magába.

Page 7: Varianciaanalízis

yCl

Page 8: Varianciaanalízis

• Ha a faktornak van hatása Y-ra:– a csoportok közötti variancia rész nagyobb, mint a

csoporton belüli variancia.

• Ha nincs hatása Y-ra:– a csoportok közötti variancia megegyezik a csoporton

belüli varianciával– ez azt jelenti, hogy Y értékét nem befolyásolja az,

hogy egy megfigyelés a faktor melyik csoportjába tartozik, az Y értékei között tapasztalt különbségek a véletlen ingadozásnak tudhatók be.

Page 9: Varianciaanalízis

• Az egyes varianciafrakciók számszerűsítése eltérés-négyzetösszegekkel történik

• A teljes eltérés-négyzetösszeg (SStotal) a csoportok közötti (SSbetween) és csoporton belüli (SSwithin) eltérés-négyzetöszeg összege:

• A lineáris regressszóhoz hasonlítva:a csoportok közötti eltérés-négyzetösszeg a regressziós, míg a csoporton belüli pedig a hiba eltérés-négyzetösszegnek felel meg.

withinbetweentotal SSSSSS

Page 10: Varianciaanalízis

• A függő változó teljes varianciája:

• A csoportok közötti variancia:

• A csoporton belüli variancia:

n

iitotal YySS

1

2)(

k

jjbetween YySS

1

2)(

k

j

m

ljjlwithin yySS

1 1

2)(

Page 11: Varianciaanalízis

A faktor hatásának szignifikanciatesztje• Próbastatisztika:

A csoportok közötti és a csoporton belüli eltérés-négyzetösszeget osztva a szabadsági fokaikkal:közepes eltérés-négyzetösszegeket (Mean of Sum of squares).

A csoportok közötti és a csoporton belüli közepes eltérés-négyzetösszeg hányadosa az F próbastatisztika (ld. a köv. dián!)

• H0:a csoportok alapsokaságbeli átlagai azonosak:µ1 = µ2 = … = µk

• H1:van legalább két olyan csoport, melyeknek különbözik az alapsokaságbeli átlaga. (egyoldali hipotézis!)

Page 12: Varianciaanalízis

A variancia-felbontás és az F-próba

eredménye - ANOVA-táblázat

Variancia forrása

Szabad-ságifok(df)

Eltérés-négyzeösszegSS(Sum ofSquares)

közepes eltérés-négyzetösszeg MS(Mean Sum of Squares)

Próbastatisztika(F-value)

p-érték

Csoportokközötti(between

groups)

k-1 SSbetween MSbetween=SSbetween/k-1

F=MSbetwen/MSwithin

p

Csoportonbelüli(within groups)

k(m-1) SSwithin MSwithin=SSwithin/k(m-1)

Teljes(total)

k×m-1 SStotal MStotal=SStotal/k×m-1

Page 13: Varianciaanalízis

• Alkalmazhatósági feltételek:– függetlenség:

a mintavételi objektumok függetlenek egymástól– normalitás:

a csoportokon belül a függő változó normál eloszlású– homogenitás:

a csoportokban a függő változó szórása azonos, vagyis nincs összefüggés Y csoportbeli szórása és a csoport várható értéke között

• Az alkalmazhatósági feltételek ellenőrzéseAz ANOVA modell feltételeinek ellenőrzése a regresszióelemzéshez hasonlóan a reziduálisok vizsgálatával történik