Upload
trinhthuan
View
236
Download
5
Embed Size (px)
Citation preview
1
IV. Változók és csoportok összehasonlítása
2
Tartalom Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta átlagának
egyszempontos összehasonlítása
3
Példa összetartozó mintákra
4
Hogyan juthatunk összetartozó mintákhoz?
Változás vizsgálata Önkontrollos kísérletek Ugyanazon a skálán mért változók
összehasonlítása Összetartozó párok (házaspárok)
vizsgálata
5
Független minták
6
Hogyan juthatunk független mintákhoz?
1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket.
2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint
vagy a nem szerint.
7
Két összetartozó minta összehasonlítása
1) Átlagok összehasonlítása Pl. ugyanakkora-e egy párt szimpátiaszintje egy
választás előtt és után? Ugyanakkora-e az X változó elméleti átlaga két
helyzetben vagy időpontban? H0: μ = μ
2) Növekedés-csökkenés vizsgálata Csökkenti-e a szorongást egy terápiás eljárás? H0: Növekedés esélye = Csökkenés esélye
8
Pulzus két helyzetben (n = 115)
0
20
40
60
80
100
120
PE PK
szórás
átlag
9
Anya és apa testmagassága (n = 500)
100
110
120
130
140
150
160
170
180
190
AnyaTestmag ApaTestmag
szórás
átlag
10
Két összetartozó minta átlagának összehasonlítása
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két helyzetben vagy időpontban?
Nullhipotézis: H0: μ = μ
Próbastatisztika:
t = (y – x)/SEdif
11
Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
12
Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
13
Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
14
Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
15
Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
16
Két példa Pulzus beavatkozás előtt és után (n = 115):
– Változás átlaga (y - x) = 6,17
– t(114) = 3,987, p = 0,0001 (p < 0,001) Anya és apa testmagassága (n = 500):
– anya-átlag = 161,12, apa-átlag = 173,35
– Különbség átlaga (y - x) = 12,23 (cm)
– t(499) = 36,396, p = 0,000 (p < 0,001)GYAK
17
Az egymintás t-próba alkalmazási feltétele
A különbségváltozó normalitása Ha a minta kicsi? Ha a minta nagy?
Robusztus alternatívák Johnson-próba Gayen-próba
GYAK
18
Változás vizsgálata arányskálájú változók segítségével
Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra?
Nullhipotézis: E(Y/X) = 1 Próba: Egymintás t-próba Kiszámítandó: Változás aránya
személyenként (Y/X)
19
Változás vizsgálata egy másik próba segítségével
Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra?
Nullhipotézis: Növekedés esélye = csökkenés esélye
Próba: Előjelpróba Kiszámítandó: Pozitív és negatív
változások száma GYAK
20
Két független minta összehasonlítása
21
Hogyan juthatunk független mintákhoz?
1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket.
2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint
vagy a nem szerint.
22
Csoportdefiniálás a ROPstatban
1. Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok
1. Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú
GYAK
23
Férfiak és nők feminitása (n = 82)CPI-Feminitás skála
0
2
4
6
8
10
12
14
16
18
Nők Férfiak
szórás
átlag
24
Apa érettségije és gyerekének matematika jegye (n = 3507)
Matek-jegy a 8. osztály végén
0
1
2
3
4
5
6
Apa érettségi nélkül Apa érettségivel
szórás
átlag
25
Két független minta átlagának összehasonlítása
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban?
Nullhipotézis: H0: μ = μ
Próbastatisztika:
t = (y – x)/SEdif
26
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
27
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
28
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
29
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
30
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
31
Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82):
– X-átlag = 12,1, Y-átlag = 14,0– t(80) = -2,95, p = 0,0041 (p < 0,01)
Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507):– X-átlag = 4,06, Y-átlag = 3,82– t(3505) = 6,38, p = 0,000 (p < 0,001)
GYAK
32
A kétmintás t-próba alkalmazási feltételei
Különbségváltozó normalitása
Elméleti szórások egyenlősége: σ = σ
Szóráshomogenitás tesztelése: milyen próbákkal?
Kétmintás t-próba robusztus alternatívája?
33
Példa CPI-Fem skála, Férfiak vs. Nők (N = 82):
– X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0)
Szóráshomogenitás tesztelése: – Levene-próba: F(1; 14,6) = 3,409 (p =
0,0852)+
Átlagok összehasonlítása:– Kétmintás t: t(80) = -2,95 (p = 0,0041)**– Welch-féle d: d(13,1) = -2,37 (p = 0,0337)*
GYAK
Kezelési hatás két független minta esetén
Elméleti változás (különbség): 1 � 2
Cohen-féle delta (átlagok standardizált különbsége): (1 � 2)/
Mintabeli becslés: d = (x1x2)/se
Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK
35
Kettőnél több független minta átlagának összehasonlítása
36
-60
-40
-20
0
20
40
60
80G
BR
-csö
kken
és
Agr1 Agr2 Agr3 Fény Verbális
Kísérleti csoport
37
Különbözik-e a minták elméleti nagyságszintje?
Két ellentétes hatás: Minél jobban szóródnak a mintaátlagok,
annál jobban eltérnek egymástól a minták. Minél jobban szóródnak az adatok az egyes
mintákon belül, annál nagyobb az átfedés, annál kevésbé különböztethetők meg egymástól a minták.
38
-60
-40
-20
0
20
40
60
80G
BR
-csö
kken
és
Agr1 Agr2 Agr3 Fény Verbális
Kísérleti csoport
39
Varianciaanalízis (VA)
Vark = Átlagok varianciája = Hatásvariancia
Varb = Minták átlagos varianciája = Hibavariancia
Próbastatisztika: F = Vark/Varb
F = Hatásvariancia/Hibavariancia
40
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású.
Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
41
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású.
Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
42
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású.
Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
43
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású.
Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
44
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású.
Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
45
VA alkalmazási feltételei
Minták függetlensége Normalitás Elméleti szórások egyenlősége
(szóráshomogenitás): σ1 = σ2 = ... = σI
KonkrétKonkrét példa példa
Agr1 Agr2 Agr3 Fény Verb.
n i 5 4 6 4 4
xi 14,50 6,75 5,20 -13,45 -30,08
s i 29,60 9,15 6,96 13,11 14,57
Levene-próba:F(4; 7) = 0,784 (p > 0,10, n. sz.)
O’Brien-próba:F(4; 8) = 1,318 (p > 0,10, n. sz.)
Szóráshomogenitásellenőrzése
GYAK
• Hatásvariancia: Vark = 1413,9
• Hibavariancia: Varb = 286,2
• F próbastatisztika:
F(4; 18) = 4,940**
• p-érték: p = 0,0073 (p < 0,01)
Hagyományos VA
GYAK
49
Mit csináljunk, ha a szórás-homogenitás feltétele erősen sérül?
Robusztus varianciaanalízisek Welch-próba James-próba Brown-Forsythe-próba
Welch-próba:W(4; 7,8) = 5,544* (p = 0,0203)
James-próba:U = 27,851* (p < 0,05)
Brown-Forsythe-próba:BF(4; 9) = 5,103* (p = 0,0200)
Robusztus VA-k
GYAK
51
H0 elutasítása esetén utóelemzés: az összes átlag páronkénti
összehasonlításaHa az elméleti átlagok különböznek, hogyan
teszik ezt? Mi az eltérések mintázata?Cél: úgy végezzük el az összes páronkénti ösz-
szehasonlítást, h. az I. fajta hiba ne nőjön meg.Szóráshomogenitás OK: Tukey-Kramer-próbaSzóráshomogenitás sérül: Games-Howell-próba
Tukey-Kramer-próba: T12= 0,97 T13= 1,28T14= 3,48 T15= 5,55**T23= 0,20 T24= 2,39T25= 4,35* T34= 2,42T35= 4,57* T45= 1,97
A bemutatott példa utóelemzése
GYAK
• Legszignifikánsabb különbség az 1. és az 5. minta átlaga között van (T15**)
• Az 5. minta (Verbális) átlaga három másik átlagtól is szignifikánsan különbözik (T25*, T35*, T15**)
• Az 5. minta (Verbális) kilógása okozza az öt átlag szignifikáns különbségét.
Utóelemzés konklúziói
GYAK
Kezelési hatás több független minta esetén
• Megmagyarázott variancia-arány (nemlineáris determinációs együttható): eta-négyzet
e2 = Hatás variabilitás/Teljes variabilitás
• Korrelációs hányados (nemlineáris korrelációs együttható): eta
GYAK
55
Mit csináljunk, ha a függő változó normalitása nagyon sérül?
Összehasonlított populációk homogenitásának tesztelése rangsorolásos eljárásokkal.
Szakmai kérdés: kilóg-e valamelyik populáció (alulról vagy felülről) a többi közül?
Nagyobbak-e (kisebbek-e) valamelyik populációban az adatok, mint a többiben?
56
Kettőnél több összetartozó minta átlagának
összehasonlítása
Minden nagyjából úgy történik, mint független minták esetén, csak más képletekkel.
57
Eltérések
A szóráshomogenitás a változók páronkénti különbségeire vonatkozik (szfericitás)
A szóráshomogenitás sérülésének mértékét az epszilon együtthatók jelzik
Robusztus alternatívák (Greenhouse-Geisser, Huynh-Feldt)
Átlagok páronkénti összehasonlítása (Tukey)
Egy Egy konkrétkonkrét példa példa
Változó átlag szórás
Pulzus1 91,5 22,6
Pulzus2 97,7 21,5
Pulzus3 90,7 18,6
Hatásvariancia: Vark = 1686,9
Hibavariancia: Vare = 121,4
F-érték: F(2; 226) = 13,896***
Átlagok páronkénti összehas.:T12= 6,01** T13= 0,82 T23= 6,83**
Hagyományos VA
GYAK
Geisser-Greenhouse-féle ε:ε = 0,964
Huynh-Feldt-féle ε:ε = 0,980
Szabadságfok korrekció: A robusztus próbáknál ilyen arányban csökkennek a szabadságfokok
Epszilon együtthatók
Geisser-Greenhouse-féle VA:F(2; 218) = 13,896*** (p = 0,0000)
Huynh-Feldt-féle VA:F(2; 222) = 13,896*** (p = 0,0000)
Konklúzió: A 2. (intervenció alatt mért) pulzus kilóg a többi közül.
Robusztus VA-k
GYAK