Upload
lekhuong
View
235
Download
1
Embed Size (px)
Citation preview
Statistično zaključevanje(inferenčna statistika)
= zaključevanje o značilnostih populacije
ven
Inferenčna statistika
Izberemo vzorec. Določimo statistiko (npr. M).Posplošujemo z vzorca na populacijo.
• ocenjevanje parametraVprašanje: Kolikšen je parameter () v populaciji?
• testiranje hipotezVprašanje: Ali je M pomembno različna od neke vrednosti?
ven
Populacija in vzorec
• posploševanje z vzorca na populacijo • opredelitev populacije in vzorca
sestavljanje liste, s katere vzorčimo
• reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev)
• velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez
ven
Vzorčne porazdelitve
• Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo.
vzorčne porazdelitve statistik – opisnih statistik vzorca, npr. M, var, p, r…– drugih izrazov, npr.
• Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike
21
21
MMSEMM
ven
Vzorčne porazdelitve
Mstatistike
SEstatistike
M
SD
frekvenčna porazdelitev spremenljivke
vzorčna porazdelitev statistike
Vzorčne porazdelitve različnih statistik se razlikujejo:normalna, F, t, 2
ven
Vzorčne porazdelitve
Mstatistike
SEstatistike
M
SD
frekvenčna porazdelitev spremenljivke
vzorčna porazdelitev statistikeza manjše /večje vzorce
Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.
ven
NSEMX
'
Standardna napaka M
SEM = standardni odklon vzorčnih aritmetičnih sredin
Standardna napaka
Standardna napaka se z večanjem vzorca manjša.
ven
Vzorčna statistika je ocena populacijskega parametra.
Točkovna ocena parametra
• Nepristranska ocena: Sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru.
Velja za vse mere centralne tendence, deleže, korelacijske koeficiente.
• Pristranska ocena: Mere razpršenosti.Vzorčna SD podcenjuje vrednost .
1
2
2'
2
2
NXX
NXX
SD
Ocenjevanje parametra
ven
Ocenjevanje parametra
Intervalna ocena parametra
razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo B
= B-odstotni interval zaupanja
ven
Ocenjevanje parametra
Mp SEz
Intervalno ocenjevanje Mpri velikih vzorcih
SEM
vzorčna porazdelitev M je N.D.
M
0
1N (0,1)
Mp SE
Mz
z
sp zg
p / 2 / 2
1 -
SEM
vzorčna porazdelitev M
/ 2M
kk SE
z
vzorčna porazdelitev z
zsp zzg
p / 2
1 -
SDz = 1
z = 0
SDz · zp
SEM · zp
M
zgzg
Mzgzg
SEz
SEz
grafični prikaz kvantilov
ven
Ocenjevanje parametra
Pri majhnih vzorcih
SEM
Vzorčna porazdelitev M je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna.
preveriti
Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna odstopenj prostosti.
0
1
Mp SE
Mt
Mp SEtM Interval zaupanja za
df = N - 1
• Postavimo dve nasprotni si hipotezi (ničelno in alternativno).H0: V našem vzorcu je povprečni IQ enak 100 (oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100; M = 100).H1: V našem vzorcu je povprečni IQ različen od 100.(oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100; M 100).
• Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze).
Testiranje hipotez
100
SE
odvisna od velikosti vzorca
odvisna odrazpršenosti v populaciji
Če je vrednost statistike verjetna (znotraj intervala zaupanja), ohranimo ničelno hipotezo.
Testiranje hipotez
Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativna hipoteza je verjetnejša. Statistika našega vzorca se od poznanega / predpostavljenega parametra pomembno razlikuje.)
Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti statistike.
100
SE
M 100
SE
M
Napake pri statističnem zaključevanju
= 0M =
0M
dejanskostanje
naš zaključek
pravilna potrditev ničelne hipoteze
napaka
pravilna zavrnitev ničelne hipoteze
napaka
0M
= 0M =
zkrit.
Napake pri statističnem zaključevanju
zzkrit.
napaka
napaka
zkrit.zzkrit.
Mp SE
Mz
ven
• primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra)
• primerjava statistik dveh vzorcev• primerjava statistik več vzorcev
Ali so vrednosti preveč različne?Ali vzorci pripadajo isti populaciji?
Raziskovalni načrti z 1 NV in 1 OV
ven
Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo
SEM
M
H0: M = H1: M
0
1
z
Mp SE
Mt
t primerjamo s tkrit tkrit.tkrit.
Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo
H0: M = 6.0H1: M
Študenti v povprečju na nekem testu dosegajo rezultat 6.0,rezultati testa v naši skupini pa so bili naslednji:9 7 4 11 10 8 7 10 7 4 7 10 8 10 6 8 10 7 8 9
Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0?
Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale 2.09. Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %. Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0.
M = 8.0’ = 1.95SEM = 1.95 / Sqrt(20) = 0.44t = (8.0 - 6.0) / 0.44 = 4.60df = N - 1 = 19tkrit (19) = 2.09t > tkrit
0.44
8.0 --- t = 4.6
t-test
Ali oba vzorca izhajata iz iste populacije?Je razlika med njunimi M ničelna? Ima NV vpliv na OV?
Primerjava povprečij dveh vzorcev
SE SE SEn nX X X X1 2 1 2
2 2 12
1
22
2
21
21
XXSEXXt
Pr.1 S1 S2 7.0 7.514.0 5.010.0 5.011.0 6.0 8.5 1.0 5.0 6.0 4.5 9.011.0 3.0 9.0 6.010.0 7.0
M 9.00 5.55’ 2.90 2.27var’ 8.41 5.15
t = (9.00-5.55) / 1.16 = 2.97df = 10+10-2 = 18; t.05(18) = 2.101
Primer t testa dva neodvisna vzorca
Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna. Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost 2.101. Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (to, iz katere skupine držav je učenec) je imela učinek na merjeno odvisno spremenljivko (znanje slovenščine).
kritični t
1.16 10272.2
102.902 SEd
Vprašanje:Ali se študenti iz EU po znanju slovenščine razlikujejo od študentov iz drugih držav?
Analiza variance
• preverjamo pomembnost razlik med sredinami več vzorcev
• meritve v več pogojih (oz. vzorčenje iz več populacij)
• H0: ni razlik med njihovimi
Primerjava povprečij več vzorcev
ven
Analiza variance
• preverjamo pomembnost razlik med sredinami več vzorcev
• meritve v več pogojih (oz. vzorčenje iz več populacij)
• H0: ni razlik med njihovimi
skupinznotrajostiabiskupinamimedostiabiF
__lnvar__lnvar
ven
Analiza variance
Ocena variance
Skupno varianco vseh podatkov lahko razstavimo na dva dela:• varianco napake, ki je posledica:
– napak merjenja (slabih merskih instrumentov), – napak kontrole (zunanjih spremenljivk), – razlik med posamezniki
• varianco, nastalo zaradi učinkov neodvisne spremenljivke
2
2
1
X XN
vsota kvadratov odklonov (SS)df
Analizavariance
totjjijtotij MMMYMY
Mtot Mj Yi
222totjjijtotij MMMYMY
skupna variabilnost
variabilnostznotraj skupin
variabilnostmed skupinami
1
aSS
dfSSMS med
med
medmed 1
na
SSdfSSMS zn
zn
znzn
zn
med
MSMSF
2 3 4 5 6 7 8 9 10 11 12MT = 7
SSznotraj-1 = 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12SSmed = 9(4-7)2 + 9(10-7)2 = 81 + 81 = 162
dfznotraj = N - a = 18 - 2 = 16 dfmed = a - 1 = 2 - 1 = 1
MSznotraj = SSznotraj / dfznotraj = 24 / 16 = 1.5MSmed = SSmed / dfmed = 162 / 1 = 162F = 162 /1.5 = 108Ft (1,16) = 4.49
Primer analize variance za dva vzorca
ven
Tabela povzetka analize variance
izvor variabilnost SS df MS F p
NV 162 1 162.0 108 < .001
napaka 24 16 1.5
skupaj 186 89
Skupina 1 (M = 4.0, SD = 1.2) je dosegla statistično pomembno drugačne rezultate od skupine 2 (M = 10.0, SD = 1.2), F (1, 16) = 108, p < .001.
Primer analize variance za dva vzorca
t-test ven
Analiza variance
• neponovljene in ponovljene meritve• pogoji:
– nominalna NV– OV na vsaj intervalni merski ravni– normalna porazdelitev spremenljivke v populaciji– enakost varianc vzorcev
• analiza variance za več NV– dvosmerna, trismerna ANOVA– glavni učinki + interakcija med NV
ven
Statistično zaključevanje za frekvence
• Opis: tabele, frekvenčni poligoni, histogrami
• Običajna vprašanja:- enakost deležev kategorij pri več vzorcih- ujemanje dejanskih podatkov s pričakovanimi, testiranje hipotez o obliki porazdelitve - povezanost (interakcija) med dvema nominalnima spremenljivkama
ven
2 test za eno spremenljivko
• Ali je višja pogostost ene kategorije slučajna?• pričakovane frekvence• H0: Populacijska frekvenčna distribucija je enaka
pričakovani.• odstopanje dejanskih od pričakovanih vrednosti
… Pearsonov 2 - približek 2 distribucije
df = a - 1
2
2
f f
fe t
t
ven
Primer 2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah)
Delež izbir napačnih alternativ na vprašanju zaprtega tipa: a) b) c)fe 30 40 80 skupaj 150dejanski delež 0.20 0.27 0.53ft 50 50 50teoretični delež 0.33 0.33 0.33
2(2) = (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28kritična vrednost 2 pri 5% tveganju: 5.99
Naš dobljeni 2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost 2 po slučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato 2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjer osebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni.
ven
2 test odvisnosti dveh spremenljivk
• kontingenčna tabela• H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh ravneh
ene spremenljivke so ravni druge enako izražene).• pričakovana frekvenca ft = fvrsta fstolpec / N• v vsakem polju izračunamo
• seštejemo izračune v vseh poljih, dobimo 2
• Dobljeno vrednost primerjamo s kritično vrednostjo 2 df = (število vrstic - 1) (število stolpcev - 1)
t
te
fff 2
ven
uspešnost pri nalogi 1+ -
ženske 36 14 50(29) (21)
moški 22 28 50(29) (21)
58 42 100
2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1kritična vrednost:2
.05 (1) = 3.841
Naš dobljeni 2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorec vlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški.
robna vsota frekvenc
V oklepajih so navedene teoretične frekvence.
robna vsotafrekvenc
število vseh oseb
Previdnost!
• Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta.
• Statistična pomembnost je relativen pojem. Raste z velikostjo vzorca.------- Pregledati velikost učinka
• Ni statistično pomembno = ni dokazano.Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.
• V nekaterih primerih parametričnih testov ne moremo uporabiti.
ven
Izbor ustreznega statističnega testa
• vrsta statistike• raven merjenja• normalnost porazdelitve• enakost varianc • odvisni / neodvisni vzorci• majhni / veliki vzorci• vrednost ničelne hipoteze• nivo tveganja• enosmerno / dvosmerno testiranje
Neparametrični testi• pogosto pri majhnih vzorcih, pri
omejenosti razpona, stališča (U-porazdelitev)
• Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij - nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).
ven
Testiranje hipotez o povprečjuPovprečja
N.D.parametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
t test(independent)
t test(paired-samples)
t test(one-sample)
več vzorcev
neodvisnih odvisnih
enosmerna ANOVA(GLM - univariate)
enosmerna ANOVA(GLM - repeated-measures) ven
Testiranje hipotez o povprečjuPovprečja
ni N.D.neparametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
- Mann- Whitneyev U- medianski test
- Wilcoxonov T test (matched pairs)- test predznakov
binomski test
več vzorcev
neodvisnih odvisnih
- Kruskal- Wallisov H- razširjeni medianski test
Friedmanovtest
ven
Osnovna literatura
• Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.
• Graveter, F.J., in Wallnau, L.B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning.
• Pagano, R.R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning.
• Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap.
• Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning.
• Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.
ven