25
1 Projektas „Lietuvos HSM duomenų archyvo LiDA plėtra“ SFMIS Nr. VP1-3.1-ŠMM-02-V-02-001 SEMINARO „INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE“ MEDŽIAGA Vydas Čekanavičius (Paslaugų sutartis Nr. SA-2010-771/2, 2010-12-22) Kaunas, 2011 m.

Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

  • Upload
    doantu

  • View
    246

  • Download
    6

Embed Size (px)

Citation preview

Page 1: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

1

Projektas

„Lietuvos HSM duomenų archyvo LiDA plėtra“

SFMIS Nr. VP1-3.1-ŠMM-02-V-02-001

SEMINARO „INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE“

MEDŽIAGA

Vydas Čekanavičius

(Paslaugų sutartis Nr. SA-2010-771/2, 2010-12-22)

Kaunas, 2011 m.

Page 2: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

2

Turinys

1. Įvadas į statistinių hipotezių tikrinimą ........................................................................................................... 3

2. Hipotezių apie vidurkių lygybes tikrinimas .................................................................................................... 6

2.1 T – testas 1 imčiai .................................................................................................................................... 6

2.2. T – testas 2 nepriklausomoms imtims ..................................................................................................... 7

2.3 T – testas 2 priklausomoms imtims (porinis t testas) .............................................................................. 9

2.4 ANOVA .................................................................................................................................................... 10

2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) .............................................................. 13

3. Neparametriniai kriterijai ............................................................................................................................. 15

3.1 Mann – Whitney testas .......................................................................................................................... 16

3.2 Wilcoxon testas ..................................................................................................................................... 17

3.3 Kruskal – Wallis testas ............................................................................................................................ 18

3.4 Friedman testas ..................................................................................................................................... 20

4. Požymių priklausomumo (kryžminių lentelių) analizė. ................................................................................ 21

4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas .................................................................... 21

4.2 Chi kvadrato suderinamumo testas ....................................................................................................... 23

Literatūra .......................................................................................................................................................... 25

Page 3: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

3

1. Įvadas į statistinių hipotezių tikrinimą

Statistinės išvados (inferencinė statistika) turi vienintelį tikslą – ištyrus dalį respondentų (imtį,

imtis), padaryti išvadą apie visą populiaciją (populiacijas).

Įsivaizduokime dvi situacijas:

1) Virėjas paragauja sriubos ir nusprendţia – trūksta druskos.

2) Ekranţvaigţdė visiems TV ţiūrovams paaiškina – visi jie tokie!

Abi šios išvados yra akivaizdţiai statistinės. Virėjas prarijo šaukštą sriubos, o išvadą padarė apie

visą puodą. Ekranţvaigţdė savo patirtį apibendrino pagal gal ir nemaţą dalį, bet vis tiek tik dalį

visų jų. Matome, kad kartais apibendrinimai visiškai tikėtini (virėjas), o kartais labai abejotini

(ţvaigţdė). Inferencinėjs statistikoje viskas formalizuojama ir dar įvertinama, kiek galima tikėti

priimtu sprendimu. Visą statistinių hipotezių tikrinimą galima išskaidyti į tokius etapus:

a) Tyrimo hipotezės iškėlimas.

b) Statistinės hipotezės formulavimas.

c) Duomenų analizė.

d) Išvadų surašymas.

Aptarsime kiekvieną etapą atskirai. Tyrimo hipotezė – tai ta problema, kuri iš tikrųjų ir jaudina

tyrėją. Ji glaudţiai susijusi su tyrimo srities specifika. Pavyzdţiui, hipotezė, kad latviai valgo

daugiau ţuvies, nei lietuviai, yra sociologo (ar kulinaro, ar mediko) tyrimo hipotezė. Ji grindţiama

istoriniu kontekstu – Latvija visą laiką buvo jūrų valstybė, o Lietuva tik priešokiais, kai

prasibrukdavo prie Baltijos per kryţiuočius. Statistikos čia dar nėra. Kai politikas pasamprotauja,

kad parlamentarų darbo efektyvumas išaugs, jei jie kalbas sakys, stovėdami ant vienos kojos

(kairieji – ant kairės, dešinieji – ant dešinės), tai irgi yra tyrimo, o ne statistinė hipotezė. Ji

grindţiama ne faktais, o loginiu samprotavimu, kad tada šnekama bus trumpiau ir labiau iš esmės.

Statistinė hipotezė – tai tyrimo hipotezės formalizavimas (ir truputį matematizavimas). Visų

pirma, atitrūkstama nuo specifikos ir viskas uţrašoma standartiniais terminais. Jeigu lyginamos

vidutinės reikšmės, tai statistinė hipotezė formuluojama vidurkiams. Jeigu kalbama apie kintamųjų

priklausomybę, tai daţniausiai statistinė hipotezė keliama apie koreliacijos tarp kintamųjų stiprumą.

Standartinėse statistinėse hipotezėse naudojami tik šie terminai: vidurkiai, dispersijos,proporcijos

(procentai), koreliacija. Neparametrinėje statistikoje dar lyginami skirstiniai. Tarkime, norint

įvertinti parlamentarų darbo efektyvumą, galima tiesiog kalbėti apie vidutinį sprendimo priėmimo

laiką. Norėdami išsiaiškinti, ar vienakojis šnekėjimo metodas iš esmės efektyvesnis, turime

Page 4: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

4

ankstesnį vidutinį sprendimų priėmimo laiką (paţymėkime jį simboliu a) palyginti su vienakojiškų

sprendimų vidutiniu laiku (paţymėkime jį simboliu ).

Visos statistinės hipotezės formuluojamos, kaip du alternatyvūs teiginiai: H0 (nulinė hipotezė),

tai teiginys apie parametrų skirtumų nebuvimą, o H1 (alternatyvioji hipotezė) – teiginys, kad

parametrai skiriasi.

H0: parametrų skirtumas yra lygus nuliui.

H1: parametrų skirtumas yra nelygus nuliui.

Net ir neparametrinėse hipotezėse skirtumas skelbiamas tik alternatyvoje H1. Pavyzdyje apie

politikus statistinė hipotezė uţrašoma taip:

H0: = a,

H1: ≠a

Ţinoma, yra ir vienpusių alternatyvų, pavyzdţiui H1: a. Reikia tik atsiminti, kad griežtos

nelygybės rašomos tik alternatyvose H1. Jos niekada nerašomos nulinėje hipotezėje H0.

Duomenų analizė – tai tinkamo statistinio kriterijaus parinkimas ir taikymas. Tiriama tik dalis

populiacijos (imtis), o apibendrinama visai populiacijai. Taip ir apsirikti galima. Klaidingi

sprendimai gali būti dviejų rūšių: kai be reikalo atmetame H0 (vadinamoji pirmos rūšies klaida) ir,

kai H0 neteisinga, o mes jos neatmetame (vadinamoji antros rūšies klaida). Minimizuoti abiejų

rūšių klaidas neįmanoma, todėl visuotinai sutarta daugiau dėmesio skirti pirmos rūšies klaidai. Kaip

taisyklė, daţniausiai siekiama parodyti, kad galioja H1 . Pavyzdţiui, politikas norėtų įrodyti, kad jo

siūlomas sprendimų pagreitinimo metodas veikia. Todėl iš anksto nusistatoma, koks maksimalus

leistinas neteisingų H0 atmetimų procentas. Tai vadinamasis reikšmingumo lygmuo. Daţniausiai

naudojamas reikšmingumo lygmuo yra 0,05. Tai reiškia, kad jeigu jau H0 atmesime, tai klaidos

tikimybė neviršys 5%.

Šiais laikais, kai statistinių hipotezių tikrinimui visuotinai naudojamos statsitinė programos,

sprendimai priimami atsiţvelgus į vadinamąsias p reikšmes. P reikšmė – tai konkretiems tiriamiems

duomenims apskaičiuota tikimybė, atmetant H0, padaryti klaidą. Šis apibrėţimas skamba labai

panašiai, kaip reikšmingumo lygmens apibrėţimas. Vis dėlto yra esminis skirtumas –

reikšmingumo lygmuo, tai teorinis etalonas, nurodantis leistiną klaidingų sprendimų procentą, o p

reikšmė yra konkreti konkretaus sprendimo klaidos tikimybė. Ji gali būti daug maţesnė uţ

reikšmingumo lygmenį (tada galima atmesti H0), o gali jį ir viršyti (tada H0 neatmetame).

Page 5: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

5

Reikšmingumo lygmuo – iš anksto pasirinktas idealas (ne daugiau 5% klaidų), o p-reikšmė –

kiekvienai duomenų aibei sava tikimybė.

H0 atmetame, kai p-reikšmė < 0,05 (reikšmingumo lygmuo).

Kuo imtis didesnė, tuo p reikšmė maţesnė (jau taip jos skaičiuojamos). Todėl labai didelėms

imtims galime gauti maţas p reikšmes, vien dėl duomenų gausos.

Nors trokštamos išvados daromos apie populiacijos parametrus, jos visada formuluojamos,

imties duomenims ir visada naudojant ţodţių derinį statistiškai (ne)reikšminga. Ši frazė – grynų

gryniausias ţargonizmas. Ji tereiškia, kad (ne)labai tikėtina, jog H0 neteisinga. Pavyzdţiui, sakinys

imties vidurkis statistiškai reikšmingai skiriasi nuo skaičiaus a, tereiškia tokį samprotavimą:

sprendţiant iš imties duomenų, tikimybė, kad tikrasis vidurkis skiriasi nuo a labai didelė (didesnė

uţ 0,95, t.y. 95 %) . Teiginys imties vidurkis statistiškai reikšmingai nesiskiria nuo skaičiaus a

tereiškia, kad tikimybė, kad tikrasis vidurkis skiriasi nuo a maţesnė uţ 95 %. Bet tai dar

nereiškia, kad galima teigti, jog vidurkis lygus a. Gal lygus, o gal nelygus. Tiesiog pritrūko

įrodymų, kad nelygus. Panašiai, kaip paleidţiant įtariamąjį dėl įrodymų stokos.

Frazė statistiškai reikšmingas skirtumas interpretuotina taip: imtyje uţfiksuotas toks didelis

skirtumas, jog labai tikėtina, kad tai neatsitiktinumas ir toks skirtumas egzistuoja ir populiacijoje.

Reikia nepamiršti, kad statistiškai reikšmingi skirtumai gali atsirasti ir dėl didelio duomenų

skaičiaus. Todėl nereikia maišyti sąvokų statistiškai reikšmingas skirtumas ir prasmingas skirtumas.

Statistiškai reikšmingai sprendimas priimamas greičiau. Visomis trimis sekundėmis. Pelnas išaugo

statistiškai reikšmingai. Visu centu per metus. Ir ką – labai daug prasmės tokiame statistiniame

reikšmingume?

Statistiškai reikšmingas skirtumas gali būti visai nesvarbus tyrėjo išvadoms.

Įvado pabaigai priminsime keletą, ţemiau naudojamų sąvokų.

Skirstinys: Kintamojo įgyjamos reikšmės ir jų įgijimo tikimybės. Maţdaug: ţinau visas galimas

matuojamo kintamojo reikšmes ir kiek procentų respondentų populiacijoje jas turi.

Normalus kintamasis: kintamasis, kuris turi normalųjį skirstinį. Jo reikšmės išsibarsčiusios pagal

pakankamai bjauriai matematiškai aprašomą dėsnį. Praktikoje intervaliniai kintamieji, kurių

Page 6: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

6

dauguma reikšmių yra netoli vidurkio ir kurie pakankamai simetriški laikomi beveik normaliais.

Normalių kintamųjų histogramos:

Visuose pavyzdţiuose naudojami duomenys paimti iš http://www.lidata.eu/ . Tyrimuose

naudosime:

1) „Studijų rezultatų kokybė: universitetų absolventų integracijos darbo rinkoje tyrimas“ duomenis:

LiDA0146_LAMS_STUDY_F1.

2) 2008 metų Europos Sąjungos socialinio klausimyno (European Social Survey) Lietuvos, Estijos

ir Portugalijos duomenis ESS4LT, ESS4EE ir ESS4PT.

3) Lietuvos vartotojų 2005 m tyrimas LiDA003_ZTLT_F1.

2. Hipotezių apie vidurkių lygybes tikrinimas

2.1 T – testas 1 imčiai

Visų pirma susitarsime dėl terminų:

Stjudento kriterijai dar vadinami t testais. Ir atvirkščiai.

Duomenys: 1 normali intervalinė imtis.

Statistinė hipotezė:

H0 atmetame (imties vidurkis statistiškai reikšmingai skiraisi nuo a), jei p-reikšmė < 0,05.

Page 7: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

7

Pavyzdys: Ar 20-30 metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6?

Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes. Tada renkamės Analyze →

Compare Means → One sample T test. Į langelį Test Variable(s) įkeliame happy, o langelyje

Test Value uţrašome 6. Paspaudţiame OK.

Pirmojoje lentelėje pateikiamas imties vidurkis 6.88 (144 respondentai).

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

happy How happy are you 144 6.88 1.857 .155

Antrojoje lentelėje stulpelyje Sig. (2-tailed) uţrašyta p reikšmė = 0,000. Kadangi p < 0,05, tai

darome išvadą, jog tiriamos amţiaus grupės lietuvių laimingumo vidurkis (6.8) statistiškai

reikšmingai didesnis uţ 6.

One-Sample Test

Test Value = 6

t df Sig. (2-tailed)

Mean

Difference

95% Confidence Interval of the

Difference

Lower Upper

happy How happy are you 5.700 143 .000 .882 .58 1.19

2.2. T – testas 2 nepriklausomoms imtims

Duomenys: 2 normalios nepriklausomos intervalinės imtys.

Statistinė hipotezė:

H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Page 8: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

8

Pavyzdys: Ar 20-30 metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina

vienodai? Failai ESS4LT ir ESS4EE. Pradţioje su komanda Data – Merge Files sujungiame abudu

failus. Renkamės Analyze → Compare Means → Independent Samples T Test.

Į langelį Test Variable(s) įkeliame happy, o į langelį Grouping variable kintamąjį cntry.

Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus:

Spaudţiame Continue ir OK. Rezultatų išklotinė prasideda nuo imčių vidurkių.

Group Statistics

cntry Country N Mean Std. Deviation Std. Error Mean

happy How happy are you LT Lithuania 179 7.00 1.735 .130

EE Estonia 136 6.68 1.965 .169

Page 9: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

9

Matome, kad Lietuvos piliečių vidutinis laimingumas yra 6.68, o estai truputį laimingesni – jų

laimingumo vidurkis yra 7,0. Norint nustatyti, ar vidurkių skirtumas yra statistiškai reikšmingas,

reikia kitoje lentelėje surasti tinkamą p reikšmę. SPSS pateikia net du t testo variantus. Vienas jų

skirtas atvejui, kai dispersijos lygios, o kitas – kai dispersijos nelygios. Formaliai sprendimas

daromas taip: pasiţiūrima į stulpelyje Levene‘s Test for Equality of Variances Sig. esančią

reikšmę. Jeigu ji ≥ 0,05 , tai t testo p reikšme laikoma viršutinis stulpelyje t-test for Equality of

Means Sig. (2-tailed) esantis skaičius. Priešingu atveju – apatinis skaičius.

Independent Samples Test

Levene's Test

for Equality of

Variances t-test for Equality of Means

F Sig. t df

Sig.

(2-

tailed)

Mean

Difference

Std. Error

Difference

95% Confidence

Interval of the

Difference

Lower Upper

happy

How

happy

are you

Equal variances

assumed

3.467 .064 1.512 313 .131 .316 .209 -.095 .728

Equal variances not

assumed

1.487 270.359 .138 .316 .213 -.102 .735

Matome, kad t testo p reikšmė yra lygi 0,131 > 0,05. Todėl darome išvadą, kad 20-30 metų lietuvių

ir estų vidutiniai laimingumo vertinimai statistiškai reikšmingai nesiskiria.

2.3 T – testas 2 priklausomoms imtims (porinis t testas)

Duomenys: poriniai normalieji stebėjimai.

Statistinė hipotezė:

H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar 20-25 metų Lietuvos respondentai vienodai vertina švietimą ir sveikatos prieţiūros

įstaigas? Failas ESS4LT. Vertinimo skalė nuo 0 (labai nepatinka) iki 10 (labai patinka).

Atsirenkame norimo amţiaus respondentus. Tada renkamės Analyze → Compare Means →

Paired Samples T Test. Į laukelį Paired-Samples T Test įkeliame kintamuosius stfedu ir stfhlth.

Paspaudţiame OK.

Page 10: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

10

Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei

sveikatos prieţiūra (vid. 3,59).

Paired Samples Statistics

Mean N Std. Deviation Std. Error Mean

Pair 1 stfedu 4.09 139 2.519 .214

stfhlth 3.59 139 2.398 .203

Lentelėje Paired Samples Test susiradę Sig. (2 – tailed) matome, kad p reikšmė = 0,007 < 0,05.

Todėl darome išvadą, kad mokslas vertinamas statistiškai reikšmingai palankiau, nei sveikatos

prieţiūra.

Paired Samples Test

Paired Differences

t df

Sig. (2-

tailed) Mean

Std.

Deviation

Std. Error

Mean

95% Confidence

Interval of the

Difference

Lower Upper

Pair 1 stfedu - stfhlth .504 2.158 .183 .142 .866 2.751 138 .007

2.4 ANOVA

ANOVA – vienfaktorės dispersinės analizės trumpinys (angl. Analysis Of Variance). Pavadinimas

– klaidinantis. ANOVA lygina dviejų ar daugiau nepriklausomų imčių vidurkius. Tai t testo

nepriklausomoms imtims apibendrinimas. Tiesiog hipotezė tikrinama, palyginant dviem būdais

įvertintą kintamųjų dispersiją: laikant, kad vidurkiai lygūs ir, kad ne. Iš čia ir ţodis dispersinė

pavadinime.

Duomenys: 2 ar daugiau nepriklausomų normaliųjų imčių. Visų imčių dispersijos turi būti

panašios. Standartinis reikalavimas – visi standartiniai nuokrypiai skiriasi ne daugiau nei dvigubai.

Statistinė hipotezė:

Page 11: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

11

H0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar 20 -25 m lietuviai, estai ir portugalai vienodai vertina savo laimingumą? Failus

ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną. Su komanda Automatic Record perkoduojame

kintamąjį cntry į skaitinį kintamąjį Acountry (1 – Estija, 2 – Lietuva, 2 – Portugalija). Su Select

Cases atsirenkame reikiamus respondentus. Pasirenkame: Analyze → Compare Means → One-

Way ANOVA. Į langelį Dependent List įkeliame happy, į langelį Factor – Acountry.

Pasirenkame Post Hoc ir paţymime Bonferroni.

Paspaudę Continue, renkamės Options. Paţymime Descriptives ir Means plot. Tada spaudţiame

Continue ir OK.

Page 12: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

12

Rezultatų išklotinė prasideda nuo aprašomosios statistikos. Matome, kad vidutinis estų laimingumas

yra pats maţiausias, o portugalai – patys laimingiausi. Standartiniai nuokrypiai yra labai panašūs, nė

vienas nėra didesnis uţ kitus daugiau nei dvigubai.

Descriptives

happy How happy are you

N Mean Std. Deviation Std. Error

95% Confidence Interval for

Mean

Minimum Maximum Lower Bound Upper Bound

1 Estonia 80 6.29 2.039 .228 5.83 6.74 2 10

2 Lithuania 103 6.97 1.729 .170 6.63 7.31 3 10

3 Portugal 78 7.41 1.670 .189 7.03 7.79 2 10

Total 261 6.89 1.859 .115 6.67 7.12 2 10

Pagrindinėje ANOVA lentelėje suradę p reikšmę p = 0,001, padarome išvadą, kad ne visų

grupių vidurkiai vienodi (yra statistiškai reikšmingai besiskiriančių vidurkių).

ANOVA

happy How happy are you

Sum of Squares df Mean Square F Sig.

Between Groups 50.824 2 25.412 7.730 .001

Within Groups 848.172 258 3.287

Total 898.996 260

Lentelėje Multiple Comparisons matome Bonferoni testo rezultus. Statistiškai reikšmingi

vidurkių skirtumai paţymėti ţvaigţdutėmis. Estai skairiasi nuo lietuvių ir nuo portugalų, o lietuviai

ir portugalai savo laimingumu statistiškai reikšmingai nesiskiria.

Multiple Comparisons

happy How happy are you

Bonferroni

(I) Acountry

Country

(J) Acountry

Country

Mean

Difference (I-J) Std. Error Sig.

95% Confidence Interval

Lower Bound Upper Bound

1 Estonia 2 Lithuania -.683* .270 .036 -1.33 -.03

3 Portugal -1.123* .289 .000 -1.82 -.43

2 Lithuania 1 Estonia .683* .270 .036 .03 1.33

3 Portugal -.439 .272 .323 -1.10 .22

3 Portugal 1 Estonia 1.123* .289 .000 .43 1.82

2 Lithuania .439 .272 .323 -.22 1.10

*. The mean difference is significant at the 0.05 level.

Rezultatų išklotinė baigiasi vidurkių grafiku.

Page 13: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

13

Išvadas galima aprašyti taip: taikėme ANOVA. Gavome, kad gyvenamoji vieta ir laimingumas

statistiškai reikšmingai susiję (p = 0,007). Pagal Bonferoni kriterijų vidutinis estų laimingumas

statistiškai reikšmingai skiriasi nuo lietuvių ir portugalų laimingumo. Lietuvių ir portugalų

vidutiniai laimingumai statistiškai reikšmingai nesiskiria.

2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA)

Porinio T testo apibendrinimas, kai imčių gali būti daugiau uţ 2.

Duomenys: dviejų, ar daugiau, normaliųjų stebėjimų vektoriai (x,y,z,...).

Statistinė hipotezė:

H0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar Lietuvos 20-25 m respondentai vienodai palankiai vertina partijas, teisinę sistemą ir

Europarlamentą? Failas ESS4LT. Atsirenkame reikiamo amţiaus respondentus. Pasirenkame

Analyze → General Linear Model → Repeated Measures. Langelyje Number of Levels

nurodome kelių stulpelių vidurkius lyginsime (3), paspaudţiame Add, po to Define.

Atsidariusiame langelyje perkeliame kintamuosius trstprt, trstlgl, trstep į Within Subject

Variables. Renkamės Options.

Page 14: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

14

Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame

Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK.

Rezultatų išklotinėje pateikti vidurkiai (skalė 1 – visiškai nepasitikiu,....,10 – visiškai pasitikiu):

Descriptive Statistics

Mean Std. Deviation N

trstprt 1.88 2.016 151

trstlgl 3.50 2.503 151

trstep 4.87 2.751 151

Ar yra statistiškai besiskiriančių vidurkių, suţinome paţiūrėję į lentelę Tests of Within-Subjet

Effects, stulpelį Sig. Šiuo atveju visos p reikšmės yra statistiškai reikšmingos (pagrindinė p reikšmė

yra eilutėje Sphericity Assumed). Taigi yra statistiškai reikšmingai besiskiriančių vidurkių.

Tests of Within-Subjects Effects

Measure:MEASURE_1

Source

Type III Sum of

Squares df Mean Square F Sig.

factor1 Sphericity Assumed 675.024 2 337.512 116.164 .000

Greenhouse-Geisser 675.024 1.876 359.828 116.164 .000

Huynh-Feldt 675.024 1.899 355.484 116.164 .000

Lower-bound 675.024 1.000 675.024 116.164 .000

Bonferoni testo rezultatai yra lentelėje Pairwise Comparisons. Matome, kad statistiškai

reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Išvada: pritaikius blokuotų duomenų

ANOVA ir Bonferoni testą, gavome, kad statistiškai reikšmingai skiriasi visų trijų institucijų

vertinimų vidurkiai. Palankiausiai vertinamas Europarlamentas (vid. 4.87 balo), blogiau teisinė

Page 15: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

15

sistema (vid. 3,50 balo). Visų nepalankiausiai vertinamos partijos (vid. 1,88 balo). Visos institucijos

vertinamos blogiau, nei vidutiniškai.

Pairwise Comparisons

Measure:MEASURE_1

(I) factor1 (J) factor1

Mean

Difference (I-J) Std. Error Sig.a

95% Confidence Interval for

Differencea

Lower Bound Upper Bound

1 2 -1.616* .169 .000 -2.025 -1.206

3 -2.987* .209 .000 -3.493 -2.480

2 1 1.616* .169 .000 1.206 2.025

3 -1.371* .208 .000 -1.873 -.868

3 1 2.987* .209 .000 2.480 3.493

2 1.371* .208 .000 .868 1.873

Based on estimated marginal means

*. The mean difference is significant at the .05 level.

a. Adjustment for multiple comparisons: Bonferroni.

3. Neparametriniai kriterijai

Tai kriterijai, kuriems uţtenka rangų ir nereikia, kad kintamieji būtų normalūs. Išvadas visada

sunkiau suformuluoti ir kitiems išaiškinti. Kai visi skaičiai išrikiuojami nuo maţiausio iki

didţiausio, tai iš esmės rangas nurodo, kurioje pozicijoje konkretus stebėjimas atsidūrė. Nuo

pozicijos numerio rangas skiriasi tik tada, kai yra vienodo didumo stebėjimai, nes jų rangai turi būti

lygūs.

Stebėjimai: 1, 3, 7, 12, 23, 25, 25, 48.

Pozicijos nr: 1, 2, 3, 4, 5, 6, 7, 8.

Rangai: 1, 2, 3, 4, 5, 6.5, 6.5, 8.

Neparametriniuose kriterijuose lyginami skirstiniai, t.y. bandoma viso labo nustatyti, kurioje imtyje

daugiau didesnių skaičių. Beveik visada tai reiškia, kad išrikiuojame abiejų (visų) imčių stebėjimus

į vieną eilutę, suranguojame, o tada surandame vidutinius rangus (angl. mean rank). Ta imtis, kurios

vidutinis rangas didesnis ir įgyja daugiau didesnių reikšmių. Vidutinis rangas nėra stebėjimų

vidurkis, nes rangas nėra tas pats, kas stebėjimas. Jeigu dešimtas stovi metro dvidešimties ūgio

respondentas, tai rangas bus dšimt (jei kaimynų ūgiai skiriasi), o stebėjimas – 1,20 m.

Page 16: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

16

3.1 Mann – Whitney testas

T – kriterijaus nepriklausomoms imtims analogas.

Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas

rangines reikšmes) imtys.

Statistinė hipotezė:

H0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar vienodai patenkinti atlyginimu baigusieji ekonomiką vyrai ir moterys? Failas

LiDA0146_LAMS_STUDY_F1 . Atsirenkame ekonomiką baigusius (K8=57). Nuomonė apie algą

yra ranginė (K37_4: 1- labai ne, 5 – labai taip). Renkamės Analyze → Nonparametric Tests →

(Legacy Dialogs) → 2 Independent Samples. Kintamąjį K37_4 keliame į Test Variable List,

kintamąjį D1 į Grouping Variable ir nurodome lyties kodus. Spaudţiame OK.

Rezultatų išklotinėje matome, kad vyrai palankiau vertina savo algą (mean rank = 53,32), nei

moterys (41,91).

Ranks

D1|Lytis N Mean Rank Sum of Ranks

K37_4 1 Moteris 55 41.91 2305.00

2 Vyras 37 53.32 1973.00

Total 92

Page 17: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

17

Kitoje lentelėje suradę Asymp.Sig. (2-tailed) , įsitikiname, kad p reikšmė =0,035 < 0,05. Darome

išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys.

Test Statisticsa

K37_4 K37_4|Pasitenkinimas

atlyginimu uþ esamà darbà

Mann-Whitney U 765.000

Wilcoxon W 2305.000

Z -2.105

Asymp. Sig. (2-tailed) .035

a. Grouping Variable: D1 D1|Lytis

3.2 Wilcoxon testas

T – porinio kriterijaus analogas.

Duomenys: poriniai intervaliniai arba ranginiai (kintamasis įgyja bent 5 skirtingas rangines

reikšmes) stebėjimai.

Statistinė hipotezė:

H0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: : Ar vienodai patenkinti atlyginimu ir darbo sąlygomis baigusieji psichologiją? Failas

LiDA0146_LAMS_STUDY_F1 . Atsirenkame psichologiją baigusius (K8=60). Nuomonė apie

algą ir darbo sąlygas yra ranginė (1- labai ne, 5 – labai taip). Renkamės Analyze →

Nonparametric Tests → (Legacy Dialogs) → 2 Related Samples. Kintamuosius K37_3 ir K37_4

keliame į Test Pairs, spaudţiame OK.

Page 18: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

18

Rezultatų išklotinėje matome, kad vidutinis rangas yra didesnis atveju, kai K37_4 < K37_3.

Ranks

N Mean Rank Sum of Ranks

K37_4 - K37_3 Negative Ranks 26a 14.63 380.50

Positive Ranks 4b 21.13 84.50

Ties 9c

Total 39

a. K37_4 < K37_3

b. K37_4 > K37_3

c. K37_4 = K37_3

Suradę kitoje lentelėje Asymp.Sig.(2-tailed), įsitikiname, kad p = 0,002 < 0,05. Darome išvadą, kad

statistiškai reikšmingai palankiau vertinamos darbo sąlygos, nei gaunamas atlyginimas.

Test Statisticsb

K37_4 - K37_3

Z -3.133a

Asymp. Sig. (2-tailed) .002

3.3 Kruskal – Wallis testas

ANOVA neparametrinis analogas (bet be post hoc testų).

Duomenys: Dvi ar daugiau nepriklausomų intervalinių arba ranginių (kintamasis įgyja bent 5

skirtingas rangines reikšmes) imčių.

Statistinė hipotezė:

H0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar 20-25 m lietuviai, estai ir portugalai vienodai vertina savo pasitenkinimą gyvenimu?

Failai ESS4LT, ESS4EE, ESS4PT. Sujungiame failus (Merge Files) ir atsirenkame tinkamo

amţiaus respondentus. Su Automatic Recode sukuriame skaitinį, šalį nurodantį, kintamąjį

Acountry. Pasitenkinimas gyvenimu (kintamasis stflife) įgyja reikšmes nuo 1 –labai nepatenkintas,

iki 10 – labai patenkintas. Pasirenkame Analyze → Nonparametric Tests → (Legacy Dialogs)

→ K Independent Samples . Į langelį Test Variable List įkeliame kintamąjį stflife. Į langelį

Page 19: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

19

Grouping Variable įkeliame Acountry ir nurodome jo maţiausią (1) ir didţiausią (3) kodus.

Spaudţiame OK.

Pagal vidutinius rangus darome išvadą, kad palankiausiai gyvenimą vertina lietuviai, o

nepalankiausiai – portugalai.

Ranks

Acountry Country N Mean Rank

stflife How satisfied with life

as a whole

1 Estonia 159 249.21

2 Lithuania 162 197.95

3 Portugal 153 267.21

Total 474

Grafoje Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05. Todėl darome išvadą, kad yra statistiškai

reikšmingų skirtumų tarp Lietuvos, Estijos ir Portugalijos jaunimo poţiūrių į gyvenimą.

Test Statisticsa,b

stflife How satisfied with life as a whole

Chi-Square 22.387

df 2

Asymp. Sig. .000

a. Kruskal Wallis Test

Svarbu: niekur neminėjome vidurkių (geriausiu atveju – vidutinius rangus) ir netaikėme Post Hoc

testų (nes jų nėra). Todėl atsakymas ganėtinai dalinis, ne taip, kaip taikant ANOVA.

Page 20: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

20

3.4 Friedman testas

Blokuotų duomenų ANOVA neparametrinis analogas (bet be post hoc testų).

Duomenys: 2 ar daugiau intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines

reikšmes) stebėjimų vektoriai.

Statistinė hipotezė:

H0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Pavyzdys: Ar vienodai patenkinti atlyginimu, darbo sąlygomis ir darbo pobūdţiu baigusieji

politologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame politologiją baigusius (K8=52)

respondentus. Nuomonė apie algą, darbo sąlygas ir darbo pobūdį yra ranginė (1- labai ne, 5 – labai

taip). Renkamės Analyze → Nonparametric Tests → (Legacy Dialogs) → K Related Samples.

Kintamuosius K37_2, K37_3 ir K37_4 keliame į Test Variables, spaudţiame OK.

Lentelėje Ranks nurodyti kintamųjų vidutiniai rangai. Friedman kriterijaus atveju jie rodo, kokią

vidutiniškai vietą tarp trijų kintamųjų pagal savo didumą uţima kiekvienas kintamasis. Aiškiai

matyti, kad nepalankiausiai įvertinta nuomonė apie atlyginimą (jeigu visi respondentai šiam

kintamajam būtų skyrę maţiausius balus, vidurkis būtų 1, o dabar jis 1,37).

Ranks

Mean Rank

K37_2 2.28

K37_3 2.35

K37_4 1.37

Page 21: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

21

Nors skirtumai statistiškai reikšmingi (Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05) vis dėlto

tegalima padaryti išvadą, kad yra statistiškai reikšmingų skirtumų, vertinant darbo pobūdį, sąlygas

ir atlyginimą ir pasamprotauti apie tai, kuo labiausiai nepatenkinti respondentai. Taip, kaip

parašėme aukščiau. Post hoc kriterijų nėra.

4. Požymių priklausomumo (kryžminių lentelių) analizė.

Faktiškai kryţminių lentelių statistiniam vertinimui taikomas vienintelis – chi kvadrato kriterijus.

Reikia įsidėmėti, kad

a) Chi kvadrato kriterijus labai jautrus duomenų skaičiui. Kai duomenų nedaug, net ir dideli

procentiniai skirtumai bus pripaţinti statistiškai nereikšmingais. Kai duomenų labai daug, tai

net ir menkiausi procentiniai skirtumai tampa statistiškai reikšmingais.

b) Sudarinius kryţminę lentelę, joje neturi būti daug pustuščių langelių. Chi kvadrato statistika

tampa nepatikima, kai tokių langelių daugiau, nei penktadalis. Tada tiesiog reikėtų

sustambinti kategorijas.

4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas

Duomenys: respondentai pagal du kategorinius poţymius suskirstyti į kategorijas.

Statistinė hipotezė:

H0 atmetame (požymiai statistiškai reikšmingai susiję), jei p-reikšmė < 0,05.

Pavyzdys: Ar , išmokant grąţą, vienodai apgaudinėjami vyrai ir moterys? Failas

LiDA003_ZTLT_F1. Renkamės Analyze → Descriptive Statistics → Crosstabs.

Į langelį Row(s) įkeliame kintamąjį s01 (lytį), į Column(s) – kintamąjį a09_01.

Test Statisticsa

N 30

Chi-Square 27.519

df 2

Asymp. Sig. .000

Page 22: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

22

Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu.

Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir

spaudţiame OK.

Rezultatų išklotinėje randame lentelę Crosstabulation. Jooje pateikti procentai nerodo, kad

kaţkurią lytį apgaudinėtų daţniau. Gaunant grąţą buvo apgauti 39% vyrų ir 40,6 % moterų.

Crosstabulation

a09_01 Bûti apgautam gaunant gràþà

Total 1 Taip 2 Ne

s01 Lytis 1 Vyras Count 184 288 472

% within s01 Lytis 39.0% 61.0% 100.0%

% within a09_01 Bûti

apgautam gaunant gràþà

43.4% 45.1% 44.4%

2 Moteris Count 240 351 591

% within s01 Lytis 40.6% 59.4% 100.0%

% within a09_ Bûti

apgautam gaunant gràþà

56.6% 54.9% 55.6%

Total Count 424 639 1063

% within s01 Lytis 39.9% 60.1% 100.0%

% within a09_ 100.0% 100.0% 100.0%

Lentelėje Chi-Square Tests pateiktos net kelios p reikšmės. Kadangi šiuo atveju turime 2x2

lentelę, tai stulpelyje Exact.Sig. (2-tailed) pateikiama ir tiksli p reikšmė (0,614). Visada bus

Page 23: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

23

aprašyta ir asimptotinė p reikšmė – stulpelyje Asymp. Sig. (2-sided) (ji lygi 0,591). Kadangi p

reikšmė didesnė uţ 0,05, tai darome išvadą, nėra statistiškai reikšmingo skirtumo tarp apgautų vyrų

ir moterų procentų. Tą pačią išvadą galima formuluoti ir kitais ţodţiais: apgaudinėjimas, išmokant

grąţą, nėra statistiškai reikšmingai susijęs su apgaudinėjamos personos lytimi.

Chi-Square Tests

Value df

Asymp. Sig. (2-

sided)

Exact Sig. (2-

sided)

Exact Sig. (1-

sided)

Pearson Chi-Square .289a 1 .591

Continuity Correctionb .226 1 .635

Likelihood Ratio .290 1 .591

Fisher's Exact Test .614 .318

Linear-by-Linear

Association

.289 1 .591

N of Valid Cases 1063

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 188.27.

b. Computed only for a 2x2 table

4.2 Chi kvadrato suderinamumo testas

Duomenys: viena imtis pagal vieną poţymį suskirstytą į kategorijas.

Spėjame kiek kokių respondentų bus (procentinę sudėtį, proporcijas)

Statistinė hipotezė:

ė ė

H0 atmetame (duomenys statistiškai reikšmingai prieštarauja spėjamoms proporcijoms skiraisi),

jei p-reikšmė < 0,05.

Pavyzdys: Ar duomenys neprieštarauja spėjimui, kad išmokant grąţą, apgaudinėjama 40 %

respondentų? Failas LiDA003_ZTLT_F1. Renkamės Analyze → Nonparametric Tests →

Legacy Dialogs) → Chi Square . Į langelį Test Variable List įkeliame a09_01.

Page 24: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

24

Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio

a09_01 kodo. Kadangi kintamajema yra 1 – apgautiems ir 2 – neapgautiems, tai vedame 40 ir 60 ( o

ne 60 ir 40). Spaudţiame OK.

Pirmojoje lentelėje išrašyta, kiek ţmonių buvo apgauta (424) ir kiek jų turėtų būti imtyje, jeigu

spėjamas santykis būtų teisingas. Matome, kad neatitikimas labai maţas – tik 1,2 respondento

(trupmenos neturi gasdinti – taip tiksliau, nes matematinis modelis keičia sveikus skaičius realiais).

a09_01 Ar per pastaruosius 12 mënesiø Jums yra

tekæ: Bûti apgautam gaunant gràþà

Observed N Expected N Residual

1 Taip 424 425.2 -1.2

2 Ne 639 637.8 1.2

Total 1063

Antrojoje lentelėje suradę Asymp. Sig. eilutėje esančią p reikšmę, matome, kad ji (0,940) daug

didesnė uţ 0,05. Todėl darome išvadą, kad duomenys statistiškai reikšmingai neprieštarauja

spėjamam santykiui (apgautųjų procentui). Norime atkreipti, kad išvada švelni – neprieštarauja

spėjimui, o ne – įrodėme, kad tokių 40 procentų. Gali lygiai taip pat, tiems patiems duomenims

neprieštarauti spėjimui, kad tokių respondentų yra 39 procentai. Arba 41 %. Taigi, visada įdomiau,

kai atsiranda prieštaravimas, nes tada galima matyti – daugiau, ar maţiau buvo apgautųjų.

Test Statistics

Page 25: Projektas - lidata.eu · 2.2. T – testas 2 nepriklausomoms imtims.....7 2.3 T – testas 2 priklausomoms imtims (porinis t testas

25

a09_01 Ar per

pastaruosius 12

mënesiø Jums

yra tekæ: Bûti

apgautam

gaunant gràþà

Chi-Square .006a

df 1

Asymp. Sig. .940

Literatūra

1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai I, TEV, 2000.

1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai II, TEV, 2002.