Download pdf - introductie -toets voor homogeniteit toetsendestatistiek€¦ · introductie χ2-toets voor onafhankelijkheid pauze χ2-toets voor homogeniteit χ2-toets voor goodness-of-ﬁt ten

introductie χ2-toets voor onafhankelijkheid pauze χ

2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte

toetsende statistiek

week 1: kansen en random variabelenweek 2: de steekproevenverdelingweek 3: schatten en toetsen: de z-toetsweek 4: het toetsen van gemiddelden: de t-toetsweek 5: het toetsen van varianties: de F-toets

week 6: het toetsen van tellingen: de χ2-toets

Moore, McCabe, and Craig. Introduction to the Practice of Statistics

Chapter 9: Analysis of Two-Way Tables

9.1: Inference for Two-Way Tables

9.2: Formulas and Models for Two-Way Tables

9.3: Goodness of Fit

week 7: verdelingsvrije toetsen

Frank Busing, Universiteit Leiden1 / 38



deze week: wat hebben we al geleerd?

kennis en begrip van de 5 kansregels

kennis en begrip van marginale –, gezamelijke – en conditionele kans

kennis en begrip van onafhankelijkheid

toelichting

totaal

totaalcolumns

rows1

2

1 2

marginale kansen: P(A) en P(B)

gezamelijke kans: P(A en B)

conditionele kansen: P(A|B) en P(B|A)

2 / 38



voorbeeld

– een onderzoeker kijkt naar de relatie tussen geslacht en geloof in astrologie– hij neemt een grote steekproef van eerstejaars psychologie studenten– de onderzoeker bepaalt vervolgens het geslacht en het geloof in astrologie– vraag: is er een relatie tussen geslacht en geloof in de studentenpopulatie?

3 / 38



de χ2-toets voor onafhankelijkheid

een chi-kwadraat toets (χ2) voor onafhankelijkheidwordt gebruikt om te bepalen of twee variabelen gerelateerd zijn

de gegevens zijn afkomstig van een populatiehet meetniveau van de twee variabelen is categorisch (nominaal of ordinaal)

een populatie: eerstejaars psychologie studententwee variabelen: geslacht en geloof in astrologie

elke proefpersoon valt in een en slechts een categoriewaarnemingen zijn onafhankelijk van elkaar

de nul hypothese verwacht geen relatie tussen de twee variabelende nul hypothese verwacht dat de variabelen onafhankelijk zijn

de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en verwachte frequenties (fe)

4 / 38



χ2-toetsstatistiek

χ2-toetsstatistiek

χ2 =∑ (fo − fe)

2

fe

χ2 is de som over gestandaardiseerde gekwadrateerde residuen

als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijndan is de toetsstatistiek ongeveer gelijk aan nul

de geobserveerde frequenties hebben we geobserveerd, gemeten, geteldde verwachte frequenties (onder H0) kunnen we bepalen met behulp van kansen

5 / 38



herhaling: de productregel

regel 5: productregel (voor onafhankelijke gebeurtenissen)

P(A en B) = P(A)× P(B)

voor onafhankelijke gebeurtenissenis de gezamelijke kans het produkt van twee marginale kansen

voorbeeld

de kans op een vrouw die gelooft in astrologieis dan gelijk aande kans op geloof in astrologie (A)maal de kans op een vrouw (B)

6 / 38



verwachte celfrequenties bij onafhankelijkheid (H0)

geobserveerde frequentiesvrouw man totaal

geloof 69 16 85neutraal 90 28 118ongeloof 242 118 360totaal 401 162 563

als we verwachten, onder H0, dat de aanname van onafhankelijkheid geldt dan

Pe(A en B) = P(A)× P(B)

fe(A en B)

n=

f(A)

n×

f(B)

n

fe(A en B) =f(A)× f(B)

n

in woorden: de verwachte celfrequentie bij onafhankelijkheidis het product van de marginale frequenties gedeeld door het totaal aantal

7 / 38



verwachte celfrequenties bij onafhankelijkheid (H0)



bijvoorbeeld


n

fe(geloof en vrouw) =f(geloof)× f(vrouw)

n=

85× 401

563= 60.54

fe(ongeloof en man) =f(ongeloof)× f(man)

n=

360× 162

563= 103.54

etc.

8 / 38



de χ2-toetsstatistiek



verwachte frequentiesvrouw man totaal60.54 24.46 8584.05 33.95 118256.46 103.54 360401 162 563

aannamen

1 voor elke cel fe > 1: geen deling door nul

2 χ2-toets voor onafhankelijkheid: voor elke cel fe > 5

9 / 38






verwachte frequentiesvrouw man totaal60.54 24.46 8584.05 33.95 118256.46 103.54 360401 162 563

χ2 =∑ (fo − fe)

2

fe

=(69− 60.54)2

60.54+

(90− 84.05)2

84.05+ . . .+

(118− 103.54)2

103.54= 8.388

de steekproevenverdeling van χ2 heet de χ2-verdeling

net als de t- en F-verdeling betreft het hier een hele familie van verdelingenafhankelijk van het aantal vrijheidsgraden: χ2(df)

10 / 38



de χ2-verdeling

Probability p

( 2)*χ

1 (χ2)∗ is altijd positief

2 χ2-verdeling is scheef naar rechts

3 de piek ligt in de buurt van het aantal vrijheidsgraden

4 bij een groot aantal vrijheidsgraden is χ2 normaal verdeeld

11 / 38



χ2-tabel

Probability p

( 2)*χ

Table entry for p is the

critical value ( χ 2 )* with

probability p lying to its

right.

T A B L E F

χ2distribution critical values

Tail probability p

df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005

1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12

2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20

3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73

4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00

5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11 1

nb. χ2(df = 1) = z2

12 / 38



vrijheidsgraden voor de r× c tabel


geloof 69 85neutraal 90 118ongeloof 360totaal 401 162 563

het aantal vrijheidsgraden is df = (r− 1)× (c− 1)

ga maar na:gegeven de marginalen,hoeveel cellen kunnen er vrij ingevuld worden?

stel: α = 0.05wat is dan de grenswaarde (χ2)∗?

13 / 38



χ2-tabel: grenswaarde (χ2)∗

Probability p

( 2)*χ

Table entry for p is the

critical value ( χ 2 )* with

probability p lying to its

right.

T A B L E F


Tail probability p

df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005

1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12

2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20

3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73

4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00

5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11

14 / 38



de χ2-toets voor onafhankelijkheid

toets een relatie tussen variabelen met de χ2-toets voor onafhankelijkheid

steekproefgegevens: r = 3, c = 2,χ2 = 8.388

stappenplan χ2-toets voor onafhankelijkheid:2

1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = (r− 1)(c− 1) = 23 toetsingsgrootheid χ2 = 8.3884 verwerpingsgebied df = 2,α = 0.05, (χ2)∗ = 5.995 statistische conclusie χ2 = 8.388 > 5.99 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie geloof in astrologie en geslacht zijn afhankelijk

in de studentenpopulatie

let op: bij grote n (grote power) is χ2 altijd significant15 / 38



χ2-tabel: p-waarde

T A B L E F


Tail probability p

df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005

1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12

2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20

3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73

4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00

5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11

1 rij, aantal vrijheidsgraden df = 2

2 χ2 = 8.388 ligt tussen 7.82 en 9.21

3 p-waarde ligt tussen 0.01 en 0.02

4 conclusie: p < 0.05, H0 wordt verworpen

merk op dat de grenzen waartussen de p-waarde ligt niet verdubbeld worden:deze χ2-tabel geeft direct en uitsluitend de tweezijdige p-waarden

16 / 38



SPSS: crosstabs χ2-test results

Chi-Square Tests

Value df

Asymp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Point

Probability

Pearson Chi-Square

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

8.388a

2 .015 .015

8.734 2 .013 .013

8.406 .015

8.200b

1 .004 .005 .002 .001

563

0 cells (0.0%) have expected count less than 5. The minimum expected count is 24.46.a.

The standardized statistic is 2.864.b.

“Het geloof in astrologie is afhankelijk van het geslacht van de student,χ2 = 8.388,df = 2,p = .015.”

gebruik de Fisher’s exact test in plaats van de asymptotische χ2 benaderingde Fisher’s exact test is met name geschikt voor kleine steekproeven

17 / 38



voorbeeld

– een onderzoeker vraagt zich af of we dieren kunnen laten line-dansen– hij verzamelt 200 katten en verdeelt ze random over twee groepen– hij beloont de ene groep met voedsel voor line-dans-achtig gedrag– de andere groep wordt beloond met affectie– aan het einde van de periode telt hij hoeveel katten konden line-dansen– vraag: is er een relatie tussen line-dansen en het soort beloning?

18 / 38



de χ2-toets voor homogeniteit

een chi-kwadraat toets (χ2) voor homogeniteit4

wordt gebruikt om te bepalen of twee of meer populaties gelijk verdeeld zijnop een variabele

de gegevens zijn afkomstig van twee of meer populatieshet meetniveau van de variabele is categorisch (nominaal of ordinaal)

twee populaties: voedsel en affectie beloonde katteneen variabele: line-dansen


de nul hypothese verwacht gelijke proporties of gelijke verdelingen

de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en verwachte frequenties (fe)

de χ2-verdeling heeft df = (r− 1)× (c− 1) vrijheidsgraden

χ2-toets voor homogeniteit of homogeniteit van verdelingen of homogeniteit van populaties19 / 38



onafhankelijkheid versus homogeniteit

χ2-toets voor onafhankelijkheid

1 een populatie: studenten

2 twee variabelen: geslacht en geloof

3 H0: geslacht en geloof zijn onafhankelijk in de populatie van studenten

4 geen onderscheid tussen verklarende en respons variabele

5 omvang van de steekproef (n) staat vast

χ2-toets voor homogeniteit

1 twee of meer populaties: mannelijke en vrouwelijke studenten

2 een variabele: geloof

3 H0: geloof is gelijk verdeeld in alle populaties

4 onderscheid tussen verklarende (geslacht) en respons variabele (geloof)

5 marginalen van de verklarende variabele staan vast (maar niet per se gelijk)

conclusie: het onderzoeksontwerp bepaalt welke toets passend is5

echter: de verwachte frequenties worden voor beide toetsen op gelijke wijze bepaald20 / 38



χ2-toetsstatistiek

χ2-toetsstatistiek

χ2 =∑ (fo − fe)

2

fe

χ2 is de som over gestandaardiseerde gekwadrateerde residuen

als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijndan is de toetsstatistiek ongeveer gelijk aan nul

de geobserveerde frequenties hebben we geobserveerd, gemeten, geteldde verwachte frequenties (onder H0) kunnen we bepalen met behulp van kansen

21 / 38



verwachte celfrequenties bij homogeniteit (H0)

geobserveerde frequentiesvoedsel affectie totaal

kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200

onder H0, bij gelijke verdelingen, geldt dat

1 de conditionele kansen gelijk zijn voor alle condities(28/38 = 48/162 en 10/38 = 114/162)

2 de conditionele kansen gelijk zijn aan de marginale kansen(28/38 = 48/162 = 76/200 en 10/38 = 114/162 = 124/200)

6

zie slides TS week 122 / 38






als we verwachten dat de conditionele gelijk zijn aan de marginale kansen dan

Pe(A|B) = P(A)

fe(A en B)

f(B)=

f(A)

n


n

in woorden: de verwachte celfrequentie bij homogeniteitis het product van de marginale frequenties gedeeld door het totaal aantal7

verwachte celfrequentie bij homogeniteit = verwachte celfrequentie bij onafhankelijkheid23 / 38






bijvoorbeeld


n

fe(line-dansen en voedsel) =f(line-dansen)× f(voedsel)

n=

76× 38

200= 14.44

etc.

24 / 38






verwachte frequentiesvoedsel affectie totaal14.44 61.56 7623.56 100.44 12438 162 200

aannamen

1 voor elke cel fe > 1: geen deling door nul

2 gemiddelde fe > 5

25 / 38






verwachte frequentiesvoedsel affectie totaal14.44 61.56 7623.56 100.44 12438 162 200

χ2 =∑ (fo − fe)

2

fe

=(28− 14.44)2

14.44+

(48− 61.56)2

61.56+

(10− 23.56)2

23.56+

(114− 100.44)2

100.44= 25.35

26 / 38



de χ2-toets voor homogeniteit

het vergelijken van frequentieverdelingen met de χ2-toets voor homogeniteit

steekproefgegevens: r = 2, c = 2,χ2 = 25.35

stappenplan χ2-toets voor homogeniteit:

1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = (r− 1)(c− 1) = 13 toetsingsgrootheid χ2 = 25.354 verwerpingsgebied df = 1,α = 0.05, (χ2)∗ = 3.845 statistische conclusie χ2 = 25.35 > 3.84 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie de verdelingen voor katten beloond met voedsel

en met affectie zijn niet aan elkaar gelijk

27 / 38



SPSS: crosstabs cell results

linedance * beloning Crosstabulation

beloning

Totalvoedsel affectie

linedance ja Count

Expected Count

nee Count

Expected Count

Total Count

Expected Count

28 48 76

14.4 61.6 76.0

10 114 124

23.6 100.4 124.0

38 162 200

38.0 162.0 200.0

28 / 38



SPSS: crosstabs χ2-test results

Chi-Square Tests

Value df

Asymp. Sig.

(2-sided)

Exact Sig. (2-

sided)

Exact Sig. (1-

sided)

Pearson Chi-Square

Continuity Correctionb

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

25.356a

1 .000

23.520 1 .000

24.932 1 .000

.000 .000

25.229 1 .000

200

0 cells (0.0%) have expected count less than 5. The minimum expected count is 14.44.a.

Computed only for a 2x2 tableb.

“De verdeling van line-dansen is anders voor de verschillende soorten beloningdie katten krijgen ter aanmoediging, χ2 = 25.35,df = 1,p < .000.”

29 / 38



Pearsons r versus Pearsons χ2

voor een 2× 2 tabelis de correlatie r tussen de (dichotome) variabelen direct gerelateerd aan χ2

Correlations

linedance beloning

linedance Pearson Correlation

Sig. (2-tailed)

N

beloning Pearson Correlation

Sig. (2-tailed)

N

1 .356**

.000

200 200

.356**

1

.000

200 200

Correlation is significant at the 0.01 level (2-tailed).**.

relatie tussen r en χ2 voor een 2× 2 tabel

r2 × n = χ2

voorbeeld: 0.3562 × 200 = 25.35

30 / 38



voorbeeld

– oudere mensen kijken uit naar belangrijke gebeurtenissen in een jaar– zo ook naar hun verjaardag– het valt een onderzoeker op dat mensen vaak vlak erna overlijden– een steekproef van 348 overleden bejaarden moet duidelijkheid scheppen– vraag: proberen ouderen hun verjaardag te overleven?

31 / 38



χ2-toets voor goodness-of-fit

een chi-kwadraat toets (χ2) voor goodness-of-fitwordt gebruikt om te bepalen of de verdeling van een categorische variabeleovereenkomt met een theoretische verdeling

de gegevens zijn afkomstig van een populatiehet meetniveau van de variabele is categorisch (nominaal of ordinaal)

een populatie: oudereneen variabele: maand van overlijden


de nul hypothese verwacht een verdeling gelijk aan een theoretische verdeling

de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en theoretische frequenties (fe)

de χ2-verdeling heeft df = #categorieen− 1 vrijheidsgraden

32 / 38



χ2-toetsstatistiek

maand fo fe fo − fe (fo − fe)2 (fo − fe)

2/fe-6 24 29 -5 25 0.86-5 31 29 +2 4 0.14-4 20 29 -9 81 2.79-3 23 29 -6 36 1.24-2 34 29 +5 25 0.86-1 16 29 -13 169 5.830 26 29 -3 9 0.31

+1 36 29 +7 49 1.69+2 37 29 +8 64 2.21+3 41 29 +12 144 4.97+4 26 29 -3 9 0.31+5 34 29 +5 25 0.86

totaal 348 0 22.07

χ2 =∑ (fo − fe)

2

fe= 22.07

33 / 38



de χ2-toets voor goodness-of-fit

het passen van een frequentieverdeling met de χ2-toets voor goodness-of-fit

steekproefgegevens: n = 12,χ2 = 22.07

stappenplan χ2-toets voor goodness-of-fit:

1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = n− 1 = 113 toetsingsgrootheid χ2 = 22.074 verwerpingsgebied df = 11,α = 0.05, (χ2)∗ = 19.685 statistische conclusie χ2 = 22.07 > 19.68 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie mensen overlijden niet gelijkmatig over het jaar heen

34 / 38



SPSS: chi-square cell results

delta(maand)

Observed N Expected N Residual

-6

-5

-4

-3

-2

-1

0

1

2

3

4

5

Total

24 29.0 -5.0

31 29.0 2.0

20 29.0 -9.0

23 29.0 -6.0

34 29.0 5.0

16 29.0 -13.0

26 29.0 -3.0

36 29.0 7.0

37 29.0 8.0

41 29.0 12.0

26 29.0 -3.0

34 29.0 5.0

348

35 / 38



SPSS: chi-square test results

Test Statistics

delta(maand)

Chi-Square

df

Asymp. Sig.

22.069a

11

.024

0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 29.0.a.

“De verdeling van overlijdens komt niet overeen met de verwachteuniforme verdeling, χ2 = 22.07,df = 11,p = .024. Er zijn meer ouderendie na hun verjaardag overlijden (fo = 35.5 per maand),dan voor hun verjaardag (fo = 26.6 per maand).”

36 / 38



deze week: wat hebben we geleerd?

de verschillende χ2-onderzoekssituaties

de verwachte frequenties voor de verschillende χ2-situaties

uitvoeren en beoordelen van een χ2-toets

de relatie tussen Pearsons r en Pearsons χ2

37 / 38



deze week: wat moeten we nog leren?

het kunnen kiezen van de juiste toets

het uitvoeren en beoordelen van een χ2-toets

38 / 38