introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
toetsende statistiek
week 1: kansen en random variabelenweek 2: de steekproevenverdelingweek 3: schatten en toetsen: de z-toetsweek 4: het toetsen van gemiddelden: de t-toetsweek 5: het toetsen van varianties: de F-toets
week 6: het toetsen van tellingen: de χ2-toets
Moore, McCabe, and Craig. Introduction to the Practice of Statistics
Chapter 9: Analysis of Two-Way Tables
9.1: Inference for Two-Way Tables
9.2: Formulas and Models for Two-Way Tables
9.3: Goodness of Fit
week 7: verdelingsvrije toetsen
Frank Busing, Universiteit Leiden1 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
deze week: wat hebben we al geleerd?
kennis en begrip van de 5 kansregels
kennis en begrip van marginale –, gezamelijke – en conditionele kans
kennis en begrip van onafhankelijkheid
toelichting
totaal
totaalcolumns
rows1
2
1 2
marginale kansen: P(A) en P(B)
gezamelijke kans: P(A en B)
conditionele kansen: P(A|B) en P(B|A)
2 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
voorbeeld
– een onderzoeker kijkt naar de relatie tussen geslacht en geloof in astrologie– hij neemt een grote steekproef van eerstejaars psychologie studenten– de onderzoeker bepaalt vervolgens het geslacht en het geloof in astrologie– vraag: is er een relatie tussen geslacht en geloof in de studentenpopulatie?
3 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toets voor onafhankelijkheid
een chi-kwadraat toets (χ2) voor onafhankelijkheidwordt gebruikt om te bepalen of twee variabelen gerelateerd zijn
de gegevens zijn afkomstig van een populatiehet meetniveau van de twee variabelen is categorisch (nominaal of ordinaal)
een populatie: eerstejaars psychologie studententwee variabelen: geslacht en geloof in astrologie
elke proefpersoon valt in een en slechts een categoriewaarnemingen zijn onafhankelijk van elkaar
de nul hypothese verwacht geen relatie tussen de twee variabelende nul hypothese verwacht dat de variabelen onafhankelijk zijn
de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en verwachte frequenties (fe)
4 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-toetsstatistiek
χ2-toetsstatistiek
χ2 =∑ (fo − fe)
2
fe
χ2 is de som over gestandaardiseerde gekwadrateerde residuen
als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijndan is de toetsstatistiek ongeveer gelijk aan nul
de geobserveerde frequenties hebben we geobserveerd, gemeten, geteldde verwachte frequenties (onder H0) kunnen we bepalen met behulp van kansen
5 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
herhaling: de productregel
regel 5: productregel (voor onafhankelijke gebeurtenissen)
P(A en B) = P(A)× P(B)
voor onafhankelijke gebeurtenissenis de gezamelijke kans het produkt van twee marginale kansen
voorbeeld
de kans op een vrouw die gelooft in astrologieis dan gelijk aande kans op geloof in astrologie (A)maal de kans op een vrouw (B)
6 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij onafhankelijkheid (H0)
geobserveerde frequentiesvrouw man totaal
geloof 69 16 85neutraal 90 28 118ongeloof 242 118 360totaal 401 162 563
als we verwachten, onder H0, dat de aanname van onafhankelijkheid geldt dan
Pe(A en B) = P(A)× P(B)
fe(A en B)
n=
f(A)
n×
f(B)
n
fe(A en B) =f(A)× f(B)
n
in woorden: de verwachte celfrequentie bij onafhankelijkheidis het product van de marginale frequenties gedeeld door het totaal aantal
7 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij onafhankelijkheid (H0)
geobserveerde frequentiesvrouw man totaal
geloof 6969 16 8585neutraal 90 28 118ongeloof 242 118118 360360totaal 401401 162162 563
bijvoorbeeld
fe(A en B) =f(A)× f(B)
n
fe(geloof en vrouw) =f(geloof)× f(vrouw)
n=
85× 401
563= 60.54
fe(ongeloof en man) =f(ongeloof)× f(man)
n=
360× 162
563= 103.54
etc.
8 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toetsstatistiek
geobserveerde frequentiesvrouw man totaal
geloof 69 16 85neutraal 90 28 118ongeloof 242 118 360totaal 401 162 563
verwachte frequentiesvrouw man totaal60.54 24.46 8584.05 33.95 118256.46 103.54 360401 162 563
aannamen
1 voor elke cel fe > 1: geen deling door nul
2 χ2-toets voor onafhankelijkheid: voor elke cel fe > 5
9 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toetsstatistiek
geobserveerde frequentiesvrouw man totaal
geloof 69 16 85neutraal 90 28 118ongeloof 242 118 360totaal 401 162 563
verwachte frequentiesvrouw man totaal60.54 24.46 8584.05 33.95 118256.46 103.54 360401 162 563
χ2 =∑ (fo − fe)
2
fe
=(69− 60.54)2
60.54+
(90− 84.05)2
84.05+ . . .+
(118− 103.54)2
103.54= 8.388
de steekproevenverdeling van χ2 heet de χ2-verdeling
net als de t- en F-verdeling betreft het hier een hele familie van verdelingenafhankelijk van het aantal vrijheidsgraden: χ2(df)
10 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-verdeling
Probability p
( 2)*χ
1 (χ2)∗ is altijd positief
2 χ2-verdeling is scheef naar rechts
3 de piek ligt in de buurt van het aantal vrijheidsgraden
4 bij een groot aantal vrijheidsgraden is χ2 normaal verdeeld
11 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-tabel
Probability p
( 2)*χ
Table entry for p is the
critical value ( χ 2 )* with
probability p lying to its
right.
T A B L E F
χ2distribution critical values
Tail probability p
df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005
1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12
2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20
3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73
4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00
5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11 1
nb. χ2(df = 1) = z2
12 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
vrijheidsgraden voor de r× c tabel
geobserveerde frequentiesvrouw man totaal
geloof 69 85neutraal 90 118ongeloof 360totaal 401 162 563
het aantal vrijheidsgraden is df = (r− 1)× (c− 1)
ga maar na:gegeven de marginalen,hoeveel cellen kunnen er vrij ingevuld worden?
stel: α = 0.05wat is dan de grenswaarde (χ2)∗?
13 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-tabel: grenswaarde (χ2)∗
Probability p
( 2)*χ
Table entry for p is the
critical value ( χ 2 )* with
probability p lying to its
right.
T A B L E F
χ2distribution critical values
Tail probability p
df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005
1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12
2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20
3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73
4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00
5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11
14 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toets voor onafhankelijkheid
toets een relatie tussen variabelen met de χ2-toets voor onafhankelijkheid
steekproefgegevens: r = 3, c = 2,χ2 = 8.388
stappenplan χ2-toets voor onafhankelijkheid:2
1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = (r− 1)(c− 1) = 23 toetsingsgrootheid χ2 = 8.3884 verwerpingsgebied df = 2,α = 0.05, (χ2)∗ = 5.995 statistische conclusie χ2 = 8.388 > 5.99 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie geloof in astrologie en geslacht zijn afhankelijk
in de studentenpopulatie
let op: bij grote n (grote power) is χ2 altijd significant15 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-tabel: p-waarde
T A B L E F
χ2distribution critical values
Tail probability p
df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005
1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 12.12
2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 15.20
3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 17.73
4 5.39 5.99 6.74 7.78 9.49 11.14 11.67 13.28 14.86 16.42 18.47 20.00
5 6.63 7.29 8.12 9.24 11.07 12.83 13.39 15.09 16.75 18.39 20.51 22.11
1 rij, aantal vrijheidsgraden df = 2
2 χ2 = 8.388 ligt tussen 7.82 en 9.21
3 p-waarde ligt tussen 0.01 en 0.02
4 conclusie: p < 0.05, H0 wordt verworpen
merk op dat de grenzen waartussen de p-waarde ligt niet verdubbeld worden:deze χ2-tabel geeft direct en uitsluitend de tweezijdige p-waarden
16 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
SPSS: crosstabs χ2-test results
Chi-Square Tests
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Point
Probability
Pearson Chi-Square
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
8.388a
2 .015 .015
8.734 2 .013 .013
8.406 .015
8.200b
1 .004 .005 .002 .001
563
0 cells (0.0%) have expected count less than 5. The minimum expected count is 24.46.a.
The standardized statistic is 2.864.b.
“Het geloof in astrologie is afhankelijk van het geslacht van de student,χ2 = 8.388,df = 2,p = .015.”
gebruik de Fisher’s exact test in plaats van de asymptotische χ2 benaderingde Fisher’s exact test is met name geschikt voor kleine steekproeven
17 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
voorbeeld
– een onderzoeker vraagt zich af of we dieren kunnen laten line-dansen– hij verzamelt 200 katten en verdeelt ze random over twee groepen– hij beloont de ene groep met voedsel voor line-dans-achtig gedrag– de andere groep wordt beloond met affectie– aan het einde van de periode telt hij hoeveel katten konden line-dansen– vraag: is er een relatie tussen line-dansen en het soort beloning?
18 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toets voor homogeniteit
een chi-kwadraat toets (χ2) voor homogeniteit4
wordt gebruikt om te bepalen of twee of meer populaties gelijk verdeeld zijnop een variabele
de gegevens zijn afkomstig van twee of meer populatieshet meetniveau van de variabele is categorisch (nominaal of ordinaal)
twee populaties: voedsel en affectie beloonde katteneen variabele: line-dansen
elke proefpersoon valt in een en slechts een categoriewaarnemingen zijn onafhankelijk van elkaar
de nul hypothese verwacht gelijke proporties of gelijke verdelingen
de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en verwachte frequenties (fe)
de χ2-verdeling heeft df = (r− 1)× (c− 1) vrijheidsgraden
χ2-toets voor homogeniteit of homogeniteit van verdelingen of homogeniteit van populaties19 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
onafhankelijkheid versus homogeniteit
χ2-toets voor onafhankelijkheid
1 een populatie: studenten
2 twee variabelen: geslacht en geloof
3 H0: geslacht en geloof zijn onafhankelijk in de populatie van studenten
4 geen onderscheid tussen verklarende en respons variabele
5 omvang van de steekproef (n) staat vast
χ2-toets voor homogeniteit
1 twee of meer populaties: mannelijke en vrouwelijke studenten
2 een variabele: geloof
3 H0: geloof is gelijk verdeeld in alle populaties
4 onderscheid tussen verklarende (geslacht) en respons variabele (geloof)
5 marginalen van de verklarende variabele staan vast (maar niet per se gelijk)
conclusie: het onderzoeksontwerp bepaalt welke toets passend is5
echter: de verwachte frequenties worden voor beide toetsen op gelijke wijze bepaald20 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-toetsstatistiek
χ2-toetsstatistiek
χ2 =∑ (fo − fe)
2
fe
χ2 is de som over gestandaardiseerde gekwadrateerde residuen
als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijndan is de toetsstatistiek ongeveer gelijk aan nul
de geobserveerde frequenties hebben we geobserveerd, gemeten, geteldde verwachte frequenties (onder H0) kunnen we bepalen met behulp van kansen
21 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij homogeniteit (H0)
geobserveerde frequentiesvoedsel affectie totaal
kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200
onder H0, bij gelijke verdelingen, geldt dat
1 de conditionele kansen gelijk zijn voor alle condities(28/38 = 48/162 en 10/38 = 114/162)
2 de conditionele kansen gelijk zijn aan de marginale kansen(28/38 = 48/162 = 76/200 en 10/38 = 114/162 = 124/200)
6
zie slides TS week 122 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij homogeniteit (H0)
geobserveerde frequentiesvoedsel affectie totaal
kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200
als we verwachten dat de conditionele gelijk zijn aan de marginale kansen dan
Pe(A|B) = P(A)
fe(A en B)
f(B)=
f(A)
n
fe(A en B) =f(A)× f(B)
n
in woorden: de verwachte celfrequentie bij homogeniteitis het product van de marginale frequenties gedeeld door het totaal aantal7
verwachte celfrequentie bij homogeniteit = verwachte celfrequentie bij onafhankelijkheid23 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij homogeniteit (H0)
geobserveerde frequentiesvoedsel affectie totaal
kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200
bijvoorbeeld
fe(A en B) =f(A)× f(B)
n
fe(line-dansen en voedsel) =f(line-dansen)× f(voedsel)
n=
76× 38
200= 14.44
etc.
24 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
verwachte celfrequenties bij homogeniteit (H0)
geobserveerde frequentiesvoedsel affectie totaal
kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200
verwachte frequentiesvoedsel affectie totaal14.44 61.56 7623.56 100.44 12438 162 200
aannamen
1 voor elke cel fe > 1: geen deling door nul
2 gemiddelde fe > 5
25 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toetsstatistiek
geobserveerde frequentiesvoedsel affectie totaal
kan dansen 28 48 76kan niet dansen 10 114 124totaal 38 162 200
verwachte frequentiesvoedsel affectie totaal14.44 61.56 7623.56 100.44 12438 162 200
χ2 =∑ (fo − fe)
2
fe
=(28− 14.44)2
14.44+
(48− 61.56)2
61.56+
(10− 23.56)2
23.56+
(114− 100.44)2
100.44= 25.35
26 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toets voor homogeniteit
het vergelijken van frequentieverdelingen met de χ2-toets voor homogeniteit
steekproefgegevens: r = 2, c = 2,χ2 = 25.35
stappenplan χ2-toets voor homogeniteit:
1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = (r− 1)(c− 1) = 13 toetsingsgrootheid χ2 = 25.354 verwerpingsgebied df = 1,α = 0.05, (χ2)∗ = 3.845 statistische conclusie χ2 = 25.35 > 3.84 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie de verdelingen voor katten beloond met voedsel
en met affectie zijn niet aan elkaar gelijk
27 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
SPSS: crosstabs cell results
linedance * beloning Crosstabulation
beloning
Totalvoedsel affectie
linedance ja Count
Expected Count
nee Count
Expected Count
Total Count
Expected Count
28 48 76
14.4 61.6 76.0
10 114 124
23.6 100.4 124.0
38 162 200
38.0 162.0 200.0
28 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
SPSS: crosstabs χ2-test results
Chi-Square Tests
Value df
Asymp. Sig.
(2-sided)
Exact Sig. (2-
sided)
Exact Sig. (1-
sided)
Pearson Chi-Square
Continuity Correctionb
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
25.356a
1 .000
23.520 1 .000
24.932 1 .000
.000 .000
25.229 1 .000
200
0 cells (0.0%) have expected count less than 5. The minimum expected count is 14.44.a.
Computed only for a 2x2 tableb.
“De verdeling van line-dansen is anders voor de verschillende soorten beloningdie katten krijgen ter aanmoediging, χ2 = 25.35,df = 1,p < .000.”
29 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
Pearsons r versus Pearsons χ2
voor een 2× 2 tabelis de correlatie r tussen de (dichotome) variabelen direct gerelateerd aan χ2
Correlations
linedance beloning
linedance Pearson Correlation
Sig. (2-tailed)
N
beloning Pearson Correlation
Sig. (2-tailed)
N
1 .356**
.000
200 200
.356**
1
.000
200 200
Correlation is significant at the 0.01 level (2-tailed).**.
relatie tussen r en χ2 voor een 2× 2 tabel
r2 × n = χ2
voorbeeld: 0.3562 × 200 = 25.35
30 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
voorbeeld
– oudere mensen kijken uit naar belangrijke gebeurtenissen in een jaar– zo ook naar hun verjaardag– het valt een onderzoeker op dat mensen vaak vlak erna overlijden– een steekproef van 348 overleden bejaarden moet duidelijkheid scheppen– vraag: proberen ouderen hun verjaardag te overleven?
31 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-toets voor goodness-of-fit
een chi-kwadraat toets (χ2) voor goodness-of-fitwordt gebruikt om te bepalen of de verdeling van een categorische variabeleovereenkomt met een theoretische verdeling
de gegevens zijn afkomstig van een populatiehet meetniveau van de variabele is categorisch (nominaal of ordinaal)
een populatie: oudereneen variabele: maand van overlijden
elke proefpersoon valt in een en slechts een categoriewaarnemingen zijn onafhankelijk van elkaar
de nul hypothese verwacht een verdeling gelijk aan een theoretische verdeling
de χ2-toets beoordeelthet verschil tussen geobserveerde (fo) en theoretische frequenties (fe)
de χ2-verdeling heeft df = #categorieen− 1 vrijheidsgraden
32 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
χ2-toetsstatistiek
maand fo fe fo − fe (fo − fe)2 (fo − fe)
2/fe-6 24 29 -5 25 0.86-5 31 29 +2 4 0.14-4 20 29 -9 81 2.79-3 23 29 -6 36 1.24-2 34 29 +5 25 0.86-1 16 29 -13 169 5.830 26 29 -3 9 0.31
+1 36 29 +7 49 1.69+2 37 29 +8 64 2.21+3 41 29 +12 144 4.97+4 26 29 -3 9 0.31+5 34 29 +5 25 0.86
totaal 348 0 22.07
χ2 =∑ (fo − fe)
2
fe= 22.07
33 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
de χ2-toets voor goodness-of-fit
het passen van een frequentieverdeling met de χ2-toets voor goodness-of-fit
steekproefgegevens: n = 12,χ2 = 22.07
stappenplan χ2-toets voor goodness-of-fit:
1 hypothese H0 : fo = fe en Ha : fo 6= fe2 steekproevenverdeling χ2 verdeeld met df = n− 1 = 113 toetsingsgrootheid χ2 = 22.074 verwerpingsgebied df = 11,α = 0.05, (χ2)∗ = 19.685 statistische conclusie χ2 = 22.07 > 19.68 = (χ2)∗ en H0 wordt verworpen6 inhoudelijke conclusie mensen overlijden niet gelijkmatig over het jaar heen
34 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
SPSS: chi-square cell results
delta(maand)
Observed N Expected N Residual
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
Total
24 29.0 -5.0
31 29.0 2.0
20 29.0 -9.0
23 29.0 -6.0
34 29.0 5.0
16 29.0 -13.0
26 29.0 -3.0
36 29.0 7.0
37 29.0 8.0
41 29.0 12.0
26 29.0 -3.0
34 29.0 5.0
348
35 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
SPSS: chi-square test results
Test Statistics
delta(maand)
Chi-Square
df
Asymp. Sig.
22.069a
11
.024
0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 29.0.a.
“De verdeling van overlijdens komt niet overeen met de verwachteuniforme verdeling, χ2 = 22.07,df = 11,p = .024. Er zijn meer ouderendie na hun verjaardag overlijden (fo = 35.5 per maand),dan voor hun verjaardag (fo = 26.6 per maand).”
36 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
deze week: wat hebben we geleerd?
de verschillende χ2-onderzoekssituaties
de verwachte frequenties voor de verschillende χ2-situaties
uitvoeren en beoordelen van een χ2-toets
de relatie tussen Pearsons r en Pearsons χ2
37 / 38
introductie χ2-toets voor onafhankelijkheid pauze χ
2-toets voor homogeniteit χ2-toets voor goodness-of-fit ten slotte
deze week: wat moeten we nog leren?
het kunnen kiezen van de juiste toets
het uitvoeren en beoordelen van een χ2-toets
38 / 38