1
Cursus Mei – Juni 2002Cursus Mei – Juni 2002Kruistabelanalyse & Logistische regressieKruistabelanalyse & Logistische regressie
Frans Tan Methodologie en StatistiekFrans Tan Methodologie en Statistiek
2
Programma
1. 06-5
2. 13-5
3. 27-5
4. 03-6
5. 10-6
6. 17-6
• Confounding, standaardisatie, Mantel Haenszel
• Enkelvoudige logistische reg. Dummy variabelen
• Log.reg. Met covariaten en interactie• Bespreking opdrachten• Vergelijking met Ancova• Bespreking opdrachten
3
VoorkennisVoorkennis
• Toetsingstheorie
• Multipele regressie
OnderwerpenOnderwerpen
• ConfoundingConfounding• Standaardisatie/stratificatie/Mantel-HaenszelStandaardisatie/stratificatie/Mantel-Haenszel• Logistische regressieLogistische regressie
4
Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen
• Effect van een bepaalde behandeling op objects (bijv. Personen)
• Ook algemener: (causaal) effect van een grootheid X op een grootheid Y
5
Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen
GroepGroep
behandelingbehandeling
Geen behandelingGeen behandeling
discrepantiediscrepantie
Ideale situatie niet haalbaar. Ideale situatie niet haalbaar. Werken met proxy-controle groepWerken met proxy-controle groep
6
Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen
• De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf
• Associatie impliceert niet causale relatie tussen X en Y• Voldoende voor geen confounding is
- een gebalanceerd design- een gerandomiseerde toewijzing in groepen
Confounding (adequacy of the control group)Confounding (adequacy of the control group)
7
Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen
• Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe
• Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie
8
Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels
Overleven
gecombineerd Lage snelheid Hoge snelheid
nee ja Nee ja nee ja
nee 20 30 2 18 18 12
Gordel
ja 10 40 4 36 6 4
RR (OR) 2 ( 2.67) 1 ( 1) 1 (1)
Snelheid een confounder ?Snelheid een confounder ?
9
Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind
Kindersterfte
gecombineerd ondergewicht Normaal gew.
ja nee ja nee ja nee
oud 100 900 90 540 10 450
Lft.
moeder
jong 10 255 5 30 5 225
RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1)
Geboortegewicht een confounder ?Geboortegewicht een confounder ?
10
Illustratie 3. Effect medicijn op genezingeen gebalanceerd design
genezen
gecombineerd lichtzieken zwaarzieken
ja nee ja nee ja nee
Int. 115 85 95 5 20 80
medicijn
Contr. 85 115 80 20 5 95
RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75)
Ernst van de ziekte een confounder ?Ernst van de ziekte een confounder ?
11
Confounding
1. C is geen causaal gevolg van R (mediator)
2. Geen gerandomiseerd design
3. Geen balanced design
4. Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)
Als een factor C een confounder is, danAls een factor C een confounder is, dan
12
Confounding
• Het negeren van een confounder leidt tot vertekende resultaten (bias)• Een maat voor de invloed van een confounder is bias• Stel de werkelijke (populatie) waarde van een behandelingseffect
en ô een schatter voor
bias (ô) = verwachte waarde (ô) -
waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek
13
Methoden voor bias controle
• Standaardisatie- directe- indirecte
• Stratificatie volgens Mantel Haenszel• Correlationele methoden
14
Directe standaardisatie
confounder Fractie groep 1
Fractie groep 2
Standaard verdeling
1 p11 p21 fs1
2 p12 p22 fs2
. . . .
J p1J p2J fsJ
Verdeling van de confounder standaardiseren door Verdeling van de confounder standaardiseren door een verdeling van een standaard populatieeen verdeling van een standaard populatie
Relatief risico groep 1 t.o.v groep 2Relatief risico groep 1 t.o.v groep 2
RRp f p f p f
p f p f p fad js s J sJ
s s J sJ
11 1 1 2 2 1
2 1 1 2 2 2 2
. . .
. . .
15
Indirecte standaardisatie
confounder Fractie groep 1
Standaard verdeling
fs1 pc1
fs2 pc2
. .
fsJ pc2
Overall 1 pv pc
Verdeling van de specifieke fracties standaardiseren Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMRen vervolgens correctie toepassen m.b.v. SMR
Als standaard Als standaard populatie de controle populatie de controle groep is, dan is groep is, dan is RrRradjadj = SMR = SMR
SM Rp
p f p f p fv
c s c s cJ sJ
1 1 2 2 . . .
16
Enkele opmerkingen
• Compacte samenvatting van wat gaande is• Als steekproefaantal per stratum klein of zelfs nul• Als RR constant over strata van de confounder, dan
levert de directe methode veelal een schatting op zonder vertekening
• Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is
• Geen toets voorhanden• Variatie over strata door standaardisatie gemaskeerd
17
Stratificatie volgens Mantel Haenszel
• Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval?
• Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant?
• Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?
18
Stratificatie volgens Mantel Haenszel
• Als associatie niet consistent, dan Mantel Haenszel niet geschikt
• Mogelijk betrouwbaarheidsintervallen te contrueren
• Onder consistentie is de Mantel-Haenszel schatter onvertekend
19
Logistisch regressiemodelLogistisch regressiemodel
• sgewijze logistische regressie
• lll
20
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het model
• Vergelijking met een kruistabelanalyse
• Model met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
21
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyse
• Model met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
22
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
23
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactieModel met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
24
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactieModel met covariaat/interactie
• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
25
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactieModel met covariaat/interactie
• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen
26
Logistisch regressiemodelLogistisch regressiemodelC
I JF
ER
CIJ
FE
R
STUDIETIJDSTUDIETIJD
model:model:
y is continu en x mag discreet zijny is continu en x mag discreet zijn
Y X0 1
27
Logistisch regressiemodelLogistisch regressiemodelU
ITS
LAG
UIT
SLA
G
STUDIETIJDSTUDIETIJD
wat als y dichotoom is ?wat als y dichotoom is ?
11
00
28
Logistisch regressiemodelLogistisch regressiemodelU
ITS
LAG
UIT
SLA
G
STUDIETIJDSTUDIETIJD
bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval
11
00
29
Logistisch regressiemodelLogistisch regressiemodelU
ITS
LAG
UIT
SLA
G
STUDIETIJDSTUDIETIJD
bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval
11
00
30
Logistisch regressiemodelLogistisch regressiemodelS
LAG
ING
SS
LAG
I NG
SP
ER
CE
NT
AG
EP
ER
CE
NT
AG
E
X = STUDIETIJDX = STUDIETIJD
11
00
EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFTIS
Pe X
1
1 0 1( )
IN PLAATS VAN
NOTEREN WE
e X) ( 0 1
EXP{-( + X)}0 1
31
Logistisch regressiemodelLogistisch regressiemodelS
LAG
ING
SS
LAG
I NG
SP
ER
CE
NT
AG
EP
ER
CE
NT
AG
E
X = STUDIETIJDX = STUDIETIJD
11
00
een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P
e X
1
1 0 1( )
IN PLAATS VAN
NOTEREN WE
e X) ( 0 1
EXP{-( + X)}0 1
32
Logistisch regressiemodelLogistisch regressiemodelS
LAG
ING
SS
LAG
I NG
SP
ER
CE
NT
AG
EP
ER
CE
NT
AG
E
X = STUDIETIJDX = STUDIETIJD
11
00
een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P
e X
1
1 0 1( )
In plaats van
Noteren we
e X) ( 0 1
EXP{-( + X)}0 1
33
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyse
• Model met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
34
Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel
Pe X
1
1 0 1( ) Het logistische modelHet logistische model
Kan herschreven worden alsKan herschreven worden als
In plaats van In plaats van noteren we ook noteren we ook
Logit(p)Logit(p) of of ln(odds)ln(odds)
LNP
1 PX
0 1
LNP
1 P
35
Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel
PP
X = STUDIETIJDX = STUDIETIJD
11
00
Pe X
1
1 0 1( )
36
Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel
X = STUDIETIJD
11
00
LNP
1 P
LNP
1 PX
0 1
37
Specificatie van het model• Y = Dropout (wel =1, niet =0)
X = jaarcohort COHORT * DROPOUT Crosstabulation
Count
66 1 67
54 10 64
61 7 68
54 17 71
52 23 75
53 19 72
44 27 71
57 17 74
63 24 87
40 25 65
66 14 80
48 35 83
40 44 84
38 47 85
37 54 91
39 54 93
58 35 93
870 453 1323
74,00
75,00
76,00
77,00
78,00
79,00
80,00
81,00
82,00
83,00
84,00
85,00
86,00
87,00
88,00
89,00
90,00
COHORT
Total
no yes
DROPOUT
Total
38
Specificatie van het model• Als logistische regressiemodel:
logit (p) = 0 + 1 Cohort
Variables in the Equation
,133 ,013 103,021 1 ,000 1,143
-11,715 1,098 113,814 1 ,000 ,000
COHORT
Constant
Step1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: COHORT.a.
39
Specificatie van het modelgroot steekproefaantal
• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +
COHORT
100908070
LO
GIT
1,5
1,0
,5
0,0
-,5
-1,0
40
Specificatie van het modelgroot steekproefaantal
• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +
• Problem: als p=0, dan logit (f) bestaat niet• Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01
Coefficientsa
-11,540 1,912 -6,037 ,000
,133 ,023 ,710 5,699 ,000
(Constant)
COHORT
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: LOGITa.
R-square R-square = 0.504= 0.504
41
Specificatie van het modelgroot steekproefaantal
• Als lineair kansmodel:f = 0 + 1 Cohort +
COHORT
100908070
PE
RC
80
60
40
20
0
-20
42
Specificatie van het modelgroot steekproefaantal
• Als lineair kansmodel:f = 0 + 1 Cohort +
Coefficientsa
-191,997 39,858 -4,817 ,000
2,758 ,485 ,709 5,684 ,000
(Constant)
COHORT
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: PERCa.
R-square = 0.502R-square = 0.502
43
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
44
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
Voorbeeld: Voorbeeld: effect van geslacht op toelating effect van geslacht op toelating tot de universiteit berkeley.tot de universiteit berkeley.
STUDIE 1STUDIE 1 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 1919 8989
MANMAN 313313 512512
STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 88 1717
MANMAN 207207 353353
STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 391391 202202
MANMAN 205205 120120
45
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
IN TERMEN VAN KANSEN
SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 418418 308308
MANMAN 725725 985985
PM AN
9 8 5
7 2 5 9 8 55 7 6.
PVR O U W
3 0 8
4 1 8 3 0 84 3 0.
vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit
RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR))
R RP
PM AN
VR O U W
.
..
5 7 6
4 3 01 3 4
MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
46
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
in termen van kansenin termen van kansen
SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 418418 308308
MANMAN 725725 985985
PM AN
9 8 5
7 2 5 9 8 55 7 6.
PVR O U W
3 0 8
4 1 8 3 0 84 3 0.
vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit
47
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
in termen van kansenin termen van kansen
SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 418418 308308
MANMAN 725725 985985
PM AN
9 8 5
7 2 5 9 8 55 7 6.
PVR O U W
3 0 8
4 1 8 3 0 84 3 0.
vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit
relatieve succeskans (in literatuur: relatief risico (rr))relatieve succeskans (in literatuur: relatief risico (rr))R R
P
PM AN
VR O U W
.
..
5 7 6
4 3 01 3 4
mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit
48
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
in termen van oddsin termen van odds
SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 418418 308308
MANMAN 725725 985985
O D D S(M AN )# W EL
# N IET
9 8 5
7 2 51 3 5 9.
RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR))
O RO D D S(M AN )
O D D S(VR O U W )
1 359
7378
.
..1 4
MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
O D D S(VR O U W )# W EL
# N IET
3 0 8
4 1 87 3 7.
49
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
in termen van oddsin termen van odds
SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 418418 308308
MANMAN 725725 985985
O D D S(M AN )# W EL
# N IET
9 8 5
7 2 51 3 5 9.
relatieve odds (in literatuur: oddsratio(or))relatieve odds (in literatuur: oddsratio(or))
O RO D D S(M AN )
O D D S(VR O U W )
1 359
7378
.
..1 4
mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit
O D D S(VR O U W )# W EL
# N IET
3 0 8
4 1 87 3 7.
50
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Het verschil tussen rr (=1.34) en or (= 1.84) is Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schalingeen verschil in schaling
• Belangrijk voor interpretatie:Belangrijk voor interpretatie:als rr > (of <) 1, dan or > (of <) 1als rr > (of <) 1, dan or > (of <) 1
51
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
1.1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelen van de variabelen
2.2. Schat de regressieparameters met spssSchat de regressieparameters met spss
3.3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregelsrekenregels
Dezelfde analyse met logistische regressieDezelfde analyse met logistische regressie
Te volgen stappen:Te volgen stappen:
52
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Model: Model:
let op! Wat geeft p aanlet op! Wat geeft p aan 1 als man 1 als man
• Hoe is gesl. Gecodeerd. Hier: gesl = Hoe is gesl. Gecodeerd. Hier: gesl = 0 als 0 als
vrouwvrouw
Stap 1.Stap 1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelenvan de variabelen
LNP
1 PG ESL.
0 1
53
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
Het geschatte model:Het geschatte model:
Merk op :Merk op : odds = odds =
i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307
Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305
Stap 2.Stap 2. Schat de regressieparameters met spss Schat de regressieparameters met spss
LN O D D S G ESL. . .3 0 5 6 1 2
P
1 P
54
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels
Rekenregels: 1.Rekenregels: 1. 2. 2.
LNA
BLN (A) LN (B
)
LN (X) C X = EXP(C )
Dus: regel 1.
= .307 - -.305 = .612
Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84
LN (O R ) = LNO D D S(M AN )
O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )
)
55
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels
Rekenregels: 1.Rekenregels: 1. 2. 2.
LNA
BLN (A) LN (B
)
LN (X) C X = EXP(C )
Dus: Dus: regel 1regel 1..
= .307 - -.305 = .612= .307 - -.305 = .612
Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84
LN (O R ) = LNO D D S(M AN )
O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )
)
56
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels
Rekenregels: 1.Rekenregels: 1. 2. 2.
LNA
BLN (A) LN (B
)
LN (X) C X = EXP(C )
Dus: Dus: regel 1regel 1..
= .307 - -.305 = .612= .307 - -.305 = .612
regel 2. Ln (OR) = .612. Dus OR= exp (.612) = 1.84
LN (O R ) = LNO D D S(M AN )
O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )
)
57
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Model:
= ln (or), mits verschil in codes van variabele
x gelijk is aan 1.
• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or)
• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Enkele opmerkingenEnkele opmerkingen::LN
P
1 PX.
0 1
1
1
1
7
58
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Model:Model:
= ln (or), mits verschil in codes van variabele = ln (or), mits verschil in codes van variabele x gelijk is aan 1.x gelijk is aan 1.
• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan
= * ln (or)
• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Enkele opmerkingenEnkele opmerkingen::
LNP
1 PX.
0 1
1
1
1
7
59
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
XX
11
00
LNP
1 P
LNP
1 PX
0 1
de hellingde helling is een monotone functie van de is een monotone functie van de oddsratio or oddsratio or
1
60
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van
variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde
richting) , dan = * ln (or)richting) , dan = * ln (or)
rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Enkele opmerkingenEnkele opmerkingen::LN
P
1 PX.
0 1
1
11
7
61
Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel
• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van
variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde
richting) , danrichting) , dan = * ln (or) = * ln (or)
• veverschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Enkele opmerkingenEnkele opmerkingen::LN
P
1 PX.
0 1
1
11
7
62
Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel
• Specificatie van het modelSpecificatie van het model
• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse
• Model met covariaat/interactieModel met covariaat/interactie
• Toetsen voor het vergelijken tussen modellen
• Stapsgewijze logistische regressie
63
Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel
Net als bij ancova kan er sprake zijn van een Net als bij ancova kan er sprake zijn van een storende variabelestorende variabele
Ontstaat bijvoorbeeld doordat Ontstaat bijvoorbeeld doordat
Er studierichtingen zijn met strenge eisen en Er studierichtingen zijn met strenge eisen en overwegend vrouwenoverwegend vrouwen
Er studierichtingen zijn met minder strenge eisen Er studierichtingen zijn met minder strenge eisen en overwegend mannenen overwegend mannen
64
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 1919 8989
MANMAN 313313 512512
STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 88 1717
MANMAN 207207 353353
STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 391391 202202
MANMAN 205205 120120
strenge eisen en strenge eisen en overwegend vrouwenoverwegend vrouwen
Minder strenge eisen en Minder strenge eisen en overwegend mannenoverwegend mannen
65
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodel
GESLACHTGESLACHT
11
00
LNP
1 P
VROUWVROUW MANMAN
STUDIERICHTING 3STUDIERICHTING 3
STUDIERICHTING 1STUDIERICHTING 1
GECOMBINEERDGECOMBINEERD
dit fenomeen heet confounding (vergelijk ancova)dit fenomeen heet confounding (vergelijk ancova)
in model studierichting opnemen als covariaatin model studierichting opnemen als covariaat
66
Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel
GESLACHTGESLACHT
11
00
LNP
1 P
VROUWVROUW MANMAN
STUDIERICHTING 3STUDIERICHTING 3
STUDIERICHTING 1STUDIERICHTING 1
GECOMBINEERDGECOMBINEERD
dit fenomeen heet interactie(vergelijk ancova).dit fenomeen heet interactie(vergelijk ancova).
in model geslacht * studierichting opnemen als in model geslacht * studierichting opnemen als interactieinteractie
67
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodel
GESLACHTGESLACHT
11
00
LNP
1 P
VROUWVROUW MANMAN
STUDIERICHTING 3STUDIERICHTING 3
STUDIERICHTING 1STUDIERICHTING 1
GECOMBINEERDGECOMBINEERD
nb. interactie ook mogelijk indien verdeling nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijkmannen en vrouwen over studierichtingen gelijk
68
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 1919 8989
MANMAN 313313 512512
STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 88 1717
MANMAN 207207 353353
STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN
NIETNIET WELWEL
VROUWVROUW 391391 202202
MANMAN 205205 120120
O R STU D IE1 5 1 2
3 1 3
1 9
8 93 4 9.
O R STU D IE2 3 5 3
2 0 7
8
1 78 0 3.
O R STU D IE3 1 2 0
2 0 5
3 9 1
2 0 21 1 3 3.
69
Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel
Verschillen tussen oddsratios kunnen Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover toegeschreven worden aan toeval (hierover later)later)
Eerst consequentie voor model en interpretatie alsEerst consequentie voor model en interpretatie als
1.1. Studierichting een covariaat isStudierichting een covariaat is
2.2. Er sprake is van interactie tussen studierichting Er sprake is van interactie tussen studierichting en geslachten geslacht
70
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodel
Daar studierichting discreet is, dienen we Daar studierichting discreet is, dienen we dummy variabelen aan te makendummy variabelen aan te maken
11 als studierichting 2als studierichting 2Studie (2) =Studie (2) =
00 andersanders
11 als studierichting 3als studierichting 3Studie (3) =Studie (3) =
00 andersandersStudierichting 1 fungeert als referentiegroepStudierichting 1 fungeert als referentiegroep
71
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodelad1. studierichting is een covariaatad1. studierichting is een covariaat
LN (
OD
DS
)LN
(O
DD
S)
GESLACHTGESLACHTVROUWVROUW MANMAN
GECOMBINEERDGECOMBINEERD
alle regressielijnen zijn evenwijdig aan elkaar. dusalle regressielijnen zijn evenwijdig aan elkaar. dusmaar ongelijk aanmaar ongelijk aan
model is: model is:
O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
72
Model met covariaat/interactieModel met covariaat/interactie
logistisch regressiemodellogistisch regressiemodeluitvoer logistich regressiemodel met covariaatuitvoer logistich regressiemodel met covariaat
Variables in the EquationVariables in the Equation
-,197-,197 ,117,117 2,8292,829 11 ,093,093 ,821,821
139,246139,246 22 ,000,000
-,037-,037 ,110,110 ,110,110 11 ,740,740 ,964,964
-1,315-1,315 ,117,117 126,961126,961 11 ,000,000 ,268,268
,768,768 ,125,125 37,93037,930 11 ,000,000 2,1562,156
GESLACHTGESLACHT
STUDIESTUDIE
STUDIE(STUDIE(22))
STUDIE(STUDIE(33))
ConstantConstant
BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)
dus model is geschat door:dus model is geschat door:
ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)
en en = exp (-.197) = .821= exp (-.197) = .821 nb! denk aan stappenplannb! denk aan stappenplan
O R adj
73
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ad2.ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTGESLACHT
LN (
OD
DS
)LN
(O
DD
S)
GESLACHTGESLACHTVROUWVROUW MANMAN
GECOMBINEERDGECOMBINEERD
REGRESSIELIJNEN ZIJN REGRESSIELIJNEN ZIJN NIETNIET EVENWIJDIG. DUS ER GELDT EVENWIJDIG. DUS ER GELDT NIETNIET==
MODEL IS: MODEL IS:
O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE( )4
0 1 2 3
5 3
STUDIE 1STUDIE 1
STUDIE 2STUDIE 2
STUDIE 3STUDIE 3
74
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEUITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEVariables in the EquationVariables in the Equation
-1,052-1,052 ,263,263 16,03616,036 11 ,000,000 ,349,349
75,43075,430 22 ,000,000
-,790-,790 ,498,498 2,5222,522 11 ,112,112 ,454,454
-2,205-2,205 ,267,267 68,09468,094 11 ,000,000 ,110,110
15,46215,462 22 ,000,000
,832,832 ,510,510 2,6572,657 11 ,103,103 2,2982,298
1,1771,177 ,300,300 15,43615,436 11 ,000,000 3,2443,244
1,5441,544 ,253,253 37,33337,333 11 ,000,000 4,6844,684
GESLACHTGESLACHT
STUDIESTUDIE
STUDIE(STUDIE(22))
STUDIE(STUDIE(33))
GESLACHT * STUDIEGESLACHT * STUDIE
GESLACHT by STUDIE(GESLACHT by STUDIE(22))
GESLACHT by STUDIE(GESLACHT by STUDIE(33))
ConstantConstant
StepStep11
aa
BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)
. .
DUS MODEL IS GESCHAT DOOR:DUS MODEL IS GESCHAT DOOR:
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
75
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
OR VOOR STUDIERICHTING 1:LN(ODDS{M,ST1}) = 1.544-1.052
LN(ODDS{V,ST1})= 1.544
OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832
LN(ODDS{V,ST2}) = 1.544 - .79
OP DEZELFDE MANIER
LN (O R ) 1.052 O R .349STU D IE1 STU D IE1
LN (O R ) 22 O R .803STU D IE2 STU D IE2
O R STU D IE3 1 1 3 3.
76
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052
LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544
OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832
LN(ODDS{V,ST2}) = 1.544 - .79
OP DEZELFDE MANIER
LN (O R ) 1.052 O R .349STU D IE1 STU D IE1
LN (O R ) 22 O R .803STU D IE2 STU D IE2
O R STU D IE3 1 1 3 3.
77
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052
LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544
OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832
LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79
OP DEZELFDE MANIER
LN (O R ) 1.052 O R .349STU D IE1 STU D IE1
LN (O R ) 22 O R .803STU D IE2 STU D IE2
O R STU D IE3 1 1 3 3.
78
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052
LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544
OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832
LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79
OP DEZELFDE MANIER OP DEZELFDE MANIER
LN (O R ) 1.052 O R .349STU D IE1 STU D IE1
LN (O R ) 22 O R .803STU D IE2 STU D IE2
O R STU D IE3 1 1 3 3.
79
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:
OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN
DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL
IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN
DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN
LN O D D S G ESL. 0 1
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
80
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:
OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN
DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL
IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN
DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN
LN O D D S G ESL. 0 1
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
81
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:
OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN
DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL
IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN
DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN
LN O D D S G ESL. 0 1
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
82
MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:
OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN
DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL
IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN
DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELVAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENENIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN
LN O D D S G ESL. 0 1
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
83
LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
• BEPERKING LINEAIRE REGRESSIEMODELBEPERKING LINEAIRE REGRESSIEMODEL
• SPECIFICATIE VAN HET MODELSPECIFICATIE VAN HET MODEL
• VERGELIJKING MET EEN KRUISTABELANALYSEVERGELIJKING MET EEN KRUISTABELANALYSE
• MODEL MET COVARIAAT/INTERACTIEMODEL MET COVARIAAT/INTERACTIE
• TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN
• STAPSGEWIJZE LOGISTISCHE REGRESSIE
84
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENLOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
DRIE MODELLENDRIE MODELLEN
1.1.
2.2.
3.3.
LN O D D S G ESL. 0 1
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
85
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
Dependent Variable Encoding
0
1
Original Valueniet
wel
Internal Value
Categorical Variables Codings
4 ,000 ,000
4 1,000 ,000
4 ,000 1,000
1,00
2,00
3,00
STUDIEFrequency (1) (2)
Parameter coding
86
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 0: Beginning BlockBlock 0: Beginning Block
Variables in the Equation
,123 ,041 9,225 1 ,002 1,131ConstantStep 0B S.E. Wald df Sig. Exp(B)
MODEL ISMODEL IS LN O D D S 0
87
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
Model Summary
3320,596 ,019 ,026Step1
-2 Loglikelihood
Cox & SnellR Square
NagelkerkeR Square
Variables in the Equation
,612 ,090 46,599 1 ,000 1,844
-,305 ,075 16,538 1 ,000 ,737
GESLACHT
Constant
Step1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: GESLACHT.a.
Block 1: Method = EnterBlock 1: Method = Enter
MODEL LN O D D S G ESL. 0 1
Omnibus Tests of Model Coefficients
47,175 1 ,000
47,175 1 ,000
47,175 1 ,000
Step
Block
Model
Step 1Chi-square df Sig.
88
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
Block 2: Method = EnterBlock 2: Method = EnterMODELMODEL LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3
Omnibus Tests of Model Coefficients
149,724 2 ,000
149,724 2 ,000
196,898 3 ,000
Step
Block
Model
Step 1Chi-square df Sig.
Variables in the Equation
-,197 ,117 2,829 1 ,093 ,821
139,246 2 ,000
-,037 ,110 ,110 1 ,740 ,964
-1,315 ,117 126,961 1 ,000 ,268
,768 ,125 37,930 1 ,000 2,156
GESLACHT
STUDIE
STUDIE(2)
STUDIE(3)
Constant
Step1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: GESLACHT, STUDIE.a.
-2LL = 3320.596 – 149.724 = 3170.872
89
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
Block 3: Method = EnterBlock 3: Method = Enter
LN (O D D S) G ESL STU D IE(2) STU D IE(3)
+ G ESL STU D IE(2) G ESL STU D IE(3)4
0 1 2 3
5
MODELMODEL
-2LL = 3170.872 – 17.197 = 3153.675
Variables in the Equation
-1,052 ,263 16,036 1 ,000 ,349
75,430 2 ,000
-,790 ,498 2,522 1 ,112 ,454
-2,205 ,267 68,094 1 ,000 ,110
15,462 2 ,000
,832 ,510 2,657 1 ,103 2,298
1,177 ,300 15,436 1 ,000 3,244
1,544 ,253 37,333 1 ,000 4,684
GESLACHT
STUDIE
STUDIE(1)
STUDIE(2)
GESLACHT * STUDIE
GESLACHT by STUDIE(1)
GESLACHT by STUDIE(2)
Constant
Step1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: GESLACHT, STUDIE, GESLACHT * STUDIE .a.
STEP = 17.197 DF = 2 P-WAARDE = .0002
90
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
WELK MODELWELK MODEL::
OP GROND VAN TOP-DOWN PROCEDUREOP GROND VAN TOP-DOWN PROCEDURE
KEUZE MODEL MET INTERACTIEKEUZE MODEL MET INTERACTIE
DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOSDUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS
91
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1} = 1.544-1.052LN(ODDS{M,ST1} = 1.544-1.052
LN(ODDS{V,ST1} = 1.544LN(ODDS{V,ST1} = 1.544
OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832
LN(ODDS{V,ST2} = 1.544LN(ODDS{V,ST2} = 1.544 - .79 - .79
OP DEZELFDE MANIER OP DEZELFDE MANIER
LN (O R ) 1.052 O R .349STU D IE1 STU D IE1
LN (O R ) 22 O R .803STU D IE2 STU D IE2
O R STU D IE3 1 1 3 3.
92
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL
ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT
LN (
OD
DS
)LN
(O
DD
S)
GESLACHTGESLACHTVROUWVROUW MANMAN
STUDIE 1STUDIE 1
STUDIE 2STUDIE 2
STUDIE 3STUDIE 3
CONCLUSIECONCLUSIE
93
AncovaAncovacovariantieanalysecovariantieanalyse
groepen met elkaar te vergelijken in aanwezigheid groepen met elkaar te vergelijken in aanwezigheid van covariatenvan covariaten
covariaatcovariaat
een onafhankelijke variabele in het model waarvan een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de het effect niet interessant is voor de onderzoeksvraagonderzoeksvraag
94
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressie
•Model met storende variabele
•Welk model verdient de voorkeur
95
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabele
•Welk model verdient de voorkeur
96
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabeleModel met storende variabele
•Welk model verdient de voorkeur
97
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabeleModel met storende variabele
•Welk model verdient de voorkeurWelk model verdient de voorkeur
98
VoorbeeldVoorbeeldcovariantieanalysecovariantieanalyse
Vergelijken tussen rokers en niet rokers met Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Betrekking tot verandering in polsslag na een LoopoefeningLoopoefening
PO
LSP
OLS
GEWICHTGEWICHT
ROKERROKER
NIET ROKERNIET ROKER
99
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabele
•Welk model verdient de voorkeur
100
T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse
Twee formuleringen:Twee formuleringen:
1.1. Vergelijken tussen twee onafhankelijke Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets.steekproeven. Leidt tot t-toets.
2.2. Effect van roken op verandering in polsslag.Effect van roken op verandering in polsslag.Leidt tot lineaire regressieLeidt tot lineaire regressie..
101
T-toets versus lineaire regressieT-toets versus lineaire regressie
covariantieanalysecovariantieanalyse
Group StatisticsGroup Statistics
SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error
nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678
POLSPOLS
yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424
ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven
Independent Samples Test
t-test for Equality of Means
t df Sig. (2-tailed) Mean Difference
Equal variances assumed 1,340 33 ,189 7,0978
102
T-toets versus lineaire regressieT-toets versus lineaire regressie
covariantieanalysecovariantieanalyse
Group StatisticsGroup Statistics
SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error
nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678
POLSPOLS
yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424
ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven
Independent Samples TestIndependent Samples Test
t-test for Equality of Meanst-test for Equality of Means
tt df df Sig. (2-tailed)Sig. (2-tailed) Mean DifferenceMean Difference
Equal variances assumedEqual variances assumed 1,3401,340 3333 ,189,189 7,09787,0978
103
T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse
ad 2.ad 2. lineaire regressielineaire regressie
PO
LSP
OLS
ROKENROKEN
ROKERROKER
NIET ROKERNIET ROKER21.421.4
14.314.3
ModelModel PO LS b b R O KEN e0 1 Y Y br nr 1
NIETNIET
(CODE 0)(CODE 0)
WELWEL
(CODE 1)(CODE 1)
Dus een negatieve hellingDus een negatieve helling
104
T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse
Unstandardized CoefficientsUnstandardized Coefficients
ModelModel BB Std. Error Std. Error t t Sig.Sig.
(Constant)(Constant) 21,34821,348 3,1023,102 6,8826,882 ,000,000
SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189
uitvoer enkelvoudige regressieanalyseuitvoer enkelvoudige regressieanalyse
dus model isdus model is Y = 21.4 – 7.1 ROKEN + e Y = 21.4 – 7.1 ROKEN + e
Y Y br nr 1 = -7.1
105
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabeleModel met storende variabele
•Welk model verdient de voorkeur
106
Model met storende variabeleModel met storende variabeleCOVARIANTIEANALYSECOVARIANTIEANALYSE
lichaamsgewicht is potentiele storende variabelelichaamsgewicht is potentiele storende variabele
er zijn drie mogelijkhedener zijn drie mogelijkheden
PO
LSP
OLS
GEWICHTGEWICHT
ROKERROKER
NIET ROKERNIET ROKER
107
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
a. gewicht is geen storende variabelea. gewicht is geen storende variabeleP
OL S
PO
L S
ROKENROKEN
ROKERROKER
NIET ROKERNIET ROKER21.421.4
14.314.3
108
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
b. gewicht is een covariaat(confounder)b. gewicht is een covariaat(confounder)
twee evenwijdige regressielijnentwee evenwijdige regressielijnen
PO
LSP
OLS
GEWICHTGEWICHT
ROKERROKER
NIET ROKERNIET ROKER
109
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
c. er is een interactie tussen gewicht en rokenc. er is een interactie tussen gewicht en roken
twee niet evenwijdige regressielijnentwee niet evenwijdige regressielijnen
PO
LSP
OLS
GEWICHTGEWICHT
ROKERROKER
NIET ROKERNIET ROKER
110
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
ad b.ad b. als gewicht een covariaat is, dan als gewicht een covariaat is, dan modelmodel PO LS R O KEN G EW IC H T 0 1 2
POLSPOLS
GEWICHTGEWICHT
21.421.4
14.314.3
Y adj
zonder gewicht:zonder gewicht: Y Y Y 14.3 21.4 7.1r nr
met gewicht als covariaat:met gewicht als covariaat: Y adj 1
111
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
PO LS R O KEN G EW IC H T 0 1 2
POLSPOLS
GEWICHTGEWICHT
21.421.4
14.314.3
Y adj
Y adj 1
E(Y |R O KER ) G EW IC H T
E(Y |N IET R O KER ) G EW IC H T
0 1 2
0 1 2
1
0
112
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
Unstandardized CoefficientsUnstandardized Coefficients
ModelModel BB Std. ErrorStd. Error tt Sig.Sig.
(Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000
SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362
weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003
uitvoer regressiemodel met covariaatuitvoer regressiemodel met covariaat
dus model is:dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e
Y badj 1 = - 4.4
113
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
ad c.ad c. als er een interactie is tussen gewicht en als er een interactie is tussen gewicht en roken , dan model:roken , dan model:PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3POLSPOLS
GEWICHTGEWICHT
21.421.4
14.314.3
Y adj
MET INTERACTIETERM:MET INTERACTIETERM: Y G EW IC H Tadj 1 3
R_G
114
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3
POLSPOLS
GEWICHTGEWICHT
21.421.4
14.314.3
Y adj Y G EW IC H Tadj 1 3
R_GR_G
E(Y |R O KER ) G EW IC H T + 1 G EW IC H T
E(Y |N IET R O KER ) G EW IC H T G EW IC H T3
3
0 1 2
0 1 2
1
0 0
115
Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse
Unstandardized CoefficientsUnstandardized Coefficients
ModelModel BB Std. ErrorStd. Error t t Sig. Sig.
(Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000
SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242
weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004
R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295
uitvoer regressiemodel met interactieuitvoer regressiemodel met interactie
dus model isdus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e : Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e
Y G EW IC H Tadj 3 7 9 2. .
116
AncovaAncovacovariantieanalysecovariantieanalyse
•VoorbeeldVoorbeeld
•T-toets versus lineaire regressieT-toets versus lineaire regressie
•Model met storende variabeleModel met storende variabele
•Welk model verdient de voorkeurWelk model verdient de voorkeur
117
Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse
Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:
1. Toets op interactieals dan geen interactie
2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele
PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3
3 0H
H0 3
3
0
0
:
:
a
2 0H
H0 2
2
0
0
:
:
a
118
Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse
Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:
1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie
1. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele
PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3
3 0
H
H0 3
3
0
0
:
:
a
2 0H
H0 2
2
0
0
:
:
a
119
Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse
Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:
1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie
2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele
PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3
3 0
H
H0 3
3
0
0
:
:
a
2 0 H
H0 2
2
0
0
:
:
a
120
AncovaAncovacovariantieanalysecovariantieanalyse
Unstandardized CoefficientsUnstandardized Coefficients
ModelModel BB Std. ErrorStd. Error t t Sig. Sig.
11 (Constant)(Constant) 21,34821,348 3,1023,102 6,882 6,882 ,000,000
SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189
22 (Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000
SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362
weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003
33 (Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000
SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242
weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004
R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295
121
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënn
1 als IQ hoog1 als IQ hoogIQ = IQ =
0 als IQ laag0 als IQ laag
Indicator voor mensen Indicator voor mensen met een hoog IQmet een hoog IQ
CIJ
FE
RC
IJF
ER
IQIQ00 11
122
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer
IQIQ00 11
Model:Model:Y X 0 1
E(Y|X=1)E(Y|X=1)
E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1
UIT FIGUUR:
1
a
b
E(Y | X 1) E(Y | X 0)
1E(Y | X 1) E(Y | X 0)
a
b
123
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer
IQIQ00 11
Model:Model:Y X 0 1
E(Y|X=1)E(Y|X=1)
E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1
Uit figuur:
1
a
b
E(Y | X 1) E(Y | X 0)
1E(Y | X 1) E(Y | X 0)
a
b
124
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer
IQIQ00 11
E(Y|X=1)E(Y|X=1)
E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1
aa
bbE(Y | X) X 0 1
Door berekening:Door berekening:
E(Y|X=1)=
E(Y|X=0)=
DUS
0 1
0
1 E(Y | X 1) E (Y | X 0)
125
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer
IQIQ00 11
E(Y|X=1)E(Y|X=1)
E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1
aa
bbE(Y | X) X 0 1
Door berekening:Door berekening:
E(Y|X=1)=
E(Y|X=0)=
DUS
0 1
0
1 E(Y | X 1) E (Y | X 0)
126
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
ÉéÉén discrete variabele met drie categorien discrete variabele met drie categorieëënn
YY YY
XX XX11 22 33 00 11 55
Model specificatie Model specificatie is fout want is fout want lineairiteit alleen voldaan onder speciale coderinglineairiteit alleen voldaan onder speciale codering
Y IQ 0 1
127
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren
D_HOOGD_HOOG 11 0 0
HoogHoog Niet zoNiet zoD_GEMD_GEM
11 0 0
GemidGemid.. Niet zoNiet zo
D_LAAGD_LAAG 11 0 0
LaagLaag Niet zoNiet zo
128
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren
D_HOOGD_HOOG 11 0 0
HoogHoog Niet zoNiet zoD_GEMD_GEM
11 0 0
GemidGemid.. Niet zoNiet zo
D_LAAGD_LAAG 11 0 0
LaagLaag Niet zoNiet zo
Twee van de drie indicatoren voldoende om de drieTwee van de drie indicatoren voldoende om de driegroepen te onderscheidengroepen te onderscheiden
129
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
IQIQ D_HOOGD_HOOG D_GEMD_GEM
HOOGHOOG 11 00
HOOGHOOG 11 00
HOOGHOOG 11 00
GEMIDGEMID 00 11
GEMIDGEMID 00 11
GEMIDGEMID 00 11
GEMIDGEMID 00 11
LAAGLAAG 00 00
LAAGLAAG 00 00
LAAGLAAG 00 00
LAAGLAAG 00 00
LAAGLAAG 00 00
VoorbeeldVoorbeeld
130
Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel
Model specificatie:Model specificatie:
nu is wel aan de lineairiteitseis voldaannu is wel aan de lineairiteitseis voldaan
C IJFER D _ H O O G D _ G EM 0 1 2