Math Candel Universiteit Maastricht. 1.Heldere en haalbare probleemstelling 2.Keuze van het design...

Preview:

Citation preview

Math Candel

Universiteit Maastricht

1. Heldere en haalbare probleemstelling2. Keuze van het design3. Keuze van onderzoeks/analyse-eenheid4. Operationalisatie van variabelen5. Keuze van statistische technieken6. Afbakening van populatie7. Steekproefmethode, steekproefomvang en “power”8. Tijdschema en procedures

Dit is ook de volgorde van het verslag !!

Als rode draad een voorbeeld

- Wel of geen interventie ?- Wel of niet longitudinaal ?

Leidt langdurige blootstelling aan harde muziek in disco’s tot gehoorbeschadiging ?

L O N G I T U D I N A A L

I____________________________________________

N ja neeT____________________________________________

E ja Experiment

R Quasi-experimentV

E nee Cohort studie Dwarsdoorsnede

N (Steekproef uit basispopulatie)

T Patiënt-controle

I (Selectie van zieken)

E ____________________________________________

Voorbeeld

• Interventie:

Onmogelijk, expositie aan harde muziek niet ethisch

• Longitudinaal: meer zicht op causatie

• Geen individuele informatie omtrent blootstelling aan muziek prospectieve

cohort studie

Vaak geneste structuur (voorbeeld)

Vaak geneste structuur (voorbeeld)

Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3

Niveau 2

Niveau 1

Vaak geneste structuur (voorbeeld)

Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3

Niveau 2

Niveau 1

Vaak geneste structuur (voorbeeld)

Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3

Niveau 2

Niveau 1

Vragen: Keuze analysetechniek:

• Zijn de niveau’s fixed of random ?

• Op welk niveau speelt de vraagstelling zich af ?

• Is het design gebalanceerd ?

• Bij random niveaus: Random-effects of Multilevel Analyse

• Uitzondering:

Hoogste niveau + gebalanceerd design: Aggregeer metingen tot op hoogste niveau

Hoe zet ik begrippen als “blootstelling aan harde muziek” en “gehoorschade” om in meetbare grootheden ?

• Afhankelijke variabele slechts op 1 manier operationaliseren multiple testing

• Metingen dienen betrouwbaar te zijn (doe hermetingen en neem gemiddelde)

• Metingen dienen valide te zijn (voorkom bijv. antwoordtendenties bij vragenlijsten)

Multiple testing

• Dubbelzinnige resultaten: Sommige operationalisaties laten wel een effect zien, andere niet

• Veel type I foutenOplossing: Bonferroni correctieBij K toetsen, neem dan als significantieniveau:

* = /K

Illustratie Bonferroni correctie

Aantal toetsen (K) Aantal toetsen

121086420

Kans op m

instens 1 typ

e I fout

.5

.4

.3

.2

.1

0.0

Bonferroni correctie

Geen correctie

Aantal toetsen

Voorbeeld• Effectmaat: Gehoorverlies in dB,

gemiddeld over een reeks toonhoogten

• Onafhankelijke variabelen: – Duur van blootstelling:

Via een vragenlijst het aantal uren in 5 jaar(gemiddelde per week x aantal weken)

– Intensiteit:Aantal dB via audiometer

(meerdere metingen over 5 jaar in gefrequenteerde

disco’s)

• Confounders / Effectmodificatoren:

Geslacht, leeftijd, expositie aan ander lawaai

(via vragenlijst)

• Aantal variabelen:– Onafhankelijke variabelen– Afhankelijke variabelen

• Type variabele:– Binair– Polytoom– Continu

• Type design:– Tussen-subject design– Binnen-subject design

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X’en

Lineaire regressie

ANOVA

Logistische

regressie

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X-en

Lineaire regressie

ANOVA

Logistische

regressie

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X-en

Lineaire regressie

ANOVA

Logistische

regressie

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X-en

Lineaire regressie

ANOVA

Logistische

regressie

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X-en

Lineaire regressie

ANOVA

Logistische

regressie

Y continu Y binair

1 X

binair T-toets

Mann-Whitney

2- toets voor

kruistabel

polytoom 1-weg ANOVA

Kruskal-Wallis test

2- toets voor

kruistabel

continu (Rang)correlatie

Lineaire regressie

Logistische

regressie

Meerdere X-en

Lineaire regressie

ANOVA

Logistische

regressie

Voorbeeld

• Afhankelijke variabele: Gehoorbeschadiging (GB)

• Blootstellingsduur (DUUR) is een effectmodificator van de muziekintensiteit (INT)

• Potentiële confounders: Overig lawaai (LAWAAI), geslacht (GESL) en leeftijd (LEEFT)

Meervoudige lineaire regressie: GB = B0 + B1*INT + B2*DUUR + B3*INT*DUUR +

B4*LAWAAI + B5*GESL + B6*LEEFT +

Gehoorbeschadiging als functie van

intensiteit en blootstellingsduur

Intensiteit (in dB)

16014012010080604020

Gehoorb

eschadig

ing (

dre

mpelw

aard

e in d

B)

50

40

30

20

10

0

Blootstellingsduur

550 uren

450 uren

350 uren

250 uren

150 uren

50 uren

• Ethische redenen (bijv. geen ernstig zieken)

• Praktische redenen (beperkte hoeveelheid tijd en geld)

• Methodologische redenen:– Minder onverklaarde variantie– Minder storende factoren (“confounders”)– Voldoende variatie op risicofactor

Voorbeeld

• Praktische reden:

Alleen Zuid-Nederland

• Methodologische redenen:

Alleen jongeren tussen de 14 en 20 jaar

Minder variatie wat betreft gehoorsbeschadiging t.g.v. andere factoren (bijv. werk)

Tast afbakening de generaliseerbaarheid aan ?

Vraag: De generaliseerbaarheid van wat ?

Het gemiddelde ?

GB

Randstad

Parkstad

Muziekintensiteit

RG B

PG B

Relatie tussen gehoorbeschadiging en intensiteit ?

GB

Randstad

Parkstad

Muziekintensiteit

Conclusies:

• Gemiddelde is niet generaliseerbaar;Dit is anders voor Randstad en Parkstad

• Bestudeerde effect is wel generaliseerbaar;Gemiddelde toename in gehoorbeschadiging t.g.v. een bepaalde toename in muziekintensiteit is hetzelfde voor Randstad als voor Parkstad

• Dus:Een effect kan wel generaliseerbaar zijn naar andere populaties, ook als het gemiddelde dat niet is !

• Eenvoudige toetsende statistiek gaat uit van:– Een aselecte/willekeurige steekproef– Een populatie die veel groter is dan de steekproef

• In de praktijk:– Steekproef > 10% van de populatie

– Gestratificeerde steekproef: Bijv. prestratificatie op geslacht of sociaal-economische status Deze variabelen als covariaat in de analyse opnemen

Voorbeeld: Reden voor stratificatie ?

• Effectmodificatie:Het effect van muziekintensiteit is anders voor lange dan voor korte blootstellingsduren

• Confouding: Vrouwen en mannen verschillen wat betreft de mate van blootstelling aan harde muziek

In beide gevallen: Stratificatie-factor als extra covariaat in de analyse opnemen

– Tweestaps- of clustersteekproef: Men trekt een groot aantal eenheden (bedrijven, scholen, ziekenhuizen, gezondheidscentra, steden), en daarbinnen weer:

een aantal individuen: tweestapssteekproef alle individuen: clustersteekproef

Geschikte analyse: Multilevel of Random-effects

analyse

Hoe krijgen we de gewenste power ?

: Moet klein zijn om type I fouten te vermijden (vaak 0.05 of 0.01)

• Signaal: Contrast op interventie of risico-factor verhogen

• Ruis:

– Invloed van variatie op andere factoren minimaliseren middels design of statistische correctie

– Minimaliseren van meetfout

1- : gewenste power, zeg 0.90

Z : waarde uit standaardnormale verdeling;

Z 0.90 = 1.28

• Steekproefomvang voldoende groot laten zijn.

Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

N Z Z x 2 1 1 2

2 2

21( )/ ( )

: kans op het type I fout, zeg 0.05

Z : waarde uit standaardnormale verdeling;

Z 0.975 = 1.96

• Steekproefomvang voldoende groot laten zijn.

Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

N Z Z x 2 1 1 2

2 2

21( )/ ( )

: kleinste correlatie die ontdekt moet worden,zeg 0.30

• Steekproefomvang voldoende groot laten zijn.

Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

N Z Z x 2 1 1 2

2 2

21( )/ ( )

• Steekproefomvang voldoende groot laten zijn.

Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

N x 2 1 2 8 1 9 62 2

21 0 3

0 3 1 0 8 1 4( . . ) ( ) ...

Nog aanpassingen van deze N :

A. Er zijn covariabelen:

NA = N x VIF = 108.14 x 2 (naar schatting)

= 216.28

B. Er is uitval te verwachten:

Bij k % uitval: NAA = 100/(100-k) x NA

Bij 10 % uitval: NAA = 100/90 x 216.28 = 241

Relatie power, steekproefomvang en signaal

Steekproefomvang

2001000

Po

wer 1.0

.8

.6

.4

.2

0.0

Correlatie:

0.40

0.35

0.30

0.25

• Overzicht van stappen en tijdsplanning

Voorbereiden van onderzoek (testen vragenlijsten, werven proefpersonen,….)

Dataverzameling

Tussentijdse analyses

Eindrapportage en/of presentatie

Hoe om te gaan met:

1. Non-response: niet deelnemen2. Uitval: voortijdig uit the onderzoek stappen3. Non-compliance: niet naleven van instructies

• Procedures

Waarborgen anonimiteit, werven van proefpersonen, “informed consent”, blindering e.d.

Effecten van uitval/nonresponse:

Effecten van uitval/nonresponse:

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Effecten van uitval/nonresponse:

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Leeftijd (covariaat)

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong (40%)

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong (40%)oud (60%)

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong (40%)oud (60%)gemiddeld

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong (40%)oud (60%)gemiddeld

Leeftijd is geen confounder

Effecten van uitval/nonresponse:

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Uitval

Leeftijd (covariaat)

Uitval houdt verband met kernvariabele :

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Uitval

Leeftijd (covariaat)

Uitval houdt verband met kernvariabele en covariaat:

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Uitval

Leeftijd (covariaat)

Uitval houdt verband met kernvariabele en covariaat:

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Uitval

Leeftijd (covariaat)

Confouding door covariaat; betrek covariaat in de analyse

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong oud

Vooral uitval bij hoge muziekintensiteiten

Uitval treedt met name op onder ouderen

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong oud

Vooral uitval bij hoge muziekintensiteiten

Uitval treedt met name op onder ouderen

0

5

10

15

20

25

IntensiteitMuziek

Geh

oorb

esch

adig

ing

jong oud gemiddeld

Uitval houdt verband met afhankelijke variabele en kernvariabele :

Intensiteit muziek (kernvariabele)

Gehoorbeschadiging

Uitval

Leeftijd (covariaat)

Uitval zelf is confounder:

uitval als extra covariaat in de analyse betrekken

Gevolg:

Relatie tussen uitval en afhankelijke variabele kan niet geschat worden

Probleem:

Voor uitvallers kennen we de waarden niet op de

afhankelijke variabele

Hoe om te gaan met non-compliance ?

• Intention-to-treat:

Non-compliers betrekken in de analyse

Adequaat beeld van de effectiviteit van een behandeling in de praktijk

• Statistische correctie:

Effect van interventie kan weggepoetst worden

Recommended