De omvang van een steekproef bepalen -...

Preview:

Citation preview

Hoofdstuk 13

De omvang van een

steekproef bepalen

Steekproefnauwkeurigheid

• Steekproefnauwkeurigheid: verwijst naar hoe dicht een steekproefgrootheid (bijvoorbeeld het gemiddelde van de antwoorden op een vraag) zit bij de werkelijke populatiewaarde die zij vertegenwoordigt.

• Belangrijke punten:

• De steekproefomvang bepaalt niet zozeer de representativiteit...Een steekproef van 20.000 voetganger zou niet representatief zijn voor de stad.

• Steekproefomvang is direct van invloed op de nauwkeurigheid.

Axioma’s over de

steekproefomvang

Deze grondregels dienen als de basis

voor de methode van het betrouw-

baarheidsinterval, dat de beste methode

is om de steekproefomvang te bepalen.

Axioma’s over de steekproefomvang

• De enige perfect nauwkeurige steekproef is een volledig onderzoek.

• Een aselecte steekproef is altijd enigszins onnauwkeurig (steekproeffout).

• Hoe groter een aselecte steekproef is, hoe nauwkeuriger hij is (geringere steekproeffout).

• De nauwkeurigheid van een aselecte steekproef (de steekproeffout) kan met een eenvoudige formule worden berekend en worden uitgedrukt als een getal in de vorm van ± procent.

Axioma’s over de steekproefomvang

• Je kunt een uitkomst uit het survey nemen, het survey met een aselecte steekproef van dezelfde omvang repliceren en de kans is ‘zeer waarschijnlijk’ dat je dezelfde uitkomst krijgt binnen ± procent van de eerste uitkomst.

• In bijna alle gevallen is de nauwkeurigheid

(steekproeffout) van een aselecte steekproef

onafhankelijk van de omvang van de populatie.

Axioma’s over de steekproefomvang

• Een aselecte steekproef kan uit een zeer klein percentage van de populatie bestaan en toch zeer nauwkeurig zijn (een geringe steekproeffout kennen).

• De omvang van een aselecte steekproef is afhankelijk van de gewenste nauwkeurigheid (acceptabele steekproeffout) versus de kosten van de dataverzameling voor die steekproeffout.

Er is slechts één manier om de steekproefomvang te

bepalen die de nauwkeurigheid vaststelt van de

steekproefresultaten…

De betrouwbaarheidsinterval-

methode om de steekproefomvang

te bepalen.

De betrouwbaarheidsintervalmethode om de

steekproefomvang te bepalenHet begrip betrouwbaarheidsinterval

Dit axioma is gebaseerd op het begrip ‘betrouwbaarheidsinterval’ en de centrale-limietstelling...

Betrouwbaarheidsinterval: een waardegebied waarvan de grenzen een bepaald percentage antwoorden op een vraag omvatten.

Centrale-limietstelling: vele statistische begrippen liggen ten grondslag aan deze theorie. Als we een survey een flink aantal keren zouden herhalen (misschien wel 1000 keer) met telkens een nieuwe aselecte steekproef van dezelfde grootte en een staafdiagram zouden maken van alle 1000 keren (in percentages) dat er ‘ja’ is geantwoord, luidt de centrale-limietstelling dat het staafdiagram op een normale verdeling lijkt.

De betrouwbaarheidsintervalmethode om de

steekproefomvang te bepalen

• Methode van het betrouwbaarheidsinterval: methode, waarbij de begrippen: nauwkeurigheid (steekproeffout), variabiliteit (variability) en het betrouwbaarheidsinterval (confidence interval) worden gecombineerd om een ‘juiste’ steekproefomvang te nemen.

• Twee soorten steekproeffouten:

• Niet-steekproeffout: heeft betrekking op alle foutenbronnen die buiten de methode van steekproeftrekking en de steekproefomvang liggen.

• Steekproeffout: het verschil tussen de steekproefuitkomst en de werkelijke populatiewaarde vanwege het feit dat er een steekproef is getrokken.

• Formule voor de steekproeffout:

De betrouwbaarheidsintervalmethode om de

steekproefomvang te bepalen

• Het verband tussen steekproefomvang en steekproeffout:

De betrouwbaarheidsintervalmethode om de

steekproefomvang te bepalenVariabiliteit

• Variabiliteit: omschreven als de mate van verschil (of overeenkomst) in de antwoorden van de respondenten op een bepaalde vraag.

• P: procent

• Q: 100% - P

Belangrijk punt: Hoe groter de variabiliteit, hoe groter de steekproefomvang moet zijn om een bepaalde nauwkeurigheid te bereiken.

Grafiek bij een variabiliteit van 50-50 en 90-10

De betrouwbaarheidsintervalmethode is gebaseerd op de

normale verdeling

• We kunnen de normale verdeling gebruiken, vanwege

de centrale-limietstelling- ongeacht de vorm van de

verdeling van de populatie, zal de verdeling van de

steekproeven (als n groter is dan 30) een normale

verdeling aannemen.

De uitkomsten getekend van 1000 herhalingen van het Domino’s Pizza-survey: een illustratievan de centrale-limietstelling

De betrouwbaarheidsintervalmethode om de

steekproefomvang te bepalenNormale verdeling

1,96 X s.a. bepaalt de eindpunten voor 95% van de verdeling

Uit de steekproefverdelingen blijkt dat de steekproeffout afneemt bij een toename van de

steekproefomvang…

Dus, wat hebben tot nu toe geleerd?

Er bestaat een verband tussen:

• De gewenste nauwkeurigheid van de resultaten indien het onderzoek herhaald zou worden-

• Variabiliteit in de populatie en-

• De mate van de acceptabele steekproeffout -

• De omvang van de steekproef!

De formule voor de steekproefomvang

Om de juiste steekproefomvang voor een survey te berekenen, hoef je slechts drie factoren in overweging te nemen:

1 de (verwachte) mate van variabiliteit in de populatie,

2 de gewenste nauwkeurigheid en

3 het vereiste betrouwbaarheidsniveau van je schattingen van de populatiewaarden..

• Als het bovenstaande wordt gespecificeerd dan kunnen we de formule gebruiken om de steekproefomvang te berekenen.

De formule voor de steekproefomvang

• formule voor de steekproefomvang voor een percentage:

Praktische overwegingen bij de bepaling van de

steekproefomvang

• Hoe je de variabiliteit in de populatie schat

• Ga van het slechtste geval uit (p = 50; q = 50)

• Geef een schatting van de feitelijke variabiliteit?

Praktische overwegingen bij de bepaling van de

steekproefomvang

• Hoe je het niveau van de gewenste steekproeffout vaststelt

• De onderzoeksleider moet aan de marketingmanager vragen wat voor hem een acceptabele steekproeffout is.

• Gebruikelijk is + of - 5%

• Hoe belangrijker de beslissing, des te kleiner de steekproeffout moet zijn

Praktische overwegingen bij de bepaling van de

steekproefomvang

• Hoe je het gewenste betrouwbaarheidsniveau vaststelt

• De onderzoeksleider moet aan de marketingmanager vragen wat voor hem acceptabel is. Hoe hoger het betrouwbaarheidsniveau, des te groter moet de steekproefomvang zijn.

• Gebruikelijk is 95% (z = 1,96)

• Hoe belangrijker de beslissing, des te groter het betrouwbaarheidsniveau wordt.

• 99% betrouwbaarheidsniveau, z = 2,58.

De steekproefomvang bepalen door een

gemiddelde te schatten: wat is n?

z = 1,96 (95% betrouwbaarheid)

p = 42

q = 100; p = 58

e = 5

Wat is n?

Wat is n?

s = 1,7

z = 2,58 (99% betrouwbaarheid)

e = 0,5

n = 77 Wat betekent dit? Na de survey kan het management de volgende mededeling doen

(we nemen aan dat het gemiddelde 7,3 is):

De meest waarschijnlijke schatting van onze klanttevredenheid is 7,3 op een 10-puntsschaal.

Verder kunnen we met 99% zekerheid concluderen dat de tevredenheid ligt tussen 6,8 en 7,8.

Andere methoden om de steekproefomvang te

bepalen

• Arbitraire steekproefomvang met de ‘percentagevuistregel’:

• Als je een percentagevuistregel gebruikt, verlies je die nauwkeurigheid uit het oog

• Het is eenvoudig en makkelijk om steekproeven van een arbitraire omvang te trekken, maar ze zijn niet efficiënt en ook niet economisch

Andere methoden om de steekproefomvang te

bepalen

• Conventionele specificatie van de steekproefomvang

• Bij de conventionele methode wordt een of andere ‘regel’ of getal gevolgd waarvan men denkt dat het de juiste steekproefomvang is

• Conventionele steekproeven kunnen resulteren in steekproeven die veel te groot of te klein zijn

• Er valt kritiek te leveren op het gewoon overnemen van de steekproefomvang uit het verleden of van aantallen die andere bedrijven gebruiken

Andere methoden om de steekproefomvang te

bepalen

• Statistische eisen aan de bepaling van de steekproefomvang

• Soms wordt de steekproefomvang bepaald door de statistische analysemethode, omdat overwegingen van statistische aard de belangrijkste zijn

• Kosten als uitgangspunt voor de bepaling van de steekproefomvang

• ‘wat je je kunt permitteren’-methode

• Deze benadering, gebruikt de kosten als uitgangspunt voor de steekproefomvang.

Speciale situaties bij de steekproefomvangEen steekproef trekken uit een kleine populatie

• Er is sprake van een kleine populatie als de steekproef groter is dan vijf procent van de totale populatie

• Als de populatie daarentegen klein is, moet de formule voor de steekproefomvang enigszins worden aangepast met de zogenoemde eindigheidscorrectie

• Correct gebruikt van de eindigheidscorrectie zal de berekende steekproefomvang reduceren en zal veel geld besparen

Speciale situaties bij de steekproefomvangDe steekproefomvang bij niet-aselecte steekproeven

• Bij niet-aselecte steekproeven is de steekproefomvang vrijwel geheel gebaseerd op hoe belangrijk de informatie voor de manager is, en niet op de gewenste precisie in verhouding tot de kosten.

Recommended