Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig...

Preview:

Citation preview

Wozu brauche ich Statistik?

Markus Lehmann, DAAD

iDA Seminar – 14.12.2016

Formulierung und Präzisierung der Fragestellung

Planung und Vorbereitung der Erhebung

Konstruktion des Erhebungsinstruments

Festlegung der Untersuchungsform

Stichprobenverfahren

Pretest

Datenerhebung

Datenauswertung

Berichterstattung

Rückblick – Der Forschungsablauf

2

3

Grundgesamtheit Stichprobe (sample)

Verteilung von Merkmalen, z.B. 50%

Männer, 50% Frauen

Abbildung der Grundgesamtheit in

Bezug auf die Verteilung der

Merkmale

Stichprobenverfahren

Grundbegriffe I

Grundgesamtheit (GG) / Zielpopulation

Menge von Objekten, auf die sich die Aussagen der Untersuchung beziehen

sollen (angestrebte GG)

Festlegung der Erhebungseinheit (Personen, Organis., Länder, ...) & Raum-

zeitliche Eingrenzung.

Bsp.: „Alle Personen mit deutscher Staatsangehörigkeit, die zum Zeitpunkt

der Befragung in der BRD in Privathaushalten leben und die spätestens am

1.1.1982 geboren sind“

Auswahlgesamtheit

Alle Objekte, die eine prinzipielle Chance haben in die Stichprobe zu

gelangen (faktische GG)

4

Survey-Population

Entspricht der Auswahlgesamtheit abzüglich der Menge der Elemente, die nicht

zur Zielpopulation gehören (Overcoverage)

Ziel einer Stichprobenziehung

Survey-Population und Grundgesamtheit möglichst deckungsgleich

5

Grundbegriffe II

Zielpopulation

6

Auswahlgesamtheit

Survey-Population

Ausfälle

Overcoverage

Undercoverage

Under- und Overcoverage

Auf welche Weise sollen Elemente der Grundgesamtheit ausgewählt werden?

Wahrscheinlichkeitsauswahl

Zufallsstichproben, z.B. Klumpung/Cluster, Schichtung

Bewusste Auswahl

Nach Kriterien, z.B.

Quotenverfahren

Willkürliche Auswahl

Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente

7

Stichprobenverfahren

Vollerhebung vs. Stichprobe

8

Vorteile einer Stichprobe Nachteile einer Stichprobe

Geringere Kosten

Daten schneller verfügbar

Vollerhebung oft nicht möglich

Zufallsfehler der Stichprobe

Selektives Sample (Gegenteil:

repräsentatives Sample)

Systematische Fehler bei

Stichprobenziehung und

Umsetzung

Verzerrung durch Non-Response

Aber: auch „Voll“erhebungen

produzieren Fehler

Auswahlverfahren

Gewichtung

Designgewichtung: bei disproportionaler Schichtung

Anpassungsgewichtung: zur Korrektur der Ausfälle

Aber: Unklar, ob nicht angepasste Merkmale evtl. sogar stärker verzerrt

Nicht-Repräsentativität kein Problem bei Kausalanalysen

Bei Aussagen über Grundgesamtheit (Populationsparameter) wird kontrolliertes

Stichprobenverfahren benötigt

9

Repräsentativität

10

Online-Befragung zu vers. Aspekten studienbezogener Auslandsaufenthalte

Brutto-Stichprobe: Anzahl kontaktierter Studierender

Stichprobe bereinigt: Brutto-Stichprobe abzüglich Studierende, die Studium

bereits abgeschlossen hatten und unzustellbare E-Mails

Rücklauf (brutto): Studierende, die Teilnahmelink aktiviert und an Befragung

beteiligt waren

Rücklauf (bereinigt): Nach Plausibilisierung und Bereinigung der Daten (z. B.

Ausschluss von unzureichend ausgefüllten Fragebögen)

Repräsentativität: DAAD/DZHW-Mobilitätsstudie I

11

Prüfung Rücklauf auf Repräsentativität: zentrale soziodemografische und

studienspezifische Strukturmerkmale mit entsprechenden Verteilungen in der

Grundgesamtheit gegenübergestellt

Grundgesamtheit: Studierende (deutsche und Bildungsinländer(innen) im

Wintersemester 2013/14 an staatlichen Hochschulen (ohne

Verwaltungsfachhochschulen)

Prüfungsergebnis: Hinsichtlich einzelner Merkmale geringfügige Unterschiede

zw. Verteilungen der Stichprobe zu Grundgesamtheit

z.B. Studentinnen überproportional an Befragung beteiligt

Lösung: Nutzung von Anpassungsgewichten, um Abweichungen auszugleichen,

demnach sind Ergebnisse der Mobilitätsstudie 2015 nach berücksichtigten

Strukturmerkmalen auf Bundesebene repräsentativ

Repräsentativität: DAAD/DZHW-Mobilitätsstudie II

12

Studie zur Motivation, Integration und Förderung internationaler

Nachwuchswissenschaftler in Deutschland, u.a. standardisierte

Onlinebefragung

Brutto-Stichprobe: 4.200 Personen, Analyse-Sample: 1.532

Prüfung Repräsentativität: Vergleich Stichprobe mit Grundgesamtheit

hinsichtlich regionaler Herkunft und Fächerzugehörigkeit der Befragten (hier:

Wissenschaftler)

Prüfungsergebnis: Hinsichtlich regionaler Herkunft spiegelt MIND-Stichprobe

Zusammensetzung in GG wider, kleinere Abweichung hinsichtlich

Fachzugehörigkeit

Repräsentativität: MIND-Studie von GATE I

13

Repräsentativität: MIND-Studie von GATE I

Rückblick: Der Forschungsablauf

Formulierung und Präzisierung des Forschungsproblems

Planung und Vorbereitung der Erhebung

Konstruktion des Erhebungsinstruments

Festlegung der Untersuchungsform

Stichprobenverfahren

Pretest

Datenerhebung

Datenauswertung

Berichterstattung

14

Phasen der Datenauswertung

15

Kodierung und Datenübertragung

Fehlerkontrolle, eventuelle Fehlerbereinigung, Ausschluss fehlerhafter und fehlender Angaben

Umformung/Neubildung von Variablen, Indizes und Skalen

Statistische Analyse von Verteilungen und Zusammenhängen

univariat / bivariat / mulitvariat

Fokus auf Deskriptivstatistik, d.h.

Berechnung von Kennziffern zur

Beschreibung einer Stichprobe

Univariate Analyse: Verteilungen

Randauszählung: Auszählung und Berechnung der absoluten, relativen und

prozentualen Häufigkeiten nach den Kategorien von Variablen

Tabellarische und graphische Darstellungsmöglichkeiten der

Häufigkeitsverteilung

16

Kategorien

Prozentuale

Häufigkeiten

Univariate Analyse: Graphische Darstellung von

Verteilungen (1)

Histogramm: Standardform zur graphischen Darstellung empirischer

Häufigkeitsverteilung, Darstellung relativer Häufigkeiten/Prozentanteile je

Kategorie

17

Quelle: Wissenschaft weltoffen 2016, S.127

Univariate Analyse: Graphische Darstellung von

Verteilungen (2)

Kreis- oder Tortendiagramm: bei nichtmetrischen Daten mit wenig

Variablenausprägungen, meist Verwendung von Prozentwerten

18

Quelle: Wissenschaft weltoffen 2016, S.59

Univariate Analyse: Mittelwert & Streuung

Maßzahlen der zentralen Tendenz

Arithmetischer Mittelwert / Median / Modus

Maßzahlen der Dispersion (Streuung)

Minimum & Maximum / Range / Standardabweichung / etc.

Boxplot: Diagramm zur graphischen Darstellung, fasst verschiedene Streuungs-

und Lagemaße zusammen

19

Univariate Analyse: Graphische Darstellung von Mittelwert

& Streuung

20

Quelle: Sechste Erhebung von Profildaten 2015, S. 14

Bivariate Zusammenhänge: Tabellenanalyse

Prüfung von Zusammenhangshypothesen zwischen zwei dichotomen Variablen,

Mögliche verzerrende Einflüsse durch Drittvariablen nicht berücksichtigt

21

Bivariate Zusammenhänge: Tabellenanalyse (2)

22

Praktische Übung

Interpretation von Statistiken

Ableitung von Handlungsempfehlungen

23

Interpretation und Weiterverwertung von Statistiken

24

Aussage der Tabellen – was steht hier überhaupt?

Aufbereitung von Tabellen – wie kann ich die enthaltene

Info meiner Leitungsebene näher bringen?

Welchen weiterführenden Infos bräuchte ich? Was könnten

Empfehlungen sein?

Bitte bereiten Sie bis 10:30 Uhr ein Plakat vor.

Recommended