24
Wozu brauche ich Statistik? Markus Lehmann, DAAD iDA Seminar 14.12.2016

Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Wozu brauche ich Statistik?

Markus Lehmann, DAAD

iDA Seminar – 14.12.2016

Page 2: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Formulierung und Präzisierung der Fragestellung

Planung und Vorbereitung der Erhebung

Konstruktion des Erhebungsinstruments

Festlegung der Untersuchungsform

Stichprobenverfahren

Pretest

Datenerhebung

Datenauswertung

Berichterstattung

Rückblick – Der Forschungsablauf

2

Page 3: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

3

Grundgesamtheit Stichprobe (sample)

Verteilung von Merkmalen, z.B. 50%

Männer, 50% Frauen

Abbildung der Grundgesamtheit in

Bezug auf die Verteilung der

Merkmale

Stichprobenverfahren

Page 4: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Grundbegriffe I

Grundgesamtheit (GG) / Zielpopulation

Menge von Objekten, auf die sich die Aussagen der Untersuchung beziehen

sollen (angestrebte GG)

Festlegung der Erhebungseinheit (Personen, Organis., Länder, ...) & Raum-

zeitliche Eingrenzung.

Bsp.: „Alle Personen mit deutscher Staatsangehörigkeit, die zum Zeitpunkt

der Befragung in der BRD in Privathaushalten leben und die spätestens am

1.1.1982 geboren sind“

Auswahlgesamtheit

Alle Objekte, die eine prinzipielle Chance haben in die Stichprobe zu

gelangen (faktische GG)

4

Page 5: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Survey-Population

Entspricht der Auswahlgesamtheit abzüglich der Menge der Elemente, die nicht

zur Zielpopulation gehören (Overcoverage)

Ziel einer Stichprobenziehung

Survey-Population und Grundgesamtheit möglichst deckungsgleich

5

Grundbegriffe II

Page 6: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Zielpopulation

6

Auswahlgesamtheit

Survey-Population

Ausfälle

Overcoverage

Undercoverage

Under- und Overcoverage

Page 7: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Auf welche Weise sollen Elemente der Grundgesamtheit ausgewählt werden?

Wahrscheinlichkeitsauswahl

Zufallsstichproben, z.B. Klumpung/Cluster, Schichtung

Bewusste Auswahl

Nach Kriterien, z.B.

Quotenverfahren

Willkürliche Auswahl

Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente

7

Stichprobenverfahren

Page 8: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Vollerhebung vs. Stichprobe

8

Vorteile einer Stichprobe Nachteile einer Stichprobe

Geringere Kosten

Daten schneller verfügbar

Vollerhebung oft nicht möglich

Zufallsfehler der Stichprobe

Selektives Sample (Gegenteil:

repräsentatives Sample)

Systematische Fehler bei

Stichprobenziehung und

Umsetzung

Verzerrung durch Non-Response

Aber: auch „Voll“erhebungen

produzieren Fehler

Auswahlverfahren

Page 9: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Gewichtung

Designgewichtung: bei disproportionaler Schichtung

Anpassungsgewichtung: zur Korrektur der Ausfälle

Aber: Unklar, ob nicht angepasste Merkmale evtl. sogar stärker verzerrt

Nicht-Repräsentativität kein Problem bei Kausalanalysen

Bei Aussagen über Grundgesamtheit (Populationsparameter) wird kontrolliertes

Stichprobenverfahren benötigt

9

Repräsentativität

Page 10: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

10

Online-Befragung zu vers. Aspekten studienbezogener Auslandsaufenthalte

Brutto-Stichprobe: Anzahl kontaktierter Studierender

Stichprobe bereinigt: Brutto-Stichprobe abzüglich Studierende, die Studium

bereits abgeschlossen hatten und unzustellbare E-Mails

Rücklauf (brutto): Studierende, die Teilnahmelink aktiviert und an Befragung

beteiligt waren

Rücklauf (bereinigt): Nach Plausibilisierung und Bereinigung der Daten (z. B.

Ausschluss von unzureichend ausgefüllten Fragebögen)

Repräsentativität: DAAD/DZHW-Mobilitätsstudie I

Page 11: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

11

Prüfung Rücklauf auf Repräsentativität: zentrale soziodemografische und

studienspezifische Strukturmerkmale mit entsprechenden Verteilungen in der

Grundgesamtheit gegenübergestellt

Grundgesamtheit: Studierende (deutsche und Bildungsinländer(innen) im

Wintersemester 2013/14 an staatlichen Hochschulen (ohne

Verwaltungsfachhochschulen)

Prüfungsergebnis: Hinsichtlich einzelner Merkmale geringfügige Unterschiede

zw. Verteilungen der Stichprobe zu Grundgesamtheit

z.B. Studentinnen überproportional an Befragung beteiligt

Lösung: Nutzung von Anpassungsgewichten, um Abweichungen auszugleichen,

demnach sind Ergebnisse der Mobilitätsstudie 2015 nach berücksichtigten

Strukturmerkmalen auf Bundesebene repräsentativ

Repräsentativität: DAAD/DZHW-Mobilitätsstudie II

Page 12: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

12

Studie zur Motivation, Integration und Förderung internationaler

Nachwuchswissenschaftler in Deutschland, u.a. standardisierte

Onlinebefragung

Brutto-Stichprobe: 4.200 Personen, Analyse-Sample: 1.532

Prüfung Repräsentativität: Vergleich Stichprobe mit Grundgesamtheit

hinsichtlich regionaler Herkunft und Fächerzugehörigkeit der Befragten (hier:

Wissenschaftler)

Prüfungsergebnis: Hinsichtlich regionaler Herkunft spiegelt MIND-Stichprobe

Zusammensetzung in GG wider, kleinere Abweichung hinsichtlich

Fachzugehörigkeit

Repräsentativität: MIND-Studie von GATE I

Page 13: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

13

Repräsentativität: MIND-Studie von GATE I

Page 14: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Rückblick: Der Forschungsablauf

Formulierung und Präzisierung des Forschungsproblems

Planung und Vorbereitung der Erhebung

Konstruktion des Erhebungsinstruments

Festlegung der Untersuchungsform

Stichprobenverfahren

Pretest

Datenerhebung

Datenauswertung

Berichterstattung

14

Page 15: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Phasen der Datenauswertung

15

Kodierung und Datenübertragung

Fehlerkontrolle, eventuelle Fehlerbereinigung, Ausschluss fehlerhafter und fehlender Angaben

Umformung/Neubildung von Variablen, Indizes und Skalen

Statistische Analyse von Verteilungen und Zusammenhängen

univariat / bivariat / mulitvariat

Fokus auf Deskriptivstatistik, d.h.

Berechnung von Kennziffern zur

Beschreibung einer Stichprobe

Page 16: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Univariate Analyse: Verteilungen

Randauszählung: Auszählung und Berechnung der absoluten, relativen und

prozentualen Häufigkeiten nach den Kategorien von Variablen

Tabellarische und graphische Darstellungsmöglichkeiten der

Häufigkeitsverteilung

16

Kategorien

Prozentuale

Häufigkeiten

Page 17: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Univariate Analyse: Graphische Darstellung von

Verteilungen (1)

Histogramm: Standardform zur graphischen Darstellung empirischer

Häufigkeitsverteilung, Darstellung relativer Häufigkeiten/Prozentanteile je

Kategorie

17

Quelle: Wissenschaft weltoffen 2016, S.127

Page 18: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Univariate Analyse: Graphische Darstellung von

Verteilungen (2)

Kreis- oder Tortendiagramm: bei nichtmetrischen Daten mit wenig

Variablenausprägungen, meist Verwendung von Prozentwerten

18

Quelle: Wissenschaft weltoffen 2016, S.59

Page 19: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Univariate Analyse: Mittelwert & Streuung

Maßzahlen der zentralen Tendenz

Arithmetischer Mittelwert / Median / Modus

Maßzahlen der Dispersion (Streuung)

Minimum & Maximum / Range / Standardabweichung / etc.

Boxplot: Diagramm zur graphischen Darstellung, fasst verschiedene Streuungs-

und Lagemaße zusammen

19

Page 20: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Univariate Analyse: Graphische Darstellung von Mittelwert

& Streuung

20

Quelle: Sechste Erhebung von Profildaten 2015, S. 14

Page 21: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Bivariate Zusammenhänge: Tabellenanalyse

Prüfung von Zusammenhangshypothesen zwischen zwei dichotomen Variablen,

Mögliche verzerrende Einflüsse durch Drittvariablen nicht berücksichtigt

21

Page 22: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Bivariate Zusammenhänge: Tabellenanalyse (2)

22

Page 23: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Praktische Übung

Interpretation von Statistiken

Ableitung von Handlungsempfehlungen

23

Page 24: Wozu brauche ich Statistik? - DAAD€¦ · Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente 7 Stichprobenverfahren Vollerhebung vs. Stichprobe 8 Vorteile

Interpretation und Weiterverwertung von Statistiken

24

Aussage der Tabellen – was steht hier überhaupt?

Aufbereitung von Tabellen – wie kann ich die enthaltene

Info meiner Leitungsebene näher bringen?

Welchen weiterführenden Infos bräuchte ich? Was könnten

Empfehlungen sein?

Bitte bereiten Sie bis 10:30 Uhr ein Plakat vor.