FPR I - WS 2009 - Herzlich Willkommen - 2. Block Crash-Kurs: Versuchsplanung Versuchsdesign Planung...

Preview:

Citation preview

FPR I - WS 2009- Herzlich Willkommen -

2. Block

Crash-Kurs:

Versuchsplanung

VersuchsdesignPlanung und Gestaltung einer empirischen

Studie

Heutige Themen

Versuchsplanung, Versuchsdesign, Planung und Gestaltung einer empirischen Studie

Die multiple lineare Regression

Die Reliabilitätsanalyse

Die Faktorenanalyse

Versuchsplanung

Versuchsdesign

Planung und Gestaltung einer empirischen Studie

Planung einer empirischen Studie (1)

Planungsreferat

Phase 1: Erkundungsphase– Interesse, Idee, praktisches Problem, Literatursuche

Phase 2: theoretische Phase

– Datensammlung und Datenauswahl– Formulierung einer Fragestellung– Aufstellen der statistischen Hypothesen (H0, H1)

Planung einer empirischen Studie (2)

Phase 3: Planungsphase– Aufstellen eines Versuchsdesigns – Auswahl der Stichprobe – Auswahl der Versuchsbedingungen– Auswahl des Messinstruments – ev. Fragebogen-, Testkonstruktion und Beschreibung der

Items/Fragen– Auswahl der (voraussichtlichen) statistischen Methoden (mit

Begründung und Voraussetzungen)

--- Ende Planungsreferat ---

Planung einer empirischen Studie (3)

Phase 4: Untersuchungsphase– Datenerhebung mittels Experiment, Befragung,

Beobachtung, Testung und...– Eingabe der Daten in SPSS

Auswertungsreferat

Phase 5: Auswertungsphase– Testtheoretische Überprüfung eigens konstruierter Tests,

Fragebögen,… (Reliabilitätsanalyse, Item-Trennschärfen, Itemschwierigkeiten, ev. Validität: Korrelationen mit einem Kriterium,…)

Planung einer empirischen Studie (4)

Phase 5 (Fortsetzung)– Deskriptive Beschreibung der Stichprobe, (Grafiken,

Tabellen, Mittelwerte, Median, Varianzen, Quartilabstand…)

– Verteilungen der selbst konstruierten Items bzw. Fragen (Rohscore, Häufigkeiten der Antwortmögl. pro Item…)

– Hypothesenprüfung: Durchführung diverser zulässiger (!) statistischer Verfahren (t-Test, (M)ANOVA, Korrelationen, Regression, Kreuztabellen, Chi-Quadrat-Test...)

Anmerkung: Bessere Verfahren/Analysen – bessere Bewertung der Seminararbeit

Planung einer empirischen Studie (5)

Phase 6: Interpretationsphase– Ergebnisse, ev. Kritikpunkte, schwächen der

Untersuchung, Störvariablen

Phase 7: Konklusion (Kurzzusammenfassung der wichtigsten Ergebnisse der Studie! – wichtig für den Zuhörer!)

Literatursuche (1)

UB-OPAC (Online Katalog ab 1989)– (http://aleph.univie.ac.at/ALEPH/) – Gesamtbestand der Uni Wien ab 1989

(Hauptbibliothek und Institutsbibliotheken)– Suche nach Titel, Autor, Schlagwort,…

Literatursuche (2)

(psychologische) Datenbanken– Psyndex – PsycInfo– Medizinische Datenbank: Pubmed– Über diesen Link auch von zu Hause:

https://univpn.univie.ac.at/– Login mit User-ID und Passwort

Literatursuche (3)

Wichtig: Vor allem mit englischen Suchbegriffen und Schlagwörtern suchen!

Viele Zeitschriften auch online verfügbar

http://bibliothek.univie.ac.at/fb-psychologie/online_verfuegbare_zeitschriften.html

Gesamte verfügbare Zeitschriftenliste in FB (neben PCs) oder Online über FB-Homepagehttp://bibliothek.univie.ac.at/fb-psychologie/zeitschriftenliste_al.html

Elektronische Zeitschriftenbibliothek UNI Wien

http://rzblx1.uni-regensburg.de/ezeit/fl.phtml?bibid=UBWI&colors=7&lang=de&notation=CL-CZ

– Zugang zu Zeitschriften: freie bis kostenpflichtige Volltextverfügbarkeit. (Ampelsymbol)

– Zugang über Campus PCs oder von zu Hause über https://univpn.univie.ac.at/

Literatursuche (4)

Literatursuche (5)

Psychologische Tests/Messinstrumente

„Testliste“ in FB für Psychologie (bei PCs)

Testbeschreibungen und Gütekriterien in – Kubinger, K. D. (1995). Einführung in die psychologische

Diagnostik. Weinheim: Psychologie Verlags Union. (siehe auch Anhang!)

– Kubinger, K. D. (2003). Schlüsselbegriffe der psychologischen Diagnostik. Weinheim: Beltz

– Handbuch des Messinstruments

Literatursuche (6)

Lehrbücher, Monographien ausleihen– Online suchen– bei UB Wien online bestellen– bei FB f. Psych. online oder selbst suchen (jedes

Buch hat eine Signaturnummer aus einem Buchstaben+Zahlencode)

z.B: EA-521/P-Rot

Zitierregeln (1) kurzes Beispiel

Nach der Deutschen Gesellschaft für Psychologie– www.dgps.de

A) Zitieren im Literaturverzeichnis

Bsp Monographie: Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Erscheinungsort: Verlag.

Rost, J. (1996). Lehrbuch Testtheorie Testkonstruktion. Bern: Verlag Hans Huber.

Zitierregeln (2)

Bsp Zeitschrift:

Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Name der Zeitschrift, Jahrgang bzw. Band, Seitenangaben.Borg, I. (1984). Das additive Konstantenproblem der multidimensionalen Skalierung. Zeitschrift für Sozialpsychologie, 15, 248-253.

Zitierregeln (3)

B) Zitieren im Text

Bsp: In einer Studie konnten Schmid et al. (1981) zeigen, dass…

Bsp: 1981 konnten Schmid et al. in einer Studie zeigen, dass…

Bsp: In einer Studie (Schmid et al., 1981) konnte gezeigt werden, dass…

Einführung in die Versuchsplanung

Versuchsdesign aufstellen

1. Was will ich erheben, testen,…

2. Wie will ich es erheben, testen,…a) Fragebogen

b) Test

c) Experiment, Quasiexperiment (VG, KG)

d) Beobachtung

e) Interview

f) …

-> selbst konstruiert (vs. aus Literatur, bereits vorhanden)

Test/Fragebogensuche:

1. Literatursuche

2. Existiert bereits ein Fragebogen, Test?

3. Wenn ja, Testqualität (Gütekriterien) überprüfen (Handbuch)

4. Wenn nein, eigene Konstruktion

Ad Messinstrument:

Selbstkonstruktion

1) Wie kann ich eine Fragestellung, Hypothese operationalisieren?

Grundfrage für weitere stat. Auswertungen:

-> Welche Variablenart bzw. welches Skaleniveau soll mein Messinstrument aufweisen?!!!

Variablentypen

Quantitativ Stetig: (theoretisch) unendlich viele Ausprägungen/Intervalle

(wie Größe, Gewicht, Längen,...) Diskret: eine bestimmte, endliche Anzahl (z.B: Anzahl der

Personen in einem Raum, Testscore,...).

Qualitativ

nur beschränkte Ausprägungen oder quantitative Variablen in Klassen zusammengefasst

Dichotom: 2 Ausprägungen (z.B: Geschlecht, Versuchs-Kontrollgruppe, Psychologie vs. Nicht-PsychologiestudentInnen, Altersklasse: 15-30 und 31-60…)

Polytom: mehr als 2 Ausprägungen (z.B: Bildung, Haarfarbe, Beruf, Einkommensklasse: 0-500, 501-1000, >1000 Euro...)

Skalentypen

– intervallskaliert/rationalskaliert (Größe, Gewicht, Längen, (~)Rohscore, Temperatur...)

– rang- oder ordinalskaliert (Noten, Rangreihen, Dienstgrade, Beliebtheit von Personen...)

– nominalskaliert (Geschlecht, Bildungsgrad, Haarfarbe, Beruf...)

Zusammenhang Skalen- Variablentypen

Intervallskala Quantitativ (stetig, diskret)

Rangskala Grenzfall zw. Quant. und Qual.

Nominalskala Qualitativ (dichotom, polytom)

Vorplanung

Achtung!!!

-> Je nach Variablentyp sind nur bestimmte zulässige statistische Verfahren anwendbar!

-> daher muss vor Item-, Test- oder Fragebogenkonstruktion folgendes beachtet werden:

– welche statistischen Verfahren will ich anwenden– wie müssen demnach die Variablen erhoben bzw.

konstruiert werden– Welche Möglichkeiten der Erhebung habe ich

Beispiel 1

Ich will eine lineare Regression rechnen:

Voraussetzung für eine Regression: AV muss

intervallskaliert, quantitativ sein.

Beispiel 2

Ich will eine zweifache Varianzanalyse rechnen:

Voraussetzung für eine 2-fache ANOVA: AV

intervallskaliert, quantitativ UVs

beide qualitativ (dichotom, polytom) oder qualitative V. in Klassen zusammengefasst

Genügend VP pro Zelle (Faktorkombination)

Skalenkonstruktion

Definition: Eine Skala besteht aus einer Reihe von Items, welche die gleiche Dimension messen.

Qualitätsprüfung: Mittels testtheoretischer Verfahren (Reliabilitätsanalyse, FA, Rasch Modell!, Trennschärfen…)

Beispiel: Forschungsfrage: Einstellung zur EU Konstruktion einer Anzahl von Items (Skala), welche die

Einstellung der Befragten zur EU erfassen.

Skalenkonstruktion

Vorgehen:– die Items formulieren– Das Antwortformat festlegen (z.B. „Rating Skala“:

dreikategoriell: stimme zu, weiß nicht, stimme nicht zu; multiple choice, single choice, Zahlenwerte von 1 bis 10… )

– Das Antwortformat muss über die Items gleich bleiben!

…und hoffen dass die Qualität der Skala bei späteren testtheoretischen Auswertungen gewährleistet ist.

– Die testtheoretische, qualitative Überprüfung der Skala kann i.d.R. nur nach Testungen (mit Daten!) durchgeführt werden!

SkalenkonstruktionExemplarischer Fragebogen mit 3 Items

zum Thema „Einstellung zur EU“

Frage 1: Die EU bringt uns viele wirtschaftliche Vorteile.O trifft zu O trifft manchmal zu O trifft nicht zu

Frage 2: Eine ständige Erweiterung des europäischen Raumes schadet der heimischen Wirtschaft enorm.

O trifft zu O trifft manchmal zu O trifft nicht zu

Frage 3: Ich würde bei einer Volksabstimmung für die EU stimmen.O trifft zu O trifft manchmal zu O trifft nicht zu

Kodierung: 1-3 Werte pro ItemRohscore: hoher Wert: positive Einstellung, niedriger Wert: negative Einstellung

Min. Max: 3 bzw. 9 Rohwertepunkte Eine Skala hat immer 2 Dimensionen Achtung auf die Polarität der einzelnen Items!!

3 12

321

3 2 1

Rohwert

Die gewählten Antwortwerte aller Items eines Befragten werden zu (s)einem Rohwert summiert.

Likert-Skala, Ratingskala Voraussetzung!: Die Skala ist testtheoretisch in

Ordnung (die Überprüfung ist jedoch erst mit Daten möglich!)

Rohwert

Achtung!!: auf die richtige Punktevergabe der Antwortmöglichkeiten pro Item achten! (die Polarität muss stimmen!) (siehe oben: Bsp.-Skala „EU“)

Eine Skala hat 2 Dimensionen: ad Beispiel:

hoher Rohscore -> positive Einstellung zur EU

niedriger Rohscore -> negative Einstellung zur EU

Antwortkategorien (1)

Rating-Skalen 0 stimmt gar nicht 0 stimmt teilweise 0 stimmt völlig

Durch Punktevergabe: z.B.: Wertebereich von 1 bis 10

Polaritätenprofil:gespannt 1 2 3 4 5 gelöst

aggressiv -2 -1 0 1 2 friedlich

Analogskala:Durch ankreuzen | x |

Durch ankreuzen |

Antwortkategorien (2)

Multiple Choice

Mehrfachantworten: Wählen sie Ihre Hobbies0 Sport 0 Kino 0 Lesen 0 Ausgehen 0 Basteln,…

Meist bei demographischen Fragen

Einfachantwort: Hauptstadt von Frankreich0 Istanbul 0 Oslo 0 Paris 0 Bukarest

Meist bei Leistungstests

Testtheoretische Analyse der Skala

Qualitätsprüfung der Skala– Immer erst nach der Stichprobenerhebung

möglich– Man benötigt Daten um testtheoretisch

auszuwerten

1. Überprüfung der Eindimensionalität

„Messen alle Items einer Skala die gleiche Dimension?“– Reliabilitätsanalyse – Rasch Modell – ev. Faktorenanalyse (1 Faktor)

2. Itemparameter

Itemschwierigkeit (bzw. Lösungshfgkt) Dichotom (richtig/falsch)

Item1

2 2,9 2,9 2,9

66 97,1 97,1 100,0

68 100,0 100,0

nicht gelöst

gelöst

Total

ValidFrequency Percent Valid Percent

CumulativePercent

nicht gelöst gelöst

Item1

0

20

40

60

80

100

Per

cen

t

Item1

2. Itemparameter

– Häufigkeiten/Verteilungen der gewählten Antwortkategorien pro Item

– auch mehrkategoriell!

Number of Children

419 27,6 27,8 27,8

255 16,8 16,9 44,7

375 24,7 24,9 69,5

215 14,2 14,2 83,8

127 8,4 8,4 92,2

54 3,6 3,6 95,8

24 1,6 1,6 97,3

23 1,5 1,5 98,9

17 1,1 1,1 100,0

1509 99,5 100,0

8 ,5

1517 100,0

0

1

2

3

4

5

6

7

Eight or More

Total

Valid

NAMissing

Total

Frequency Percent Valid PercentCumulative

Percent

2. Itemparameter

– Itemtrennschärfe („Wie gut passt das Item zur Gesamtskala“)

-> Korrelation eines Items mit der Skala

Item-Total Statistics

6,66 9,877 ,686 ,895

6,38 8,883 ,837 ,840

6,32 8,697 ,815 ,848

6,31 9,350 ,741 ,876

J1

J2

J3

J4

Scale Mean ifItem Deleted

ScaleVariance if

Item Deleted

CorrectedItem-TotalCorrelation

Cronbach'sAlpha if Item

Deleted

Reliability Statistics

,896 4

Cronbach'sAlpha N of Items

3. Validität(eventuell)

„Misst die Skala das, was sie messen soll?“– Korrelation mit Testwerten aus einem anderem

Test, der gleiches misst– Korrelation mit einem anderen (Außen-)Kriterium

(z.B: Rohscore im Mathematiktest korreliert mit Mathematiknote)

Vorgehen

Nach testtheoretischen Überprüfung der Skala:– Eliminierung der Items, die nicht zu den anderen

passen (geringe Trennschärfe, zu leicht, zu schwer, verringerte Reliabilität…)

Achtung!!: ev. nur falsche Polarität

Weitere Auswertung und Hypothesenprüfung nur mit der korrigierten Skala!

Zusammenfassung: selbst konstruierte Messinstrumente

Angabe von: – Entwicklungsschritten/Vorgehen (kurz)– Skalentyp – Antwortformat (Bsp.: 3stufige Ratingskala) – Anzahl der Items– (!) Itembeispiele (wichtig für das Referat! – besseres

Verständnis für den Zuhörer)– Gütekriterien: (v.a. Reliabilität und Itemtrennschärfen!)

Testtheoretische Analysen (nach Datenerhebung) des selbst entwickelten Messinstruments sind Voraussetzung für weiteres Vorgehen!

gegebene Tests, Fragebögen

Prüfung, ob passend und testtheoretisch in Ordnung (Handbuch lesen)

Immer Angabe von:– Name des Untersuchungsinstruments – Autor(inn)en– Kurze Erklärung, was mit dem Instrument gemessen wird– Gütekriterien (Rel., Obj., Val…)– Welches Antwortformat– Anzahl der Items– (!) Itembeispiel (wichtig für das Referat! – besseres

Verständnis für den Zuhörer)– Wurden die Items modifiziert? Warum? (wenn möglich

Originalskala übernehmen)

Demographische Variablen

Niemals bei Erhebung vergessen! Fast alle Fragestellungen zielen auf differentielle

Unterschiede ab!– Geschlecht– Alter– Schulbildung– Beruf– Familienstand– Anzahl der Kinder– ……immer an die Untersuchung angepasst

Tipp…

Immer maximale Information erfragen!Beispiel

Alter immer genau erheben (z.B: in Jahren 21, 54, 66…) nicht in Klassen erheben (0-20, 21-60,…) bereits anfänglicher Informationsverlust!

In Altersklassen kann nachträglich in SPSS eingeteilt werden

Qualitative vs. Quantitative Auswertung

Was kann wie ausgewertet werden?

1 Demographische Variablen (1)

z.B. Geschlecht, Bildungsstand, Haarfarbe… Sind qualitative (dichotome, polytome)

Variablen, nominalskaliert Auswertung:

deskriptiv, nach Häufigkeiten, qualitativ (Binomialtest, Chi-Quadrat-Test,

Kreuztabellen)

1. Demographische Variablen (2)

z.B. Alter, Einkommen Sind quantitative (stetige, diskrete) Variablen,

min. intervallskaliert Auswertung: alles möglich

Deskriptiv, nach Häufigkeiten, qualitativ (wenn in Klassen) quantitativ (t-Test, VA, Regression…)

2. einzelne Fragen, Items(nominalskaliert)

z.B. Welche Augenfarbe

0 blau 0 grün 0 braun 0 andere Ist eine qualitative (polytome) Variable,

nominalskaliert Auswertung:

deskriptiv, nach Häufigkeiten qualitativ (Binomialtest, Chi-Quadrat-Test, Kreuztabellen)

3. einzelne Fragen, Items(rangskaliert)

z.B. Sind sie mit dem EU Betritt der Türkei einverstanden?

0 trifft zu 0 trifft eher zu 0 trifft eher nicht zu 0 trifft nicht zu

Ist eine rangskalierte Variable Auswertung:

deskriptiv, nach Häufigkeiten, qualitativ (Binomialtest, Chi-Quadrat-Test,

Kreuztabellen) beschränkt quantitativ (Median, Quartilabstand)

4. Eine Skala von Items(~ intervallskaliert) (1)

A) Normierter Test, Fragebogen aus Literatur

B) Selbstkonstruierte Skala, wenn Testtheoretische Kriterien (Reliabilität, Item-Trennschärfen,…) in Ordnung sind Regel für FPR I:

Reliabilität: >0.6…ok, >0.8…gut Trennschärfen: >0.10…ok, >0.3…gut Items mit negativen oder Trennschärfen um

Null eliminieren!

4. Eine Skala von Items(~ intervallskaliert) (2)

Der Rohscore (Summe der Antworten pro Item) ist eine ~intervallskalierte Variable

Auswertung: Deskriptiv, nach Häufigkeiten, qualitativ Quantitative Auswertung (t-Test, VA,

Regression, Produkt-Moment-Korrelation,…)

ZusammenfassungFragebogen-Testkonstruktion

Was will ich überprüfen Wie will ich es überprüfen Welche statistischen Verfahren will ich anwenden Fragen, Items so konstruieren, dass Variablentyp

und Skalenniveau passend für Fragestellung und Auswertung sind einzelne Items/Fragen, Antwortformat richtig

wählen Welche demographischen Variablen benötige ich?

ZusammenfassungFragebogen-Testkonstruktion

Nach Datenerhebung testtheoretische Überprüfung der Items/Fragen, Skala

Eliminierung nicht geeigneter Items/Fragen Statistische Analyse und Hypothesenprüfung

mit verbliebenen Items/Fragen Mit geeigneten statistischen Methoden!

Essentielle LiteraturVersuchsplanung

Bortz, J. & Döring, N. (1995). Forschungsmethoden und Evaluation. Berlin, Heidelberg: Springer.

Bortz, J. (1993). Statistik für Sozialwissenschaftler. Berlin: Springer.

Kubinger, K. D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psychologie Verlags Union.

Recommended