Upload
lekhanh
View
223
Download
0
Embed Size (px)
Citation preview
Methoden derPsychologie
Multivariate Analysemethodenund
Multivariates Testen
Günter MeinhardtJohannes Gutenberg Universität Mainz
11.05.2009
Methoden derPsychologie
Einführung
Verfahren
Multivariate Analysemethoden & Multivariates Testen
Prinzipien des inferenzstatistischen Schliessens
• Konfidenzintervalle• multivariate Mittelwertsvergleiche
• Hotelling‘s T2
• mulivariate Varianzanalyse (MANOVA)
Versuchspläne
Ziele • Wissen über statistische Verfahren• Wissen über Untersuchungsstrategien• Umsetzung mit Software
Typische Designs (Exp/Kontroll) nur Huasaufgabe
Methoden derPsychologie
Literatura) b)
c) d)
Multivariate Analysemethoden & Multivariates Testen
Johnson/Wichern Backhaus
Bortz Winer
Methoden derPsychologie
Problem
Frage
Anzahl der gefundenen Zielelemente in einem Konzentrationsleistungstest
(metrisch)Gruppierungsvariable Messgröße
Geschlecht
M J
Univariate Mittelwertevergleiche - Problemstellung
x
Unterscheidet sich die Leistung von Mädchen und Jungenim statistischen Mittelwert ?
Beispiel
Methoden derPsychologie
Stichprobe
Frage
Wir untersuchen 40 Mädchen und 45 Jungen
Univariate Mittelwertevergleiche - Problemstellung
Gibt es wirkliche Leistungsunterschiede zwischen Jungen und Mädchen, oder ist der gefundene Unterschied „rein zufällig“ ?
Beispieldaten
23.7 17.2
Geschlecht
M J
Mx Jx M Jx x x− = Δ
23.7 – 17.2 = 6.5
Methoden derPsychologie
Strategie
Urteil
Ermittle die Wahrscheinlichkeit für den beobachtetenMittelwertsunterschied unter der Annahme, dass beide Gruppen in der Population denselben Mittelwert besitzen
Univariate Mittelwertevergleiche - Prüfstrategie
Ist der beobachtete Mittelwertsunterschied unter der H0 sehr unwahrscheinlich (höchstens 5%), so lehnen wir die H0 ab, und sehen die H1 als die bessere Alternative an.
Annahme
0 : J MH μ μ=
Die Populationsmittelwerte von Jungen und Mädchen sind gleich
Null-Hypothese
Alternativ-Hypothese 1 : J MH μ μ≠
Methoden derPsychologie
Theoretische Verteilung – Sampling Distribution
Sampling Population der Jungen
Stichprobe des Umfangs NJ
Jx
Population der Mädchen
Stichprobe des Umfangs NM
Mx
Mittelwertsdifferenz
M Jx x xΔ = −
1 1 1M Jx x xΔ = −
2 2 2M Jx x xΔ = −Tue dies k - mal:
k Mk Jkx x xΔ = −
( )1 2 i kx x x xΔ Δ Δ Δ… …Verteilung derDifferenzen von Mittelwerten
Methoden derPsychologie
Central LimitTheorem
Die Verteilung von Differenzen von Mittelwerten nähert sich mit wachsendem Umfang der Sample‐Stichproben einer Normalverteilung. Für N > 30 ist die Approximation gut.
σ0.00
0.05
0.10
Wah
rsch
einl
ichk
eits
dich
te
xΔ
( )f xΔ
0 2σ
xσ Δ
Es gilt:
Theoretische Verteilung – Sampling Distribution
xΔxΔ−σ xΔ−2σ xΔ
xσ Δ
0xμΔ =
(wird geschätzt)
In der theoretischen Verteilung der Differenzen von Mittel‐werten wird die Wahrscheinlichkeitsbestimmung vorge‐nommen. Sie liegt dem inferenzstatistischen Schluss zugrunde.
Inferenzstat.Schluss
Methoden derPsychologie
Sampling Distribution – Bestimmung des Standardfehlers
Unabhängigkeit Ist die Messvariable eine in beiden Populationen unabhängige ZV:
2 2M J
xM JN N
σ σσ Δ = +
Jungen und Mädchen kommen aus derselben Population2 2 2M Jσ σ σ= =
Gleichheit derPopulations-varianz
2 1 1x
M JN Nσ σΔ
⎛ ⎞= +⎜ ⎟
⎝ ⎠Standardfehler
Methoden derPsychologie
Sampling Distribution – Schätzung des Standardfehlers
Für die Populationsvarianz verwendet man eine Schätzung aus den Daten beider Stichproben:
2 22ˆ
2M M J J M J
M J M J
N s N s SAQ SAQN N df df
σ ⋅ + ⋅ += =
+ − +
wobei und die Stichprobenvarianzen sind2Ms 2
Js
2 2 1 1ˆ2
M M J Jx
M J M J
N s N sN N N N
σ Δ
⋅ + ⋅= ⋅ +
+ −
Dann gilt
Schätzung ausStichproben
“Pooling”
(Beste Schätzung des Standardfehlers aus Stichprobendaten)
Schätzformel
Methoden derPsychologie
Normalverteilung – z –Standardnormalverteilung
20 30 40 50 60 70 800.00
0.05
0.10
Wah
rsch
einl
ichk
eits
dich
te
xσ
x xzs−
=
Wah
rsch
einl
ichk
eits
dich
te
-3 -2 -1 0 1 2 30.00
0.05
0.10
f (z)
1zσ =
zx
Normalverteilung Standard‐Normalverteilung
Die z‐ Transformation übersetzt die Rohdatenskala in die Standardskala( z = 0, σz = 1)_
x_
z_
f (x)
Methoden derPsychologie
Sampling Distribution – Prüfgrösse
z- Skala derDifferenzen von Mittelwerten
x
x
xz μσ
Δ
Δ
Δ −=
Unter der H0 gilt 0xμΔ =
Dann gilt:Prüfgrössex
xzσ Δ
Δ= ist standardnormalverteilt
[ ] z0 1 22− 1−
0 xσ Δxσ Δ− 2 xσ Δ2 xσ Δ−[ ] xΔTransformation
Methoden derPsychologie
Entscheidung über Prüfgrösse mit Standardnormalverteilung
( )f t
-4 -2 2 4
0.1
0.2
t0
2.5%2.5%
95%x
xzσ Δ
Δ=
Prüfgrösse
Testen zum Signifikanzniveau α: Ist |z| > z1-α/2?
0.05α =Signifikanzniveau
( )1 /2P z z α α−> =
1 /2z α−1 /2z α−−Annahmebereich
1 /2z z α−≤Ablehnungsbereich
1 /2z z α−>Ablehnungsbereich
1 /2z z α−<
Methoden derPsychologie
Entscheidung über Signifikanz des Mittelwerteunterschieds
1. Prüfgrösse Berechnex
xzσ Δ
Δ=
A. Gilt |z| > z1-α/2 Ablehnung von H03. Entscheide
(die Mittelwerte der J. und M. sind signifikant verschieden)
Ermittle kritischen z ‐Wert z1-α/2 für ein α− Fehlerniveau2. Kritischerz - Wert
(die Mittelwerte der J. und M. unterscheiden sich zufällig)
B. Gilt |z| < z1-α/2 Beibehalten von H0_
Methoden derPsychologie
Numerisches Beispiel
Differenz derMittelwerte
23.7 17.2
173 106
Mx Jx M Jx x x− = Δ
23.7 – 17.2 = 6.52Ms 2
Js
40 173 45 106 1 1ˆ 2.5840 45 2 40 45xσ Δ
⋅ + ⋅= ⋅ + =
+ −Standardfehler
Prüfgrösse undKritischer Wert
6.5 2.522.58
z = = z1-α/2 = z0.975 = 1.96
Entscheidung d.h. |z| > z1-α/22.52 > 1.96 H0 ablehnen
Die Mittelwerte entstammen nicht derselben Population(unterscheiden sich signifikant)
Methoden derPsychologie
Voraussetzungen der Prüfung
Varianz-homogenität
Unabhängigkeit
a. Die Populationsvarianzen die beiden Stichproben zuGrunde liegen, müssen gleich (homogen) sein. (Prüfung mit geignetem Verfahren)
b. Die Messeinheiten innerhalb jeder Stichprobe müssenunabhängig sein.
c. Die Messeinheiten beider Stichproben dürfen nicht teilweise paarweise zuzuordnen sein.
Verletzungen Der Test ist relativ robust gegen Verletzungen der Varianzhomogenität. Verletzungen der Unabhängigkeit(b.) führen zur Ungültigkeit der Prüfgrösse, der Unab‐hängigkeit (c.) je nach Höhe der Korrelationen zu progressiven (kleine Korr.) oder zu konservativen Entscheidungen (hohe Korr.).
Methoden derPsychologie
Mittelwertsprüfung bei mehreren Variablen
Beispiel
X1: GehaltX2: EntscheidungsfreiheitX3: Qualität der Kommunikation
Person
ArbeitX4: EheX5: Freunde/BeziehungenX6: Sexualität
Privatsphäre
X7: LebensansprücheX8: Sinnhaftigkeit
X9: HobbiesX10: Sport/Fitness
Aktivität
( )1 2 10, , ,x x x…
Lebenszufriedenheit
Gesunde Herzinfarktpatienten
10 Variablen
2 Gruppen
Methoden derPsychologie
Multivariate Mittelwertsvergleiche - Einzeltestungen
Teststrategie
Frage
Ausweg
Unterscheiden sich Gesunde und Patienten im Variablen‐komplex Lebenszufriedenheit?
Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t‐ Test. Wenn irgend einer der Tests signifikantwird, sehen wir die Gruppen als verschieden an.
Probleme 1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.2. Unterstellte Unabhängigkeit:Man behandelt die einzelnen
Skalen als unabhängig voneinander.3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als
Variablenkomplex mit Binnenstruktur behandelt.4. Mangelnde Teststärke:Man nutzt nicht die Korrelations‐
struktur der Variablen für einen leistungsfähigen Test.
Verwendung einesmultivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in einestatistische Prüfgrösse einfliessen lässt.
Methoden derPsychologie
Einzeltestungen - Bonferronikorrektur
α − FehlerKumulierung
Overall α
Bei simultanen Einzeltestungen „kumuliert“ sich das α – Risiko:
BonferroniApproximation
( )1/ˆ1 1ˆ
m
m
α αα
= − −
≈
Setzt man das overall -Niveau fest und löst nach auf, folgt α̂
( ) ( )( )
( )( ) ( )( )
1 2
ˆ mind. 1 falsch 1 keinen 1 falsch
1
1 1 1 1
1 1
m
m
P P
P T T T
α
α α α
α
= = −
= − ∩ ∩ ∩
= − − − −
= − −
…
…
Um alle m Tests auf einem konventionellen Alpha Niveau abzusichern, muss dieses durch die Anzahl der Tests geteilt werden. Bei 10 Tests muss man für ein overall Alpha = 5% ein Test‐Alpha von 0.5% verwenden.
Methoden derPsychologie
Multivariate Mittelwertsvergleiche - Verfahren
MultivariatesTestkonstrukt
Variablen-komplex
Verfahren
( )1 2 10, , ,x x x…
Multivariate Distanz(Mahalanobisdistanz)
Multivariate Quadratsummen(SSCP-Matrizen-Zerlegung)
Optimale Linearkombination(Linear Discriminant Function)
Hotelling‘s T2 MANOVA Diskriminanz-Analyse
Alle Verfahren entscheiden über den Gruppenunterschied imgesamten Variablenkomplexmit einem statistischen Test
Methoden derPsychologie
Grundprinzip(2 Gruppen)
Multivariates Testen - Diskriminanzanalyse
( )1 2, , , mx x x…finde eine Linearkombination zu einer neuen Variable
Für die m Variablen
0 1 1 2 2 m my b b x b x b x= + + + +…so dass diese die Gruppen c1 und c2 optimal trennt.
Das Optimierungskriterium für die Wahl der bj lautet
erklärte Variation maxnicht erklärte Variation
Between
Within
QSQS
= =
Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.
Kriterium derOptimierung
Methoden derPsychologie
2D-Beispiel Man möchte trennen
anhand von
Anforderung
2D Beispiel Diskriminanzanalyse
Stechmückenc1
Blindmückenc2
Fühlerlängex1
2 Variablen Flügellängex2
• Maximale Gruppentrennung (Mittelwerte)• Minimale Klassifikationsfehler (Fall‐Klassifikation)
2 Gruppen
Methoden derPsychologie
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1.40
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70
(Fühlerlänge)
Blindmücke
Stechmücke
Variablenraum
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).
Ausgangslage
x1
(Flügelänge)x2
2D Beispiel Diskriminanzanalyse
Regression Stechmücke
Regression Blindmücke
Methoden derPsychologie
Bestes Kriterium auf x1
Blindmücke
Stechmücke
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1und X2 offenbar nicht.
Problem
2D Beispiel Diskriminanzanalyse
x1
x2
Bestes Kriterium auf x2
Variablenraum
Methoden derPsychologie
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1.40
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70
(Fühlerlänge)
Blindmücke
Stechmücke
x1
(Flügelänge)x2
Variablenraum
2D Beispiel Diskriminanzanalyse
Kriteriumsfunktion
Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2).
2 1x b ax= +Somit folgt die Klassifikationsfunktion
( ) 1 2 11 2
2 2 1
, wenn ,
, wenn c x ax b
g x xc x ax b
− >⎧= ⎨ − ≤⎩
Methoden derPsychologie
EinfacheLösung
2D Beispiel Diskriminanzanalyse
Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel α drehen !
x1
1x′
2x′x2
α
α
Zentrierung&
Rotation !
Die Varianz zwischen den Gruppen wird auf der Achse x‘1maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.
Methoden derPsychologie
z-Standard
2D Beispiel Diskriminanzanalyse
standardisiert
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00
z1
z2
Methoden derPsychologie
z-Standard
2D Beispiel Diskriminanzanalyse
Diskriminanz-funktion
• Die neue x‐ Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßtsich ein Kriterium zur optimalen Trennung beider Gruppen finden.
1 1 1 2 2z b z b z′ = +
• Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00
z‘1
z‘2
Koordinaten rotiert um α = 46° (clockwise)
Methoden derPsychologie
y: Linear-kombination
2D Beispiel Diskriminanzanalyse
Koeffizientenvon y
Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel α zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems.
y (Diskriminanzfunktion)
Kriterium y0
blindstech
1 1
2 2
cos sinsin cos
z zz z
α αα α
′− ⎛ ⎞ ⎛ ⎞⎛ ⎞=⎜ ⎟ ⎜ ⎟⎜ ⎟ ′⎝ ⎠⎝ ⎠ ⎝ ⎠
1 2 1
1 2 2
cos sinsin cos
z z zz z z
α αα α
′− =′+ =
Da 1y z′= gilt
1 1 2 2y b z b z= +
mit 1 cosb α= und 2 sinb α= −
[Excel-Beispiel]
Methoden derPsychologie
Rotation zury - Funktion
2D Beispiel Diskriminanzanalyse
y (Diskriminanzfunktion)
z1
z2
Klassifikation • Case‐Classification durch einfachen Vergleich mit dem Kriterium y0.
• Prüfung des Gruppenunterschieds mit einem einfachen t ‐ Test auf y.
y (Diskriminanzfunktion)
Kriterium y0
blind
stech