Upload
floria
View
30
Download
0
Embed Size (px)
DESCRIPTION
STATISIK. LV Nr.: 1375 SS 2005 12. April 2005. Nichtparametrische Tests. Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). Rangtests für Lageparameter Zeichentest Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung - PowerPoint PPT Presentation
Citation preview
1
STATISIK
LV Nr.: 1375
SS 2005
12. April 2005
2
Nichtparametrische Tests
• Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist).
• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum einer Verteilung
• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder
Mann-Whitney U Test
3
Rangtests für Lagemarameter
Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn
stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.
• Test für den Median ξ0,5 der Grundgesamtheit
• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0
– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0
• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0
4
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Bestimmung von yi
– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0
5
Rangtests für Lagemarameter
• Teststatistik:
Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):
• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung
n
1iiyT
n2
12
ny
2
11
2
1n
2
1ny
Z
n
1ii
n
1ii
6
Rangtests für Lagemarameter
• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten
Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.
i Alter xi xi‘ yi
1 30,6 5,6 1
2 17,8 -7,2 0
: : : :
35 20 -5 0
36 23,5 -1,5 0
7
Rangtests für Lagemarameter
• Beispiel
• Approximation durch N-Vt
• Entscheidung (bei α=0,05): Z < 1,645
Lehne H0: ξ0,5 25 nicht ab.
n
ii 1
1y 36
20 182Z 0,667
1 3362
8
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen
(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F
• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
9
Rangtests für LagemarameterVerteilungsfunktion F(x)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-3 -2 -1 0 1 2 3
F(ξ0-y)
1-F(ξ0+y)
ξ0 ξ0+yξ0-y
10
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit
• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0
– H0: F symmetrisch um ξ ξ0
• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0
11
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).
• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i
12
Rangtests für Lagemarameter
• Teststatistik:
mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)
n
1iiiRcT~
13
Rangtests für Lagemarameter
• Approximation durch N(0,1) Verteilung:
• Teststatistik T* (keine Bindungen):
mit E T+ = n(n+1) / 4
und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)
• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung
+ +*
+
T -E TT =
Var T
14
Rangtests für Lagemarameter
• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi
H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05
• Teststatistik:
ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
n
1iiiRcT~
15
Rangtests für Lagemarameter
• Beispiel:
• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53
i xi xi‘ = xi- ξ0 Ri R� i
1 72 11 10,5 10,5
2 55 -6 3 -3
3 67 6 3 3
4 53 -8 7 -7
5 69 8 7 7
6 71 10 9 9
7 55 -6 3 -3
8 68 7 5 5
9 65 4 1 1
10 72 11 10,5 10,5
11 69 8 7 7
16
Rangtests für Lagemarameter
• Beispiel:
• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54
• Entscheidung:
w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975
Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.
17
Vt.-freie Lokationsvergleiche
• Wilcoxon Rangsummentest oder Mann-Whitney U Test
• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).
• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?
18
Vt.-freie LokationsvergleicheVerteilungsfunktionen
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-5 -4 -3 -2 -1 0 1 2 3 4 5 6
19
Vt.-freie Lokationsvergleiche
• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und
für mind. ein x gilt: F1(x) < F2(x)
– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)
• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)
20
Vt.-freie Lokationsvergleiche
• Vorgehensweise: • Gemeinsame Rangzahlen der beiden
Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2
• Teststatistik:
• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)
1n
n1,n1 ii=1
W = r
21
Vt.-freie Lokationsvergleiche
• Entscheidung: – H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α
– H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 < Wn1;n2;α
• Zweiseitig Hypothese: – H0: F1(x) = F2(x)
H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2
22
Vt.-freie Lokationsvergleiche
• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?
Behand-lung Rangz.
Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.
27 19 26,5 18 18 7 17 6
34 22,5 22 14 14,5 5 18,5 8
20,5 12 24,5 17 13,5 3 9,5 1
29,5 21 34 22,5 12,5 2 14 4
20 10,5 35,5 24 23 15
28 20 19 9 24 16
20 10,5 21 13
23
Vt.-freie Lokationsvergleiche
• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.
• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.
• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.
D.h. die Behandlung führt zu einem signifikant höheren Gewicht.
24
Varianzanalyse
Varianzanalyse od. ANOVA
• Frage: Hat ein Faktor Einfluss auf ein Merkmal?
• Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen
• Merkmal (durch Faktor beeinflusst): Metrische Größe
25
Varianzanalyse
Varianzanalyse
• Einfache Varianzanalyse: Ein Faktor
• Zweifache Varianzanalyse: Zwei Faktoren
• …
26
Varianzanalyse
• Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. – Test, ob die Differenz der arithmetischen Mittel
von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.
27
Varianzanalyse
• Modellannahmen der Varinazanalyse: – Unabhängigkeit der Stichproben (i=1,…,r)
– Normalverteilung der Merkmale mit µi und σi²
– Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²
28
Varianzanalyse
• Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ
H0: µ1 = µ2 = … = µ
• Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ
H1: mindestens zwei µi sind ungleich
29
Varianzanalyse
• Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)?
• Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen).
• Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.
30
Varianzanalyse
• Modell der einfachen Varianzanalyse:
• xij = µ + αi + eij – µ … Gesamtmittelwert
– αi … Effekt auf der i-ten Ebene
– eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene.
eij = xij – µi = xij – (µ + αi)