30
1 STATISIK LV Nr.: 1375 SS 2005 12. April 2005

STATISIK

  • Upload
    floria

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

STATISIK. LV Nr.: 1375 SS 2005 12. April 2005. Nichtparametrische Tests. Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). Rangtests für Lageparameter Zeichentest Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung - PowerPoint PPT Presentation

Citation preview

Page 1: STATISIK

1

STATISIK

LV Nr.: 1375

SS 2005

12. April 2005

Page 2: STATISIK

2

Nichtparametrische Tests

• Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist).

• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das

Symmetriezentrum einer Verteilung

• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder

Mann-Whitney U Test

Page 3: STATISIK

3

Rangtests für Lagemarameter

Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn

stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.

• Test für den Median ξ0,5 der Grundgesamtheit

• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0

– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0

• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0

Page 4: STATISIK

4

Rangtests für Lagemarameter

• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Bestimmung von yi

– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0

Page 5: STATISIK

5

Rangtests für Lagemarameter

• Teststatistik:

Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):

• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

n

1iiyT

n2

12

ny

2

11

2

1n

2

1ny

Z

n

1ii

n

1ii

Page 6: STATISIK

6

Rangtests für Lagemarameter

• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten

Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.

i Alter xi xi‘ yi

1 30,6 5,6 1

2 17,8 -7,2 0

: : : :

35 20 -5 0

36 23,5 -1,5 0

Page 7: STATISIK

7

Rangtests für Lagemarameter

• Beispiel

• Approximation durch N-Vt

• Entscheidung (bei α=0,05): Z < 1,645

Lehne H0: ξ0,5 25 nicht ab.

n

ii 1

1y 36

20 182Z 0,667

1 3362

Page 8: STATISIK

8

Rangtests für Lagemarameter

• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen

(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F

• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?

Page 9: STATISIK

9

Rangtests für LagemarameterVerteilungsfunktion F(x)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-3 -2 -1 0 1 2 3

F(ξ0-y)

1-F(ξ0+y)

ξ0 ξ0+yξ0-y

Page 10: STATISIK

10

Rangtests für Lagemarameter

• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit

• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0

– H0: F symmetrisch um ξ ξ0

• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0

Page 11: STATISIK

11

Rangtests für Lagemarameter

• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).

• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i

Page 12: STATISIK

12

Rangtests für Lagemarameter

• Teststatistik:

mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)

n

1iiiRcT~

Page 13: STATISIK

13

Rangtests für Lagemarameter

• Approximation durch N(0,1) Verteilung:

• Teststatistik T* (keine Bindungen):

mit E T+ = n(n+1) / 4

und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)

• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

+ +*

+

T -E TT =

Var T

Page 14: STATISIK

14

Rangtests für Lagemarameter

• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi

H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05

• Teststatistik:

ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

n

1iiiRcT~

Page 15: STATISIK

15

Rangtests für Lagemarameter

• Beispiel:

• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53

i xi xi‘ = xi- ξ0 Ri R� i

1 72 11 10,5 10,5

2 55 -6 3 -3

3 67 6 3 3

4 53 -8 7 -7

5 69 8 7 7

6 71 10 9 9

7 55 -6 3 -3

8 68 7 5 5

9 65 4 1 1

10 72 11 10,5 10,5

11 69 8 7 7

Page 16: STATISIK

16

Rangtests für Lagemarameter

• Beispiel:

• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54

• Entscheidung:

w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975

Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.

Page 17: STATISIK

17

Vt.-freie Lokationsvergleiche

• Wilcoxon Rangsummentest oder Mann-Whitney U Test

• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).

• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?

Page 18: STATISIK

18

Vt.-freie LokationsvergleicheVerteilungsfunktionen

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-5 -4 -3 -2 -1 0 1 2 3 4 5 6

Page 19: STATISIK

19

Vt.-freie Lokationsvergleiche

• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und

für mind. ein x gilt: F1(x) < F2(x)

– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)

• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)

Page 20: STATISIK

20

Vt.-freie Lokationsvergleiche

• Vorgehensweise: • Gemeinsame Rangzahlen der beiden

Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2

• Teststatistik:

• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

1n

n1,n1 ii=1

W = r

Page 21: STATISIK

21

Vt.-freie Lokationsvergleiche

• Entscheidung: – H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α

– H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 < Wn1;n2;α

• Zweiseitig Hypothese: – H0: F1(x) = F2(x)

H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2

Page 22: STATISIK

22

Vt.-freie Lokationsvergleiche

• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?

Behand-lung Rangz.

Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.

27 19 26,5 18 18 7 17 6

34 22,5 22 14 14,5 5 18,5 8

20,5 12 24,5 17 13,5 3 9,5 1

29,5 21 34 22,5 12,5 2 14 4

20 10,5 35,5 24 23 15    

28 20 19 9 24 16    

20 10,5     21 13    

Page 23: STATISIK

23

Vt.-freie Lokationsvergleiche

• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.

• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.

• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.

D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

Page 24: STATISIK

24

Varianzanalyse

Varianzanalyse od. ANOVA

• Frage: Hat ein Faktor Einfluss auf ein Merkmal?

• Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen

• Merkmal (durch Faktor beeinflusst): Metrische Größe

Page 25: STATISIK

25

Varianzanalyse

Varianzanalyse

• Einfache Varianzanalyse: Ein Faktor

• Zweifache Varianzanalyse: Zwei Faktoren

• …

Page 26: STATISIK

26

Varianzanalyse

• Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. – Test, ob die Differenz der arithmetischen Mittel

von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

Page 27: STATISIK

27

Varianzanalyse

• Modellannahmen der Varinazanalyse: – Unabhängigkeit der Stichproben (i=1,…,r)

– Normalverteilung der Merkmale mit µi und σi²

– Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²

Page 28: STATISIK

28

Varianzanalyse

• Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ

H0: µ1 = µ2 = … = µ

• Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ

H1: mindestens zwei µi sind ungleich

Page 29: STATISIK

29

Varianzanalyse

• Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)?

• Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen).

• Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

Page 30: STATISIK

30

Varianzanalyse

• Modell der einfachen Varianzanalyse:

• xij = µ + αi + eij – µ … Gesamtmittelwert

– αi … Effekt auf der i-ten Ebene

– eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene.

eij = xij – µi = xij – (µ + αi)