103
1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005

1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

Embed Size (px)

Citation preview

Page 1: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

1

STATISIK

LV Nr.: 0028

SS 2005

30. Mai 2005

Page 2: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

2

Konfidenzintervall

• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.

Page 3: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

3

Konfidenzintervall

• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall

XX

zσX;zσX

Page 4: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

4

KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Stichprobenmittelwert

Dic

hte

der

N(0

,1)

1-α = 0,95

α/2 = 0,025

Konfidenzintervall

α/2 = 0,025

x-z(α/2)σ x+z(1-α/2)σ

Page 5: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

5

Konfidenzintervall

• Bsp. Körpergröße: – Mittelwert = 173,42– Standardabweichung = 9,54– N = 73– 2-seitiges KI zum Niveau α=0,05

Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t = 1,99, Quantile der N(0,1)-Vt: z = 1,96

KI: [171,19 ≤ µ ≤ 175,65] t-Vt.KI: [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt.

Page 6: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

6

Statistische Tests

• Fragen: – Besteht ein Zusammenhang zw. dem

Geschlecht und dem Rauchverhalten?– Ist der Ausschussanteil kleiner als 5%?– Ist die mittlere Länge eines Werkstücks, das

von zwei verschiedenen Maschinen hergestellt wird, gleich?

– Soll ein neues Medikament zugelassen werden?– Stammen Daten aus einer N-Vt

Grundgesamtheit?– …

Page 7: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

7

Statistische Tests

• Deskriptive Analyse der Daten– Lage- und Streuungsmassen– Kontingenztafeln – Korrelationsmaße– Verteilungsdiagramme– …

• Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen.

Page 8: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

8

Statistische Tests

Einführung:

• Testen von Hypothesen (Annahmen, Behauptungen)

• Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen.

• Statistische Testverfahren basieren auf Stichprobentheorie

Page 9: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

9

Statistische Tests

Einführung:• Ziel: Richtigkeit von Aussagen über die

Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines

zufälligen Vorgangs.• Daher: Entscheidungen nicht immer richtig• Aber: Beim Vorliegen einiger der möglichen

Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.

Page 10: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

10

Statistische Tests: Hypothesen

Hypothesen:

• Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit

• 2 Arten von Hypothesen:– Parameterhypothesen, Überprüfung durch

Parametertests– Verteilungshypothesen, Überprüfung durch

Verteilungstests

Page 11: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

11

Statistische Tests: Hypothesen

Formulierung von Hypothesen:

• Nullhypothese H0 (Ausgangshypothese)

• Alternativhypothese H1 (Gegenhypothese)

Page 12: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

12

Statistische Tests: Hypothesen

Bsp.• Anteile:

– H0: Ausschussanteil = 10%

– H1: Ausschussanteil > 10%

• Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm

– H1: Mittlere Länge eines Werkstücks 5cm

• Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich

– H1: Gruppe 1 und Gruppe 2 sind ungleich

Page 13: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

13

Statistische Tests

• Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn

• Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht.

• Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?

Page 14: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

14

Statistische Tests

Mögliche Fehlentscheidungen:

• Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt

• Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt.

Page 15: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

15

Statistische Tests

• Fehlentscheidungen

Trifft zu

EntscheidungH0 H1

H0Richtige

EntscheidungFehler 2. Art (β -Fehler)

H1Fehler 1. Art

(α-Fehler)Richtige

Entscheidung

Page 16: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

16

Statistische Tests

Problem bei Fehlentscheidungen:

• Falsche Entscheidung

• Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist.

Page 17: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

17

Statistische Tests

• Signifikanzniveau eines Tests α:– Die Wahrscheinlichkeit eine Fehler 1. Art zu

machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.

Page 18: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

18

Statistische Tests

• Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt).

• Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).

Page 19: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

19

Statistische TestsFehler 1. Art und Fehler 2. Art

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6

x

f(x)

N(0,1) N(3,1)

Fehler 1. Art

Fehler 2. Art

µ0=0 µ1=3

Page 20: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

20

Statistische Tests

• D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert.

• Bei Entscheidung für H1: – H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit

Wahrscheinlichkeit ≤ α.

• Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.

Page 21: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

21

Statistische Tests

• Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man

glaubt aber dass es wirkt– Fehler 2. Art: das Medikament wirkt, man

glaubt aber dass es unwirksam ist.

Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.

Page 22: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

22

Statistische Tests

• Arten von Hypothesen:

• Einseitige Hypothesen– H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen– H0: θ = θ0 gegen H1: θ ≠ θ0

• Verteilungshypothesen:– H0: bestimmten Vt. gegen H1: nicht diese Vt.

Page 23: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

23

Statistische Tests

• Arten von Testproblemen:– Einseitige Testprobleme

• Tests für einseitige Hypothesen

– Zweiseitige Testprobleme• Tests für zweiseitige Hypothesen

– Anpassungstests• Test für Verteilungshypothesen

Page 24: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

24

Statistische Tests

• Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist.

• Test zum Niveau α:– g(θ) ≤ α für alle θ H0

– g(θ) ≥ α für alle θ H1

– Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art.

– Funktion 1-g(θ) heißt Operationscharakteristik (OC)

Page 25: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

25

Statistische TestsGütefunktion (einseitiger Test)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

1,00

499 499,5 500 500,5 501 501,5 502

µ

g(µ

)

µ0=500

Page 26: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

26

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

1,00

499,5 500 500,5 501 501,5 502

µ

Feh

ler

2.A

rt =

1-g

(µ)

µ0=500

Page 27: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

27

Statistische Tests

• Trennschärfe eines Tests:– Steilheit der OC Kurve 1-g(θ)– Es gilt: Je größer die Stichprobe umso besser

die Trennschärfe.

Page 28: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

28

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test),

unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

1,00

499,5 500 500,5 501 501,5 502

µ

Feh

ler

2.A

rt =

1-g

(µ)

µ0=500

Page 29: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

29

Statistische Tests

• Vorgehensweise bei statistischen Tests (I):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Bestimmung des kritischen Bereichs– Berechnung der Prüfgröße (=Teststatistik)– Entscheidung und Interpretation

Page 30: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

30

Statistische Tests

• Vorgehensweise bei statistischen Tests (II):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Berechnung der Prüfgröße (=Teststatistik)– Bestimmung des p-Wertes der Teststatistik– Entscheidung und Interpretation

Page 31: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

31

Statistische Tests

• p-Wert– Anstatt den kritischen Bereich bzw. die

kritischen Werte zu bestimmen, Berechnung des „p-Wertes“.

– p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte.

– Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α.

– Entscheidung: Lehne H0 ab, wenn p-Wert < α

Page 32: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

32

Statistische Tests

• Einseitige Tests (I)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)

– T > c, lehne H0 ab

– T ≤ c, lehne H0 nicht ab

Page 33: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

33

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

de

r T

es

tve

rte

ilun

g

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Page 34: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

34

Statistische Tests

• Einseitige Tests (II)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes

– p < α, lehne H0 ab

– p ≥ α, lehne H0 nicht ab

Page 35: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

35

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der

Tes

tver

teil

un

g

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=1,64 p-Wert=0,05

Page 36: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

36

Statistische Tests

• Einseitige Tests (I)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)

– T < c, lehne H0 ab

– T ≥ c, lehne H0 nicht ab

Page 37: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

37

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

de

r T

es

tve

rte

ilun

g

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Page 38: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

38

Statistische Tests

• Einseitige Tests (II)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes

– p < α, lehne H0 ab

– p ≥ α, lehne H0 nicht ab

Page 39: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

39

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der

Tes

tver

teil

un

g

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=-1,64 p-Wert=0,05

Page 40: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

40

Statistische Tests

• Zweiseitige Tests (I)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. der

kritischen Werte (cu und co)

– T < cu oder T > co, lehne H0 ab

– cu ≤ T ≤ co, lehne H0 nicht ab

Page 41: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

41

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

de

r T

es

tve

rte

ilun

g

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

Page 42: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

42

Statistische Tests

• Zweiseitige Tests (II)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes

– p < α, lehne H0 ab

– p ≥ α, lehne H0 nicht ab

Page 43: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

43

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der

Tes

tver

teil

un

g

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

Prüfgröße= -1,96, +1,96 p-Wert=0,05

Page 44: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

44

Statistische Tests

• Kritischer Wert: Wert auf der Achse

• p-Wert: Fläche unter der Dichte

• Entscheidung: – Lehne H0 ab, wenn Prüfgröße im kritischen

Bereich

– Lehen H0 ab, wenn p-Wert der Prüfgröße < α

Page 45: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

45

χ² Unabhängigkeitstest

Chi-Quadrat (χ²) Unabhängigkeitstest

• Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind.

• Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig?

Page 46: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

46

χ² Unabhängigkeitstest

Chi-Quadrat (χ²) Unabhängigkeitstest

• H0: die beiden Merkmale sind voneinander unabhängig.

• H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig

• Festlegen des Signifikanzniveaus α.

Page 47: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

47

χ² Unabhängigkeitstest

• Kontingenztafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

A \ B b1 ... bs ∑

a1 h11 … h1s h1.

: : : :

ar hr1 … hrs hr.

∑ h.1 ... h.s h.. = n

Page 48: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

48

χ² Unabhängigkeitstest

• Bsp. 4-Felder Tafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

Raucher Nichtraucherweiblich 9 32 41männlich 5 27 32

14 59 73

Page 49: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

49

χ² Unabhängigkeitstest

Prüfgröße und Testverteilung:

• Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

Page 50: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

50

χ² Unabhängigkeitstest

• Unter H0 erwartete absoluten Häufigkeiten

• Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten

• Dann: unter H0 erwartete absoluten Häufigkeiten

o oi je h h

h =n

Page 51: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

51

χ² Unabhängigkeitstest

• Bsp. Geschlecht - Rauchverhalteno oi je h h

h =n

ho

Geschlecht j nw 9 32 41m 5 27 32

14 59 73

Raucher

he

Geschlecht j nw 7,9 33,1 41m 6,1 25,9 32

14 59 73

Raucher

Page 52: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

52

χ² Unabhängigkeitstest

• Teststatistik χ²:– Abweichung der beobachteten Häufigkeiten

von den erwartete Häufigkeiten

2o er sij ij2

ei=1 j=1 ij

h hχ =

h

Page 53: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

53

χ² Unabhängigkeitstest

Verteilung der Teststatistik χ²:

• χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden

Page 54: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

54

χ² Unabhängigkeitstest

Kritischer Bereich:

• Signifikanzniveau α

• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1) Verteilung

• Lehne H0 ab, wenn gilt:

Wert der Teststatistik > kritischer Wert

Page 55: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

55

χ² Unabhängigkeitstest

Bsp. Geschlecht – Rauchverhalten: Teststatistik χ²

• Verteilung der Teststatistik: χ²1

Chi-Quadrat Verteilung mit einem Freiheitsgrad

2o e2 2ij ij2

ei=1 j=1 ij

h hχ = 0,5

h

Page 56: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

56

χ² Unabhängigkeitstest

Bsp. Geschlecht – Rauchverhalten:

• Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84

• Entscheidung:

(I) Teststatistik = 0,5 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab.

(II) p-Wert = 0,496 > 0,05. Also: Lehne H0 nicht ab.

• Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig.

Page 57: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

57

χ² Homogenitätstest

Chi-Quadrat (χ²) Homogenitätstest

• Betrachte zwei Gruppen bzw. Stichproben.

• Teste, ob die Stichproben aus der gleichen Grundgesamtheit stammen.

Page 58: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

58

χ² Homogenitätstest

Chi-Quadrat (χ²) Homogenitätstest

• H0: die beiden Stichproben stammen aus der gleichen Grundgesamtheit.

• H1: die beiden Stichproben stammen nicht aus der gleichen Grundgesamtheit.

• Festlegen des Signifikanzniveaus α.

Page 59: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

59

χ² Homogenitätstest

Bsp. Geschlecht – Rauchverhalten

• H0: Das Rauchverhalten der beiden Gruppen stimmt überein.

• H1: Das Rauchverhalten der beiden Gruppen stimmt nicht überein.

Page 60: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

60

χ² Homogenitätstest

Prüfgröße und Testverteilung:

• Prinzip: Vergleiche die Werte, die man unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

Page 61: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

61

χ² Homogenitätstest

• Unter H0 erwartete absoluten Häufigkeiteno oi je h h

h =n

Page 62: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

62

χ² Homogenitätstest

• Teststatistik χ²:– Abweichung beobachteten Häufigkeiten und

erwartete Häufigkeiten

• Verteilung der Teststatistik χ²:

χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden

2o er sij ij2

ei=1 j=1 ij

h hχ =

h

Page 63: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

63

χ² Homogenitätstest

Bsp. Geschlecht – Rauchverhalten:• Teststatistik χ² = 0,5• Verteilung der Teststatistik: χ²1 • Entscheidung:

– (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab.

• Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen.

Page 64: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

64

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:

• Teststatistik und Testverteilung sind gleich

• Nullhypothese und Interpretation sind verschieden. – Test auf Unabhängigkeit (die Merkmale sind

unabhängig voneinander)– Test auf Homogenität (die Stichproben

stammen aus der gleichen Grundgesamtheit).

Page 65: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

65

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:

• Für die Approximation durch die χ²-Vt. sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein.

• Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen

(siehe Hartung S. 414ff)

Page 66: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

66

Anpassungstests

Test einer Verteilungshypothese – Nichtparametrische Testverfahren

• Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung.

• „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird.

Page 67: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

67

Anpassungstests

χ² Anpassungstest:

• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.

• Vorgehensweise: – Bestimme die unter H0 zu erwartenden

Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho.

– Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0.

Page 68: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

68

Anpassungstests

χ² Anpassungstest:

• Teststatistik:

k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen)

• Testverteilung: χ²v verteilt mit v=n-1

• Es gilt wieder: he sollten 5 sein.

k

1iei

2ei

oi2

h

)h(hχ

Page 69: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

69

Anpassungstests

χ² Anpassungstest:

• Entscheidung: – Bestimmung des kritischen Bereichs,

χ² > kritischer Wert, lehne H0 ab

– Bestimmung des p-Wertes,

p-Wert < α lehne H0 ab

Page 70: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

70

Anpassungstest

• Bsp. χ² Anpassungstest:– H0: Augenfarbe ist gleichverteilt

– H1: Augenfarbe ist nicht gleichverteilt

– α = 0,05

• Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2 Verteilung) => H0 ablehnen

• p-Wert: 0,014 < 0,05 => H0 ablehnen

Merkmal ho he

1 35 242 22 243 15 24

72 72

Page 71: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

71

Anpassungstests

Kolmogorov-Smirnov- Anpassungstest:

• Test zur Beurteilung der Güte der Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung.

• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.

• Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion.

Page 72: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

72

Anpassungstests

Kolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D):

– größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion.

• Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur

vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen).

• Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab.

Page 73: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

73

Anteilstests

• Einstichprobentest für den Anteilswert – Hat der Anteil einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe.

• Zweistichprobentest für Anteilswerte– Unterscheiden sich die Anteile zweier

unabhängiger Gruppen?– Entscheidung basiert auf zwei Stichproben

Page 74: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

74

Anteilstest - Einstichprobentest

Einstichprobentest für den Anteilswert:

• Einseitige Hypothesen: – H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen: – H0: θ = θ0 gegen H1: θ ≠ θ0

Page 75: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

75

Anteilstest - Einstichprobentest

Vorgehensweise:

• Teststatistik bestimmen

• Testverteilung bestimmen

• Entescheidung über Annahme oder Ablehnung von H0.

Page 76: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

76

Anteilstest - Einstichprobentest

• Anteilswert einer Stichprobe: P = x / n

• Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern – E(P) = θ0

– Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)]• Vernachlässigung der Endlichkeitskorrektur wenn

n/N < 0,05.

Page 77: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

77

Anteilstest - Einstichprobentest

Prüfgröße / Teststatistik:

• Standardisierte Zufallsvariable Z:

0

P

P-θZ=

σ

Page 78: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

78

Anteilstest - Einstichprobentest

Testverteilung:

• Teststatistik Z ist unter H0 N(0,1) verteilt.

• Daher: Testverteilung ist die Standardnormalverteilung.

Page 79: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

79

Anteilstest - Einstichprobentest

Kritischer Bereich:• α festlegen (z.B. α = 0,05) • Kritischer Wert: α – Quantil der N(0,1)-Vt. • Entscheidung: H0 ablehnen, wenn Teststatistik im

kritischen Bereich. p-Wert: • α festlegen (z.B. α = 0,05)• p-Wert: Niveau, bei dem der Test gerade noch die

H0 ablehnen würde. • Entscheidung: H0 ablehnen, wenn p-Wert < α

Page 80: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

80

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten

• Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9.

• 1. Einseitige Tests:– H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05

– H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05

• 2. Zweiseitiger Test: – H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05

Page 81: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

81

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten

• H0: pw 0,5 gegen H1: pw > 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert 1,64– p-Wert: 0,1461

Page 82: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

82

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten

• H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert -1,64– p-Wert: 0,8539

Page 83: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

83

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten

• H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritische Werte -1,96

und +1,96 – p-Wert: 0,2922

Page 84: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

84

Anteilstest - Zweistichprobentest

Test für die Differenz zweier Anteilswerte

• Stichprobe 1: Anteil P1 = x / n1

• Grundgesamtheit 1: Anteil θ1

• Stichprobe 2: Anteil P2 = x / n2

• Grundgesamtheit 2: Anteil θ2

• H0: Anteilswerte der beiden Grundgesamtheiten sind gleich.

H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2

Page 85: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

85

Anteilstest - Zweistichprobentest

Teststatistik:

(Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind)

• Verteilung der Teststatistik unter H0:

Z ~ N(0,1)

1 2

1 2

1 2

(P -P )Z=

n +nθ(1-θ)

n n

Page 86: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

86

Anteilstest - Zweistichprobentest

Entscheidung:

• Bestimmung des kritischen Bereichs. – Z > |c| lehne H0 ab

• Bestimmung des p-Wertes– p-Wert < α lehne H0 ab

• Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.

Page 87: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

87

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: – Hat das arithm. Mittel einen bestimmten Wert,

bzw. liegt es in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe.

• Zweistichprobentest für das arithm. Mittel– Unterscheiden sich die Mittelwerte zweier

Gruppen?– Entscheidung basiert auf zwei Stichproben

Page 88: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

88

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: – Varianz der Grundgesamtheit ist bekannt.– Varianz der Grundgesamtheit ist unbekannt.

Page 89: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

89

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel:

• Zweiseitige Hypothese:

H0: µ = µ0 gegen H1: µ ≠ µ0

• Festlegen des Signifikanzniveaus

Page 90: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

90

Test für arithmetisches Mittel

• Varianz der Grundgesamtheit ist bekannt.

• Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n

• Teststatistik:

• Testverteilung: N(0,1)n

σμX

σ

μXZ

X

Page 91: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

91

Test für arithmetisches Mittel

• Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes

• Entscheidung

• Interpretation

Page 92: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

92

Test für arithmetisches Mittel

• Varianz der Grundgesamtheit ist unbekannt.

• Schätzwert für unbekanntes σ²: Stichprobenvarianz s².

• Teststatistik:

• Testverteilung: tn-1

• t-Test

n

sμX

T

Page 93: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

93

Test für arithmetisches Mittel

• Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tc

u = -tco

• Berechung des p-Wertes:

• Entscheidung:

|t| > tc, lehne H0 ab

p-Wert < α, lehne H0 ab

• Interpretation

Page 94: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

94

Test für arithmetisches Mittel

Bsp. mittlere Körpergröße (n = 73)

• H0: µ = 170 gegen H1: µ 170, α = 0,05

• Arithm. Mittel der Stpr: 173,4

• Standardabweichung der Stichprobe: 9,5

• Teststatistik T = (173,4-170) / 9,5/73 = 3,1

• Kritische Werte: -1,96 und +1,96

• p-Wert: 0,0021

• Mittlere Körpergröße ist signifikant 170

Page 95: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

95

Test für arithmetisches Mittel

• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier

Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier

verbundener Stichproben?

Page 96: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

96

Test für arithmetisches Mittel

• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.

• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.

Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig

– Endlichkeitskorrektur ist vernachlässigbar

Page 97: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

97

Test für arithmetisches Mittel

• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.

• Varianzen verschieden, σ1² σ2² :

• Teststatistik:

• Testverteilung: Z asymptotisch N(0,1)-vt.

2

22

1

21

21

n

S

n

S

)XX(Z

Page 98: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

98

Test für arithmetisches Mittel

• Varianzhomogenität, σ1² = σ2² = σ²:

• Teststatistik:

wobei

• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

21

21

21

nn

nnS

)XX(T

2nn

1)S(n1)S(nS

21

222

211

Page 99: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

99

Test für arithmetisches Mittel

• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen

der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.

• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

Page 100: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

100

Test für arithmetisches Mittel

• Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²

• Teststatistik:

• Testverteilung: T~tv mit v=n-1

n

SδD

TD

n

1i

2iD

n

1ii )D(D

1n

1SundD

n

1X

Page 101: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

101

Test für Varianz

• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe.

• Zweistichprobentest für die Varianz– Unterscheiden sich die Varianzen zweier

Gruppen?– Entscheidung basiert auf zwei Stichproben

Page 102: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

102

Test für Varianz

Einstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:

• Testverteilung: χ²v mit v=n-1• Entscheidung:

– χ² > χ²co oder χ² < χ²c

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

2

22

σ

1)s(nχ

Page 103: 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der

103

Test für Varianz

Zweistichprobentest für den Quotienen zweier Varianzen:

• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:

• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:

– F > Fco oder F < Fc

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

22

21

S

SF