Download pdf - LMU_FS13_Statistik2

UNISEMINAR

Sem

inar

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

Einleitung

Statistik IISommersemester 2013

München, April 2013

Einleitung uniseminar.eu

Herzlich Willkommen bei Uniseminar

Vorwort

Ziel von Uniseminar ist es, Dich optimal auf Deine Prüfungen vorzubereiten und Deine Prü-fungsvorbereitung an der LMU München so effizient wie möglich zu gestalten. Um dieses Zielzu erreichen, haben wir ein zweiteiliges Konzept entwickelt, das sich nun mehrere Jahre alsgroße Hilfe für die Studenten bewährt hat. Dieses besteht zum einen aus sehr umfangreichenLernunterlagen in Form eines Ordners und dazu passenden Prüfungsvorbereitungsseminarenam Ende des Semesters. Damit werden sämtliche Inhalte aus den Vorlesungen und Übungen ineinfacher und anschaulicher Form kompakt zusammengefasst.

Während des Semesters bieten wir Dir deshalb unsere umfangreichen Lernunterlagen in Formeines Ordners an. Diese Lehrmittel solltest Du im Selbststudium am Ende des Semesters durch-arbeiten.

Danach empfehlen wir Dir zur gezielten Prüfungsvorbereitung unsere Seminare zu besuchen,wo wir Dir in acht Stunden nochmals die essentiellsten Aufgaben und Konzepte näherbringenund Dich so optimal auf Deine Prüfungen vorbereiten. Dieser mehrteilige Ansatz ermöglichtDir mit einer ausgewogenen Mischung verschiedener auf einander abgestimmter Medien DeinenLernerfolg nachhaltig zu verbessern.

-1-


Aufbau

Dieser Ordner soll Dir als Lernhilfe zur effizienten Prüfungsvorbereitung der Statistik II Prü-fungen dienen und umfasst 5 Teile. Wir möchten Dir im Folgenden einen Überblick über denAufbau des Ordners geben.

1. Theorie: Das Theorieskript fasst in einfacher und übersichtlicher Form den gesamtenStoff des Semesters zusammen und erklärt diesen anhand anschaulicher Beispiele. AmEnde findest Du ein Stichwortverzeichnis, welches Dir bei allfälligen Fragen schnellstmög-lich Zugriff auf das erforderliche Wissen verschafft. Das Theorieskript umfasst 8 Kapitel.

2. Aufgaben: Zu allen Kapiteln des Theorieskripts haben wir Dir abgestimmte Übungsauf-gaben erstellt. Wir empfehlen Dir diese Aufgaben gleich nach den erfolgten Seminarblö-cken zu lösen, um anschliessend Fragen an unsere Dozenten stellen zu können. Diese sindgerne während den Pausen und auch nach den offiziellen Seminarstunden für Dich da, umDir bei Deinen persönlichen Problemfeldern weiterzuhelfen.

3. Übungen: In den vergangenen Jahren hat es sich gezeigt, dass die Übungsblätter derUniversität zunehmend wichtiger für das erfolgreiche Bestehen der Prüfung geworden sind.Die Professoren haben die aktuellsten Prüfungsaufgaben vermehrt unter Berücksichtigungder Übungen konzipiert. Der Grund dafür liegt darin, dass die Anwesenheit der Studentenwährend der Übungen sich lohnen und auszahlen soll. Aus diesem Grund haben wir Dirsämtliche Übungsaufgaben mit ausführlichen Lösungswegen zusammengestellt.

4. Prüfungen: Beginne früh damit, bisherige Prüfungen zu lösen, denn nur so gewinnst Dudas nötige Verständnis für deren Aufbau. Du wirst erkennen, was für die Prüfung relevantist und kannst Dich gezielt darauf vorbereiten. Dazu haben wir Dir alle verfügbarenPrüfungen mit ausführlichen Lösungswegen zusammengestellt.

5. Formeln: Die Formelsammlung stellt die wichtigen Formeln der Vorlesung sowie dasVorgehen bei den Hypothesentests übersichtlich zusammen. Nimm Dir nach dem Durch-arbeiten des Theorieskripts die Formelsammlung öfter vor, um sie zeilenweise abzulesenund die Formeln zu memorieren. Jede Formel, die im Kopf verfügbar ist und nicht wäh-rend der Prüfung nachgeschlagen werden muss, spart wertvolle Zeit. Verwende die Ta-bellen mit den Übungsaufgaben und den Musterprüfungen, um das schnelle Ablesen vonWahrscheinlichkeiten und Quantilen zu üben.

-4-


Vorgehensweise

Wir empfehlen Dir mit dem Ordner wie folgt schrittweise vorzugehen um einen perfekten Ler-nerfolg zu erzielen:

1. Theorie: Lies als erstes ein Theoriekapitel aufmerksam durch und versuche die theoreti-schen Inhalte zu verstehen.

2. Aufgaben: Löse nun einige oder am besten alle unsere eigens erstellten Aufgaben passendzum soeben gelesenen Theoriekapitel komplett durch. Diese umfassen exakt den in diesemTheoriekapitel erlernten Stoff. So siehst Du gleich, an welchen Stellen Du allenfalls einTheoriekapitel nochmals gründlicher durchlesen solltest.

3. Prüfungen: Mit Deinem aktuellen theoretischen Wissensstand kannst Du nun ideal aus-gewählte Prüfungsaufgaben lösen. So siehst Du gleich was Dich an der Prüfung erwartetund kannst Dich bereits jetzt perfekt darauf einstellen. Dazu haben wir Dir am Ende vonjedem Theoriekapitel einige ausgewählte Prüfungsaufgaben zusammengestellt, die sich aufdas soeben behandelte Thema beziehen.

4. Mache eine Pause und beginne danach wieder mit einem weiteren Theoriekapitel.

-5-


Kontakt

Solltest Du noch Fragen zu unseren Lernunterlagen, Seminaren oder Dienstleistungen haben,kannst Du uns jederzeit gerne kontaktieren. Dabei stehen Dir folgende Möglichkeiten zur Ver-fügung:

• Schreibe eine E-Mail an: [email protected]

• Füge uns bei Skype hinzu und schreibe uns dort (Kontakt: Uniseminar)

• Ruf uns einfach an unter +49 (0)30 202 15 668

• Werde Mitglied unserer Facebook Gruppe und nutze die Wall oder schreibe einem derKoordinatoren (Du erkennst Sie am “Uniseminar” im Namen)

-8-

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

T

Theorie

Statistik II

Sommersemester 2013


Inhaltsverzeichnis

1 Kombinatorik 1

1.1 Permutationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Kombinationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Wahrscheinlichkeitsrechnung 5

2.1 Wahrscheinlichkeitsbegrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 Zufallsvariablen 14

3.1 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2 Kenngröÿen diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 17

3.3 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.4 Kenngröÿen stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 21

3.5 Die Ungleichung von Tschebysche . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.6 Mehrdimensionale Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . 23

3.7 Kenngröÿen mehrerer Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 27

4 Spezielle Verteilungen 31

4.1 Gleichverteilung für diskrete Variablen . . . . . . . . . . . . . . . . . . . . . . . 31

4.2 Bernoulliverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.3 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.4 Geometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.5 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.6 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.7 Multinomiale Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.8 Gleichverteilung für stetige Variablen . . . . . . . . . . . . . . . . . . . . . . . . 39

4.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.10 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.11 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.12 t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.13 F -Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5 Grenzwertsätze 48

5.1 Approximation B → Po . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.2 Approximation B → N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.3 Approximation H → N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

6 Punkt- und Intervallschätzung 54

6.1 Punktschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

6.2 Kondenzintervalle für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . 57

6.3 Kondenzintervalle für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . 59

6.4 Kondenzintervalle für die Varianz (µ unbekannt) . . . . . . . . . . . . . . . . . 62

6.5 Kondenzintervalle für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . 64

6.6 Bestimmung des notwendigen Stichprobenumfangs . . . . . . . . . . . . . . . . . 66

7 Statistische Tests 67

7.1 Einseitige und zweiseitige Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

7.2 Einfacher Gauss-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7.3 Einfacher t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

7.4 Approximativer Binomialtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

7.5 Testentscheid mit dem p -Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

7.6 Fehlerarten bei Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

7.7 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

7.8 Doppelter Gauss-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

7.9 Doppelter t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

7.10 Vergleichstest für gepaarte Stichproben . . . . . . . . . . . . . . . . . . . . . . . 88

7.11 Approximativer doppelter Binomialtest . . . . . . . . . . . . . . . . . . . . . . . 90

7.12 Der F -Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

7.13 Der χ2-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

7.14 Der Mann-Whitney-U-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

7.15 Kolmogorov-Smirnov-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . 99

7.16 Der Odds-Ratio-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

8 Regressionsanalyse 103

8.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

8.2 Einfache lineare Regression: Idee . . . . . . . . . . . . . . . . . . . . . . . . . . 105

1

8.3 Schätzer für β0 und β1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

8.4 Varianzanalyse (ANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

8.5 Statistische Tests für Signikanz . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

8.6 Überprüfen der Modellannahmen . . . . . . . . . . . . . . . . . . . . . . . . . . 123

8.7 Multiple Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

8.8 Der Overall-F -Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

Stichwortverzeichnis 127

2

Theorie: Wahrscheinlichkeitsrechnung uniseminar.eu

2 Wahrscheinlichkeitsrechnung

Inhalte dieses Kapitels:

• Grundlegende Notation für die Wahrscheinlichkeitsrechnung

• Rechenregeln für Wahrscheinlichkeiten

• Totale und bedingte Wahrscheinlichkeiten

Die Wahrscheinlichkeitstheorie stellt Regeln und Aussagen zur Verfügung, die es uns erlauben

unabhängig von konkreten Stichproben den Begri der Zufälligkeit einzufangen, diesen zu be-

schreiben und ezient damit zu rechnen.

Sie liefert auch Einsicht in den Zusammenhang zwischen einer idealisierten Zufallsverteilung

und den Stichprobenwerten die sie annähern je gröÿer die Stichprobe wird. Das Kernresultat

für die Statistik wird am Schluss des Kapitels das Gesetz der groÿen Zahlen sein, welches das

mathematische Fundament ist, auf dem die gesamte Statistik ruht.

Dazu sind allerdings eine Reihe von Grundbegrien nötig, die von den konkreten Beispielen

der letzten Kapitel abstrahiert und möglichst allgemein gehalten sind, damit möglichst viele

Sachverhalte damit beschrieben werden können:

• Ein Zufallsexperiment ist ein Vorgang, der

nach einer bestimmten Vorschrift ausgeführt wird,

beliebig oft wiederholbar ist, und

zufallsabhängig ein Ergebnis liefert.

• Ein Elementarereignis oder Ergebnis ist ein möglicher Ausgang des Experiments.

Ergebnisse werden mit kleinen Buchstaben a, b, ω, . . . geschrieben.

• Der Ereignisraum (oder Grundraum) Ω ist die Menge aller möglichen Ergebnisse des

Experiments.

-5-


• Ein Ereignis ist eine Teilmenge des Grundraums, also eine Menge aus keinem, einem

oder mehreren Elementarereignissen. Ein Ereignis tritt ein, wenn eines seiner Elemen-

te (Elementarereignisse) beim Experiment herauskommt. Ereignisse werden mit groÿen

lateinischen Buchstaben A,B, . . . beschrieben.

Beispiel

Angenommen in einer Urne liegen ein roter, ein blauer und ein grüner Würfel. Das ziehen

eines Würfels aus der Urne entspricht einem Zufallsexperiment mit Ereignisraum Ω = r, b, g,

die Elementarereignisse sind r, g und b. Ein mögliches Ereignis wäre A = r, b. Dies ist das

Ereignis, dass der rote oder der blaue Würfel gezogen werden.

Ereignisse kann man mit Diagrammen beschreiben: Dabei wird der gesamte Ereignisraum Ω

als eine Box dargestellt und die Ergebnisse als Punkte in der Box. Ereignisse sind schraerte

Flächen in der Box. Hier ein paar wichtige spezielle Ereignisse als Text und als Diagramm:

• Das unmögliche Ereignis ist die leere Menge

∅ = . Das unmögliche Ereignis tritt nie ein,

weil es keine Elementarereignisse enthält.

Ω

• Ω Das sichere Ereignis ist der komplette Er-

eignisraum Ω. Im Beispiel wäre Ω = r, b, g das

sichere Ereignis.

Ω

• Das zu A komplementäre Ereignis besteht aus

den Elementarereignissen, die nicht in A liegen.

Im Beispiel: Wenn A = r das Ereignis roter

Würfel ist, dann ist A = b, g das Gegenteil

nicht roter Würfel.

ΩA

A

• Der Durchschnitt der Ereignisse A1 und A2

wird mit A1 ∩ A2 notiert, er enthält die Elemen-

tarereignisse, die sowohl in A1 als auch in A2 ent-

halten sind. Im Beispiel ist der Durchschnitt von

A = g, b und B = b dann A ∩B = b.

ΩA1

A2

A1 ∩ A2

-6-


• Die Vereinigung von Ereignissen A1 und A2 ist

A1 ∪ A2. Das ist die Menge der Elementarereig-

nisse, die in A1 oder A2 liegen. Ist beispielsweise

A = g und B = b, dann ist A ∪B = g, b.

ΩA1 A2

• Zwei Ereignisse A1 und A2 sind unverträglich

(oder disjunkt), falls sie kein gemeinsames Ele-

ment haben: A1 ∩ A2 = ∅. Dann können die

beiden Ereignisse nicht gleichzeitig eintreten. Im

Beispiel sind B = b und C = g disjunkt,

nicht aber B und C = b, g.

ΩA1 A2

2.1 Wahrscheinlichkeitsbegrie

Den Begri der Wahrscheinlichkeit kann man auf drei Arten einführen. Jede entspricht irgend-

wie unserer Vorstellung davon, wie wahrscheinlich es ist, dass ein Ereignis eintritt:

• Der klassische Wahrscheinlichkeitsbegri stammt von P.-S. Laplace: Wenn man vor-

aussetzt, dass alle Ergebnisse gleich wahrscheinlich sind, dann ist die Wahrscheinlich-

keit für das Ereignis A gegeben durch

P (A) =Anzahl der Ergebnisse in AAnzahl Ergebnisse in Ω

=|A||Ω|

Dabei bezeichnet |A| die Anzahl der Elemente inA. Im Beispiel ist P (g) = 13, P (r, g) =

23und P (Ω) = 3

3= 1.

• Der statistische Wahrscheinlichkeitsbegri deniert die Wahrscheinlichkeit dagegen

als Grenzwert der relativen Häugkeit, wenn man das Zufallsexperiment unendlich oft

wiederholt:

P (A) = limAnzahl Versuche→∞

Anzahl der für A günstigen VersucheAnzahl Versuche

-7-

Theorie: Spezielle Verteilungen uniseminar.eu

4 Spezielle Verteilungen


• Die in der Vorlesung verwendeten Verteilungen werden vorgestellt

• Diskrete Verteilungen und ihre Kenngröÿen

• Stetige Verteilungen und ihre Kenngröÿen

Einer der wichtigsten Vorteile beim Rechnen mit Zufallsvariablen ist, dass die meisten Zufalls-

experimente bestimmte Wahrscheinlichkeitsfunktionen haben, die bereits gut untersucht und

tabelliert sind. Man sagt, dass die Zufallsvariable eine bestimmteVerteilung besitzt und meint,

dass die Wahrscheinlichkeitsfunktion f(xi) = P (X = xi) tabelliert ist oder als Formel vorliegt.

Dann sind auch ihre Kenngröÿen automatisch bekannt. Die wichtigsten bekannten Verteilungen

für diskrete Zufallsvariablen sind die Binomialverteilung und die Poissonverteilung, die wir in

den folgenden Abschnitten vorstellen.

4.1 Gleichverteilung für diskrete Variablen

Eine Gleichverteilung beschreibt ein Experiment, bei dem jeder Ausgang gleichwahrscheinlich

ist. Im diskreten Fall (nur k mögliche Ausgänge des Experiments) ist dann für jeden Wert xi

der (diskreten) Zufallsvariablen X einfach

P (X = xi) =1

ni = 1, . . . , k

unabhängig davon, welches konkrete xi wir einsetzen. Dabei ist zu beachten, dass P (X = x) = 0

ist für x ∈ R\x1, . . . , xk die kein möglicher Wert von X sind. Diese Wahrscheinlichkeitsver-

teilung führt zu folgenden Kenngröÿen für die Variable X:

Mittelwert: E(X) = k+12

Varianz: Var(X) = 112

(k2 − 1)

Standardabweichung: σ(X) =√

112

(k2 − 1)

-31-


4.2 Bernoulliverteilung

Eine Bernoulliverteilung beschreibt ein Zufallsexperiment, dass nur zwei verschiedene Ausgänge

(Erfolg oder Misserfolg) haben kann. Die einzig sinnvolle (diskrete) Zufallsvariable zu einem

solchen Experiment ist X = X(ω) ∈ 0, 1

X = 1 falls Erfolg als Ergebnis bzw. 0 falls Misserfolg .

Da es nur zwei mögliche Ausgänge des Experiments gibt, hat man nur die Wahrscheinlichkeiten

P (X = 1) = p , P (X = 0) = 1− p

mit der Erfolgswahrscheinlichkeit p ∈ [0, 1]. Das Experiment ist durch die Angabe von p

schon eindeutig beschrieben, daher schreibt man einfach X ∼ B(p) für eine Bernoulli-verteilte

VariableX. Diese Wahrscheinlichkeitsverteilung führt zu folgenden Kenngröÿen für die Variable

X:

Mittelwert: E(X) = p

Varianz: Var(X) = p(1− p)

Standardabweichung: σ(X) =√p(1− p)

4.3 Binomialverteilung

Eine Binomialverteilung beschreibt folgendes Zufallsexperiment:

• Ein Bernoulli-Experiment (nur Erfolg/Misserfolg als Ausgang möglich) wird n-mal aus-

geführt,

• es wird nur die Anzahl X der Erfolge gezählt, die Reihenfolge interessiert nicht.

• Jedes der n Einzelexperimente hat die gleiche Erfolgswahrscheinlichkeit p.

Die diskrete Zufallsvariable X gibt die Anzahl erfolgreicher Versuche an, also wieviele von den

n Versuchen einen Erfolg produziert haben. Man sagt dann, das X binomialverteilt ist mit

n Versuchen und Erfolgswahrscheinlichkeit p. Das schreibt man auch kurz

-32-


X ∼ B(n, p)

Eine binomialverteilte Zufallsvariable hat die folgende Wahrscheinlichkeitsfunktion:

P (X = x) =

(n

x

)· px · (1− p)n−x =

n!

x! · (n− x)!· px · (1− p)n−x

Diese Wahrscheinlichkeitsfunktion führt zu folgenden Kenngröÿen für die Binomialverteilung:

Mittelwert: E(X) = np

Varianz: Var(X) = np(1− p)

Standardabweichung: σ(X) =√np(1− p)

Im folgenden Bild sieht man die Binomialverteilung B(10, 0.3). Bei dem Mittelwert 3 ist die

Wahrscheinlichkeit am gröÿten. Wenn der Parameter p vergröÿert wird, verschieben sich die

maximalen Werte weiter nach rechts. Wenn die Anzahl Versuche erhöht wird, nähert sich die

Form einer Glocke an.

X ∼ B(10, 0.3)

x

P (X = x)

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4 5 6 7 8 9 10

Beispiel

60% der LMU-Absolventen haben im letzten Jahr ehrenamtliche Arbeit verrichtet. Wählen wir

zufällig 4 Absolventen. Wie hoch ist die Wahrscheinlichkeit, dass keiner von ihnen im letzten

-33-

Theorie: Statistische Tests uniseminar.eu

7 Statistische Tests


• Prinzip des Hypothesentests

• Testentscheidung über Prüfgröÿe oder p-Wert

• Berechnung der Prüfgröÿe für Standardsituationen

Ein statistischer Test wird verwendet um zu entscheiden, ob eine gezogene Stichprobe einer

bestimmten Annahme über die Grundgesamtheit widerspricht. Diese Annahme nennt man auch

die Nullhypothese H0, ihr Gegenteil ist die Alternativhypothese H1. Spricht die Stichpro-

be zu stark gegen H0, so verwirft man die Nullhypothese und sagt, die Stichprobe spricht

signikant gegen H0 bzw. für H1. Andernfalls behält man die Nullhypothese bei. Die einzige

Schwierigkeit besteht darin festzulegen, ab welchem Punkt die Stichprobe signikant gegen H0

spricht. Dazu verwendet man folgenden allgemeinen Ansatz:

• Man gibt ein kleines Signikanzniveau bzw. Irrtumswahrscheinlichkeit α vor, typi-

scherweise 5%.

• Dann zieht man eine Stichprobe und berechnet einen Punktschätzer.

• Für diesen Schätzer bestimmt man einen Annahmebereich für H0 und einen Verwerfungs-

bereich. Diese Bereiche werden nach folgender Regel festgelegt: Ist H0 wahr, so erhält

man einen Schätzwert im Ablehnungsbereich höchstens mit Wahrscheinlichkeit α. Liegt

der berechnete Wert dort, wird H0 abgelehnt, ansonsten wird H0 beibehalten.

Das Signikanzniveau α steuert dabei, für wie aussagekräftig (signikant) man die Stichprobe

vor der Ziehung hält:

• Ein hohes Signikanzniveau führt dazu, dass H0 schon bei geringer Abweichung des

Schätzwerts von H0 abgelehnt wird.

• Ein niedriges Signikanzniveau bedeutet, dass man der Stichprobe nicht sehr vertraut

oder dass eine Ablehnung von H0 mit hohen Kosten verbunden wäre. Der Schätzwert

muss dann stark von H0 abweichen, damit die Nullhypothese abgelehnt wird.

-67-


Um ein einheitliches Testverfahren zu haben, wird aus dem Schätzwert zunächst eine Test-

grösse (engl. standard score) gebildet, die dann mit Werten aus einer tabellierten Verteilung

verglichen wird. Eine Ablehnung von H0 erfolgt dann, wenn die Stichprobe zu einer Testgrösse

führt, die im Verwerfungsbereich liegt. Dieser kann verschiedene Formen haben, je nachdem

ob die Fragestellung ein- oder zweiseitig formuliert ist. Es gibt zwei Arten von Hypothesen:

• Hypothesen über unbekannte Parameter, die mit so genannten Parametertests über-

prüft werden. Meist kennt man die Verteilung der Grundgesamtheit nicht. Dank des

Grenzwertsatzes können wir zur Bestimmung der Annahmebereiche aber meist die Nor-

malverteilung oder die t-Verteilung einsetzen.

• Hypothesen über die unbekannte Verteilungsform einer Grundgesamtheit, die mit Ver-

teilungstests überprüft werden. Hier werden spezielle Verteilungen zur Bestimmung der

Annahmebereiche verwendet.

Bei Parametertests haben wir stets das folgende rechnerische Vorgehen:

1. Nullhypothese und Alternativhypothese formulieren:

Man stellt die Nullhypothese H0 aufgrund der Aufgabenstellung auf. Typischerweise ist

dies eine Gleichheits- oder Ungleichheitsaussage für einen Parameter. Die Alternativhypo-

these H1 ist der Nullhypothese entgegengesetzt (mathematisch exakt formuliert gehören

zu beiden Hypothesen Intervalle für den gesuchten Parameter, die disjunkt sein müssen).

Will man mit Hilfe einer Statistik eine bestimmte Aussage signikant untermauern, so ist

diese Aussage als H1 zu wählen, denn die Stichprobe spricht immer für H1.

2. Signikanzniveau α wählen:

Das Signikanzniveau α gibt an, wie sehr wir der Stichprobe vertrauen (üblich α =

10%, 5%, 1%). Mathematisch ist α im Test die Wahrscheinlichkeit, dass wir im Fall einer

richtigen H0 eine unglückliche Stichprobe ziehen, die zur Ablehnung von H0 führt.

3. Testverfahren festlegen:

Aufgrund gegebener Daten und des zu schätzenden Parameters entscheidet man, welcher

Test durchzuführen ist. Das Grundprinzip der Tests ist gleich. Die Testart entscheidet

-68-


Bei einem zweiseitigen Test lautet die Hypothese H0 : θ = θ0. Man berechnet einen Schätz-

wert für θ und lehnt ab, falls dieser zu weit von θ0 entfernt ist. Der Annahmebereich ist also ein

Intervall um θ0. Für die standardisierte Testgrösse ist der Annahmebereich einfach ein Intervall

um den Nullpunkt, dass die Wahrscheinlichkeit 1− α abdeckt:

Zweiseitiger Test

Nullhypothese H0: θ = θ0

Alternativhypothese H1: θ 6= θ0

Annahmebereich: [−c, c]0

c−c

1− αα/2α/2

Annehmen VerwerfenVerwerfen

Bei einem einseitigen Test lautet die Hypothese H0 : θ ≥ θ0 (linksseitiger Test, Alternative

nach unten) oder H0 : θ ≤ θ0 (rechtsseitiger Test, Alternative nach oben). Man berechnet den

Schätzwert für θ und lehnt ab, falls dieser zu weit links von θ0 bzw. zu weit rechts liegt. Der

Annahmebereich ist hier ein einseitiges Intervall:

Linksseitiger Test

Nullhypothese H0: θ ≥ θ0

Alternativhypothese H1: θ < θ0

Annahmebereich: ≥ −c0

AnnehmenVerwerfen

−c

1− αα

Rechtsseitiger Test

Nullhypothese H0: θ ≤ θ0

Alternativhypothese H1: θ > θ0

Annahmebereich: ≤ c

0

Annehmen Verwerfen

c

1− α α

Wie bei den Kondenzintervallen beschreiben wir in den folgenden Abschnitten die wichtigsten

Tests im Detail.

-71-

Theorie: Regressionsanalyse uniseminar.eu

8.4 Varianzanalyse (ANOVA)

Wir wenden uns im Folgenden der Qualität unseres linearen Modells zu. Wir fragen uns,

wie genau unsere geschätzten Werte yi sind und somit auch, welche Genauigkeit wir für ei-

ne Prognose erwarten können. Dazu rufen wir uns die statistischen Hilfsmittel der Lage- und

Streuparameter aus den vorangegangenen Kapiteln in Erinnerung. Wir betrachten den Lage-

parameter y der wahren Werte, um so die Streuung der Daten zu betrachten. Für jeden Wert

yi müssen wir mit unserem Modell die Abweichung vom Mittelwert yi− y erklären. Betrachten

wir dazu wiederum die Situation für ein Datenpaar (xi, yi):

Abbildung 4: Zerlegung der Abweichung

Wir betrachten in der Abbildung 4 drei verschiedene Arten von Abweichungen:

• die zu erklärende Abweichung yi − y (dabei ist y das Mittel der Y -Werte),

• die durch unser Modell erklärte Abweichung yi − y,

• sowie die durch unser Modell nicht erklärte Abweichung yi − yi.

Wir sehen sofort, dass folgender Zusammenhang gilt:

yi − y = (yi − yi) + (yi − y) = ei + (yi − y). (2)

-115-


7.2 Einfacher Gauss-Test

Der einfache Gauss-Test prüft eine Vermutung über den Mittelwert µ einer Grundgesamtheit,

für welche die Standardabweichung σ schon bekannt ist. Der ML-Schätzwert für µ ist bekannt-

lich das Mittel aus der gezogenen Stichprobe. Für Aufgaben aus diesem Szenario liegen folgende

Gröÿen vor:

• µ0 vermuteter Mittelwert der Grundgesamtheit

• x Stichprobenmittelwert

• n Stichprobenumfang

• σ Vorab bekannte Standardabweichung der Grundgesamtheit

• α Signikanzniveau

Als Standardfehler bezeichnet man wie bei den Kondenzintervallen die Standardabweichung

des Schätzwerts. Beim Mittelwertschätzer ist das

Sx =σ√n.

Standardisieren bedeutet, dass man den vermuteten Mittelwert µ0 abzieht und durch den Stan-

dardfehler teilt. Dadurch erhält man die standardisierte Testgrösse

T =x− µ0

σ/√n

Bei den kritischen Werten muss man entscheiden, ob man sie direkt für den Schätzwert x

berechnet oder für die standardisierte Grösse T . Für diese sind die kritischen Werte wie folgt

gegeben:

1. Zweiseitig: z1−α/2 ist das Quantil der Standardnormalverteilung, also P(−z1−α/2 ≤ T ≤ z1−α/2

)=

1− α bzw. Φ(z1−α/2) = 1− α/2.

2. Einseitig: zα und z1−α sind die Quantile an den Rändern.

Die Nullhypothese H0 wird verworfen, wenn T nicht im Annahmebereich liegt. Im zweiseitigen

Fall also, falls |T | > z1−α/2 ist. Im linksseitigen Fall lehnt man ab, falls T < zα, im rechtsseitigen

Fall falls T > z1−α ist.

-72-


Wenn wir nun diese Varianzanalyse auf den ganzen Datensatz ausweiten, müssen wir wiederum

sicherstellen, dass sich positive und negative Abweichungen nicht auslöschen. Wir betrachten

daher auch hier die Summe der quadrierten Abweichungen. Wir summieren also über die qua-

drierten Summanden auf beiden Seiten der Gleichung in (2) und erhalten dieGrundgleichung

der Streuungsanalyse:

n∑i=1

(yi − y)2 =n∑i=1

e2i +

n∑i=1

(yi − y)2 , (3)

Diese Summen bezeichnet man üblicherweise mit folgenden Symbolen:

• SSY =∑

(yi − y)2 ist die Gesamtvarianz von Y ,

• RSS =∑

(yi − yi)2 ist die Reststreuung (der Modellfehler),

• SSReg =∑

(yi − yi)2 ist die erklärte Streuung des Modells.

Die Grundgleichung lautet also knapp formuliert

SSY = RSS + SSReg

Die drei Summen SSY, RSS und SSReg werden typischerweise von einem Computerprogramm

aus den Datenwerten berechnet. Diese Kennzahlen unseres Modells erlauben es uns nun, die

Qualität des Modells mit einem Gütemass auszudrücken. Im Idealfall (der Datensatz genügt

fehlerfrei dem Modell) sollte RSS = 0 (keine Fehler gemacht) und SSY = SSReg sein (die

Streuung von Y wird durch die Streuung von X verursacht und nicht durch das Modell). Im

anderen Extrem (X und Y sind unabhängig) ist SSReg = 0 und die Gleichung SSY = RSS

drückt aus, dass die Streuung von Y nicht durch den Einuss von X erklärt werden kann.

Ein zentrales Gütemass der Regressionsanalyse ist gegeben durch das Bestimmtheitsmaÿ:

R2 =SSRegSSY

= 1− RSSSSY

Dieser Koezient beschreibt, welchen Prozentsatz der zu erklärenden Abweichung der wahren

Werte yi vom Mittelwert y durch die geschätzten Werte yi auf der Regressionsgerade erklärt

wird. Logischerweise ist unser Modell umso besser, je näher der Wert von R2 bei Eins liegt.

-116-


Graphisch gesehen zeigt der Wert von R2, wie nahe die wahren Werte an der Regressionsgerade

liegen.

Beispiel

Wir wollen nun herausnden, wie gut das Regressionsmodell für den Zusammenhang von Jah-

resumsatz und Verkaufsäche ist. Betrachten wir dazu die bis anhin gewonnenen Daten:

Filiale y y y (yi − y)2 (yi − y)2

1 5.2533 2.9300 2.2245 5.3979 9.1737

2 5.2533 5.2700 5.7233 0.0003 0.2209

3 5.2533 6.8500 6.9244 2.5493 2.7925

4 5.2533 7.0100 7.3422 3.0859 4.3632

5 5.2533 7.0200 6.4544 3.1211 1.4426

6 5.2533 8.3500 8.3866 9.5893 9.8173

7 5.2533 4.3300 4.6789 0.8525 0.3300

8 5.2533 5.7700 5.5144 0.2669 0.0682

9 5.2533 7.6800 7.3422 5.8887 4.3632

10 5.2533 3.1600 3.1123 4.3820 4.5841

11 5.2533 1.5200 1.8590 13.9378 11.5217

12 5.2533 3.1500 3.4778 4.4240 3.1524

Total: 53.4959 51.8297

= SSY = SSReg

Tabelle 1: Die Daten aus dem Beispiel, ergänzt durch die quadratischen Abweichungen und

deren Summe.

Wir können nun den R2-Koezienten für die Analyse einfach durch Einsetzen der Werte aus

Tabelle 1 in die Formel für R2 berechnen :

R2 =51.8297

53.4959= 0.968851 .

Das heisst also, dass wir gut 96.9% der zu erklärenden Variation durch die Regressionsgerade

erklären können. Dies wiederum bedeutet, dass 96.9% der Variation in den Jahresumsätzen

-117-

Aufgaben

Übu

ngen

Prüfung

enExtras

A

Aufgaben

Statistik II

Sommersemester 2013


Inhaltsverzei hnis

1 Kombinatorik 1

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Wahrs heinli hkeitsre hnung 8

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3 Zufallsvariablen 17

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4 Spezielle Verteilungen 20

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

5 Grenzwertsätze 29

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

6 Punkt- und Intervalls hätzung 32

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

7 Statistis he Tests 40

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

8 Regressionsanalyse 60

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

Kombinatorik: Aufgaben uniseminar.eu

1 Kombinatorik

Aufgabe 1: Ri htige Formel nden

Bestimmen Sie die folgenden Anzahlen mit Hilfe kombinatoris her Formeln:

1. Anzahl der Mögli hkeiten, 5 vers hiedene Zahlen von 1 bis 20 bei einem Tippspiel

anzukreuzen.

2. Anzahl der Mögli hkeiten, 5 (ggf. glei he) Zahlen von 1 bis 20 aus einer Urne mit 20

Kugeln na heinander zu ziehen.

3. Anzahl der Wörter mit 6 Bu hstaben, die nur aus Vokalen bestehen und genau zweimal

e enthalten.

4. Anzahl der Mögli hkeiten, aus einer S ha htel mit 15 Pralinen (2 mit Alkohol, 13 ohne

Alkohol, das ist einziges Unters heidungsmerkmal) drei Pralinen zu nehmen?

5. Anzahl der Mögli hkeiten, 5 Veranstaltungen (2 mit je einem Zeitblo k, 2 mit je zwei

Zeitblö ken, 1 mit drei Zeitblö ken), auf 9 Zeitberei he zu verteilen (Die Zeitblö ke der

selben Veranstaltung müssen ni ht direkt hintereinander liegen).

Aufgabe 2: Relative Häugkeiten bere hnen

Bere hnen Sie diese relativen Häugkeiten (spri h Lapla e-Wahrs heinli hkeiten):

1. Anteil der aus Vokalen gebildeten Worte mit 4 Bu hstaben unter allen mögli hen Worten

mit 4 (aus 26 mögli hen) Bu hstaben.

2. Wahrs heinli hkeit, aus der Pralinens ha htel von Teil 4 der vorangehenden Aufgabe

genau drei Pralinen ohne Alkohol zu ziehen.

(Re hnen Sie elementar, ohne Formeln für Wahrs heinli hkeitsverteilungen zu verwenden)

Aufgabe 3: Lotto-Modikation

Eine Tippgemeins haft bietet folgendes Spiel an: Sie müssen zusätzli h zu den 6 aus 49

Lottozahlen für 6 Ri htige (hier ohne Zusatzzahl) au h no h die ri htige Reihenfolge der

Ziehung mit angeben. Dafür dürfen Sie 20 vers hiedene Tipps (ein Tipp besteht aus 6 Zahlen

-1-

Kombinatorik: Aufgaben uniseminar.eu

und ihrer Reihenfolge) abgeben und man gewinnt, wenn wenigstens einer dieser Tipps 6

Ri htige plus die ri htige Reihenfolge enthält. Ist es wahrs heinli her, dieses Spiel oder das

klassis he Lotto mit 6 Ri htigen ohne Reihenfolge zu gewinnen?

Angenommen ein klassis her Tipp kostet 1 Euro, wie teuer sollte ein Los der Spielgemeins haft

sein, damit der Erwartungswert für den Gewinn der Glei he ist wie beim klassis hen Lotto?

-2-

Zufallsvariablen: Aufgaben uniseminar.eu

3 Zufallsvariablen

Aufgabe 7: Kenngröÿen ausre hnen

Eine diskrete Zufallsvariable X kann die Werte X = 3, X = 8 oder X = 10 annehmen. Die

entspre henden Wahrs heinli hkeiten sind 0.2, 0.7 und 0.1. Bere hnen Sie den Mittelwert, die

Varianz und die Standardabwei hung der Zufallsvariablen X .

Aufgabe 8: Lineare Transformation

Eine Sti hprobe mit 20 Datenwerten habe den Mittelwert x = 1 und die Varianz S2X = 4. Eine

lineare Transformation der gesamten Verteilung Y = aX + b führt auf den Mittelwert y = 2

und die Varianz S2Y = 1. Wel he Koezienten stehen in der Transformationsglei hung?

-17-

Statistis he Tests: Aufgaben uniseminar.eu

7 Statistis he Tests

Aufgabe 20: Einseitige und zweiseitige Tests

Formulieren Sie geeignete Nullhypothesen und Alternativhypothesen für die folgenden Aus-

sagen. Ents heiden Sie jeweils, ob ein einseitiger oder ein zweiseitiger Test anzuwenden ist, und

stellen Sie den Verwerfungsberei h graphis h dar.

1. Die Studierenden geben dur hs hnittli h ni ht mehr als 500 Franken pro Semester in der

Universitätsbu hhandlung aus.

2. Ein Erwa hsener trinkt dur hs hnittli h 1.5 Tassen Kaee pro Tag.

3. Ein dur hs hnittli her Arbeitnehmer hat in der letzten Wo he mindestens 3.5 Überstun-

den geleistet.

Aufgabe 21: Hypothesentest für µ, σ bekannt

Ein Hersteller von elektronis hen Baukästen hat festgestellt, dass die dur hs hnittli he Zeit,

die ein Neuling für die Montage eines S haltkreistesters benötigt, 3 Stunden beträgt bei einer

Standardabwei hung von 0.2 Stunden. Ein Fa hberater hat eine neue Anleitung entwi kelt, um

die Montagezeit für unerfahrene Mitarbeiter zu verkürzen. Bei einem Eektivitätstest für die

neue Anleitung haben 15 Neulinge dur hs hnittli h 2.9 Stunden für die Montage des Testers

gebrau ht. Es sei angenommen, die Grundgesamtheit sei normalverteilt. Können wir zum Sig-

nikanzniveau α = 0.05 ents heiden, dass die neue Anleitung eektiv ist? Bestimmen und

interpretieren Sie den p-Wert.

Aufgabe 22: Hypothesentest für µ, σ unbekannt

Die mittlere Flugentfernung amerikanis her Regionaluggesells haften beträgt 299 Meilen.

Diese Hypothese soll mit einem Signikanzniveau von α = 0.05 getestet werden. Dazu wird

eine Sti hprobe von 30 Flügen genommen, die ermittelte Dur hs hnittsentfernung ist x = 314.6

Meilen und die Sti hprobenstandardabwei hung ist s = 42.8 Meilen.

-40-


Aufgabe 23: Hypothesentest für π

Langjährige Erfahrungen haben gezeigt, dass das Medikament A in 75% aller Fälle wirksam

ist. Eine Fors hungsgruppe entwi kelt ein Konkurrenzprodukt B, das auf den Markt gebra ht

werden soll, falls es A überlegen ist. B wird an 120 Personen getestet, und erweist si h bei 93

Personen als wirksam.

1. Testen Sie (mit α = 0.05), ob das Medikament B auf den Markt gebra ht werden soll.

2. Mit wel her Wahrs heinli hkeit würde das Medikament B, falls seine wirkli he Wirk-

samkeit 0.8 beträgt, denno h ni ht auf den Markt kommen?

Aufgabe 24: Hypothesentest für Dierenz der Mittelwerte

In einer Studie wurde rausgefunden, dass in der Altersgruppe 30-59 Jahre dur hs hnittli h

0.57 Tassen Kaee pro Person pro Tag getrunken werden und in der Altersgruppe 60 und

älter 0.75 Tassen. Führen Sie einen z-Test dur h (mit α = 0.05), um festzustellen, ob der

mittlere Kaeeverbrau h der beiden Gruppen übereinstimmen kann. Setzen Sie dabei die

Sti hprobengröÿen n1 = 200 resp. n2 = 100 und Standardabwei hungen der Sti hproben

s1 = 0.43 resp. s2 = 0.68 voraus.

Bestimmen und interpretieren Sie den p-Wert.

Aufgabe 25: Hypothesentest für Dierenz der Mittelwerte

Ein Fa hblatt für Automobile mö hte den Benzinverbrau h von 2 Automobilen derselben

Gröÿenklasse miteinander verglei hen. Für die beiden Automarken A und B wurden folgende

Sti hprobenwerte festgestellt:

nA = 50 xA = 9.4 s2A = 3.6

nB = 40 xB = 8.7 s2B = 3.8

Wir können davon ausgehen, dass die Varianz des Benzinverbrau hs der beiden Automarken

übereinstimmt.

Testen Sie die Hypothese H0, dass der mittlere Benzinverbrau h der beiden Typen überein-

stimmt. Die Wahrs heinli hkeit eines Fehlers 1. Art sei 5%.

-41-


Aufgabe 26: Hypothesentest für Dierenz der Anteilswerte

In einer 6-jährigen Untersu hung haben 3429 der Testpersonen tägli h Aspirin genommen. Von

denen sind 148 an einem Herzinfarkt gestorben. Die zweite Gruppe bestand aus 1710 Personen

und hat ein Pla ebo bekommen. In dieser Gruppe gab es 79 Todesfälle. Prüfen Sie mit einem

Signikanzniveau von 0.01, ob Aspirin die Wahrs heinli hkeit eines Herzinfarkts verringert.

Aufgabe 27: Hypothesentest mit Störenfried

Eine Zufallsvariable X sei N(µ, 4)-verteilt mit unbekanntem Mittelwert µ und bekannter Stan-

dardabwei hung σ(X) = 2. Eine Testreihe ergibt die folgenden Werte:

0 , 1 , −1 , 2 , 3 , 2 , 2 , 3 , 120 , 0 , 2 .

Bere hnen Sie ein Annahmeintervall für X beim Test der Nullhypothese H0 : µ = 1 gegen die

Alternative H1 : µ 6= 1 auf dem Signikanzniveau α = 10% unter der gegebenen Standardab-

wei hung, sowie das Annahmeintervall unter der Annahme, das σ fehlerhaft ist und daher aus

der Sti hprobe ges hätzt werden muss. Wie interpretiert man diese Tests?

Aufgabe 28: Vers hiedene Sti hprobenzahl

Zwei Zufallsvariablen X und Y seien jeweils normalverteilt mit unbekannten Mittelwerten µX

und µY , sowie glei her bekannter Standardabwei hung σ(X) = σ(Y ) = 3. Gegeben seien die

Sti hproben

(x1, x2, x3) = (10, 11, 12) , (y1, y2, y3, y4, y5) = (2, 3, 1, 2, 1)

vers hiedener Länge. Ents heiden Sie die Nullhypothese H0 : µX−µY = 9 gegen die Alternative

H0 : µX − µY 6= 9 auf dem 5%-Niveau. Bere hnen Sie au h den p -Wert und interpretieren Sie

ihn: wie knapp war die Testents heidung?

Aufgabe 29: Wahr oder fals h

Ents heiden Sie für die folgenden Aussagen, ob sie jeweils wahr oder fals h sind. Versu hen

Sie eine kurze Begründung für die Antort anzugeben (dur h eine kleine Re hnung oder ein

-42-


Gegenbeispiel):

1. Bei einem t -Test für einen Mittelwert wird das Annahmeintervall für das Sti hprobenmit-

tel X kürzer, wenn man die Sti hprobenzahl erhöht und die anderen Daten glei hbleiben.

2. Bei einem z -Test für eine Mittelwertdierenz wird das Annahmeintervall für das Sti h-

probenmittel X kürzer, wenn man das Niveau α erhöht und die anderen Daten glei h-

bleiben.

3. Die Di htefunktion f(x) einer stetigen Zufallsvariable erfüllt 0 ≤ f(x) ≤ 1 für alle x ∈ R.

4. Die Verteilungsfunktion F (x) einer stetigen Zufallsvariable erfüllt 0 ≤ F (x) ≤ 1 für alle

x ∈ R.

5. Wenn die Testgröÿe T beim Odds-Ratio-Test positiv ist, besteht ein positiver Zusammen-

hang der Sti hproben.

6. Das Vertaus hen der beiden Sti hproben (bzw. der Variablen X und Y ) ändert einen

zweiseitigen Mann-Whitney-U-Testents heid ni ht.

7. Jeder χ2-Anpassungstest kann prinzipiell dur h einen (einfa heren) Kolmogorov-Smirnov-

Test ersetzt werden.

-43-

Übu

ngen

Prüfung

enExtras

Ü

Übungen



Inhaltsverzeichnis

Übungsblatt 1: 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3












Übungsblatt 1 - Lösungen uniseminar.eu

Lösungen

Aufgabe 1:

Bei einer Party mit zehn Gästen küsst zur Begrüßung jeder jeden. Wieviele Küsse gibt es dann?

Lösung:

Ganz intuitiv kann man die Aufgabe durch Aufsummieren der Anzahl der Küsse lösen. Die erstePerson verteilt neun Küsse an die jeweils anderen, während die zweite nur noch acht Personenküsst, die dritte braucht nur noch sieben zu küssen usw. Somit erhält man für die Anzahl derKüsse:

9∑i=1

10− i =9 · 10

2= 45

Mathematisch eleganter ist jedoch ein anderer Weg. Aus einer Gruppe von 10 Personen (n = 10)ist die Anzahl von Paaren (m = 2) zu ermitteln. Dabei spielt die Reihenfolge keine Rolle undes handelt sich um eine Anordnung ohne Wiederholung. Dies führt somit auch auf

(102

)= 45

Möglichkeiten.

Aufgabe 2:

Ein Würfel wird dreimal hintereinander geworfen. Wieviele Kombinationsmöglichkeiten gibt es,bei denen

a) der erste Wurf eine „6“ ist?

b) die Augenzahl im dritten Wurf gerade ist?

c) der erste und der dritte Wurf eine „3“ ist?

Lösung:

a) Der Würfel wird hintereinander gewürfelt. Somit spielt die Reihenfolge eine Rolle. Damitdas Ereignis eintritt, muss im ersten Wurf eine „6“ gewürfelt werden. Die Würfe zwei unddrei sind für das Eintreten des Ereignisses irrelevant. Wir erhalten 1·6·6 = 36 Möglichkeiten.

b) Es existieren drei Möglichkeiten dafür, dass der dritte Würfel eine gerade Augenzahl auf-weist. Somit erhalten wir 6 · 6 · 3 = 108 Möglichkeiten für Ereignis b).

c) Die Reihenfolge ist für das Ereignis relevant. Es ergeben sich 1 · 6 · 1 = 6 Möglichkeiten.

-3-


Aufgabe 3:

Ein Skatspiel besteht aus 32 Karten. Die 8 unterschiedlichen Karten ’7, 8, 9, 10, Bube, Dame,König, As’ existieren jeweils in vier verschiedenen ’Farben’ (Kreuz, Pik, Herz, Karo). JederSpieler erhält 10 Karten. Wir betrachten nun die möglichen Hände eines einzelnen Spielers.Wieviele mögliche Hände gibt es, in denen er unter seinen 10 Karten

a) genau 3 Könige und genau 2 Damen besitzt?

b) alle 4 Buben besitzt?

Lösung:

Die Reihenfolge, in der man die Karten erhält, spielt keine Rolle. Des Weiteren tauchen die Kar-ten nicht mehrfach auf. Die Anzahl der Patien wird also durch Kombinationen ohne Reihenfolgeund ohne Wiederholung berechnet.

a) Die Anzahl an Möglichkeiten von vier möglichen Königen drei auszuwählen beträgt also(43

)= 4. Analog erhalten wir

(42

)Möglichkeiten zwei Damen zu wählen. Die restlichen fünf

Karten dürfen beliebig aus den übrigen 32 − 4 − 4 = 24 Karten gewählt werden, da keineweitere Dame oder ein weiterer König gezogen werden darf. Insgesamt erhalten wir(

4

3

)·(

4

2

)·(

24

5

)= 1′020′096

Möglichkeiten.

b) Analog zu a) erhalten wir(

44

)·(

286

)= 376′740 Möglichkeiten.

Aufgabe 4:

Ein Getränkemarkt bietet als Spezialangebot den ’Münchner Kasten’ an. Dabei dürfen sichdie Kunden von dem Bier (nur ’Helles’) der sechs großen Münchner Brauereien ein beliebigesSortiment zusammenstellen. Ein Kasten beinhaltet dabei 20 Flaschen.

a) Wie viele Kombinationsmöglichkeiten bei der Zusammenstellung eines Kastens gibt es ins-gesamt?

b) Ein Kunde möchte auf alle Fälle mindestens eine Flasche pro Brauerei in seinem Kastenhaben. Wie viele Kombinationsmöglichkeiten für den Kasten gibt es jetzt?

Lösung:

a) Wir müssen Wiederholungen aber keine Reihenfolge berücksichtigen. Dabei ist n = 6 (Ele-mente, die zur Verfügung stehen) und m = 20 (Elemente, die ausgewählt werden). Die

-4-


Anzahl der Kombinationen mit Wiederholung, aber ohne Berücksichtigung der Reihenfolgebeträgt dann (

n+m− 1

m

)=

(6 + 20− 1

20

)=

25!

20! · 5!= 53′130

Möglichkeiten seinen individuellen Kasten zu erstellen.

b) Durch diese Forderung sind 6 der 20 Plätze belegt. Die restlichen 14 Plätze können jedochbeliebig verteilt werden. Daraus ergeben sich Kombinationsmöglichkeiten von(

n+m− 1

m

)=

(6 + 14− 1

14

)=

19!

15! · 5!= 11′628

Aufgabe 5:

Die Hockeybundesliga der Herren besteht in Deutschland aus zwölf Mannschaften. In einerSaison spielt jede Mannschaft gegen jede andere ein Hin- und ein Rückspiel. Wieviele Spielefinden insgesamt während einer Saison statt?

Lösung:

Es spielen immer nur m = 2 der n = 12 Mannschaften gegeneinander. Wir haben keine Wieder-holung, da keine Mannschaft gegen sich selbst spielt. Hingegen spielt die Reihenfolge aufgrunddes Hin- und Rückspieles eine Rolle. Wir erhalten:(

n

m

)·m! =

(12

2

)· 2! =

12!

2! · 10!·2! = 132

als Anzahl der Spiele.

-5-


Lösungen

Aufgabe 1:

Für 2 diskrete Zufallsvariablen X und Y sei nur die gemeinsame Verteilung bekannt.

X\Y 1 2 30 0 1

214

1 16

112

0

a) Bestimmen Sie die Randverteilung von X und Y .

b) Sind X und Y unabhängig?

c) Bestimmen Sie die Kovarianz zwischen X und Y .

Lösung:

a) X und Y sind diskret, somit erhalten wir die Randverteilung von X und Y durch dieSummation aller Ausprägungen der jeweils anderen Zufallsvariable.

X\Y 1 2 3 P(X = xi)

0 0 12

14

34

1 16

112

0 14

P(Y = yi)16

712

14

1

b) Die Zufallsvariablen X und Y sind nicht stochastisch unabhängig, denn es gilt:

P (X = 0, Y = 1) = 0 6= 1

8=

3

4· 1

6= P (X = 0) · P (Y = 1)

c) Die Kovarianz zwischen X und Y ist definiert durch:

Cov(X, Y ) = E ((X − E(X)) · (Y − E(X))) = E(XY )− E(X) · E(Y )

Für den Erwartungswert der diskreten Zufallsvariablen X und Y erhalten wir:

E(X) =2∑i=1

xi · pi︸︷︷︸P(X=xi)

= 0 · 3

4+ 1 · 1

4=

1

4

E(Y ) =3∑i=1

yi · pi︸︷︷︸P(Y=yi)

= 1 · 1

6+ 2 · 7

12+ 3 · 1

4=

25

12

-24-


Sowie für die neue diskrete Zufallsvariable XY :

E(XY ) =2∑i=1

3∑j=1

xi · yj · pij︸︷︷︸P(X=xi,Y=yj)

= 1 · 1 · 1

6+ 1 · 2 · 1

12+ 1 · 3 · 0 =

1

3

Die ersten drei Summanden der Doppelsumme verschwinden, da hier die Zufallsvariable Xden Wert Null annimmt. Insgesamt erhalten wir für die Kovarianz:

Cov(X, Y ) = E(XY )− E(X) · E(Y ) =1

3− 1

4· 25

12= − 3

16

Es besteht also ein negativer Zusammenhang zwischen X und Y .

Aufgabe 2:

Die Zufallsvariable X beschreibe die „Augenzahl beim einmaligen Würfeln mit einem Dodeka-eder (Würfel mit 12 Seiten)“. Wie ist X verteilt? Berechnen Sie E (X) und Var (X))!

Lösung:

Unter der Annahme, dass es sich um einen fairen Würfel handelt, ist die Zufallsvariable Xdiskret gleichverteilt. Die Wahrscheinlichkeitsfunktion nimmt für jede Ausprägung den gleichenWert

(P(X = xi) = 1

12

)an. Wir erhalten trivialerweise folgende Wahrscheinlichkeitstabelle:

xi 1 2 3 . . . 12P(X = xi)

112

112

112

. . . 112

Für den Erwartungswert und die Varianz gilt:

E(X) =12∑i=1

xi · pi =12∑i=1

i

12=

12(12 + 1)

2= 6.5

E(X2)

=12∑i=1

x2i · pi =

12∑i=1

i2

12=

1

12·12(12 + 1)(24 + 1)

6=

325

6

⇒ Var(X) = E(X2)− (E(X))2 =

325

6− (6.5)2 ≈ 11.92

Aufgabe 3:

Ein bekannter Hersteller von Keksen verspricht seinen Kunden eine Extraüberraschung in jdersechsten Keksschachtel. Voller Freude kauf ein übereifriger Vater gleich 20 Schachteln.Hinweis: Hinsichtlich der Ergebnisse verschiedener Schachteln kann von Unabhängigkeit aus-gegangen werden.

-25-


Lösungen

Aufgabe 1:

Jupp beschließt das neue Album seines Lieblingsinterpreten im Internet zu erwerben. Da erdavon gehört hat, dass es in einem bekannten Internetauktionshaus immer gute Angebote gibt,möchte er sich dort die CD ersteigern. Als er die Webseite betrachtet, fällt ihm auf, dass mannicht nur bei Auktionen mitbieten, sondern auch Artikel sofort erwerben kann. Des Weiterenrät ihm ein Kollege, ebenfalls bei einem großen Internetbuchhändler nachzuschauen, da es dortauch günstig CDs zu erwerben gibt. Um bei dieser Angebotsvielfalt den Überblick zu bewahren,beschließt Jupp vorerst die Angebote zu vergleichen. Dazu betrachtet er am 11.01.2006 dasAngebot des Internetbuchhandels, 14 Sofortkaufangebote und 14 Auktionen, die an diesem Tagauslaufen. Er notiert sich jeweils den Verkaufspreis inklusive der Versandkosten in Euro.

1. Internetbuchhändler: 16.95

2. Sofortkaufpreise: 18.19, 16.98, 19.97, 16.98, 18.19, 15.99, 13.79, 15.90, 15.90, 15.90,15.90, 15.90, 19.97, 17.72

3. Auktionspreise: 10.50, 12.00, 9.54, 10.55, 11.99, 9.30, 10.59, 10.50, 10.01, 11.89, 11.03,9.52, 15.49, 11.02

Zusammengefasst erhält man damit die folgenden Informationen:

Sofortkaufpreis Auktionspreisx 16.949 10.995s2 2.949 2.461s 1.717 1.569

Für die jeweiligen Verkaufspreise darf Normalverteilung unterstellt werden. Das Signifikanzni-veau sei auf fünf Prozent festgelegt.

a) Testen Sie die Hypothese, dass der mittlerere Sofortkaufpreis nicht 16.95 Euro beträgt, alsoungleich dem Preis des Internetbuchuchhändlers ist.

b) Testen Sie die Hypothese, dass der mittlere Auktionspreis weniger als 16.95 Euro beträgt,also geringer ist als der des Internetbuchhändlers.

c) Testen Sie die Hypothese, dass der mittlere Sofortkaufpreis größer als der mittlere Auktions-preis ist. Führen Sie unter der Annahme, dass beide Varianzen gleich sind, den geeignetenTest durch. (t26,0.95 = 1.712)

-58-


Lösung:

Sei im Folgenden X : „Höhe des Sofortkaufpreises“ und Y : „Höhe des Auktionspreises“.

a) Die Hypothese, dass der mittlere Sofortkaufpreis nicht 16.95 Euro beträgt, führt zu einenzweiseitigen Test und wir erhalten:

H0 : µ = µ0 = 16.95 vs. H1 : µ 6= µ0 = 16.95

Wir haben es mit normalverteilten Zufallsvariablen zu tun. Der Erwartungswert und dieVarianz sind unbekannt. Daher nutzen wir den einfachen t-Test. Für die Realisierung derTestgröße gilt:

t =√n · x− µ0

sX=√

14 · 16.949− 16.95

1.717≈ −0.002

Die Irrtumswahrscheinlichkeit liegt bei α = 0.05, sodass wirH0 ablehnen, falls |t| > t13,0.975 =

2.16 gilt. Unser Wert |t| = 0.002 < 2.16 liegt unterhalb der Grenze 2.16, sodass H0 nichtverworfen wird.

b) Die Hypothese verändert sich zu:

H0 : µ = µ0 ≥ 16.95 vs. H1 : µ < µ0 = 16.95

Die Realisierung der Testgröße hat den Wert:

t =√n · x− µ0

sY=√

14 · 10.995− 16.95

1.569≈ −14.201

Wir betrachten einen einseitigen Test. Wegen

t = −14.201 < −1.77 = t13,0.05 = −tn−1,0.95 = tn−1,α

wird H0 verworfen. Der mittlere Auktionspreis liegt damit signifikant unter dem Festpreisdes Internetbuchhändlers.

c) Wir wenden den doppelten t-Test an, da die zwei Zufallsvariablen X und Y normalverteiltsind und unbekannte, aber sich gleichende Varianzen besitzen.

H0 : µX ≤ µY vs. H1 : µX > µY ⇔ µX − µY > 0

Nach der Vorlesung gilt für die Realisierung der Prüfgröße:

t =xX − xY

s·√

nX · nYnX + nY

-59-


Mit der gepoolten Stichprobenvarianz

s2 =(nX − 1)s2

X + (nY − 1)s2Y

nX + nY − 2=

13 · 2.949 + 13 · 2.461

14 + 14− 2≈ 2.705

erhalten wir für t = 9.578, weswegen wir H0 verwerfen. Es gilt nämlich:

9.578 = t > tnX+nY −2,0.95 = 1.712

Die mittleren Sofortkaufpreise liegen signifikant über den mittleren Auktionspreisen.

Aufgabe 2:

Die folgende Tabelle gibt die erzielten Tore der 18 Vereine der Fußball-Bundesliga in der 1.Halbzeit bzw. in der 2. Halbzeit in der Saison 2004/2005 wieder. Diese beiden Merkmale sollenim Folgenden als normalverteilt angenommen werden.

Team 1.Halbzeit 2.HalbzeitBayern München 36 38

Schalke 04 33 24Werder Bremen 21 47

Hertha BSC Berlin 25 35VfB Stuttgart 21 31

Bayer Leverkusen 18 48Dortmund 29 20Hamburg 30 27Wolfsburg 28 22Hannover 15 20Mainz 16 35

Kaiserslautern 20 22Arminia Bielefeld 17 22

Nürnberg 19 35Mönchengladbach 17 20

Bochum 17 30Hansa Rostock 14 19

Freiburg 15 15

Führen Sie den paired t-Test durch, um zu prüfen ob sich die mittlere Anzahl der geschossenenTore in den beiden Halbzeiten unterscheiden (Signifikanzniveau: 5%).

-60-

Prüfung

enExtras

P

Prüfungen



Inhaltsverzeichnis

Prüfung Sommersemester 2011 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Übungsprüfung Sommersemester 2012 18Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Übungsklausur von Uniseminar 1 34Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Übungsklausur von Uniseminar 2 48Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

Prüfung Sommersemester 2011: Lösung uniseminar.eu

Lösungen

Aufgabe 1 (5 Punkte)

Die folgenden Multiple-Choice-Aufgaben sind jeweils durch Ankreuzen einer der beiden Ant-wortmöglichkeiten zu beantworten.

Bei korrekter Antwort gibt es einen Punkt.Ist die Antwort nicht korrekt, wird ein Punkt abgezogen.Bei keiner Antwort gibt es keinen Punkt.Eine negative Punktezahl für die gesamte Aufgabe wird auf Null gesetzt.

1. Eine Schätzung T (X) des Parameters θ heißt erwartungstreu für θ,wenn gilt: Eθ(T (X)) = θ.

Wahr/Falsch

2. Gegeben seien zwei unabhängige Zufallsvariablen X und Y. Dann giltCov(X, Y ) = 0.

Wahr/Falsch

3. Sei X ∼ N(µ, σ2 = 25). Die Länge des 95%-Konfidenzintervalls für µbei einer Stichprobe von Umfang 25 beträgt ca. 9.8.

Wahr/Falsch

4. Gegeben sei eine Zufallsvariable X mit E(X) = 2.Dann gilt E(3 ·X − 1) = 5.

Wahr/Falsch

5. Für zwei disjunkte Ereignisse mit P (A) = 0.8 und P (B) = 0.5 giltP (A ∩B) = 0.4.

Wahr/Falsch

Lösung

1. Die Aussage ist wahr. Eine Schätzung T (X) des Parameters θ heißt erwartungstreu fürθ, wenn gilt Eθ(T (X)) = θ.

2. Die Aussage ist wahr. Zwei unabhängige Zufallsvariablen X und Y sind immer auchunkorreliert, d.h. es gilt Cov(X, Y ) = 0.

-6-


Hinweis: Die Umkehrung dieser Aussage ist nicht richtig: Zwei unkorrelierte Zufallsva-riablen sind nicht notwendigerweise unabhängig.

3. Die Aussage ist falsch. Wir berechnen die Länge des 95%-Konfidenzintervall für µ beieiner Stichprobe von Umfang 25. Die Varianz σ2 der Grundgesamtheit ist bekannt, somitist das gesuchte Konfidenzintervall für µ gegeben durch:

[Iµ(X), I0(X)] = [X − z(1−α)/2 ·σ0√n,X + z(1−α)/2 ·

σ0√n

]

= [X − z0.025 ·5√25, X + z0.025 ·

5√25

]

= [X − z0.025 ·5

5, X + z0.025 ·

5

5]

= [X − z0.025, X + z0.025],

wobei z0.025 das 0.025-Quantil derN(0, 1)-Standardnormalverteilung bezeichnet. Das 0.025-Quantil z0.025 beträgt 1.96. Die Länge des 95%-Konfidenzintervall für µ ist also

z0.025 + z0.025 = 2 · z0.025 = 2 · 1.96 = 3.92 6= 9.8.

4. Die Aussage ist wahr. Bei der Berechnung des Ausdrucks, benutzen wir die Linearität desErwartungswertes. Es gilt

E(3 ·X − 1) = 3 · E(X)− 1 = 3 · 2− 1 = 5.

5. Die Aussage ist falsch. Es gilt allgemein:

P (A ∩B) = P (A) + P (B)− P (A ∪B)

Da die Ereignisse A und B disjunkt sind, gilt:

P (A ∪B) = P (A) + P (B).

Somit folgt:

P (A ∩B) = P (A) + P (B)− P (A)− P (B) = 0 6= 0.4.

-7-


Aufgabe 2 (6 Punkte)

Gegeben sind die folgenden Wahrscheinlichkeiten:

P (A) = 0.7, P (B|A) = 0.2 und P (B|A) = 0.5.

Berechnen Sie die folgenden Wahrscheinlichkeiten:

a) P (A) =

b) P (A ∪ A) =

c) P (A ∪B) =

d) P (B) =

Lösung

a) Die Wahrscheinlichkeit des zu A komplementären Ereignis A ist:

P (A) = 1− P (A) = 1− 0.7 = 0.3.

b) Die Wahrscheinlichkeit des sicheren Ereignis ist:

P (A ∪ A) = P (Ω) = 1.

c) Wir benutzen hier die bedingte Wahrscheinlichkeit:

P (A ∪B) = P (B ∪ A) = P (B|A) · P (A) = 0.2 · 0.7 = 0.14.

d) Wir benutzen hier den Satz von der totalen Wahrscheinlichkeit. A und A bilden einevollständige Zerlegung von Ω in zwei disjunkte Ereignisse. Somit gilt

P (B) = P (B|A) · P (A) + P (B|A) · P (A) = 0.2 · 0.7 + 0.5 · 0.3 = 0.14 + 0.15 = 0.29.

-8-

EExtras

Formeln

Statistik II

Sommersemester 2013


Inhaltsverzeichnis

Kenngrössen der Wahrscheinlichkeitstheorie 1

Wahrscheinlichkeitsverteilungen 3

Lineare Regression 5

Schätzer und Kondenzintervalle 8

Hypothesentests 10

Tabelle der Binomialverteilung 13

Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Tabelle der Poisson-Verteilung 19

Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19


Tabelle der Standardnormalverteilung 23


Quantile der Studentschen t-Verteilung 24

Quantile der F -Verteilung 25

Quantile der χ2-Verteilung 28

Hier haben wir alle wichtigen Formeln und Tabellen zur Vorlesung kurz und übersichtlich

zusammen gestellt. Zudem ndest Du die Schemas aus dem Theorieskript zu den jeweiligen

Tests. Diese helfen Dir schneller voran zu kommen und einen guten Überblick zu erhalten.

Formeln uniseminar.eu

Kenngrössen der Wahrscheinlichkeitstheorie

Kenngrösse Diskrete ZV X Stetige ZV X

Erwartungswert µX∑

xi · P (X = xi)

∫ ∞−∞

xf(x)dx

Erwartungsoperator E[g(X)]∑

g(xi) · P (X = xi)

∫ ∞−∞

g(x)f(x)dx

Varianz σ2X

∑(xi − µX)2 · P (X = xi)

∫ ∞−∞

(x− µX)2f(x)dx

Std-Abweichung σX

√σ2X

√σ2X

Quantil xα∑xj≤xα

P (X = xj) = α

∫ xα

−∞f(x)dx = α

Die Kenngrössen für Stichproben x1, . . . , xn sind leicht anders deniert:

Arithmetisches Mittel x =1

n

n∑i=1

xi

Varianz S2 =1

n− 1

n∑i=1

(xi − x)2

Std-Abweichung S =√S2

Kovarianz Cov(X, Y ) =1

n− 1

n∑i=1

(xi − x)(yi − y)

Kovarianzmatrix Cov(X) = (cij) , cij = Cov(Xi, Xj)

-1-


Rechenregeln für Kenngrössen

Erwartungswert E(X + Y ) = E(X) + E(Y )

ist vollständig linear E(a+ b ·X) = a+ b · E(X)

Varianz Var(X + Y ) = Var(X) + Var(Y ) (falls unabhängig)

skaliert quadratisch Var(a+ b ·X) = b2 · Var(X)

Var(X + Y ) = Var(X) + Var(Y ) + 2Cov(X, Y )

Var(X) = E(X2)− E(X)2

Standardabweichung σ(X + Y ) =√σ(X)2 + σ(Y )2 (falls unabhängig)

skaliert linear σ(a+ b ·X) = |b| · σ(X)

Kovarianz Cov(X, Y ) = E(XY )− E(X) · E(Y )

skaliert linear Cov(X, Y1 + Y2) = Cov(X, Y1) + Cov(X, Y2)

in beiden Variablen Cov(X1 +X2, Y ) = Cov(X1, Y ) + Cov(X2, Y )

Kombinatorik

n-Fakultät: n! = n · (n− 1) · (n− 2) · . . . · 2 · 1 n! = n · (n− 1)!, 1! = 1, 0! = 1

Binomialkoezienten(n

k

)=

n!

k! · (n− k)!, (0 ≤ k ≤ n)

(n

0

)= 1, für k > n⇒

(n

k

)= 0

Permutationen n verschiedene Elemente n!

k aus n Elementenn!

(n− k)!

Kombinationen Möglichkeiten, n aus m Ob-

jekten zu wählen

(m

n

)=

m!

n! · (m− n)!

Bei n = n1 + · · ·+ns klassi-

zierten Objekten

(n

n1 . . . ns

)=

n!

n1! · n2! · · ·ns!

-2-


Wahrscheinlichkeitsverteilungen

Diskrete Wahrscheinlichkeitsverteilungen

Verteilung Notation Wahrscheinlichkeit µX σ2X

Gleich U(1, . . . , n) P (X = i) =1

nfür i = 1, . . . , n

n+ 1

2

1

12(n2 − 1)

Bernoulli B(1, p) P (X = 1) = p , P (X = 0) = 1− p p p(1− p)

Binomial B(n, p) P (X = x) =

(n

x

)· px · (1− p)n−x np np(1− p)

Geometrisch G(p) P (X = k) = p · (1− p)k−1 1

p

1

p

(1

p− 1

)

Poisson Po(λ) P (X = x) =λx · e−λ

x!λ λ

Hypergeometrische Verteilung

Notation Wahrscheinlichkeit µX σ2X

X ∼ H(n,M,N) P (X = x) =

(M

x

)·(N −Mn− x

)(N

n

) n · MN

n · MN·(

1− M

N

)· N − nN − 1

Multinomialverteilung

Notation Wahrscheinlichkeit µX

X ∼M(n; p1, . . . , pk) P (X = x) =

(n!

n1! · · ·nk!

)· px11 · · · p

xkk

np1...

npk

-3-