UNISEMINAR
Sem
inar
Theorie
Aufgaben
Übu
ngen
Prüfung
enExtras
Einleitung
Statistik IISommersemester 2013
München, April 2013
Einleitung uniseminar.eu
Herzlich Willkommen bei Uniseminar
Vorwort
Ziel von Uniseminar ist es, Dich optimal auf Deine Prüfungen vorzubereiten und Deine Prü-fungsvorbereitung an der LMU München so effizient wie möglich zu gestalten. Um dieses Zielzu erreichen, haben wir ein zweiteiliges Konzept entwickelt, das sich nun mehrere Jahre alsgroße Hilfe für die Studenten bewährt hat. Dieses besteht zum einen aus sehr umfangreichenLernunterlagen in Form eines Ordners und dazu passenden Prüfungsvorbereitungsseminarenam Ende des Semesters. Damit werden sämtliche Inhalte aus den Vorlesungen und Übungen ineinfacher und anschaulicher Form kompakt zusammengefasst.
Während des Semesters bieten wir Dir deshalb unsere umfangreichen Lernunterlagen in Formeines Ordners an. Diese Lehrmittel solltest Du im Selbststudium am Ende des Semesters durch-arbeiten.
Danach empfehlen wir Dir zur gezielten Prüfungsvorbereitung unsere Seminare zu besuchen,wo wir Dir in acht Stunden nochmals die essentiellsten Aufgaben und Konzepte näherbringenund Dich so optimal auf Deine Prüfungen vorbereiten. Dieser mehrteilige Ansatz ermöglichtDir mit einer ausgewogenen Mischung verschiedener auf einander abgestimmter Medien DeinenLernerfolg nachhaltig zu verbessern.
-1-
Einleitung uniseminar.eu
Aufbau
Dieser Ordner soll Dir als Lernhilfe zur effizienten Prüfungsvorbereitung der Statistik II Prü-fungen dienen und umfasst 5 Teile. Wir möchten Dir im Folgenden einen Überblick über denAufbau des Ordners geben.
1. Theorie: Das Theorieskript fasst in einfacher und übersichtlicher Form den gesamtenStoff des Semesters zusammen und erklärt diesen anhand anschaulicher Beispiele. AmEnde findest Du ein Stichwortverzeichnis, welches Dir bei allfälligen Fragen schnellstmög-lich Zugriff auf das erforderliche Wissen verschafft. Das Theorieskript umfasst 8 Kapitel.
2. Aufgaben: Zu allen Kapiteln des Theorieskripts haben wir Dir abgestimmte Übungsauf-gaben erstellt. Wir empfehlen Dir diese Aufgaben gleich nach den erfolgten Seminarblö-cken zu lösen, um anschliessend Fragen an unsere Dozenten stellen zu können. Diese sindgerne während den Pausen und auch nach den offiziellen Seminarstunden für Dich da, umDir bei Deinen persönlichen Problemfeldern weiterzuhelfen.
3. Übungen: In den vergangenen Jahren hat es sich gezeigt, dass die Übungsblätter derUniversität zunehmend wichtiger für das erfolgreiche Bestehen der Prüfung geworden sind.Die Professoren haben die aktuellsten Prüfungsaufgaben vermehrt unter Berücksichtigungder Übungen konzipiert. Der Grund dafür liegt darin, dass die Anwesenheit der Studentenwährend der Übungen sich lohnen und auszahlen soll. Aus diesem Grund haben wir Dirsämtliche Übungsaufgaben mit ausführlichen Lösungswegen zusammengestellt.
4. Prüfungen: Beginne früh damit, bisherige Prüfungen zu lösen, denn nur so gewinnst Dudas nötige Verständnis für deren Aufbau. Du wirst erkennen, was für die Prüfung relevantist und kannst Dich gezielt darauf vorbereiten. Dazu haben wir Dir alle verfügbarenPrüfungen mit ausführlichen Lösungswegen zusammengestellt.
5. Formeln: Die Formelsammlung stellt die wichtigen Formeln der Vorlesung sowie dasVorgehen bei den Hypothesentests übersichtlich zusammen. Nimm Dir nach dem Durch-arbeiten des Theorieskripts die Formelsammlung öfter vor, um sie zeilenweise abzulesenund die Formeln zu memorieren. Jede Formel, die im Kopf verfügbar ist und nicht wäh-rend der Prüfung nachgeschlagen werden muss, spart wertvolle Zeit. Verwende die Ta-bellen mit den Übungsaufgaben und den Musterprüfungen, um das schnelle Ablesen vonWahrscheinlichkeiten und Quantilen zu üben.
-4-
Einleitung uniseminar.eu
Vorgehensweise
Wir empfehlen Dir mit dem Ordner wie folgt schrittweise vorzugehen um einen perfekten Ler-nerfolg zu erzielen:
1. Theorie: Lies als erstes ein Theoriekapitel aufmerksam durch und versuche die theoreti-schen Inhalte zu verstehen.
2. Aufgaben: Löse nun einige oder am besten alle unsere eigens erstellten Aufgaben passendzum soeben gelesenen Theoriekapitel komplett durch. Diese umfassen exakt den in diesemTheoriekapitel erlernten Stoff. So siehst Du gleich, an welchen Stellen Du allenfalls einTheoriekapitel nochmals gründlicher durchlesen solltest.
3. Prüfungen: Mit Deinem aktuellen theoretischen Wissensstand kannst Du nun ideal aus-gewählte Prüfungsaufgaben lösen. So siehst Du gleich was Dich an der Prüfung erwartetund kannst Dich bereits jetzt perfekt darauf einstellen. Dazu haben wir Dir am Ende vonjedem Theoriekapitel einige ausgewählte Prüfungsaufgaben zusammengestellt, die sich aufdas soeben behandelte Thema beziehen.
4. Mache eine Pause und beginne danach wieder mit einem weiteren Theoriekapitel.
-5-
Einleitung uniseminar.eu
Kontakt
Solltest Du noch Fragen zu unseren Lernunterlagen, Seminaren oder Dienstleistungen haben,kannst Du uns jederzeit gerne kontaktieren. Dabei stehen Dir folgende Möglichkeiten zur Ver-fügung:
• Schreibe eine E-Mail an: [email protected]
• Füge uns bei Skype hinzu und schreibe uns dort (Kontakt: Uniseminar)
• Ruf uns einfach an unter +49 (0)30 202 15 668
• Werde Mitglied unserer Facebook Gruppe und nutze die Wall oder schreibe einem derKoordinatoren (Du erkennst Sie am “Uniseminar” im Namen)
-8-
Theorie
Aufgaben
Übu
ngen
Prüfung
enExtras
T
Theorie
Statistik II
Sommersemester 2013
München, April 2013
Inhaltsverzeichnis
1 Kombinatorik 1
1.1 Permutationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Kombinationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Wahrscheinlichkeitsrechnung 5
2.1 Wahrscheinlichkeitsbegrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Zufallsvariablen 14
3.1 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Kenngröÿen diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4 Kenngröÿen stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 21
3.5 Die Ungleichung von Tschebysche . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.6 Mehrdimensionale Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . 23
3.7 Kenngröÿen mehrerer Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 27
4 Spezielle Verteilungen 31
4.1 Gleichverteilung für diskrete Variablen . . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Bernoulliverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.4 Geometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.5 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.6 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.7 Multinomiale Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.8 Gleichverteilung für stetige Variablen . . . . . . . . . . . . . . . . . . . . . . . . 39
4.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.10 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.11 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.12 t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.13 F -Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5 Grenzwertsätze 48
5.1 Approximation B → Po . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2 Approximation B → N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Approximation H → N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6 Punkt- und Intervallschätzung 54
6.1 Punktschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.2 Kondenzintervalle für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . 57
6.3 Kondenzintervalle für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . 59
6.4 Kondenzintervalle für die Varianz (µ unbekannt) . . . . . . . . . . . . . . . . . 62
6.5 Kondenzintervalle für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . 64
6.6 Bestimmung des notwendigen Stichprobenumfangs . . . . . . . . . . . . . . . . . 66
7 Statistische Tests 67
7.1 Einseitige und zweiseitige Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7.2 Einfacher Gauss-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.3 Einfacher t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.4 Approximativer Binomialtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7.5 Testentscheid mit dem p -Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
7.6 Fehlerarten bei Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.7 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.8 Doppelter Gauss-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.9 Doppelter t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.10 Vergleichstest für gepaarte Stichproben . . . . . . . . . . . . . . . . . . . . . . . 88
7.11 Approximativer doppelter Binomialtest . . . . . . . . . . . . . . . . . . . . . . . 90
7.12 Der F -Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.13 Der χ2-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.14 Der Mann-Whitney-U-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.15 Kolmogorov-Smirnov-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . 99
7.16 Der Odds-Ratio-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
8 Regressionsanalyse 103
8.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.2 Einfache lineare Regression: Idee . . . . . . . . . . . . . . . . . . . . . . . . . . 105
1
8.3 Schätzer für β0 und β1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.4 Varianzanalyse (ANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.5 Statistische Tests für Signikanz . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.6 Überprüfen der Modellannahmen . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.7 Multiple Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.8 Der Overall-F -Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
Stichwortverzeichnis 127
2
Theorie: Wahrscheinlichkeitsrechnung uniseminar.eu
2 Wahrscheinlichkeitsrechnung
Inhalte dieses Kapitels:
• Grundlegende Notation für die Wahrscheinlichkeitsrechnung
• Rechenregeln für Wahrscheinlichkeiten
• Totale und bedingte Wahrscheinlichkeiten
Die Wahrscheinlichkeitstheorie stellt Regeln und Aussagen zur Verfügung, die es uns erlauben
unabhängig von konkreten Stichproben den Begri der Zufälligkeit einzufangen, diesen zu be-
schreiben und ezient damit zu rechnen.
Sie liefert auch Einsicht in den Zusammenhang zwischen einer idealisierten Zufallsverteilung
und den Stichprobenwerten die sie annähern je gröÿer die Stichprobe wird. Das Kernresultat
für die Statistik wird am Schluss des Kapitels das Gesetz der groÿen Zahlen sein, welches das
mathematische Fundament ist, auf dem die gesamte Statistik ruht.
Dazu sind allerdings eine Reihe von Grundbegrien nötig, die von den konkreten Beispielen
der letzten Kapitel abstrahiert und möglichst allgemein gehalten sind, damit möglichst viele
Sachverhalte damit beschrieben werden können:
• Ein Zufallsexperiment ist ein Vorgang, der
nach einer bestimmten Vorschrift ausgeführt wird,
beliebig oft wiederholbar ist, und
zufallsabhängig ein Ergebnis liefert.
• Ein Elementarereignis oder Ergebnis ist ein möglicher Ausgang des Experiments.
Ergebnisse werden mit kleinen Buchstaben a, b, ω, . . . geschrieben.
• Der Ereignisraum (oder Grundraum) Ω ist die Menge aller möglichen Ergebnisse des
Experiments.
-5-
Theorie: Wahrscheinlichkeitsrechnung uniseminar.eu
• Ein Ereignis ist eine Teilmenge des Grundraums, also eine Menge aus keinem, einem
oder mehreren Elementarereignissen. Ein Ereignis tritt ein, wenn eines seiner Elemen-
te (Elementarereignisse) beim Experiment herauskommt. Ereignisse werden mit groÿen
lateinischen Buchstaben A,B, . . . beschrieben.
Beispiel
Angenommen in einer Urne liegen ein roter, ein blauer und ein grüner Würfel. Das ziehen
eines Würfels aus der Urne entspricht einem Zufallsexperiment mit Ereignisraum Ω = r, b, g,
die Elementarereignisse sind r, g und b. Ein mögliches Ereignis wäre A = r, b. Dies ist das
Ereignis, dass der rote oder der blaue Würfel gezogen werden.
Ereignisse kann man mit Diagrammen beschreiben: Dabei wird der gesamte Ereignisraum Ω
als eine Box dargestellt und die Ergebnisse als Punkte in der Box. Ereignisse sind schraerte
Flächen in der Box. Hier ein paar wichtige spezielle Ereignisse als Text und als Diagramm:
• Das unmögliche Ereignis ist die leere Menge
∅ = . Das unmögliche Ereignis tritt nie ein,
weil es keine Elementarereignisse enthält.
Ω
• Ω Das sichere Ereignis ist der komplette Er-
eignisraum Ω. Im Beispiel wäre Ω = r, b, g das
sichere Ereignis.
Ω
• Das zu A komplementäre Ereignis besteht aus
den Elementarereignissen, die nicht in A liegen.
Im Beispiel: Wenn A = r das Ereignis roter
Würfel ist, dann ist A = b, g das Gegenteil
nicht roter Würfel.
ΩA
A
• Der Durchschnitt der Ereignisse A1 und A2
wird mit A1 ∩ A2 notiert, er enthält die Elemen-
tarereignisse, die sowohl in A1 als auch in A2 ent-
halten sind. Im Beispiel ist der Durchschnitt von
A = g, b und B = b dann A ∩B = b.
ΩA1
A2
A1 ∩ A2
-6-
Theorie: Wahrscheinlichkeitsrechnung uniseminar.eu
• Die Vereinigung von Ereignissen A1 und A2 ist
A1 ∪ A2. Das ist die Menge der Elementarereig-
nisse, die in A1 oder A2 liegen. Ist beispielsweise
A = g und B = b, dann ist A ∪B = g, b.
ΩA1 A2
• Zwei Ereignisse A1 und A2 sind unverträglich
(oder disjunkt), falls sie kein gemeinsames Ele-
ment haben: A1 ∩ A2 = ∅. Dann können die
beiden Ereignisse nicht gleichzeitig eintreten. Im
Beispiel sind B = b und C = g disjunkt,
nicht aber B und C = b, g.
ΩA1 A2
2.1 Wahrscheinlichkeitsbegrie
Den Begri der Wahrscheinlichkeit kann man auf drei Arten einführen. Jede entspricht irgend-
wie unserer Vorstellung davon, wie wahrscheinlich es ist, dass ein Ereignis eintritt:
• Der klassische Wahrscheinlichkeitsbegri stammt von P.-S. Laplace: Wenn man vor-
aussetzt, dass alle Ergebnisse gleich wahrscheinlich sind, dann ist die Wahrscheinlich-
keit für das Ereignis A gegeben durch
P (A) =Anzahl der Ergebnisse in AAnzahl Ergebnisse in Ω
=|A||Ω|
Dabei bezeichnet |A| die Anzahl der Elemente inA. Im Beispiel ist P (g) = 13, P (r, g) =
23und P (Ω) = 3
3= 1.
• Der statistische Wahrscheinlichkeitsbegri deniert die Wahrscheinlichkeit dagegen
als Grenzwert der relativen Häugkeit, wenn man das Zufallsexperiment unendlich oft
wiederholt:
P (A) = limAnzahl Versuche→∞
Anzahl der für A günstigen VersucheAnzahl Versuche
-7-
Theorie: Spezielle Verteilungen uniseminar.eu
4 Spezielle Verteilungen
Inhalte dieses Kapitels:
• Die in der Vorlesung verwendeten Verteilungen werden vorgestellt
• Diskrete Verteilungen und ihre Kenngröÿen
• Stetige Verteilungen und ihre Kenngröÿen
Einer der wichtigsten Vorteile beim Rechnen mit Zufallsvariablen ist, dass die meisten Zufalls-
experimente bestimmte Wahrscheinlichkeitsfunktionen haben, die bereits gut untersucht und
tabelliert sind. Man sagt, dass die Zufallsvariable eine bestimmteVerteilung besitzt und meint,
dass die Wahrscheinlichkeitsfunktion f(xi) = P (X = xi) tabelliert ist oder als Formel vorliegt.
Dann sind auch ihre Kenngröÿen automatisch bekannt. Die wichtigsten bekannten Verteilungen
für diskrete Zufallsvariablen sind die Binomialverteilung und die Poissonverteilung, die wir in
den folgenden Abschnitten vorstellen.
4.1 Gleichverteilung für diskrete Variablen
Eine Gleichverteilung beschreibt ein Experiment, bei dem jeder Ausgang gleichwahrscheinlich
ist. Im diskreten Fall (nur k mögliche Ausgänge des Experiments) ist dann für jeden Wert xi
der (diskreten) Zufallsvariablen X einfach
P (X = xi) =1
ni = 1, . . . , k
unabhängig davon, welches konkrete xi wir einsetzen. Dabei ist zu beachten, dass P (X = x) = 0
ist für x ∈ R\x1, . . . , xk die kein möglicher Wert von X sind. Diese Wahrscheinlichkeitsver-
teilung führt zu folgenden Kenngröÿen für die Variable X:
Mittelwert: E(X) = k+12
Varianz: Var(X) = 112
(k2 − 1)
Standardabweichung: σ(X) =√
112
(k2 − 1)
-31-
Theorie: Spezielle Verteilungen uniseminar.eu
4.2 Bernoulliverteilung
Eine Bernoulliverteilung beschreibt ein Zufallsexperiment, dass nur zwei verschiedene Ausgänge
(Erfolg oder Misserfolg) haben kann. Die einzig sinnvolle (diskrete) Zufallsvariable zu einem
solchen Experiment ist X = X(ω) ∈ 0, 1
X = 1 falls Erfolg als Ergebnis bzw. 0 falls Misserfolg .
Da es nur zwei mögliche Ausgänge des Experiments gibt, hat man nur die Wahrscheinlichkeiten
P (X = 1) = p , P (X = 0) = 1− p
mit der Erfolgswahrscheinlichkeit p ∈ [0, 1]. Das Experiment ist durch die Angabe von p
schon eindeutig beschrieben, daher schreibt man einfach X ∼ B(p) für eine Bernoulli-verteilte
VariableX. Diese Wahrscheinlichkeitsverteilung führt zu folgenden Kenngröÿen für die Variable
X:
Mittelwert: E(X) = p
Varianz: Var(X) = p(1− p)
Standardabweichung: σ(X) =√p(1− p)
4.3 Binomialverteilung
Eine Binomialverteilung beschreibt folgendes Zufallsexperiment:
• Ein Bernoulli-Experiment (nur Erfolg/Misserfolg als Ausgang möglich) wird n-mal aus-
geführt,
• es wird nur die Anzahl X der Erfolge gezählt, die Reihenfolge interessiert nicht.
• Jedes der n Einzelexperimente hat die gleiche Erfolgswahrscheinlichkeit p.
Die diskrete Zufallsvariable X gibt die Anzahl erfolgreicher Versuche an, also wieviele von den
n Versuchen einen Erfolg produziert haben. Man sagt dann, das X binomialverteilt ist mit
n Versuchen und Erfolgswahrscheinlichkeit p. Das schreibt man auch kurz
-32-
Theorie: Spezielle Verteilungen uniseminar.eu
X ∼ B(n, p)
Eine binomialverteilte Zufallsvariable hat die folgende Wahrscheinlichkeitsfunktion:
P (X = x) =
(n
x
)· px · (1− p)n−x =
n!
x! · (n− x)!· px · (1− p)n−x
Diese Wahrscheinlichkeitsfunktion führt zu folgenden Kenngröÿen für die Binomialverteilung:
Mittelwert: E(X) = np
Varianz: Var(X) = np(1− p)
Standardabweichung: σ(X) =√np(1− p)
Im folgenden Bild sieht man die Binomialverteilung B(10, 0.3). Bei dem Mittelwert 3 ist die
Wahrscheinlichkeit am gröÿten. Wenn der Parameter p vergröÿert wird, verschieben sich die
maximalen Werte weiter nach rechts. Wenn die Anzahl Versuche erhöht wird, nähert sich die
Form einer Glocke an.
X ∼ B(10, 0.3)
x
P (X = x)
0.05
0.10
0.15
0.20
0.25
0.30
0 1 2 3 4 5 6 7 8 9 10
Beispiel
60% der LMU-Absolventen haben im letzten Jahr ehrenamtliche Arbeit verrichtet. Wählen wir
zufällig 4 Absolventen. Wie hoch ist die Wahrscheinlichkeit, dass keiner von ihnen im letzten
-33-
Theorie: Statistische Tests uniseminar.eu
7 Statistische Tests
Inhalte dieses Kapitels:
• Prinzip des Hypothesentests
• Testentscheidung über Prüfgröÿe oder p-Wert
• Berechnung der Prüfgröÿe für Standardsituationen
Ein statistischer Test wird verwendet um zu entscheiden, ob eine gezogene Stichprobe einer
bestimmten Annahme über die Grundgesamtheit widerspricht. Diese Annahme nennt man auch
die Nullhypothese H0, ihr Gegenteil ist die Alternativhypothese H1. Spricht die Stichpro-
be zu stark gegen H0, so verwirft man die Nullhypothese und sagt, die Stichprobe spricht
signikant gegen H0 bzw. für H1. Andernfalls behält man die Nullhypothese bei. Die einzige
Schwierigkeit besteht darin festzulegen, ab welchem Punkt die Stichprobe signikant gegen H0
spricht. Dazu verwendet man folgenden allgemeinen Ansatz:
• Man gibt ein kleines Signikanzniveau bzw. Irrtumswahrscheinlichkeit α vor, typi-
scherweise 5%.
• Dann zieht man eine Stichprobe und berechnet einen Punktschätzer.
• Für diesen Schätzer bestimmt man einen Annahmebereich für H0 und einen Verwerfungs-
bereich. Diese Bereiche werden nach folgender Regel festgelegt: Ist H0 wahr, so erhält
man einen Schätzwert im Ablehnungsbereich höchstens mit Wahrscheinlichkeit α. Liegt
der berechnete Wert dort, wird H0 abgelehnt, ansonsten wird H0 beibehalten.
Das Signikanzniveau α steuert dabei, für wie aussagekräftig (signikant) man die Stichprobe
vor der Ziehung hält:
• Ein hohes Signikanzniveau führt dazu, dass H0 schon bei geringer Abweichung des
Schätzwerts von H0 abgelehnt wird.
• Ein niedriges Signikanzniveau bedeutet, dass man der Stichprobe nicht sehr vertraut
oder dass eine Ablehnung von H0 mit hohen Kosten verbunden wäre. Der Schätzwert
muss dann stark von H0 abweichen, damit die Nullhypothese abgelehnt wird.
-67-
Theorie: Statistische Tests uniseminar.eu
Um ein einheitliches Testverfahren zu haben, wird aus dem Schätzwert zunächst eine Test-
grösse (engl. standard score) gebildet, die dann mit Werten aus einer tabellierten Verteilung
verglichen wird. Eine Ablehnung von H0 erfolgt dann, wenn die Stichprobe zu einer Testgrösse
führt, die im Verwerfungsbereich liegt. Dieser kann verschiedene Formen haben, je nachdem
ob die Fragestellung ein- oder zweiseitig formuliert ist. Es gibt zwei Arten von Hypothesen:
• Hypothesen über unbekannte Parameter, die mit so genannten Parametertests über-
prüft werden. Meist kennt man die Verteilung der Grundgesamtheit nicht. Dank des
Grenzwertsatzes können wir zur Bestimmung der Annahmebereiche aber meist die Nor-
malverteilung oder die t-Verteilung einsetzen.
• Hypothesen über die unbekannte Verteilungsform einer Grundgesamtheit, die mit Ver-
teilungstests überprüft werden. Hier werden spezielle Verteilungen zur Bestimmung der
Annahmebereiche verwendet.
Bei Parametertests haben wir stets das folgende rechnerische Vorgehen:
1. Nullhypothese und Alternativhypothese formulieren:
Man stellt die Nullhypothese H0 aufgrund der Aufgabenstellung auf. Typischerweise ist
dies eine Gleichheits- oder Ungleichheitsaussage für einen Parameter. Die Alternativhypo-
these H1 ist der Nullhypothese entgegengesetzt (mathematisch exakt formuliert gehören
zu beiden Hypothesen Intervalle für den gesuchten Parameter, die disjunkt sein müssen).
Will man mit Hilfe einer Statistik eine bestimmte Aussage signikant untermauern, so ist
diese Aussage als H1 zu wählen, denn die Stichprobe spricht immer für H1.
2. Signikanzniveau α wählen:
Das Signikanzniveau α gibt an, wie sehr wir der Stichprobe vertrauen (üblich α =
10%, 5%, 1%). Mathematisch ist α im Test die Wahrscheinlichkeit, dass wir im Fall einer
richtigen H0 eine unglückliche Stichprobe ziehen, die zur Ablehnung von H0 führt.
3. Testverfahren festlegen:
Aufgrund gegebener Daten und des zu schätzenden Parameters entscheidet man, welcher
Test durchzuführen ist. Das Grundprinzip der Tests ist gleich. Die Testart entscheidet
-68-
Theorie: Statistische Tests uniseminar.eu
Bei einem zweiseitigen Test lautet die Hypothese H0 : θ = θ0. Man berechnet einen Schätz-
wert für θ und lehnt ab, falls dieser zu weit von θ0 entfernt ist. Der Annahmebereich ist also ein
Intervall um θ0. Für die standardisierte Testgrösse ist der Annahmebereich einfach ein Intervall
um den Nullpunkt, dass die Wahrscheinlichkeit 1− α abdeckt:
Zweiseitiger Test
Nullhypothese H0: θ = θ0
Alternativhypothese H1: θ 6= θ0
Annahmebereich: [−c, c]0
c−c
1− αα/2α/2
Annehmen VerwerfenVerwerfen
Bei einem einseitigen Test lautet die Hypothese H0 : θ ≥ θ0 (linksseitiger Test, Alternative
nach unten) oder H0 : θ ≤ θ0 (rechtsseitiger Test, Alternative nach oben). Man berechnet den
Schätzwert für θ und lehnt ab, falls dieser zu weit links von θ0 bzw. zu weit rechts liegt. Der
Annahmebereich ist hier ein einseitiges Intervall:
Linksseitiger Test
Nullhypothese H0: θ ≥ θ0
Alternativhypothese H1: θ < θ0
Annahmebereich: ≥ −c0
AnnehmenVerwerfen
−c
1− αα
Rechtsseitiger Test
Nullhypothese H0: θ ≤ θ0
Alternativhypothese H1: θ > θ0
Annahmebereich: ≤ c
0
Annehmen Verwerfen
c
1− α α
Wie bei den Kondenzintervallen beschreiben wir in den folgenden Abschnitten die wichtigsten
Tests im Detail.
-71-
Theorie: Regressionsanalyse uniseminar.eu
8.4 Varianzanalyse (ANOVA)
Wir wenden uns im Folgenden der Qualität unseres linearen Modells zu. Wir fragen uns,
wie genau unsere geschätzten Werte yi sind und somit auch, welche Genauigkeit wir für ei-
ne Prognose erwarten können. Dazu rufen wir uns die statistischen Hilfsmittel der Lage- und
Streuparameter aus den vorangegangenen Kapiteln in Erinnerung. Wir betrachten den Lage-
parameter y der wahren Werte, um so die Streuung der Daten zu betrachten. Für jeden Wert
yi müssen wir mit unserem Modell die Abweichung vom Mittelwert yi− y erklären. Betrachten
wir dazu wiederum die Situation für ein Datenpaar (xi, yi):
Abbildung 4: Zerlegung der Abweichung
Wir betrachten in der Abbildung 4 drei verschiedene Arten von Abweichungen:
• die zu erklärende Abweichung yi − y (dabei ist y das Mittel der Y -Werte),
• die durch unser Modell erklärte Abweichung yi − y,
• sowie die durch unser Modell nicht erklärte Abweichung yi − yi.
Wir sehen sofort, dass folgender Zusammenhang gilt:
yi − y = (yi − yi) + (yi − y) = ei + (yi − y). (2)
-115-
Theorie: Statistische Tests uniseminar.eu
7.2 Einfacher Gauss-Test
Der einfache Gauss-Test prüft eine Vermutung über den Mittelwert µ einer Grundgesamtheit,
für welche die Standardabweichung σ schon bekannt ist. Der ML-Schätzwert für µ ist bekannt-
lich das Mittel aus der gezogenen Stichprobe. Für Aufgaben aus diesem Szenario liegen folgende
Gröÿen vor:
• µ0 vermuteter Mittelwert der Grundgesamtheit
• x Stichprobenmittelwert
• n Stichprobenumfang
• σ Vorab bekannte Standardabweichung der Grundgesamtheit
• α Signikanzniveau
Als Standardfehler bezeichnet man wie bei den Kondenzintervallen die Standardabweichung
des Schätzwerts. Beim Mittelwertschätzer ist das
Sx =σ√n.
Standardisieren bedeutet, dass man den vermuteten Mittelwert µ0 abzieht und durch den Stan-
dardfehler teilt. Dadurch erhält man die standardisierte Testgrösse
T =x− µ0
σ/√n
Bei den kritischen Werten muss man entscheiden, ob man sie direkt für den Schätzwert x
berechnet oder für die standardisierte Grösse T . Für diese sind die kritischen Werte wie folgt
gegeben:
1. Zweiseitig: z1−α/2 ist das Quantil der Standardnormalverteilung, also P(−z1−α/2 ≤ T ≤ z1−α/2
)=
1− α bzw. Φ(z1−α/2) = 1− α/2.
2. Einseitig: zα und z1−α sind die Quantile an den Rändern.
Die Nullhypothese H0 wird verworfen, wenn T nicht im Annahmebereich liegt. Im zweiseitigen
Fall also, falls |T | > z1−α/2 ist. Im linksseitigen Fall lehnt man ab, falls T < zα, im rechtsseitigen
Fall falls T > z1−α ist.
-72-
Theorie: Regressionsanalyse uniseminar.eu
Wenn wir nun diese Varianzanalyse auf den ganzen Datensatz ausweiten, müssen wir wiederum
sicherstellen, dass sich positive und negative Abweichungen nicht auslöschen. Wir betrachten
daher auch hier die Summe der quadrierten Abweichungen. Wir summieren also über die qua-
drierten Summanden auf beiden Seiten der Gleichung in (2) und erhalten dieGrundgleichung
der Streuungsanalyse:
n∑i=1
(yi − y)2 =n∑i=1
e2i +
n∑i=1
(yi − y)2 , (3)
Diese Summen bezeichnet man üblicherweise mit folgenden Symbolen:
• SSY =∑
(yi − y)2 ist die Gesamtvarianz von Y ,
• RSS =∑
(yi − yi)2 ist die Reststreuung (der Modellfehler),
• SSReg =∑
(yi − yi)2 ist die erklärte Streuung des Modells.
Die Grundgleichung lautet also knapp formuliert
SSY = RSS + SSReg
Die drei Summen SSY, RSS und SSReg werden typischerweise von einem Computerprogramm
aus den Datenwerten berechnet. Diese Kennzahlen unseres Modells erlauben es uns nun, die
Qualität des Modells mit einem Gütemass auszudrücken. Im Idealfall (der Datensatz genügt
fehlerfrei dem Modell) sollte RSS = 0 (keine Fehler gemacht) und SSY = SSReg sein (die
Streuung von Y wird durch die Streuung von X verursacht und nicht durch das Modell). Im
anderen Extrem (X und Y sind unabhängig) ist SSReg = 0 und die Gleichung SSY = RSS
drückt aus, dass die Streuung von Y nicht durch den Einuss von X erklärt werden kann.
Ein zentrales Gütemass der Regressionsanalyse ist gegeben durch das Bestimmtheitsmaÿ:
R2 =SSRegSSY
= 1− RSSSSY
Dieser Koezient beschreibt, welchen Prozentsatz der zu erklärenden Abweichung der wahren
Werte yi vom Mittelwert y durch die geschätzten Werte yi auf der Regressionsgerade erklärt
wird. Logischerweise ist unser Modell umso besser, je näher der Wert von R2 bei Eins liegt.
-116-
Theorie: Regressionsanalyse uniseminar.eu
Graphisch gesehen zeigt der Wert von R2, wie nahe die wahren Werte an der Regressionsgerade
liegen.
Beispiel
Wir wollen nun herausnden, wie gut das Regressionsmodell für den Zusammenhang von Jah-
resumsatz und Verkaufsäche ist. Betrachten wir dazu die bis anhin gewonnenen Daten:
Filiale y y y (yi − y)2 (yi − y)2
1 5.2533 2.9300 2.2245 5.3979 9.1737
2 5.2533 5.2700 5.7233 0.0003 0.2209
3 5.2533 6.8500 6.9244 2.5493 2.7925
4 5.2533 7.0100 7.3422 3.0859 4.3632
5 5.2533 7.0200 6.4544 3.1211 1.4426
6 5.2533 8.3500 8.3866 9.5893 9.8173
7 5.2533 4.3300 4.6789 0.8525 0.3300
8 5.2533 5.7700 5.5144 0.2669 0.0682
9 5.2533 7.6800 7.3422 5.8887 4.3632
10 5.2533 3.1600 3.1123 4.3820 4.5841
11 5.2533 1.5200 1.8590 13.9378 11.5217
12 5.2533 3.1500 3.4778 4.4240 3.1524
Total: 53.4959 51.8297
= SSY = SSReg
Tabelle 1: Die Daten aus dem Beispiel, ergänzt durch die quadratischen Abweichungen und
deren Summe.
Wir können nun den R2-Koezienten für die Analyse einfach durch Einsetzen der Werte aus
Tabelle 1 in die Formel für R2 berechnen :
R2 =51.8297
53.4959= 0.968851 .
Das heisst also, dass wir gut 96.9% der zu erklärenden Variation durch die Regressionsgerade
erklären können. Dies wiederum bedeutet, dass 96.9% der Variation in den Jahresumsätzen
-117-
Aufgaben
Übu
ngen
Prüfung
enExtras
A
Aufgaben
Statistik II
Sommersemester 2013
München, April 2013
Inhaltsverzei hnis
1 Kombinatorik 1
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Wahrs heinli hkeitsre hnung 8
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3 Zufallsvariablen 17
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 Spezielle Verteilungen 20
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5 Grenzwertsätze 29
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
6 Punkt- und Intervalls hätzung 32
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
7 Statistis he Tests 40
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
8 Regressionsanalyse 60
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Kombinatorik: Aufgaben uniseminar.eu
1 Kombinatorik
Aufgabe 1: Ri htige Formel nden
Bestimmen Sie die folgenden Anzahlen mit Hilfe kombinatoris her Formeln:
1. Anzahl der Mögli hkeiten, 5 vers hiedene Zahlen von 1 bis 20 bei einem Tippspiel
anzukreuzen.
2. Anzahl der Mögli hkeiten, 5 (ggf. glei he) Zahlen von 1 bis 20 aus einer Urne mit 20
Kugeln na heinander zu ziehen.
3. Anzahl der Wörter mit 6 Bu hstaben, die nur aus Vokalen bestehen und genau zweimal
e enthalten.
4. Anzahl der Mögli hkeiten, aus einer S ha htel mit 15 Pralinen (2 mit Alkohol, 13 ohne
Alkohol, das ist einziges Unters heidungsmerkmal) drei Pralinen zu nehmen?
5. Anzahl der Mögli hkeiten, 5 Veranstaltungen (2 mit je einem Zeitblo k, 2 mit je zwei
Zeitblö ken, 1 mit drei Zeitblö ken), auf 9 Zeitberei he zu verteilen (Die Zeitblö ke der
selben Veranstaltung müssen ni ht direkt hintereinander liegen).
Aufgabe 2: Relative Häugkeiten bere hnen
Bere hnen Sie diese relativen Häugkeiten (spri h Lapla e-Wahrs heinli hkeiten):
1. Anteil der aus Vokalen gebildeten Worte mit 4 Bu hstaben unter allen mögli hen Worten
mit 4 (aus 26 mögli hen) Bu hstaben.
2. Wahrs heinli hkeit, aus der Pralinens ha htel von Teil 4 der vorangehenden Aufgabe
genau drei Pralinen ohne Alkohol zu ziehen.
(Re hnen Sie elementar, ohne Formeln für Wahrs heinli hkeitsverteilungen zu verwenden)
Aufgabe 3: Lotto-Modikation
Eine Tippgemeins haft bietet folgendes Spiel an: Sie müssen zusätzli h zu den 6 aus 49
Lottozahlen für 6 Ri htige (hier ohne Zusatzzahl) au h no h die ri htige Reihenfolge der
Ziehung mit angeben. Dafür dürfen Sie 20 vers hiedene Tipps (ein Tipp besteht aus 6 Zahlen
-1-
Kombinatorik: Aufgaben uniseminar.eu
und ihrer Reihenfolge) abgeben und man gewinnt, wenn wenigstens einer dieser Tipps 6
Ri htige plus die ri htige Reihenfolge enthält. Ist es wahrs heinli her, dieses Spiel oder das
klassis he Lotto mit 6 Ri htigen ohne Reihenfolge zu gewinnen?
Angenommen ein klassis her Tipp kostet 1 Euro, wie teuer sollte ein Los der Spielgemeins haft
sein, damit der Erwartungswert für den Gewinn der Glei he ist wie beim klassis hen Lotto?
-2-
Zufallsvariablen: Aufgaben uniseminar.eu
3 Zufallsvariablen
Aufgabe 7: Kenngröÿen ausre hnen
Eine diskrete Zufallsvariable X kann die Werte X = 3, X = 8 oder X = 10 annehmen. Die
entspre henden Wahrs heinli hkeiten sind 0.2, 0.7 und 0.1. Bere hnen Sie den Mittelwert, die
Varianz und die Standardabwei hung der Zufallsvariablen X .
Aufgabe 8: Lineare Transformation
Eine Sti hprobe mit 20 Datenwerten habe den Mittelwert x = 1 und die Varianz S2X = 4. Eine
lineare Transformation der gesamten Verteilung Y = aX + b führt auf den Mittelwert y = 2
und die Varianz S2Y = 1. Wel he Koezienten stehen in der Transformationsglei hung?
-17-
Statistis he Tests: Aufgaben uniseminar.eu
7 Statistis he Tests
Aufgabe 20: Einseitige und zweiseitige Tests
Formulieren Sie geeignete Nullhypothesen und Alternativhypothesen für die folgenden Aus-
sagen. Ents heiden Sie jeweils, ob ein einseitiger oder ein zweiseitiger Test anzuwenden ist, und
stellen Sie den Verwerfungsberei h graphis h dar.
1. Die Studierenden geben dur hs hnittli h ni ht mehr als 500 Franken pro Semester in der
Universitätsbu hhandlung aus.
2. Ein Erwa hsener trinkt dur hs hnittli h 1.5 Tassen Kaee pro Tag.
3. Ein dur hs hnittli her Arbeitnehmer hat in der letzten Wo he mindestens 3.5 Überstun-
den geleistet.
Aufgabe 21: Hypothesentest für µ, σ bekannt
Ein Hersteller von elektronis hen Baukästen hat festgestellt, dass die dur hs hnittli he Zeit,
die ein Neuling für die Montage eines S haltkreistesters benötigt, 3 Stunden beträgt bei einer
Standardabwei hung von 0.2 Stunden. Ein Fa hberater hat eine neue Anleitung entwi kelt, um
die Montagezeit für unerfahrene Mitarbeiter zu verkürzen. Bei einem Eektivitätstest für die
neue Anleitung haben 15 Neulinge dur hs hnittli h 2.9 Stunden für die Montage des Testers
gebrau ht. Es sei angenommen, die Grundgesamtheit sei normalverteilt. Können wir zum Sig-
nikanzniveau α = 0.05 ents heiden, dass die neue Anleitung eektiv ist? Bestimmen und
interpretieren Sie den p-Wert.
Aufgabe 22: Hypothesentest für µ, σ unbekannt
Die mittlere Flugentfernung amerikanis her Regionaluggesells haften beträgt 299 Meilen.
Diese Hypothese soll mit einem Signikanzniveau von α = 0.05 getestet werden. Dazu wird
eine Sti hprobe von 30 Flügen genommen, die ermittelte Dur hs hnittsentfernung ist x = 314.6
Meilen und die Sti hprobenstandardabwei hung ist s = 42.8 Meilen.
-40-
Statistis he Tests: Aufgaben uniseminar.eu
Aufgabe 23: Hypothesentest für π
Langjährige Erfahrungen haben gezeigt, dass das Medikament A in 75% aller Fälle wirksam
ist. Eine Fors hungsgruppe entwi kelt ein Konkurrenzprodukt B, das auf den Markt gebra ht
werden soll, falls es A überlegen ist. B wird an 120 Personen getestet, und erweist si h bei 93
Personen als wirksam.
1. Testen Sie (mit α = 0.05), ob das Medikament B auf den Markt gebra ht werden soll.
2. Mit wel her Wahrs heinli hkeit würde das Medikament B, falls seine wirkli he Wirk-
samkeit 0.8 beträgt, denno h ni ht auf den Markt kommen?
Aufgabe 24: Hypothesentest für Dierenz der Mittelwerte
In einer Studie wurde rausgefunden, dass in der Altersgruppe 30-59 Jahre dur hs hnittli h
0.57 Tassen Kaee pro Person pro Tag getrunken werden und in der Altersgruppe 60 und
älter 0.75 Tassen. Führen Sie einen z-Test dur h (mit α = 0.05), um festzustellen, ob der
mittlere Kaeeverbrau h der beiden Gruppen übereinstimmen kann. Setzen Sie dabei die
Sti hprobengröÿen n1 = 200 resp. n2 = 100 und Standardabwei hungen der Sti hproben
s1 = 0.43 resp. s2 = 0.68 voraus.
Bestimmen und interpretieren Sie den p-Wert.
Aufgabe 25: Hypothesentest für Dierenz der Mittelwerte
Ein Fa hblatt für Automobile mö hte den Benzinverbrau h von 2 Automobilen derselben
Gröÿenklasse miteinander verglei hen. Für die beiden Automarken A und B wurden folgende
Sti hprobenwerte festgestellt:
nA = 50 xA = 9.4 s2A = 3.6
nB = 40 xB = 8.7 s2B = 3.8
Wir können davon ausgehen, dass die Varianz des Benzinverbrau hs der beiden Automarken
übereinstimmt.
Testen Sie die Hypothese H0, dass der mittlere Benzinverbrau h der beiden Typen überein-
stimmt. Die Wahrs heinli hkeit eines Fehlers 1. Art sei 5%.
-41-
Statistis he Tests: Aufgaben uniseminar.eu
Aufgabe 26: Hypothesentest für Dierenz der Anteilswerte
In einer 6-jährigen Untersu hung haben 3429 der Testpersonen tägli h Aspirin genommen. Von
denen sind 148 an einem Herzinfarkt gestorben. Die zweite Gruppe bestand aus 1710 Personen
und hat ein Pla ebo bekommen. In dieser Gruppe gab es 79 Todesfälle. Prüfen Sie mit einem
Signikanzniveau von 0.01, ob Aspirin die Wahrs heinli hkeit eines Herzinfarkts verringert.
Aufgabe 27: Hypothesentest mit Störenfried
Eine Zufallsvariable X sei N(µ, 4)-verteilt mit unbekanntem Mittelwert µ und bekannter Stan-
dardabwei hung σ(X) = 2. Eine Testreihe ergibt die folgenden Werte:
0 , 1 , −1 , 2 , 3 , 2 , 2 , 3 , 120 , 0 , 2 .
Bere hnen Sie ein Annahmeintervall für X beim Test der Nullhypothese H0 : µ = 1 gegen die
Alternative H1 : µ 6= 1 auf dem Signikanzniveau α = 10% unter der gegebenen Standardab-
wei hung, sowie das Annahmeintervall unter der Annahme, das σ fehlerhaft ist und daher aus
der Sti hprobe ges hätzt werden muss. Wie interpretiert man diese Tests?
Aufgabe 28: Vers hiedene Sti hprobenzahl
Zwei Zufallsvariablen X und Y seien jeweils normalverteilt mit unbekannten Mittelwerten µX
und µY , sowie glei her bekannter Standardabwei hung σ(X) = σ(Y ) = 3. Gegeben seien die
Sti hproben
(x1, x2, x3) = (10, 11, 12) , (y1, y2, y3, y4, y5) = (2, 3, 1, 2, 1)
vers hiedener Länge. Ents heiden Sie die Nullhypothese H0 : µX−µY = 9 gegen die Alternative
H0 : µX − µY 6= 9 auf dem 5%-Niveau. Bere hnen Sie au h den p -Wert und interpretieren Sie
ihn: wie knapp war die Testents heidung?
Aufgabe 29: Wahr oder fals h
Ents heiden Sie für die folgenden Aussagen, ob sie jeweils wahr oder fals h sind. Versu hen
Sie eine kurze Begründung für die Antort anzugeben (dur h eine kleine Re hnung oder ein
-42-
Statistis he Tests: Aufgaben uniseminar.eu
Gegenbeispiel):
1. Bei einem t -Test für einen Mittelwert wird das Annahmeintervall für das Sti hprobenmit-
tel X kürzer, wenn man die Sti hprobenzahl erhöht und die anderen Daten glei hbleiben.
2. Bei einem z -Test für eine Mittelwertdierenz wird das Annahmeintervall für das Sti h-
probenmittel X kürzer, wenn man das Niveau α erhöht und die anderen Daten glei h-
bleiben.
3. Die Di htefunktion f(x) einer stetigen Zufallsvariable erfüllt 0 ≤ f(x) ≤ 1 für alle x ∈ R.
4. Die Verteilungsfunktion F (x) einer stetigen Zufallsvariable erfüllt 0 ≤ F (x) ≤ 1 für alle
x ∈ R.
5. Wenn die Testgröÿe T beim Odds-Ratio-Test positiv ist, besteht ein positiver Zusammen-
hang der Sti hproben.
6. Das Vertaus hen der beiden Sti hproben (bzw. der Variablen X und Y ) ändert einen
zweiseitigen Mann-Whitney-U-Testents heid ni ht.
7. Jeder χ2-Anpassungstest kann prinzipiell dur h einen (einfa heren) Kolmogorov-Smirnov-
Test ersetzt werden.
-43-
Übu
ngen
Prüfung
enExtras
Ü
Übungen
Statistik IISommersemester 2013
München, April 2013
Inhaltsverzeichnis
Übungsblatt 1: 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Übungsblatt 2: 6Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Übungsblatt 3: 14Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Übungsblatt 4: 22Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Übungsblatt 5: 28Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Übungsblatt 6: 35Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Übungsblatt 7: 41Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Übungsblatt 8: 47Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Einleitung uniseminar.eu
Übungsblatt 9: 55Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Übungsblatt 10: 65Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Übungsblatt 11: 74Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Übungsblatt 1 - Lösungen uniseminar.eu
Lösungen
Aufgabe 1:
Bei einer Party mit zehn Gästen küsst zur Begrüßung jeder jeden. Wieviele Küsse gibt es dann?
Lösung:
Ganz intuitiv kann man die Aufgabe durch Aufsummieren der Anzahl der Küsse lösen. Die erstePerson verteilt neun Küsse an die jeweils anderen, während die zweite nur noch acht Personenküsst, die dritte braucht nur noch sieben zu küssen usw. Somit erhält man für die Anzahl derKüsse:
9∑i=1
10− i =9 · 10
2= 45
Mathematisch eleganter ist jedoch ein anderer Weg. Aus einer Gruppe von 10 Personen (n = 10)ist die Anzahl von Paaren (m = 2) zu ermitteln. Dabei spielt die Reihenfolge keine Rolle undes handelt sich um eine Anordnung ohne Wiederholung. Dies führt somit auch auf
(102
)= 45
Möglichkeiten.
Aufgabe 2:
Ein Würfel wird dreimal hintereinander geworfen. Wieviele Kombinationsmöglichkeiten gibt es,bei denen
a) der erste Wurf eine „6“ ist?
b) die Augenzahl im dritten Wurf gerade ist?
c) der erste und der dritte Wurf eine „3“ ist?
Lösung:
a) Der Würfel wird hintereinander gewürfelt. Somit spielt die Reihenfolge eine Rolle. Damitdas Ereignis eintritt, muss im ersten Wurf eine „6“ gewürfelt werden. Die Würfe zwei unddrei sind für das Eintreten des Ereignisses irrelevant. Wir erhalten 1·6·6 = 36 Möglichkeiten.
b) Es existieren drei Möglichkeiten dafür, dass der dritte Würfel eine gerade Augenzahl auf-weist. Somit erhalten wir 6 · 6 · 3 = 108 Möglichkeiten für Ereignis b).
c) Die Reihenfolge ist für das Ereignis relevant. Es ergeben sich 1 · 6 · 1 = 6 Möglichkeiten.
-3-
Übungsblatt 1 - Lösungen uniseminar.eu
Aufgabe 3:
Ein Skatspiel besteht aus 32 Karten. Die 8 unterschiedlichen Karten ’7, 8, 9, 10, Bube, Dame,König, As’ existieren jeweils in vier verschiedenen ’Farben’ (Kreuz, Pik, Herz, Karo). JederSpieler erhält 10 Karten. Wir betrachten nun die möglichen Hände eines einzelnen Spielers.Wieviele mögliche Hände gibt es, in denen er unter seinen 10 Karten
a) genau 3 Könige und genau 2 Damen besitzt?
b) alle 4 Buben besitzt?
Lösung:
Die Reihenfolge, in der man die Karten erhält, spielt keine Rolle. Des Weiteren tauchen die Kar-ten nicht mehrfach auf. Die Anzahl der Patien wird also durch Kombinationen ohne Reihenfolgeund ohne Wiederholung berechnet.
a) Die Anzahl an Möglichkeiten von vier möglichen Königen drei auszuwählen beträgt also(43
)= 4. Analog erhalten wir
(42
)Möglichkeiten zwei Damen zu wählen. Die restlichen fünf
Karten dürfen beliebig aus den übrigen 32 − 4 − 4 = 24 Karten gewählt werden, da keineweitere Dame oder ein weiterer König gezogen werden darf. Insgesamt erhalten wir(
4
3
)·(
4
2
)·(
24
5
)= 1′020′096
Möglichkeiten.
b) Analog zu a) erhalten wir(
44
)·(
286
)= 376′740 Möglichkeiten.
Aufgabe 4:
Ein Getränkemarkt bietet als Spezialangebot den ’Münchner Kasten’ an. Dabei dürfen sichdie Kunden von dem Bier (nur ’Helles’) der sechs großen Münchner Brauereien ein beliebigesSortiment zusammenstellen. Ein Kasten beinhaltet dabei 20 Flaschen.
a) Wie viele Kombinationsmöglichkeiten bei der Zusammenstellung eines Kastens gibt es ins-gesamt?
b) Ein Kunde möchte auf alle Fälle mindestens eine Flasche pro Brauerei in seinem Kastenhaben. Wie viele Kombinationsmöglichkeiten für den Kasten gibt es jetzt?
Lösung:
a) Wir müssen Wiederholungen aber keine Reihenfolge berücksichtigen. Dabei ist n = 6 (Ele-mente, die zur Verfügung stehen) und m = 20 (Elemente, die ausgewählt werden). Die
-4-
Übungsblatt 1 - Lösungen uniseminar.eu
Anzahl der Kombinationen mit Wiederholung, aber ohne Berücksichtigung der Reihenfolgebeträgt dann (
n+m− 1
m
)=
(6 + 20− 1
20
)=
25!
20! · 5!= 53′130
Möglichkeiten seinen individuellen Kasten zu erstellen.
b) Durch diese Forderung sind 6 der 20 Plätze belegt. Die restlichen 14 Plätze können jedochbeliebig verteilt werden. Daraus ergeben sich Kombinationsmöglichkeiten von(
n+m− 1
m
)=
(6 + 14− 1
14
)=
19!
15! · 5!= 11′628
Aufgabe 5:
Die Hockeybundesliga der Herren besteht in Deutschland aus zwölf Mannschaften. In einerSaison spielt jede Mannschaft gegen jede andere ein Hin- und ein Rückspiel. Wieviele Spielefinden insgesamt während einer Saison statt?
Lösung:
Es spielen immer nur m = 2 der n = 12 Mannschaften gegeneinander. Wir haben keine Wieder-holung, da keine Mannschaft gegen sich selbst spielt. Hingegen spielt die Reihenfolge aufgrunddes Hin- und Rückspieles eine Rolle. Wir erhalten:(
n
m
)·m! =
(12
2
)· 2! =
12!
2! · 10!·2! = 132
als Anzahl der Spiele.
-5-
Übungsblatt 4 - Lösungen uniseminar.eu
Lösungen
Aufgabe 1:
Für 2 diskrete Zufallsvariablen X und Y sei nur die gemeinsame Verteilung bekannt.
X\Y 1 2 30 0 1
214
1 16
112
0
a) Bestimmen Sie die Randverteilung von X und Y .
b) Sind X und Y unabhängig?
c) Bestimmen Sie die Kovarianz zwischen X und Y .
Lösung:
a) X und Y sind diskret, somit erhalten wir die Randverteilung von X und Y durch dieSummation aller Ausprägungen der jeweils anderen Zufallsvariable.
X\Y 1 2 3 P(X = xi)
0 0 12
14
34
1 16
112
0 14
P(Y = yi)16
712
14
1
b) Die Zufallsvariablen X und Y sind nicht stochastisch unabhängig, denn es gilt:
P (X = 0, Y = 1) = 0 6= 1
8=
3
4· 1
6= P (X = 0) · P (Y = 1)
c) Die Kovarianz zwischen X und Y ist definiert durch:
Cov(X, Y ) = E ((X − E(X)) · (Y − E(X))) = E(XY )− E(X) · E(Y )
Für den Erwartungswert der diskreten Zufallsvariablen X und Y erhalten wir:
E(X) =2∑i=1
xi · pi︸︷︷︸P(X=xi)
= 0 · 3
4+ 1 · 1
4=
1
4
E(Y ) =3∑i=1
yi · pi︸︷︷︸P(Y=yi)
= 1 · 1
6+ 2 · 7
12+ 3 · 1
4=
25
12
-24-
Übungsblatt 4 - Lösungen uniseminar.eu
Sowie für die neue diskrete Zufallsvariable XY :
E(XY ) =2∑i=1
3∑j=1
xi · yj · pij︸︷︷︸P(X=xi,Y=yj)
= 1 · 1 · 1
6+ 1 · 2 · 1
12+ 1 · 3 · 0 =
1
3
Die ersten drei Summanden der Doppelsumme verschwinden, da hier die Zufallsvariable Xden Wert Null annimmt. Insgesamt erhalten wir für die Kovarianz:
Cov(X, Y ) = E(XY )− E(X) · E(Y ) =1
3− 1
4· 25
12= − 3
16
Es besteht also ein negativer Zusammenhang zwischen X und Y .
Aufgabe 2:
Die Zufallsvariable X beschreibe die „Augenzahl beim einmaligen Würfeln mit einem Dodeka-eder (Würfel mit 12 Seiten)“. Wie ist X verteilt? Berechnen Sie E (X) und Var (X))!
Lösung:
Unter der Annahme, dass es sich um einen fairen Würfel handelt, ist die Zufallsvariable Xdiskret gleichverteilt. Die Wahrscheinlichkeitsfunktion nimmt für jede Ausprägung den gleichenWert
(P(X = xi) = 1
12
)an. Wir erhalten trivialerweise folgende Wahrscheinlichkeitstabelle:
xi 1 2 3 . . . 12P(X = xi)
112
112
112
. . . 112
Für den Erwartungswert und die Varianz gilt:
E(X) =12∑i=1
xi · pi =12∑i=1
i
12=
12(12 + 1)
2= 6.5
E(X2)
=12∑i=1
x2i · pi =
12∑i=1
i2
12=
1
12·12(12 + 1)(24 + 1)
6=
325
6
⇒ Var(X) = E(X2)− (E(X))2 =
325
6− (6.5)2 ≈ 11.92
Aufgabe 3:
Ein bekannter Hersteller von Keksen verspricht seinen Kunden eine Extraüberraschung in jdersechsten Keksschachtel. Voller Freude kauf ein übereifriger Vater gleich 20 Schachteln.Hinweis: Hinsichtlich der Ergebnisse verschiedener Schachteln kann von Unabhängigkeit aus-gegangen werden.
-25-
Übungsblatt 9 - Lösungen uniseminar.eu
Lösungen
Aufgabe 1:
Jupp beschließt das neue Album seines Lieblingsinterpreten im Internet zu erwerben. Da erdavon gehört hat, dass es in einem bekannten Internetauktionshaus immer gute Angebote gibt,möchte er sich dort die CD ersteigern. Als er die Webseite betrachtet, fällt ihm auf, dass mannicht nur bei Auktionen mitbieten, sondern auch Artikel sofort erwerben kann. Des Weiterenrät ihm ein Kollege, ebenfalls bei einem großen Internetbuchhändler nachzuschauen, da es dortauch günstig CDs zu erwerben gibt. Um bei dieser Angebotsvielfalt den Überblick zu bewahren,beschließt Jupp vorerst die Angebote zu vergleichen. Dazu betrachtet er am 11.01.2006 dasAngebot des Internetbuchhandels, 14 Sofortkaufangebote und 14 Auktionen, die an diesem Tagauslaufen. Er notiert sich jeweils den Verkaufspreis inklusive der Versandkosten in Euro.
1. Internetbuchhändler: 16.95
2. Sofortkaufpreise: 18.19, 16.98, 19.97, 16.98, 18.19, 15.99, 13.79, 15.90, 15.90, 15.90,15.90, 15.90, 19.97, 17.72
3. Auktionspreise: 10.50, 12.00, 9.54, 10.55, 11.99, 9.30, 10.59, 10.50, 10.01, 11.89, 11.03,9.52, 15.49, 11.02
Zusammengefasst erhält man damit die folgenden Informationen:
Sofortkaufpreis Auktionspreisx 16.949 10.995s2 2.949 2.461s 1.717 1.569
Für die jeweiligen Verkaufspreise darf Normalverteilung unterstellt werden. Das Signifikanzni-veau sei auf fünf Prozent festgelegt.
a) Testen Sie die Hypothese, dass der mittlerere Sofortkaufpreis nicht 16.95 Euro beträgt, alsoungleich dem Preis des Internetbuchuchhändlers ist.
b) Testen Sie die Hypothese, dass der mittlere Auktionspreis weniger als 16.95 Euro beträgt,also geringer ist als der des Internetbuchhändlers.
c) Testen Sie die Hypothese, dass der mittlere Sofortkaufpreis größer als der mittlere Auktions-preis ist. Führen Sie unter der Annahme, dass beide Varianzen gleich sind, den geeignetenTest durch. (t26,0.95 = 1.712)
-58-
Übungsblatt 9 - Lösungen uniseminar.eu
Lösung:
Sei im Folgenden X : „Höhe des Sofortkaufpreises“ und Y : „Höhe des Auktionspreises“.
a) Die Hypothese, dass der mittlere Sofortkaufpreis nicht 16.95 Euro beträgt, führt zu einenzweiseitigen Test und wir erhalten:
H0 : µ = µ0 = 16.95 vs. H1 : µ 6= µ0 = 16.95
Wir haben es mit normalverteilten Zufallsvariablen zu tun. Der Erwartungswert und dieVarianz sind unbekannt. Daher nutzen wir den einfachen t-Test. Für die Realisierung derTestgröße gilt:
t =√n · x− µ0
sX=√
14 · 16.949− 16.95
1.717≈ −0.002
Die Irrtumswahrscheinlichkeit liegt bei α = 0.05, sodass wirH0 ablehnen, falls |t| > t13,0.975 =
2.16 gilt. Unser Wert |t| = 0.002 < 2.16 liegt unterhalb der Grenze 2.16, sodass H0 nichtverworfen wird.
b) Die Hypothese verändert sich zu:
H0 : µ = µ0 ≥ 16.95 vs. H1 : µ < µ0 = 16.95
Die Realisierung der Testgröße hat den Wert:
t =√n · x− µ0
sY=√
14 · 10.995− 16.95
1.569≈ −14.201
Wir betrachten einen einseitigen Test. Wegen
t = −14.201 < −1.77 = t13,0.05 = −tn−1,0.95 = tn−1,α
wird H0 verworfen. Der mittlere Auktionspreis liegt damit signifikant unter dem Festpreisdes Internetbuchhändlers.
c) Wir wenden den doppelten t-Test an, da die zwei Zufallsvariablen X und Y normalverteiltsind und unbekannte, aber sich gleichende Varianzen besitzen.
H0 : µX ≤ µY vs. H1 : µX > µY ⇔ µX − µY > 0
Nach der Vorlesung gilt für die Realisierung der Prüfgröße:
t =xX − xY
s·√
nX · nYnX + nY
-59-
Übungsblatt 9 - Lösungen uniseminar.eu
Mit der gepoolten Stichprobenvarianz
s2 =(nX − 1)s2
X + (nY − 1)s2Y
nX + nY − 2=
13 · 2.949 + 13 · 2.461
14 + 14− 2≈ 2.705
erhalten wir für t = 9.578, weswegen wir H0 verwerfen. Es gilt nämlich:
9.578 = t > tnX+nY −2,0.95 = 1.712
Die mittleren Sofortkaufpreise liegen signifikant über den mittleren Auktionspreisen.
Aufgabe 2:
Die folgende Tabelle gibt die erzielten Tore der 18 Vereine der Fußball-Bundesliga in der 1.Halbzeit bzw. in der 2. Halbzeit in der Saison 2004/2005 wieder. Diese beiden Merkmale sollenim Folgenden als normalverteilt angenommen werden.
Team 1.Halbzeit 2.HalbzeitBayern München 36 38
Schalke 04 33 24Werder Bremen 21 47
Hertha BSC Berlin 25 35VfB Stuttgart 21 31
Bayer Leverkusen 18 48Dortmund 29 20Hamburg 30 27Wolfsburg 28 22Hannover 15 20Mainz 16 35
Kaiserslautern 20 22Arminia Bielefeld 17 22
Nürnberg 19 35Mönchengladbach 17 20
Bochum 17 30Hansa Rostock 14 19
Freiburg 15 15
Führen Sie den paired t-Test durch, um zu prüfen ob sich die mittlere Anzahl der geschossenenTore in den beiden Halbzeiten unterscheiden (Signifikanzniveau: 5%).
-60-
Prüfung
enExtras
P
Prüfungen
Statistik IISommersemester 2013
München, April 2013
Inhaltsverzeichnis
Prüfung Sommersemester 2011 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Übungsprüfung Sommersemester 2012 18Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Übungsklausur von Uniseminar 1 34Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Übungsklausur von Uniseminar 2 48Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Prüfung Sommersemester 2011: Lösung uniseminar.eu
Lösungen
Aufgabe 1 (5 Punkte)
Die folgenden Multiple-Choice-Aufgaben sind jeweils durch Ankreuzen einer der beiden Ant-wortmöglichkeiten zu beantworten.
Bei korrekter Antwort gibt es einen Punkt.Ist die Antwort nicht korrekt, wird ein Punkt abgezogen.Bei keiner Antwort gibt es keinen Punkt.Eine negative Punktezahl für die gesamte Aufgabe wird auf Null gesetzt.
1. Eine Schätzung T (X) des Parameters θ heißt erwartungstreu für θ,wenn gilt: Eθ(T (X)) = θ.
Wahr/Falsch
2. Gegeben seien zwei unabhängige Zufallsvariablen X und Y. Dann giltCov(X, Y ) = 0.
Wahr/Falsch
3. Sei X ∼ N(µ, σ2 = 25). Die Länge des 95%-Konfidenzintervalls für µbei einer Stichprobe von Umfang 25 beträgt ca. 9.8.
Wahr/Falsch
4. Gegeben sei eine Zufallsvariable X mit E(X) = 2.Dann gilt E(3 ·X − 1) = 5.
Wahr/Falsch
5. Für zwei disjunkte Ereignisse mit P (A) = 0.8 und P (B) = 0.5 giltP (A ∩B) = 0.4.
Wahr/Falsch
Lösung
1. Die Aussage ist wahr. Eine Schätzung T (X) des Parameters θ heißt erwartungstreu fürθ, wenn gilt Eθ(T (X)) = θ.
2. Die Aussage ist wahr. Zwei unabhängige Zufallsvariablen X und Y sind immer auchunkorreliert, d.h. es gilt Cov(X, Y ) = 0.
-6-
Prüfung Sommersemester 2011: Lösung uniseminar.eu
Hinweis: Die Umkehrung dieser Aussage ist nicht richtig: Zwei unkorrelierte Zufallsva-riablen sind nicht notwendigerweise unabhängig.
3. Die Aussage ist falsch. Wir berechnen die Länge des 95%-Konfidenzintervall für µ beieiner Stichprobe von Umfang 25. Die Varianz σ2 der Grundgesamtheit ist bekannt, somitist das gesuchte Konfidenzintervall für µ gegeben durch:
[Iµ(X), I0(X)] = [X − z(1−α)/2 ·σ0√n,X + z(1−α)/2 ·
σ0√n
]
= [X − z0.025 ·5√25, X + z0.025 ·
5√25
]
= [X − z0.025 ·5
5, X + z0.025 ·
5
5]
= [X − z0.025, X + z0.025],
wobei z0.025 das 0.025-Quantil derN(0, 1)-Standardnormalverteilung bezeichnet. Das 0.025-Quantil z0.025 beträgt 1.96. Die Länge des 95%-Konfidenzintervall für µ ist also
z0.025 + z0.025 = 2 · z0.025 = 2 · 1.96 = 3.92 6= 9.8.
4. Die Aussage ist wahr. Bei der Berechnung des Ausdrucks, benutzen wir die Linearität desErwartungswertes. Es gilt
E(3 ·X − 1) = 3 · E(X)− 1 = 3 · 2− 1 = 5.
5. Die Aussage ist falsch. Es gilt allgemein:
P (A ∩B) = P (A) + P (B)− P (A ∪B)
Da die Ereignisse A und B disjunkt sind, gilt:
P (A ∪B) = P (A) + P (B).
Somit folgt:
P (A ∩B) = P (A) + P (B)− P (A)− P (B) = 0 6= 0.4.
-7-
Prüfung Sommersemester 2011: Lösung uniseminar.eu
Aufgabe 2 (6 Punkte)
Gegeben sind die folgenden Wahrscheinlichkeiten:
P (A) = 0.7, P (B|A) = 0.2 und P (B|A) = 0.5.
Berechnen Sie die folgenden Wahrscheinlichkeiten:
a) P (A) =
b) P (A ∪ A) =
c) P (A ∪B) =
d) P (B) =
Lösung
a) Die Wahrscheinlichkeit des zu A komplementären Ereignis A ist:
P (A) = 1− P (A) = 1− 0.7 = 0.3.
b) Die Wahrscheinlichkeit des sicheren Ereignis ist:
P (A ∪ A) = P (Ω) = 1.
c) Wir benutzen hier die bedingte Wahrscheinlichkeit:
P (A ∪B) = P (B ∪ A) = P (B|A) · P (A) = 0.2 · 0.7 = 0.14.
d) Wir benutzen hier den Satz von der totalen Wahrscheinlichkeit. A und A bilden einevollständige Zerlegung von Ω in zwei disjunkte Ereignisse. Somit gilt
P (B) = P (B|A) · P (A) + P (B|A) · P (A) = 0.2 · 0.7 + 0.5 · 0.3 = 0.14 + 0.15 = 0.29.
-8-
EExtras
Formeln
Statistik II
Sommersemester 2013
München, April 2013
Inhaltsverzeichnis
Kenngrössen der Wahrscheinlichkeitstheorie 1
Wahrscheinlichkeitsverteilungen 3
Lineare Regression 5
Schätzer und Kondenzintervalle 8
Hypothesentests 10
Tabelle der Binomialverteilung 13
Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Tabelle der Poisson-Verteilung 19
Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Tabelle der Standardnormalverteilung 23
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Quantile der Studentschen t-Verteilung 24
Quantile der F -Verteilung 25
Quantile der χ2-Verteilung 28
Hier haben wir alle wichtigen Formeln und Tabellen zur Vorlesung kurz und übersichtlich
zusammen gestellt. Zudem ndest Du die Schemas aus dem Theorieskript zu den jeweiligen
Tests. Diese helfen Dir schneller voran zu kommen und einen guten Überblick zu erhalten.
Formeln uniseminar.eu
Kenngrössen der Wahrscheinlichkeitstheorie
Kenngrösse Diskrete ZV X Stetige ZV X
Erwartungswert µX∑
xi · P (X = xi)
∫ ∞−∞
xf(x)dx
Erwartungsoperator E[g(X)]∑
g(xi) · P (X = xi)
∫ ∞−∞
g(x)f(x)dx
Varianz σ2X
∑(xi − µX)2 · P (X = xi)
∫ ∞−∞
(x− µX)2f(x)dx
Std-Abweichung σX
√σ2X
√σ2X
Quantil xα∑xj≤xα
P (X = xj) = α
∫ xα
−∞f(x)dx = α
Die Kenngrössen für Stichproben x1, . . . , xn sind leicht anders deniert:
Arithmetisches Mittel x =1
n
n∑i=1
xi
Varianz S2 =1
n− 1
n∑i=1
(xi − x)2
Std-Abweichung S =√S2
Kovarianz Cov(X, Y ) =1
n− 1
n∑i=1
(xi − x)(yi − y)
Kovarianzmatrix Cov(X) = (cij) , cij = Cov(Xi, Xj)
-1-
Formeln uniseminar.eu
Rechenregeln für Kenngrössen
Erwartungswert E(X + Y ) = E(X) + E(Y )
ist vollständig linear E(a+ b ·X) = a+ b · E(X)
Varianz Var(X + Y ) = Var(X) + Var(Y ) (falls unabhängig)
skaliert quadratisch Var(a+ b ·X) = b2 · Var(X)
Var(X + Y ) = Var(X) + Var(Y ) + 2Cov(X, Y )
Var(X) = E(X2)− E(X)2
Standardabweichung σ(X + Y ) =√σ(X)2 + σ(Y )2 (falls unabhängig)
skaliert linear σ(a+ b ·X) = |b| · σ(X)
Kovarianz Cov(X, Y ) = E(XY )− E(X) · E(Y )
skaliert linear Cov(X, Y1 + Y2) = Cov(X, Y1) + Cov(X, Y2)
in beiden Variablen Cov(X1 +X2, Y ) = Cov(X1, Y ) + Cov(X2, Y )
Kombinatorik
n-Fakultät: n! = n · (n− 1) · (n− 2) · . . . · 2 · 1 n! = n · (n− 1)!, 1! = 1, 0! = 1
Binomialkoezienten(n
k
)=
n!
k! · (n− k)!, (0 ≤ k ≤ n)
(n
0
)= 1, für k > n⇒
(n
k
)= 0
Permutationen n verschiedene Elemente n!
k aus n Elementenn!
(n− k)!
Kombinationen Möglichkeiten, n aus m Ob-
jekten zu wählen
(m
n
)=
m!
n! · (m− n)!
Bei n = n1 + · · ·+ns klassi-
zierten Objekten
(n
n1 . . . ns
)=
n!
n1! · n2! · · ·ns!
-2-
Formeln uniseminar.eu
Wahrscheinlichkeitsverteilungen
Diskrete Wahrscheinlichkeitsverteilungen
Verteilung Notation Wahrscheinlichkeit µX σ2X
Gleich U(1, . . . , n) P (X = i) =1
nfür i = 1, . . . , n
n+ 1
2
1
12(n2 − 1)
Bernoulli B(1, p) P (X = 1) = p , P (X = 0) = 1− p p p(1− p)
Binomial B(n, p) P (X = x) =
(n
x
)· px · (1− p)n−x np np(1− p)
Geometrisch G(p) P (X = k) = p · (1− p)k−1 1
p
1
p
(1
p− 1
)
Poisson Po(λ) P (X = x) =λx · e−λ
x!λ λ
Hypergeometrische Verteilung
Notation Wahrscheinlichkeit µX σ2X
X ∼ H(n,M,N) P (X = x) =
(M
x
)·(N −Mn− x
)(N
n
) n · MN
n · MN·(
1− M
N
)· N − nN − 1
Multinomialverteilung
Notation Wahrscheinlichkeit µX
X ∼M(n; p1, . . . , pk) P (X = x) =
(n!
n1! · · ·nk!
)· px11 · · · p
xkk
np1...
npk
-3-
Recommended