Upload
uniseminar
View
212
Download
0
Embed Size (px)
DESCRIPTION
Â
Citation preview
UNISEMINAR
Sem
inar
Theorie
Aufgaben
Übu
ngen
Prüfung
enExtras
Einleitung
ForschungsmethodenBachelor
St.Gallen, September 2012
Einleitung uniseminar.ch
Herzlich Willkommen bei Uniseminar
Vorwort
Ziel von Uniseminar ist es, Dich optimal auf Deine Prüfungen vorzubereiten und Deine Prü-fungsvorbereitung an der HSG so effizient wie möglich zu gestalten. Um dieses Ziel zu erreichen,haben wir ein dreiteiliges Konzept entwickelt, das sich nun mehrere Jahre als grosse Hilfe fürdie Studenten bewährt hat. Dieses besteht zum einen aus sehr umfangreichen Lernunterla-gen in Form eines Ordners, perfekt darauf abgestimmten Karteikarten und dazu passendenPrüfungsvorbereitungsseminaren am Ende des Semesters. Damit werden sämtliche Inhalte ausden Vorlesungen und Übungen in einfacher und anschaulicher Form kompakt zusammengefasst.
Gleich zu Beginn des Semesters bieten wir Dir deshalb unsere umfangreichen Lernunterlagenin Form eines Ordners und perfekt darauf abgestimmten Karteikarten an. Diese beiden Lehr-mittel solltest Du im Selbststudium bereits während des Semesters begleitend zur Vorlesungverwenden.
Am Ende des Semesters empfehlen wir Dir zur gezielten Prüfungsvorbereitung unsere Seminarezu besuchen, wo wir Dir in zehn Stunden nochmals die essentiellsten Aufgaben und Konzeptenäherbringen und Dich so optimal auf Deine Prüfungen vorbereiten. Dieser dreiteilige Ansatzermöglicht Dir mit einer ausgewogenen Mischung verschiedener auf einander abgestimmter Me-dien Deinen Lernerfolg nachhaltig zu verbessern.
-1-
Einleitung uniseminar.ch
Karteikarten
Die Karteikarten von Uniseminar decken in Kombination mit unserem Ordner den gesamtenprüfungsrelevanten Stoff ab und helfen Dir Dein theoretisches wie auch praktisches Wissen derwichtigsten Themen, Begriffe und Zusammenhänge in Forschungsmethoden prüfungsorientiertzu unterstützen. Um dies zu gewährleisten, haben wir eine Vielfalt von Fragentypen entwickelt,die Dein inhaltliches Verständnis umfassend abrunden und verbessern.
Die Karteikarten enthalten zum einen die wichtigsten Definitionen, Vorgehensweisen und For-meln. Zum anderen haben wir Dir aber auch relevante Verständnisfragen und kurze Rechen-aufgaben erstellt um Dein erlerntes Wissen selbstständig und umfassend abzufragen. Denn ander Prüfung musst Du nicht nur wichtige Formeln auswendig können, sondern die Thematikumfassend verstehen. Formeln, die an der Prüfung ausgeteilt werden oder mitgenommen wer-den dürfen, sind deshalb in den Karteikarten konsequenterweise nicht enthalten.
Ziel ist es folglich, den kompletten prüfungsrelevanten Lehrstoff in Forschungsmethoden aufmöglichst kompakte Art und Weise auf Karteikarten zusammenzufassen, sodass Du Dich inkurzer Zeit effizient auf die Prüfungen vorbereiten kannst. Lerne also gleichzeitig mit demOrdner und den Karteikarten von Uniseminar um optimal auf die Prüfungen vorbereitet zusein.
Seminare
Sämtliche Kurse von Uniseminar werden von erfahrenen Doktoranden geleitet und betreut. AlleDozenten verfügen über langjährige Unterrichtserfahrung an diversen Universitäten und wissendeshalb genau Bescheid, wo Probleme bei den Studierenden auftreten können.
Oberstes Ziel unserer Seminare ist es den prüfungsrelevanten Stoff anschaulich und verständlichin zwei vierstündigen Seminarblöcken zu vermitteln. Zuerst werden die wichtigsten mathema-tischen Grundlagen und Themen der Vorlesung besprochen, um danach auf die häufigst auftre-tenden Aufgabentypen einzugehen und geeignete Vorgehensweisen an der Prüfung zu erklären.
Während den Seminaren werden zu 30% theoretische Vorlesungsinhalte behandelt und Grund-kenntnisse erarbeitet. 70% der Zeit nehmen wir uns, um reale Prüfungsaufgaben zu bearbeitenund effiziente Prüfungsstrategien zu besprechen. Es wird somit in den Seminaren zuerst eintheoretisches Fundament gelegt, da grundlegende theoretische Kenntnisse beim Lösen von Prü-fungsaufgaben von grosser Bedeutung sind.
Es ist also unser Ziel nicht nur den prüfungsrelevanten Stoff anschaulich zu erklären, sondernauch theoretische Kenntnisse zu vermitteln, die nötig sind, um fachliche Zusammenhänge auch
-3-
Einleitung uniseminar.ch
Aufbau
Dieser Ordner soll Dir als Lernhilfe zur effizienten Prüfungsvorbereitung der Forschungsmetho-den Prüfungen dienen und umfasst 5 Teile. Wir möchten Dir im Folgenden einen Überblicküber den Aufbau des Ordners geben.
1. Theorie: Die Theorieskripte fassen in einfacher und übersichtlicher Form den gesamtenStoff des Herbstsemesters 2012/2013 zusammen und erklären diesen anhand anschaulicherBeispiele. Am Ende findest Du jeweils ein Stichwortverzeichnis, welches Dir bei allfälligenFragen schnellstmöglich Zugriff auf das erforderliche Wissen verschafft. Das Theorieskriptzum quantitativen Teil umfasst 9 Kapitel, diese werden im Seminar der Reihe nach bear-beitet. Das kleinere Skript zum qualitativen Teil umfasst drei Kapitel, die zum Teil mitdem quantitativen Teil überlappen.
2. Aufgaben: Zu allen Kapiteln in unseren Theorieskripten haben wir abgestimmte Übungs-aufgaben erstellt. Wir empfehlen Dir diese Aufgaben gleich nach den erfolgten Seminar-blöcken zu lösen, um anschliessend Fragen an unsere Dozenten stellen zu können. Diesesind gerne während den Pausen und auch nach den offiziellen Seminarstunden für Dichda, um Dir bei Deinen persönlichen Problembereichen weiterzuhelfen.
3. Übungen: In den vergangenen Jahren hat es sich gezeigt, dass die Übungsserien der Uni-versität St. Gallen (HSG) zunehmend wichtiger für das erfolgreiche Bestehen der Prüfunggeworden sind. Die Professoren haben die aktuellsten Prüfungsaufgaben vermehrt unterBerücksichtigung der Serien konzipiert. Der Grund dafür liegt darin, dass die Anwesenheitder Studenten während der Übungen sich lohnen und auszahlen soll. Aus diesem Grundhaben wir Dir sämtliche Übungsaufgaben mit ausführlichen Lösungswegen zusammenge-stellt.
4. Prüfungen: Beginne früh damit bisherige Prüfungen zu lösen, denn nur so gewinnst Dudas nötige Verständnis für deren Aufbau. Du wirst erkennen, was für die Prüfung relevantist und kannst Dich gezielt darauf vorbereiten. Dazu haben wir Dir alle verfügbaren Prü-fungen aus beiden Vorlesungsteilen mit ausführlichen Lösungswegen zusammengestellt.
5. Formeln: Die Formelsammlung stellt die wichtigen Formeln der Vorlesung sowie dasVorgehen bei den Hypothesentests übersichtlich zusammen. Nimm Dir nach dem Durch-arbeiten der Theorieskripte die Formelsammlung öfter vor, um sie zeilenweise abzulesenund die Formeln zu memorieren. Jede Formel, die im Kopf verfügbar ist und nicht wäh-rend der Prüfung nachgeschlagen werden muss, spart wertvolle Zeit. Verwende die Ta-bellen mit den Übungsaufgaben und den Musterprüfungen, um das schnelle Ablesen vonWahrscheinlichkeiten und Quantilen zu üben.
-5-
Einleitung uniseminar.ch
Vorgehensweise
Wir empfehlen Dir mit dem Ordner und den Karteikarten wie folgt schrittweise vorzugehen umeinen perfekten Lernerfolg zu erzielen:
1. Theorie: Lies als erstes ein Theoriekapitel aufmerksam durch und versuche die theoreti-schen Inhalte zu verstehen.
2. Karteikarten: Schaue Dir anschliessend die passenden Karteikarten an, welche wir Diram Ende des Theoriekapitels empfehlen und versuche die wichtigsten Punkte zu memo-rieren. Die Karteikarten runden Dein bereits erlerntes Wissen perfekt ab und zeigen Dirauf, wo du allenfalls noch Schwächen hast.
3. Aufgaben: Löse nun einige oder am besten alle unsere eigens erstellten Aufgaben passendzum soeben gelesenen Theoriekapitel komplett durch. Diese umfassen exakt den in diesemTheoriekapitel erlernten Stoff. So siehst Du gleich, an welchen Stellen Du allenfalls einTheoriekapitel nochmals gründlicher durchlesen solltest.
4. Prüfungen: Mit Deinem aktuellen theoretischen Wissensstand kannst Du nun ideal aus-gewählte Prüfungsaufgaben lösen. So siehst Du gleich was Dich an der Prüfung erwartetund kannst Dich bereits jetzt perfekt darauf einstellen. Dazu haben wir Dir am Ende vonjedem Theoriekapitel einige ausgewählte Prüfungsaufgaben zusammengestellt, die sich aufdas soeben behandelte Thema beziehen.
5. Mache eine Pause und beginne danach wieder mit einem weiteren Theoriekapitel.
-6-
Sem
inar
Theorie
Aufgaben
Übu
ngen
Prüfung
enExtras
S
Seminar
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Seminar uniseminar.ch
Ziel und Inhalt
Am Ende des Semesters empfehlen wir Dir unsere gezielten Prüfungsvorbereitungsseminare zu
besuchen. In zwei vierstündigen Seminarblöcken zeigen wir Dir dabei welche Themen für das
erfolgreiche Bestehen Deiner Prüfung essentiell sind und erarbeiten mit Dir gemeinsam effizi-
ente Strategien um die spezifischen Aufgabentypen gezielt anzugehen. Dabei wird Dir nur das
Allerwichtigste an Theorie kurz und prägnant erklärt und repetiert. Der Fokus des Seminars
liegt im Lösen alter Prüfungsaufgaben wobei wir Dir mit strukturierten Vorgehensweisen einen
zielgerichteten Ansatz aufzeigen, wie Du die Prüfung optimal lösen kannst.
Während des Seminars werden deshalb zu 30% Grundkenntnisse und theoretische Vorlesungs-
inhalte behandelt und erarbeitet. 70% der Zeit nehmen wir uns, um reale Prüfungsaufgaben zu
bearbeiten und effiziente Prüfungsstrategien zu besprechen.
Unsere erfahrenen Dozenten zeigen Dir auch wichtige Tipps und Tricks um Deine Prüfungs-
chancen zu optimieren. In den Pausen und nach Seminarende hast Du zudem die Möglichkeit,
dem Dozenten individuelle Fragen zu stellen, um letzte Unklarheiten zu beseitigen.
Seminarleitung
Sämtliche Kurse von Uniseminar werden von erfahrenen Doktoranden geleitet und betreut. Al-
le Dozenten verfügen über langjährige Unterrichtserfahrung an diversen schweizerischen und
europäischen Universitäten und wissen deshalb genau Bescheid, wo Probleme bei den Studie-
renden auftreten können. Weitere Infos zu Deinem persönlichen Seminarleiter und zu unseren
Dozenten im Allgemeinen findest Du auf unserer Webseite www.uniseminar.ch in der Rubrik
“Über uns”.
Anmeldung
Unter www.uniseminar.ch kannst Du Dich jederzeit für die Seminare anmelden.
Notizen uniseminar.ch
Theorie
Aufgaben
Übu
ngen
Prüfung
enExtras
T
Theorie (quantitativer Teil)
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Inhaltsverzeichnis
1 Grundlagen der Wahrscheinlichkeitstheorie 1
1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Wahrscheinlichkeitsbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Diskrete Wahrscheinlichkeitsverteilungen 15
2.1 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Kenngrössen diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Mehrdimensionale Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . 27
2.6 Kenngrössen mehrerer Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 30
3 Stetige Wahrscheinlichkeitsverteilungen 37
3.1 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Kenngrössen stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.4 Normalapproximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6 Lognormalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7 Die Ungleichung von Tschebyscheff . . . . . . . . . . . . . . . . . . . . . . . . . 52
4 Stichprobenverteilungen 55
4.1 Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2 Stichprobenverteilung des Mittelwerts . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3 Stichprobenverteilung des Anteilwertes . . . . . . . . . . . . . . . . . . . . . . . 61
5 Schätzungen aus Stichproben 65
5.1 Punktschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2 Konfidenzintervalle für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . 67
5.3 Konfidenzintervalle für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . 70
5.4 Konfidenzintervalle für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . 73
5.5 Bestimmung des notwendigen Stichprobenumfangs . . . . . . . . . . . . . . . . . 75
5.6 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6 Das Testen von Hypothesen 80
6.1 Einseitige und zweiseitige Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.2 Hypothesentest für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . . . 84
6.3 Hypothesentest für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . . . 86
6.4 Hypothesentest für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.5 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.6 Testentscheid mit dem p -Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.7 Fehlerarten bei Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7 Das Testen von Hypothesen, Zweistichprobentests 103
7.1 Hypothesentest für Mittelwertdifferenz mit bekannten Standardabweichungen . . 103
7.2 Hypothesentest für Mittelwertdifferenz mit unbekannten Standardabweichungen 106
7.3 Hypothesentest für Gleichheit der Anteilswerte . . . . . . . . . . . . . . . . . . . 111
7.4 Hypothesentest für Gleichheit der Varianzen . . . . . . . . . . . . . . . . . . . . 113
7.5 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8 Varianzanalyse (ANOVA) 121
8.1 Einfaktorielle Varianzanalyse (1-Weg ANOVA) . . . . . . . . . . . . . . . . . . . 121
8.2 Randomized Block Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.3 Zweifaktorielle Varianzanalyse (2-Weg ANOVA) . . . . . . . . . . . . . . . . . . 129
8.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
9 Anwendungen der χ2-Verteilung 137
9.1 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.2 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.3 Der χ2-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.4 Der χ2-Homogenitätstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
9.5 Schätz- und Testverfahren für die Varianz . . . . . . . . . . . . . . . . . . . . . 146
Stichwortverzeichnis 152
Quantitative Theorie uniseminar.ch
• Das unmögliche Ereignis ist die leere Menge
∅ = . Das unmögliche Ereignis tritt nie ein,
weil es keine Elementarereignisse enthält.
Ω
• Ω Das sichere Ereignis ist der komplette Er-
eignisraum Ω. Im Beispiel wäre Ω = r, b, g das
sichere Ereignis.
Ω
• Das zu A komplementäre Ereignis besteht aus
den Elementarereignissen, die nicht in A liegen.
Im Beispiel: Wenn A = r das Ereignis „roter
Würfel“ ist, dann ist A = b, g das Gegenteil
„nicht roter Würfel“.
ΩA
A
• Der Durchschnitt der Ereignisse A1 und A2
wird mit A1 ∩ A2 notiert, er enthält die Elemen-
tarereignisse, die sowohl in A1 als auch in A2 ent-
halten sind. Im Beispiel ist der Durchschnitt von
A = g, b und B = b dann A ∩ B = b.
ΩA1
A2
A1 ∩ A2
• Die Vereinigung von Ereignissen A1 und A2 ist
A1 ∪ A2. Das ist die Menge der Elementarereig-
nisse, die in A1 oder A2 liegen. Ist beispielsweise
A = g und B = b, dann ist A ∪ B = g, b.
ΩA1 A2
• Zwei Ereignisse A1 und A2 sind unverträglich
(oder disjunkt), falls sie kein gemeinsames Ele-
ment haben: A1 ∩ A2 = ∅. Dann können die
beiden Ereignisse nicht gleichzeitig eintreten. Im
Beispiel sind B = b und C = g disjunkt,
nicht aber B und C = b, g.
ΩA1 A2
1.2 Wahrscheinlichkeitsbegriffe
Den Begriff der Wahrscheinlichkeit kann man auf drei Arten einführen. Jede entspricht irgend-
wie unserer Vorstellung davon, wie wahrscheinlich es ist, dass ein Ereignis eintritt:
-2-
Quantitative Theorie uniseminar.ch
Mittelwert: E(X) = nπ
Varianz: Var(X) = nπ(1 − π)
Standardabweichung: σ(X) =√
nπ(1 − π)
Im folgenden Bild sieht man die Binomialverteilung B(10, 0.3). Bei dem Mittelwert 3 ist die
Wahrscheinlichkeit am grössten. Wenn der Parameter π vergrössert wird, verschieben sich die
maximalen Werte weiter nach rechts. Wenn die Anzahl Versuche erhöht wird, nähert sich die
Form einer Glocke an.
X ∼ B(10, 0.3)
x
P (X = x)
0 1 2 3 4 5 6 7 8 9 10
0.05
0.10
0.15
0.20
0.25
0.30
Beispiel
60% der HSG-Absolventen haben im letzten Jahr ehrenamtliche Arbeit verrichtet. Wählen wir
zufällig 4 Absolventen. Wie hoch ist die Wahrscheinlichkeit, dass keiner von ihnen im letzten
Jahr ehrenamtliche Arbeit verrichtet hatte? Wie hoch ist die Wahrscheinlichkeit, dass zwei oder
mehr dabei sind?
Die Zufallsvariable X (Anzahl ehrenamtlich tätiger Absolventen) ist binomialverteilt: X ∼
-22-
Quantitative Theorie uniseminar.ch
Fläche
P (a ≤ X ≤ b)
a b x
1
f(x)
Der Parameter λ (mittlere Wartezeit auf einen Erfolg) hat genau die umgekehrte Bedeutung
des Parameters µ der Poissonverteilung (mittlere Anzahl Erfolge pro Zeiteinheit). Deshalb hat
die Exponentialverteilung diese Kenngrössen:
Mittelwert: E(X) = 1λ
Varianz: Var(X) = 1λ2
Standardabweichung: σ(X) = 1λ
Die Verteilungsfunktion der Exponentialverteilung ist besonders einfach und wird deshalb nicht
tabelliert:
F (x) = 1 − e−λx
Beispiel
Im Mittel wartet man an einer Kasse am Supermarkt 2 Minuten, angenommen die Wartezeit
ist exponentialverteilt (mit Wartezeit im Mittel λ = 2). Dann ist die Wahrscheinlichkeit, 3 oder
mehr Minuten zu warten
P (X ≥ 3) = 1 − P (X < 3) = 1 − F (3) = 1 − (1 − e−2·3) = e−6 = 0.0025 .
-49-
Quantitative Theorie uniseminar.ch
3.6 Lognormalverteilung
Die Zufallsvariable X heisst lognormalverteilt, wenn die Zufallsvariable Y = ln(X) normal-
verteilt ist mit Y ∼ N(µY , σY ). Diese Verteilung hängt von zwei Parametern ab. Wir müssen
hier aber unterscheiden zwischen den Parametern für X und Y :
• µY ist der Erwartungswert von Y und
• σY ist die Standardabweichung von Y .
Zu einer Lognormalverteilung mit diesen Parametern gehört die Dichtefunktion
f(x) =1
x· 1
σY
√2π
e− 1
2
“
ln(x)−µYσY
”2
σY = 1 σY → 0f(x)
x
Sie besitzt die folgenden Kenngrössen:
Mittelwert: E(X) = eµY +σ2
Y2
Varianz: Var(X) = e2(µY +σ2Y ) − e2µY +σ2
Y
Standardabweichung: σ(X) =√
Var(X)
Insbesondere darf man die Kenngrössen für Y nicht einfach auf X umrechnen wie bei der
Standardisierung. Bei der Berechnung der Wahrscheinlichkeiten darf man aber wie bei der
Standardisierung vorgehen, indem man die Umformung (hier: Logarithmus ziehen) auf alle
Seiten der Ungleichung durchführt:
• P (X ≤ b) = P (eY ≤ b) = P (Y ≤ ln b) = Φ(
ln b−µY
σY
)
;
-50-
Quantitative Theorie uniseminar.ch
Normalverteilung Lognormalverteilung
Anwendung als Modell für Zufallsvariablen, Anwendung als Modell für Zufallsvariablen,
die sowohl positive als auch negative Werte die nur positive Werte annehmen können
annehmen können (Bsp. Renditen) (Bsp. Aktienkurse)
Geeignet für Daten mit einer Geeignet für Daten mit einer
symmetrischen Verteilung schiefen Verteilung
Verteilungsfunktion symmetrisch Verteilungsfunktion asymmetrisch
Die nichtsymmetrische Lognormalverteilung ist links steiler als die Normalverteilung
⇒ der Erwartungswert der Lognormalverteilung ist grösser als der transformierte der
Normalverteilung: E(X) = eµY +σ2
Y2 > eµY
Wenn σ2Y ≈ 0 ⇒ Gestalt der Lognormalverteilung und Normalverteilung wird ähnlich.
3.7 Die Ungleichung von Tschebyscheff
Bei den hier vorgestellten Verteilungen konzentriert sich die Wahrscheinlichkeitsmasse (also die
Fläche unter der Dichtefunktion) um den Mittelwert µ der Verteilung. Das ist zwar nicht bei
jeder Verteilung der Fall, aber es gibt eine Grenze, wie weit sich der Grossteil der Wahrschein-
lichkeitsmasse vom Mittelwert höchstens entfernen kann. Sie hängt nur von der Standardab-
weichung ab und gilt für alle Verteilungen (stetig und diskret) und damit für alle möglichen
Zufallsvariablen. Die Ungleichung von Tschebyscheff1 besagt, dass für alle k ≥ 1 gilt:
P (µ − kσ ≤ X ≤ µ + kσ) ≥ 1 − 1
k2.
Oder in Worten: Die Wahrscheinlichkeitsmasse, die vom Mittelwert um mehr als kσ entfernt
ist, beträgt höchstens 1k2 .
1Der Name wird eigentlich kyrillisch geschrieben, und hat mehrere mögliche Übersetzungen in lateinischeBuchstaben wie beispielsweise Tschebyschow oder Chebyshev.
-52-
Quantitative Theorie uniseminar.ch
6.5 Überblick
Hypothesentest I,
eine Stichprobe,
ein Parameter
Mittelwert, µ Anteilswert, π
σ bekannt σ unbekanntIst nπ ≥ 5 und
n(1 − π) ≥ 5?
Ist n ≥ 30?
Ja Nein Ja Nein
Ist die Population
wirklich oder
approximativ
normalverteilt?
Ist die Population
wirklich oder
approximativ
normalverteilt?
Nein Nein
Ist n ≥ 30?
Ja Nein Ja
z -Test
z = x−µ0
σ
√n
wobei
µ0 ist von H0
t -Test
t = x−µ0
s
√n
wobei
df = n − 1µ0 ist von H0
z -Test
z = p−π0
σp
wobei
σp =
√π0(1−π0)
n
π0 ist von H0
z -Test
z = x−µ0
s
√n
wobei
µ0 ist von H0
-91-
Theorie (qualitativer Teil)
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Inhaltsverzeichnis
1 Einleitung - Qualitativer Teil 1
1.1 Business Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Deskriptive und induktive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Sozialforschung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Kausalität und Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Statistische Hilfsmittel 9
2.1 Darstellung von Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Statistische Beschreibung von Daten . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Zusammenhangsmass . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4 Datenerfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Regressionsanalyse 35
3.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Einfache lineare Regression: Idee . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Vorgehen: Schätzer für β1 und β2 . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Qualität des Modells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Statistische Tests für Signifikanz . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6 Konfidenzintervalle für β1 und β2 . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.7 F -Tests für das ganze Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.8 Überprüfen der Modellannahmen . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.9 Multiple Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Stichwortverzeichnis 69
Qualitative Theorie uniseminar.ch
Abbildung 1: Durchschnittliches pro Kopf Monatseinkommen in USD gegliedert nach den 50
Bundesstaaten plus Washington DC (aus dem Jahre 1970). Quelle: Anscombe, F. J. (1981)
Computing in Statistical Science Through APL. Springer-Verlag.
Wir können also ablesen, dass das durchschnittliche pro Kopf Monatseinkommen zwischen USD
3’000 und USD 3’500 liegt.
Im Zusammenhang mit einem Histogramm spricht man oft auch von der kumulierten Häufig-
keitsverteilung. Wir betrachten dazu nicht jede Klasse einzeln, sondern sind lediglich daran
interessiert, wie viele Datenpunkte kleiner als eine bestimmte Beobachtungsklasse sind. Folg-
lich addieren wir zu den in der uns interessierenden Klasse liegenden Datenpunkte die Anzahl
Datenpunkte in den links davon liegenden Klassen hinzu, und teilen diese Zahl durch die Ge-
samtzahl aller erhobenen Datenpunkte. In unserem Beispiel mit dem Einkommen der jeweiligen
Bundesstaaten kann man mit dieser kumulierten Häufigkeit zum Beispiel aussagen, wie wahr-
scheinlich es ist, dass man in den USA weniger oder gleich USD 3’000 verdient. Wir summieren
dazu die Anzahl der Datenpunkte in den Klassen von 2000 bis 3000 zusammen und teilen durch
die gesamte Anzahl der vorhandenen Datenpunkte. Da gemäss Diagramm ungefähr 18 von 51
-11-
Qualitative Theorie uniseminar.ch
Abbildung 10: Verschiedene mögliche Abhängigkeiten von zwei verschiedenenen Variablen.
-28-
Qualitative Theorie uniseminar.ch
Abbildung 14: Einfache Lineare Regression: Darstellung der Regressionsgeraden mit einem
Punkt aus dem Datensatz. yi: beobachteter Wert, yi: geschätzter Wert auf der Gerade.
Abbildung 14 zeigt uns die Situation, wenn wir nur ein Datenpaar unserer Beobachtungen be-
trachten. Der Punkt P (xi, yi) stellt unsere gemachte Beobachtung dar. Wir nehmen nun an,
dass wir bereits eine gute Schätzung für den Achsenabschnitt β1 und die Steigung β2 unseres
Modells aus (1) gefunden haben. Diese Schätzungen haben wir auf Grund unserer Daten ge-
macht. Wir bezeichnen diese Schätzungen jeweils mit β1 und β2 (das Hut-Symbol ˆ steht in
der Statistik immer dafür, dass ein wahrer Wert a durch a geschätzt wurde). Wir können also
nun berechnen, welchen Wert wir für yi erhalten hätten, falls wir diesen durch unsere gewählte
Gerade geschätzt hätten. Wir bestimmen dazu den Wert von xi auf unserer Regressionsgerade:
yi = β1 + β2 · xi
Für x-Werte, zu welchen wir keine y Beobachtung haben, ist dies genau die lineare Pro-
gnose gemäss unserem Modell. Im Beispiel mit den Filialen fragen wir uns also, was für einen
Jahresumsatz wir von einer neuen Filiale erwarten können, wenn wir die Verkaufsfläche kennen.
Der Punkt Q(xi, yi) liegt nun also auf unserer Regressionsgerade und wir können die Distanz
zwischen P und Q betrachten. Wir bezeichnen diese Distanz durch:
ei = yi − yi ist die Fehlerabweichung oder das Residuum, welche durch die Schätzung
-42-
Qualitative Theorie uniseminar.ch
für die statistische Auswertung der Regressionsanalyse ist dieser jedoch irrelevant.
3.4 Qualität des Modells
Wir wenden uns im Folgenden der Qualität unseres linearen Modells zu. Wir fragen uns,
wie genau unsere geschätzten Werte yi sind und somit auch, welche Genauigkeit wir für eine
Prognose erwarten können. Dazu rufen wir uns die statistischen Hilfsmittel der Lage- und
Streuparameter in Erinnerung (siehe Abschnitt 2.2). Wir betrachten den Lageparameter y der
wahren Werte, um so die Streuung der Daten zu betrachten. Für jeden Wert yi müssen wir mit
unserem Modell die Abweichung vom Mittelwert yi− y erklären. Betrachten wir dazu wiederum
die Situation für ein Datenpaar (xi, yi):
Abbildung 16: Zerlegung der Abweichung
Wir betrachten in der Abbildung 16 drei verschiedenene Arten von Abweichungen:
• die zu erklärende Abweichung yi − y,
• die durch unser Modell erklärte Abweichung yi − y,
• sowie die durch unser Modell nicht erklärte Abweichung yi − yi.
-46-
Qualitative Theorie uniseminar.ch
Werte β1 und β2 als „realistic Case“ und die oberen Grenzen als „best case“ Szenario.
Wenn wir also z.B. annehmen, dass 1′000m2 zusätzliche Verkaufsfläche zu einem Kostenanstieg
von 5 Mio. führen, gleicht das erwartete Jahresumsatzplus von 4.563 Mio. im Worst Case die
zusätzlichen Kosten nicht aus. Im Realistic und Best Case ist jedoch ein Umsatzplus zu erwar-
ten, das grösser ist als die zusätzlichen Kosten. Graphisch können wir diese Szenarien durch
Einzeichnen von zwei weiteren Geraden in unserem Regressionsmodell darstellen. Die beiden
neuen Geraden haben jeweils den gleichen Achsenabschnitt β1 wie unsere Regressionsgerade,
jedoch die beiden Grenzen des Konfidenzintervalles für β2 als Steigung:
Abbildung 21: Ein 95% Konfidenzintervall für die Steigung der Regressionsgerade
-60-
Stichwortverzeichnis uniseminar.ch
StichwortverzeichnisF -Test, 61
R2 angepasst, 65
R2-Koeffizient, 48
Ablehnbereich, 52
Abweichung
erklärte, 46
nicht erklärte, 46
zu erklärened, 46
Achsenabschnitt, 44, 55
Alternativhypothese, 52
Annahmebereich, 52
Autokorrelation, 63
Balkendiagramm, 12
Befragung
einmalig, 31
mündlich, 31
Panel, 31
schriftlich, 31
telefonisch, 31
Befragungstechnik, 31
Beibehaltungsbereich, 52
Beobachtungs-Studien, 32
bias, 32
Boxplot, 14
Business Statistics, 1
Census, 3
Conjointanalyse, 7
Datenerfassung, 30
Dezil, 22
Dichtefunktion, 23
Diskriminantanalyse, 7
Empirisches Signifikanzniveau, 57
Fehlerabweichung, 42
Geschichtete Stichprobe, 34
Grundgleichung, 47
Häufigkeit
absolut, 10
relativ, 10
Häufigkeitsverteilung
kumuliert, 11
Heteroskedastie, 63
Histogramm, 9
Homoskedastie, 38
Hypothese, 5
Interpretation der Regressionsgeraden, 45
Interquartile Range, 22
Intervallskala, 7
IQR, 22
Kausalität, 8
Klasse, 10
Klassenbreite, 10
Klassengrenzen, 10
Klumpenverfahren, 33
Konfidenzintervall, 59
Kontingenzanalyse, 7
Konzentrationsverfahren, 34
Korrelation, 8
-69-
Aufgaben
Übu
ngen
Prüfung
enExtras
A
Aufgaben
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Inhaltsverzeichnis
1 Grundlagen der Wahrscheinlichkeitstheorie 1
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Diskrete Wahrscheinlichkeitsverteilungen 9
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Stetige Wahrscheinlichkeitsverteilungen 16
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 Stichprobenverteilungen 24
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
5 Schätzungen aus Stichproben 29
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6 Das Testen von Hypothesen 37
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
7 Das Testen von Hypothesen, Zweistichprobentests 45
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
8 Varianzanalyse (ANOVA) 52
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
9 Anwendungen χ2-Verteilung 63
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Varianzanalyse (ANOVA): Aufgaben uniseminar.ch
8 Varianzanalyse (ANOVA)
Aufgabe 27: Konzept der einfaktoriellen Varianzanalyse
Eine Universitätspräsidentin untersucht die Anzahl der Fehltage des letzten akademischen
Jahres. Hierzu wählt sie zufällig 6 ProfessorInnen der Ingenieurwissenschaften, 9 ProfessorInnen
der Wirtschaftswissenschaften und 8 ProfessorInnen der Kunstwissenschaften aus.
1. Handelt es sich hierbei um ein konstruiertes Experiment?
(Bei einem konstruierten Experiment werden den Testobjekten die Stufen des Faktors
(treatments) zufällig zugeordnet.)
2. Identifizieren Sie die abhängige und die unabhängige Variablen des Experiments. Geben
Sie jeweils an, ob die Variable quantitativ oder qualitativ ist.
Aufgabe 28: Einfaktorielle Varianzanalyse
Betrachten Sie das Experiment aus der vorigen Aufgabe. Wie lautet eine geeignete Nullhypo-
these, um mit einer einfaktoriellen Varianzanalyse die Daten zu analysieren? Welche Schlussfol-
gerung wird bei den nachfolgenden Daten bei einem Signifikanzniveau von 5% gezogen? Welche
Abschätzung für den p-Wert können Sie anhand der Tabellen für die F -Verteilung geben?
Ing.-Wiss. Wi.-Wiss. Kunstwiss.
9 4 11
10 5 10
6 6 10
8 7 9
4 7 7
8 6 5
8 13
8 7
3
Fehltage von ProfessorInnen der Fachrichtungen
-50-
Varianzanalyse (ANOVA): Lösungen uniseminar.ch
Variation Quadratsumme Freiheitsg. mittl. Quadrats. F -Wert
Faktor SSTR = 38.152 2 MSTR = 19.076 F = 4.080
Rest SSE = 93.500 20 MSE = 4.675
Total SST = 131.652 22
Der kritische Wert der F -Verteilung für ν1 = dfZähler = 2, ν2 = dfNenner = 20 und α = 0.05
ist laut Tabelle Fα = 3.49. Wegen F = 4.080 > 3.49 = Fα wird die Nullhypothese verworfen,
d.h. es ist ein signifikanter Unterschied für die mittlere Anzahl der Fehltage zwischen den
ProfessorInnen der unterschiedlichen Fachbereiche nachweisbar.
Die kritischen Werte der F -Verteilung zu den Signifikanzniveaus α = 0.025 und α = 0.01 sind
laut Tabelle F0.025 = 4.46 und F0.01 = 5.85. Wegen F0.05 < F < F0.025 lässt sich daraus die
Abschätzung herleiten, dass der p-Wert des Tests zwischen 0.025 und 0.05 liegen muss.
Aufgabe 29: Randomized Block Design
Bei einem Randomized Block Design gibt es drei Einkommensklassen als Blöcke. Es wurden
Personen jedes Blocks zufällig zwei verschiedenen Stufen eines Faktors zugeordnet. Untersuchen
Sie anhand der vorliegenden Daten, ob ein signifikanter Einfluss des Faktors vorliegt (α = 0.01).
Liegt ein signifikanter Einfluss der Blockvariable vor (α = 0.01)?
Block Stufe 1 Stufe 2
A 46 31
B 37 26
C 44 35
Lösung:
Es liegen t = 2 Stichproben vor, und in jeder Stichprobe gibt es n = 3 gruppierte Beobachtun-
gen.
1. Um den Einfluss des Faktors zu untersuchen betrachten wir die Hypothesen
-55-
Varianzanalyse (ANOVA): Lösungen uniseminar.ch
Wir führen eine zweifaktorielle Varianzanalyse gemäss dem Vorgehen im Theorieskript durch.
Wir haben k = 2 Stufen von Faktor A und p = 3 Stufen von Faktor B, ferner n = 2 Beobach-
tungen je Faktorkombination. Die Mittelwerttabelle lautet:
Faktor B
1 2 3
Faktor A 1 11.5 17 18 x1,•,• = 15.5
2 15 20.5 16.5 x2,•,• = 17.33
x•,1,• = 13.25 x•,2,• = 18.75 x•,3,• = 17.25 x•,•,• = 16.42
Für die Quadratsummen ergibt sich hieraus
SSA = 3 · 2 ·((15.5 − 16.42)2 + (17.33 − 16.42)2
)= 10.08
SSB = 2 · 2 ·((13.25 − 16.42)2 + (18.75 − 16.42)2 + (17.25 − 16.42)2
)= 64.67
SSAB = 2 ·((11.5 − 15.5 − 18.75 + 16.42)2 + . . .
)= 16.67
SST = (13 − 16.42)2 + (10 − 16.42)2 + · · ·+ (17 − 16.42)2 = 110.92 ,
also ist SSE = SST − SSA − SSB − SSAB = 110.92 − 10.08 − 64.67 − 16.67 = 19.5.
Die mittleren Quadratsummen lauten
MSA =10.08
1= 10.08 , MSB =
64.67
2= 32.33 , MSAB =
16.67
1 · 2 = 8.33
und MSE =19.5
2 · 3 · 1 = 3.25. Damit sind die Testgrössen
FA =MSAMSE
=10.08
3.25= 3.10 , FB =
MSBMSE
=32.33
3.25= 9.95 ,
FAB =MSABMSE
=8.33
3.25= 2.56 .
Zusammenfassung der Ergebnisse in der ANOVA-Tabelle:
-59-
Anwendungen χ2-Verteilung: Aufgaben uniseminar.ch
9 Anwendungen χ2-Verteilung
Aufgabe 31: Der χ2-Anpassungstest
Anhand von Stichprobendaten soll folgende Nullhypothese
H0 : es liegt eine Normalverteilung mit Mittelwert µ = 120 vor
überprüft werden. Dazu werden die Daten in 8 Kategorien eingeteilt.
1. Wie viele Freiheitsgrade gehören zum entsprechenden χ2-Anpassungstest?
2. Was ist der kritische Wert der χ2-Verteilung zum Signifikanzniveau α = 0.05?
3. Welche Schlussfolgerung wird bei einer Testgrösse von 11.25 gezogen?
Aufgabe 32: Der χ2-Anpassungstest
Bei einer Studie zum Fahrzeugbesitz ergab eine Stichprobe von 100 zufällig gewählten Haus-
halten einer US-amerikanischen Kleinstadt die folgende Häufigkeitstabelle:
Anzahl Fahrzeuge Anzahl Haushalte
0 20
1 35
2 23
≥ 3 22
Testen Sie zum Signifikanzniveau α = 0.05, ob die Grundgesamtheit einer Poisson-Verteilung
mit Parameter µ = 1.5 folgt.
Aufgabe 33: Der χ2-Unabhängigkeitstest
In einer Studie wurde bei 100 Kunden verschiedener Altersstufen die Art und Weise beobachtet,
wie diese beim Eingang eines grossen Discounters begrüsst werden. Die folgende Tabelle zeigt
das Ergebnis:
-61-
Übu
ngen
Prüfung
enExtras
Ü
Übungen
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Inhaltsverzeichnis
1 Statistische Masszahlen 1
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Einführung in die Wahrscheinlichkeitsrechnung 6
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Diskrete Wahrscheinlichkeitsverteilungen 19
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4 Stetige Wahrscheinlichkeitsverteilungen 24
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5 Stichprobenverteilungen 31
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6 Schätzungen aus Stichproben 38
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
7 Hypothesentests I und II 47
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
8 Varianzanalyse (ANOVA) 68
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
9 Anwendungen der χ2-Verteilung 75
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Statistische Masszahlen: Lösungen uniseminar.ch
Lösungen: Statistische Masszahlen
Aufgabe 1: Lage- und Streuparameter
Der folgende Datensatz zeige eine repräsentative Auswahl der Monatseinkommen von Saison-
arbeitskräften (bereits der Grösse nach geordnet). Ermitteln Sie Median, die Quartile sowie das
erste Dezil.
2’200 2’200 2’269 2’286 2’302 2’308 2’335 2’344 2’353 2’375
2’467 2’502 2’507 2’534 2’562 2’572 2’598 2’600 2’606 2’614
2’669 2’678 2’691 2’706 2’708 2’712 2’770 2’791 2’798 2’826
2’827 2’858 2’867 2’873 2’876 2’905 2’969 2’978 2’989 2’996
3’000 3’007 3’020 3’200 3’229 3’252 3’506 3’506 3’582 3’609
Zeichnen Sie ferner die (empirische) Verteilungsfunktion, einen Boxplot sowie das Histogramm.
Lösung:
Median ist der Wert, der sich in der Mitte aller Daten befindet, d.h. es sind genau so viele
Daten grösser wie kleiner als der Median, je 50%. Der Median ist das 12· (n+1) = 25.5-te
Element der sortierten Daten. Da dies keine ganze Zahl ist, nehmen wir entsprechend der
Nachkommazahl je 50% der umgebenden Werte x[25] und x[26]:
Median = x[ 1
2·(n+1)] = x[25.50] = 0.50 · x[25] + 0.50 · x[26] = 0.50 · 2′708 + 0.50 · 2′712 = 2′710.
Quartile Q1, Q2 und Q3 teilen die Wertemenge in vier gleich grosse Teilmengen ein. Sie be-
finden sich also an den Stellen 14· (n+1), 2
4· (n+1) und 3
4· (n+1) in der Datenfolge. Das
erste Dezil grenzt das erste Zehntel der Datenmenge ab und befindet sich somit an der
Stelle 110
· (n + 1). Falls diese Stellen nicht ganzzahlig sind, dann müssen den Nachkom-
mastellen entsprechende Prozentsätze der nächstgrösseren und -kleineren Datenelemente
genommen werden:
Q1 = x[ 1
4·(n+1)] = x[12.75] = 0.25 · x[12] + 0.75 · x[13] = 0.25 · 2′502 + 0.75 · 2′507 = 2′505.75.
Q2 = x[ 2
4·(n+1)] = x[25.50] = Median = 2′710.
Q3 = x[ 3
4·(n+1)] = x[38.25] = 0.75 · x[38] + 0.25 · x[39] = 0.75 · 2′978 + 0.25 · 2′989 = 2′980.75.
D1 = x[ 1
10·(n+1)] = x[5.10] = 0.90 · x[5] + 0.10 · x[6] = 0.90 · 2′302 + 0.10 · 2′308 = 2′302.6.
-2-
Statistische Masszahlen: Lösungen uniseminar.ch
Hier wurden die Werte der Tabelle entnommen:
2’200 2’200 2’269 2’286 2′302 2′308 2’335 2’344 2’353 2’375
2’467 2′502 2′507 2’534 2’562 2’572 2’598 2’600 2’606 2’614
2’669 2’678 2’691 2’706 2′708 2′712 2’770 2’791 2’798 2’826
2’827 2’858 2’867 2’873 2’876 2’905 2’969 2′978 2′989 2’996
3’000 3’007 3’020 3’200 3’229 3’252 3’506 3’506 3’582 3’609
Empirische Verteilungsfunktion:
2500 3000 3500
0.00.2
0.40.6
0.81.0
Empirische Verteilungsfunktion
x
Fn(x)
Boxplot:
22
00
24
00
26
00
28
00
30
00
32
00
34
00
36
00
Boxplot
Histogramm:
-3-
Statistische Masszahlen: Lösungen uniseminar.ch
Einkommen
Anzah
l
2000 2500 3000 3500 4000
02
46
810
12
Aufgabe 2: Mittelwert und Standardabweichung
Während der letztjährigen Olma-Messe führte die St. Galler Kantonspolizei verstärkt Alko-
holkontrollen bei Autofahrern rund um das Messegeländer durch. Bei 25 Autofahrern wurden
folgende Werte gemessen:
0.00% 0.08% 0.15% 0.18% 0.02%
0.04% 0.00% 0.03% 0.11% 0.17%
0.05% 0.21% 0.01% 0.10% 0.19%
0.00% 0.09% 0.05% 0.03% 0.00%
0.03% 0.00% 0.16% 0.04% 0.10%
1. Bestimmen Sie den Mittelwert und die Standardabweichung für diese Stichprobe.
2. Bestimmen Sie mit Hilfe der Ungleichung von Tschebyscheff den (theoretischen) Min-
destanteil an Beobachtungen, der innerhalb k = 1.50 Standardabweichungen rund
um den Mittelwert fällt. Unterstützen die Ergebnisse der Stichprobe die Aussage der
Tschebyscheff-Ungleichung?
Lösung:
1. Der Stichprobenmittelwert ist das arithmetische Mittel der Daten:
x =
n∑
i=1
xi
n=
0.00
25+
0.08
25+
0.15
25+ · · ·+ 0.04
25+
0.10
25=
1.84
25= 0.0736%
-4-
Hypothesentests I und II: Aufgaben uniseminar.ch
Universität Anzahl der befragten Anzahl der Anteil der
Personen ni Anhänger Anhänger pi
Bern 1’200 672 0.56
HSG 900 549 0.61
Prüfen Sie, ob ein Unterschied im Anteil der Befürworter fortschrittlicher Zahlungmittel an der
beiden Unis besteht (Signifikanzniveau α = 0.05).
Aufgabe 35: Test, Varianzen
Die Firma T-fix verpackt Tee zu 100 g-Packungen. Tee hat die unangenehme Eigenschaft, je
nach Luftfeuchtigkeit mehr oder weniger in seinem Gewicht zu schwanken. Eine Stichprobe
ergab folgende Packungsgewichte (in g):
100.3 99.9 102.0 98.7 103.2 101.1 100.8 99.2
98.7 100.5 100.1 97.9 101.3 100.1 98.2 101.2
Arithmetisches Mittel dieser Stichprobe: 100.2, Stichprobenvarianz: 2.04.
(a) Wenn man die Grundgesamtheit als normalverteilt ansieht, kann man die Nullhypothese,
dass das mittlere Packungsgewicht 100 g beträgt zum Niveau α = 0.05 verwerfen?
(b) Nach der Beschaffung einer neuen Abfüllanlage ermittelt man in einer einfachen Zufall-
stichprobe folgende Packungsgewichte (in g):
99.9 100.3 100.2 100.0 100.5 100.0
100.1 99.5 100.2 100.4 99.6 101.1
Testen Sie H0 : σ21 ≤ σ2
2 vs. H1 : σ21 > σ2
2 zum Niveau α = 0.05.
-50-
Prüfung
enExtras
P
Prüfungen
ForschungsmethodenBachelor
St.Gallen, September 2012
Inhaltsverzeichnis
Quantitativer Teil 1
Prüfung (Quantitativ) Wintersemester 2004/05 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Prüfung (Quantitativ) Wintersemester 2005/06 10Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Nachhol-Prüfung (Quantitativ) Wintersemester 2005/06 21Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Prüfung (Quantitativ) Wintersemester 2006/07 33Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Nachhol-Prüfung (Quantitativ) Wintersemester 2006/07 40Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Prüfung (Quantitativ) Herbstsemester 2007 50Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Nachhol-Prüfung (Quantitativ) Herbstsemester 2007 62Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Prüfung (Quantitativ) Herbstsemester 2008 72Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Nachhol-Prüfung (Quantitativ) Herbstsemester 2008 84Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Prüfung (Quantitativ) Herbstsemester 2009 92Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Nachhol-Prüfung (Quantitativ) Herbstsemester 2009 104Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Prüfung (Quantitativ) Herbstsemester 2010 116Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Nachhol-Prüfung (Quantitativ) Herbstsemester 2010 129Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Prüfung (Quantitativ) Herbstsemester 2011 144Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Nachhol-Prüfung (Quantitativ) Herbstsemester 2011 152Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Testprüfung (Quantitativ) 163Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
Qualitativer Teil 171
Prüfung (Qualitativ) Wintersemester 2005/06 171Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Prüfung (Qualitativ) Wintersemester 2006/07 177Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Prüfung (Qualitativ) Herbstsemester 2007 183Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Prüfung (Qualitativ) Herbstsemester 2008 190Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
Prüfung (Qualitativ) Herbstsemester 2009 196Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
Prüfung (Qualitativ) Herbstsemester 2010 202Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
Prüfung (Qualitativ) Herbstsemester 2011 208Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
Lösungsvorschläge für Verständnisfragen 215
Prüfung (Quantitativ) Wintersemester 2004/05: Lösung uniseminar.ch
2. (14 P.) Angenommen, die Tagesrenditen des Dow Jones seien approximativ normalver-teilt. Bestimmen Sie ein 90%-Konfidenzintervall auf Basis der 10 realisiertenTagesrenditen vom 26.10.-08.11.2004.Begründen Sie ausführlich Ihr Vorgehen.
Lösung:Wir gehen analog zur ersten Teilaufgabe - oder der Theorie zu den Konfidenzintervallen - vor.Hier müssen wir aufpassen, denn die Varianz der Stichprobe ist nicht gegeben. Wir müsen diesedurch die Stichprobenvarianz s2 zuerst schätzen. Wenn wir jedoch mit dieser geschätzten Grössearbeiten, ist
√n(x−µ)s
∼ tn−1 also t verteilt mit n− 1 Freiheitsgrade df . In diesem Fall ist n = 10
also df = 9. Zuerst berechnen wir s2 durch:
s2 =1
n− 1
n∑i=1
x2i −
1
n
(n∑i=1
xi
)2 (1)
Dazu brauchen wir die Daten:
Tagesrenditexi x2
i
26.10.2004 0.38% 0.1444%27.10.2004 0.84% 0.7056%28.10.2004 0.73% 0.5329%29.10.2004 -0.94% 0.8836%01.11.2004 1.10% 1.2100%02.11.2004 1.18% 1.3924%03.11.2004 0.96% 0.9216%04.11.2004 0.20% 0.0400%05.11.2004 1.23% 1.5129%08.11.2004 -0.28% 0.0784%Total: 5.4% 7.4218%
Mit Hilfe dieser Hilfsrechnung können wir nun gemäss (1) s2 berechnen:
s2 =1
10− 1
(7.4218− 1
10(5.4)2
)= 0.5006
Also ist s =√
0.5006 = 0.7075.
-4-
Prüfung (Quantitativ) Herbstsemester 2008: Lösung uniseminar.ch
xu = −3− 2.262 · 2.91√10
= −5.08
Das Konfidenzintervall für x ist also gegeben durch [−0.921,−5.08]
2. (5 P) Testen Sie auf einem Signifikanzniveau von α = 0.05, ob die Kur tatsächlichzu einem Gewichtsverlust geführt hat. Tragen sie näherungsweise den kritischenBereich sowie die Prüfgrösse und deren p-Wert graphisch ein.
Lösung:Wir testen also, ob die Kur zu einem Gewichtsverlust führt. Dazu stellen wir die Hypotheseauf, dass die Kur nicht hilft, denn dies wollen wir verwerfen:
H0 : µ > µ0 = 0
H1 : µ ≤ µ0 = 0
Es handelt sich also um einen linksseitigen Test für den Mittelwert mit unbekannter Varianz.Also um einen t-Test. Die Teststatistik berechnet sich aus:
t =x− µ0
s√n
=−3
0.919= −3.264
Der kritischeWert tc für einen linksseitigen Test erhalten wieder aus der Tabelle der t-Verteilung.Es gilt tc = t0.05,9 = 1.833. Da nun t = −3.264 < −1.833 = −tc verwerfen wir die Nullhypotheseauf dem Niveau α = 0.05. Die Kur hat also einen signifikanten Effekt.
-79-
Prüfung (Quantitativ) Herbstsemester 2010: Lösung uniseminar.ch
Toranzahl i 5 6 7 8 9 ≥ 10
P (X = i) 0.1163 0.0628 0.0290 0.0117 0.0042 0.0019
Wir interpretieren jetzt die Wahrscheinlichkeiten als relative Häufigkeiten der i-ten Klasse vonErgebnissen. Zu den unter H0 erwarteten absoluten Häufigkeiten Ek kommt man durch Multi-plikation der Wahrscheinlichkeiten mit der Stichprobenzahl n = 76. Bei den erwarteten Häu-figkeiten entstehen Nachkommastellen, wir dürfen sie aber nicht zu ganzen Zahlen runden:
Toranzahl i 0 1 2 3 4P (X = i) 0.0393 0.1272 0.2058 0.2221 0.1797
Ei 2.9868 9.6672 15.6408 16.8796 13.6572
Toranzahl i 5 6 7 8 9 ≥ 10
P (X = i) 0.1163 0.0628 0.0290 0.0117 0.0042 0.0019Ei 8.8388 4.7728 2.2040 0.8892 0.3192 0.1444
Es gibt Klassen, deren erwartete Häufigkeit unter der Grenze 5 liegt, also müssen wir dieKlassen neu einteilen, Wir fassen die Klassen i = 0, 1 sowie die Klassen i = 6, 7, 8, 9,≥ 10
jeweils zusammen, um E ≥ 5 für alle Klassen zu erreichen. Die Kenngrössen für die neuenKlassen entstehen durch Addieren der Werte aus den Teilklassen:
E0,1 = E0 + E1 = 12.654 , O0,1 = O0 +O1 = 12 .
Für die zweite neue Klasse gilt
E≥6 = E6 + E7 + E8 + E9 + E≥10 = 8.3296 , O≥6 = O6 +O7 +O8 +O9 +O≥10 = 8 .
Für die neuen Klasseneinteilung stellen wird die erwarteten Häufigkeiten Ei den beobachtetenHäufigkeiten Oi gegenüber:
Toranzahl i 0,1 2 3 4 5 ≥ 6
Ei 12.6540 15.6408 16.8796 13.6572 8.8388 8.3296Oi 12 15 20 12 9 8
Die Ei unterscheiden sich von den Oi, aber ob der Unterschied signifikant gegen H0 sprichtkönnen wir erst entscheiden, nachdem wir die standardisierte Testgrösse berechnet haben. Beiden χ2-Tests ist das der Wert
χ2 =∑i
(Oi − Ei)2
Ei∼ χ2
df .
-127-
Prüfung (Qualitativ) Wintersemester 2005/06: Lösung uniseminar.ch
Lösung
Aufgabe 1
Die Globale Erwärmung, Orkane und alle anderen Naturkatastrophen sind monokausal auf diesinkende Zahl von Piraten seit Beginn des 19. Jahrhunderts zurückzuführen. Ein entsprechen-der empirischer Beweis in Form eines Graphen wurde vor kurzem veröffentlicht.
1. Wie steht es um die theoretische Begründung dieses Zusammenhangs?Wie ist es möglich, dass zwischen diesen beiden Variablen ein Zusammenhangbesteht?Was ist der Unterschied zwischen Korrelation und Kausalität?
Lösung:Im Scatterplot wurden die Variablen Anzahl Piraten und durchschnittliche Erdtemperatur dar-gestellt. Man kann in diesem Plot einen linearen Zusammenhang zwischen den Daten erkennen.Die durchschnittliche Erdtemperatur nahm proportional zum Rückgang der Piraten zu. Mankann also klar eine Korrelation zwischen diesen beiden Daten erkennen.
-154-
Prüfung (Qualitativ) Wintersemester 2006/07: Lösung uniseminar.ch
Lösung
Aufgabe 1
Arbeitslose nach Bildungsab-schluss, insgesamt 151.661.
Die Grafik des Arbeitsmarkt-service zeigt’s deutlich: Je höherder Bildungsgrad, umso geringerdie Wahrscheinlichkeit, keinenJob zu bekommen. Mehr als viervon zehn Arbeitslosen haben nurdie Pflichtschule abgeschlossen.Erschreckend, dass sich fastgenauso viele Lehrlinge unter denErwerbslosen finden, wo in vielenBranchen Facharbeiter fehlen.
(Quelle: Kronen-Zeitung vom 12.8.2000)
1. Was ist die Grundgesamtheit, auf die sich diese Auswertung bezieht?
Lösung:
Die Auswertung bezieht sich auf die Zahl der arbeitslosen Bürger eines Landes (hier Österreich).
2. Welche zusätzlichen Informationen braucht man, um etwas über die Arbeitslosenund den Bildungsabschluss aussagen zu können?
Lösung:Wir müssten noch das Verhältnis zwischen den einzelnen Bereichen der Ausbildung und derGesamtbevölkerung kennen. Wir können alleine aus dem Diagramm keine Aussagen machen,denn wir wissen de facto nicht, wie gross zum Beispiel der Anteil der Uni-Absolventen in derGesamtbevölkerung ist. Der Anteil dieser Absolventen an der Zahl der Arbeitslosen beträgt lautDiagramm 4%, also gut 6′066 Leute. Wenn nun aber nur gerade 10′000 der Gesamtbevölkerung
-160-
Prüfung (Qualitativ) Wintersemester 2006/07: Lösung uniseminar.ch
Bruch des R2 Koeffizienten ändert sich dann nicht, da e2k = (yk − yk)
2 = 0. Der Mittelwertder y wird zwar durch die neue Beobachtungen nach oben gezogen, aber die zu erklärendeAbweichung yk − y ist sicherlich grösser als 0. Das heisst, dass sich der Nenner im Bruch desR2 Koeffizienten vergrössert. Beides führt dazu, dass der ganze Bruch kleiner wird und somitR2 grösser wird. Der andere Fall, dass sich der R2 Koeffizient beim Hinzufügen einer weiterenBeobachtung verkleinern kann, ist ziemlich offensichtlich. Wenn die neue Beobachtung ziemlichextrem, das heisst viel grösser als y ist und sich zusätzlich die Regressionsgerade nicht zu sehrverändert, wird der Bruch in der zweiten Form von (10) grösser. Wir ziehen also eine grössereZahl von Eins ab und erhalten somit einen kleineren R2 Koeffizienten. Die Abbildung zeigtdiese beiden Fälle. Ohne eine zusätzliche Beobachtung (durch den fetten Punkt bei x = 6
dargestellt) erhalten wir für den R2 Koeffizient einen Wert von 0.542. Im ersten Fall fällt dieneue Beobachtung gerade auf die Regressionsgerade, welche sich nicht verändert. In diesemFall berechnet man R2 = 0.5814. Man erhält also einen grösseren Wert und somit ein besseresModell. Im zweiten Fall unterscheidet sich die neue Beobachtung von den bisherigen Werten.Die neue Regressionsgerade führt zu einem Modell mit R2 = 0.07383. Dieser Wert ist vielkleiner und somit ist das Modell viel schlechter.
Abbildung 3: Die neue Beobachtung ist jeweils durch einen ausgefüllten Punkt gekennzeichnet.
-163-
Prüfung (Qualitativ) Herbstsemester 2007: Lösung uniseminar.ch
Aufgabe 4
Abbildung 7: Quelle: Vorlesungsskript von Dr. A. Herrman
1. Erläutern sie die Grundprobleme, die bei der multiplen Regression auftretenkönnen.
Lösung:Wenn wir ein Regressionsmodell auf beobachtete Daten anwenden, müssen wir uns immer dieAnnahmen an die Daten y in Erinnerung rufen. Diese findet man im Selbststudium Skript imAbschnitt 3.2.Wichtig ist, dass ein linearer Zusammenhang der Daten logisch erscheint. Dies überprüft mananhand eines Scatterplots. Falls der Plot eine nichtlineare Struktur (also zum Beispiel die Formeiner Parabel) besitzt, deutet dies auf eine Verletzung dieser Modellannahme hin. Weiter nimmtman an, dass die Varianz der Fehlerterme konstant ist (Homoskedastie). Dies überprüft man anHand eines Scatterplotes der Residuen (ei). Diese sollten so gestreut sein, dass keine Strukturerkennbar ist. Weiter macht man auch die Annahme, dass die Fehlerterme zu einander unkorre-liert sind. Im Fall von Beobachtungen, die aus Zeitreihen stammen (siehe Aufgabe 4.1.1), wirddiese Annahme oftmals verletzt, da solche Daten stark autokorreliert sein können.
2. Die beiden Abbildungen zeigen jeweils den Zusammenhang zwischen den Resi-duen und der x-Variable einer Regression.Was folgern Sie aus diesen Abbildungen?
Lösung:Die Plots zeigen klar, dass im ersten Fall die Annahme der Homoskedastie verletzt ist. Imzweiten Fall kann man vermuten, dass der Zusammenhang zwischen den Variablen nicht linear,sondern quadratisch ist.
-170-
EExtras
Formeln
Forschungsmethoden
Bachelor
St.Gallen, September 2012
Inhaltsverzeichnis
Kenngrössen der Wahrscheinlichkeitstheorie 1
Wahrscheinlichkeitsverteilungen 3
Streuungsanalyse (ANOVA) 5
Lineare Regression 8
Ablaufschemas für statistische Tests 10
Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
χ2-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Tabelle der Binomialverteilung 18
Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Tabelle der Poisson-Verteilung 24
Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Tabelle der Standardnormalverteilung 28
Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Weiersfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Quantile der Studentsche t-Verteilung 30
Quantile der F -Verteilung 31
Quantile der χ2-Verteilung 34
Hier haben wir alle wichtigen Formeln und Tabellen zur Vorlesung kurz und übersichtlich
zusammen gestellt. Zudem findest Du die Schemas aus den Theorieskripten zu den jeweiligen
Tests. Diese helfen Dir schneller voran zu kommen und einen guten Überblick zu erhalten.
Formeln uniseminar.ch
Kenngrössen der Wahrscheinlichkeitstheorie
Kenngrösse Diskrete ZV X Stetige ZV X
Erwartungswert µX
∑
xi · P (X = xi)
∫ ∞
−∞xf(x)dx
Erwartungsoperator E[g(X)]∑
g(xi) · P (X = xi)
∫ ∞
−∞g(x)f(x)dx
Varianz σ2X
∑
(xi − µX)2 · P (X = xi)
∫ ∞
−∞(x − µX)2f(x)dx
Std-Abweichung σX
√
σ2X
√
σ2X
lowertail-Quantil xα
∑
xj≤xα
P (X = xj) = α
∫ xα
−∞f(x)dx = α
uppertail-Quantil xα
∑
xj≥xα
P (X = xj) = α
∫ ∞
xα
f(x)dx = α
Die Kenngrössen für Stichproben x1, . . . , xn sind leicht anders definiert:
Arithmetisches Mittel x =1
n
n∑
i=1
xi
Varianz s2 =1
n − 1
n∑
i=1
(xi − x)2
Std-Abweichung s =√
s2
Kovarianz Cov(X, Y ) =1
n − 1
n∑
i=1
(xi − x)(yi − y)
Korrelationskoeffizient r =Cov(X, Y )
s(X) · s(Y )
-1-
Formeln uniseminar.ch
Wahrscheinlichkeitsverteilungen
Diskrete Wahrscheinlichkeitsverteilungen
Verteilung Notation Wahrscheinlichkeit µX σ2X
Binomial X ∼ B(n, π) P (X = x) =
(n
x
)
· πx · (1 − π)n−x nπ nπ(1 − π)
Poisson X ∼ Po(µ) P (X = x) =e−µ · µx
x!µ µ
Stetige Wahrscheinlichkeitsverteilungen
Verteilung Notation Dichtefunktion µX σ2X
Normalverteilt X ∼ N(µ, σ2) f(x) =1√2πσ
e−1
2(x−µ
σ)2 µ σ2
Exponentialverteilt X ∼ Exp(λ) f(x) = λe−λx 1λ
1λ2
Lognormalverteilt X ∼ logN(µY , σ2Y ) µX = eµY +
σ2
Y2
Y = log(X) ∼ N(µY , σ2Y ) σX = e2(µY +σ2
Y) − e2µY +σ2
Y
Berechnung der Wahrscheinlichkeit stetiger Verteilungen
Linksseitig P (X ≤ b) =∫ b
−∞f(x)dx = F (b) → Tabellenwert
Rechtsseitig P (X ≥ a) =∫ ∞
a
f(x)dx = 1 − F (a)
Zweiseitig P (a ≤ X ≤ b) =∫ b
a
f(x)dx = F (b) − F (a)
-3-
Formeln uniseminar.ch
Konfidenzintervalle
Konfidenzintervalle,
Konfidenzkoeffizient 1 − α
Mittelwert, µ Anteilswert, π
σ bekannt σ unbekanntIst nπ ≥ 5 und
n(1 − π) ≥ 5?
Ist n ≥ 30?
Ja Nein Ja Nein
Ist die Population
wirklich oder
approximativ
normalverteilt?
Ist die Population
wirklich oder
approximativ
normalverteilt?
Nein Nein
Ist n ≥ 30?
Ja Nein Ja
z-Intervall
x ± zα/2 · σ√n
wobei
zα/2 aus der Tabelle
abgelesen wird.
t-Intervall
x ± tα/2 · s√n
wobei
s =
√
nP
x2
i−(P
xi)2
n(n−1)
und tα/2 aus der
Tabelle abgelesen
wird mit df = n − 1.
z-Intervall
p ± zα/2 · σp
wobei
σp =
√p(1−p)
n
zα/2 aus der Tabelle
abgelesen wird.
z-Intervall
x ± zα/2 · s√n
wobei
s =
√
nP
x2
i−(
P
xi)2
n(n−1)
zα/2 aus der Tabelle
abgelesen wird.
-11-
Formeln uniseminar.ch
χ2-Test
Nullhypothese H0 formulieren
Signifikanzniveau α wählen
Anzahl Freiheitsgrade dffür den Test bestimmen
Anpassungs-,
Unabhängigkeits-
oder Homogenitätstest
Hypothesentest
für die Varianz
Tabelle der beobachteten
Häufigkeiten Oij erstellen
Tabelle der unter H0 erwarteten
Häufigkeiten Eij erstellen
Testgrösse χ2 =r∑
i=1
k∑
j=1
(Oij−Eij)2
Eij
r = Anzahl Zeilen
k = Anzahl Spalten
Testgrösse χ2 = (n−1)s2
σ2
0
n = Stichprobenumfang
s2 = Stichprobenvarianz
σ20 = hypothetische Varianz
χ2 > χ2α ? χ2 im Verwerfungsbereich?
Nein Ja Nein Ja
H0 nicht verwerfen H0 verwerfen H0 nicht verwerfen H0 verwerfen
-17-
Tabellen uniseminar.ch
BinomialverteilungWahrscheinlichkeitsfunktion
n Versuche, Erfolgswahrscheinlichkeit π
P (X = x) =
(n
x
)
πx (1 − π)n−x
n x π = 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
2 0 0.8100 0.6400 0.4900 0.3600 0.2500 0.1600 0.0900 0.0400 0.0100
1 0.1800 0.3200 0.4200 0.4800 0.5000 0.4800 0.4200 0.3200 0.1800
2 0.0100 0.0400 0.0900 0.1600 0.2500 0.3600 0.4900 0.6400 0.8100
3 0 0.7290 0.5120 0.3430 0.2160 0.1250 0.0640 0.0270 0.0080 0.0010
1 0.2430 0.3840 0.4410 0.4320 0.3750 0.2880 0.1890 0.0960 0.0270
2 0.0270 0.0960 0.1890 0.2880 0.3750 0.4320 0.4410 0.3840 0.2430
3 0.0010 0.0080 0.0270 0.0640 0.1250 0.2160 0.3430 0.5120 0.7290
4 0 0.6561 0.4096 0.2401 0.1296 0.0625 0.0256 0.0081 0.0016 0.0001
1 0.2916 0.4096 0.4116 0.3456 0.2500 0.1536 0.0756 0.0256 0.0036
2 0.0486 0.1536 0.2646 0.3456 0.3750 0.3456 0.2646 0.1536 0.0486
3 0.0036 0.0256 0.0756 0.1536 0.2500 0.3456 0.4116 0.4096 0.2916
4 0.0001 0.0016 0.0081 0.0256 0.0625 0.1296 0.2401 0.4096 0.6561
5 0 0.5905 0.3277 0.1681 0.0778 0.0313 0.0102 0.0024 0.0003 0.0000
1 0.3281 0.4096 0.3601 0.2592 0.1563 0.0768 0.0284 0.0064 0.0004
2 0.0729 0.2048 0.3087 0.3456 0.3125 0.2304 0.1323 0.0512 0.0081
3 0.0081 0.0512 0.1323 0.2304 0.3125 0.3456 0.3087 0.2048 0.0729
4 0.0005 0.0064 0.0283 0.0768 0.1563 0.2592 0.3601 0.4096 0.3280
5 0.0000 0.0003 0.0024 0.0102 0.0313 0.0778 0.1681 0.3277 0.5905
6 0 0.5314 0.2621 0.1176 0.0467 0.0156 0.0041 0.0007 0.0001 0.0000
1 0.3543 0.3932 0.3025 0.1866 0.0938 0.0369 0.0102 0.0015 0.0001
2 0.0984 0.2458 0.3241 0.3110 0.2344 0.1382 0.0595 0.0154 0.0012
3 0.0146 0.0819 0.1852 0.2765 0.3125 0.2765 0.1852 0.0819 0.0146
4 0.0012 0.0154 0.0595 0.1382 0.2344 0.3110 0.3241 0.2458 0.0984
5 0.0001 0.0015 0.0102 0.0369 0.0938 0.1866 0.3025 0.3932 0.3543
6 0.0000 0.0001 0.0007 0.0041 0.0156 0.0467 0.1176 0.2621 0.5314
7 0 0.4783 0.2097 0.0824 0.0280 0.0078 0.0016 0.0002 0.0000
1 0.3720 0.3670 0.2471 0.1306 0.0547 0.0172 0.0036 0.0004 0.0000
2 0.1240 0.2753 0.3177 0.2613 0.1641 0.0774 0.0250 0.0043 0.0002
3 0.0230 0.1147 0.2269 0.2903 0.2734 0.1935 0.0972 0.0287 0.0026
4 0.0026 0.0287 0.0972 0.1935 0.2734 0.2903 0.2269 0.1147 0.0230
5 0.0002 0.0043 0.0250 0.0774 0.1641 0.2613 0.3177 0.2753 0.1240
6 0.0000 0.0004 0.0036 0.0172 0.0547 0.1306 0.2471 0.3670 0.3720
7 0.0000 0.0002 0.0016 0.0078 0.0280 0.0824 0.2097 0.4783
8 0 0.4305 0.1678 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000
1 0.3826 0.3355 0.1977 0.0896 0.0313 0.0079 0.0012 0.0001
2 0.1488 0.2936 0.2965 0.2090 0.1094 0.0413 0.0100 0.0011 0.0000
3 0.0331 0.1468 0.2541 0.2787 0.2188 0.1239 0.0467 0.0092 0.0004
4 0.0046 0.0459 0.1361 0.2322 0.2734 0.2322 0.1361 0.0459 0.0046
5 0.0004 0.0092 0.0467 0.1239 0.2188 0.2787 0.2541 0.1468 0.0331
6 0.0000 0.0011 0.0100 0.0413 0.1094 0.2090 0.2965 0.2936 0.1488
7 0.0001 0.0012 0.0079 0.0313 0.0896 0.1977 0.3355 0.3826
8 0.0000 0.0001 0.0007 0.0039 0.0168 0.0576 0.1678 0.4305
-18-