HSG_Fometh_Ordner_Issuu

UNISEMINAR

Sem

inar

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

Einleitung

ForschungsmethodenBachelor

St.Gallen, September 2012

Einleitung uniseminar.ch

Herzlich Willkommen bei Uniseminar

Vorwort

Ziel von Uniseminar ist es, Dich optimal auf Deine Prüfungen vorzubereiten und Deine Prü-fungsvorbereitung an der HSG so effizient wie möglich zu gestalten. Um dieses Ziel zu erreichen,haben wir ein dreiteiliges Konzept entwickelt, das sich nun mehrere Jahre als grosse Hilfe fürdie Studenten bewährt hat. Dieses besteht zum einen aus sehr umfangreichen Lernunterla-gen in Form eines Ordners, perfekt darauf abgestimmten Karteikarten und dazu passendenPrüfungsvorbereitungsseminaren am Ende des Semesters. Damit werden sämtliche Inhalte ausden Vorlesungen und Übungen in einfacher und anschaulicher Form kompakt zusammengefasst.

Gleich zu Beginn des Semesters bieten wir Dir deshalb unsere umfangreichen Lernunterlagenin Form eines Ordners und perfekt darauf abgestimmten Karteikarten an. Diese beiden Lehr-mittel solltest Du im Selbststudium bereits während des Semesters begleitend zur Vorlesungverwenden.

Am Ende des Semesters empfehlen wir Dir zur gezielten Prüfungsvorbereitung unsere Seminarezu besuchen, wo wir Dir in zehn Stunden nochmals die essentiellsten Aufgaben und Konzeptenäherbringen und Dich so optimal auf Deine Prüfungen vorbereiten. Dieser dreiteilige Ansatzermöglicht Dir mit einer ausgewogenen Mischung verschiedener auf einander abgestimmter Me-dien Deinen Lernerfolg nachhaltig zu verbessern.

-1-


Karteikarten

Die Karteikarten von Uniseminar decken in Kombination mit unserem Ordner den gesamtenprüfungsrelevanten Stoff ab und helfen Dir Dein theoretisches wie auch praktisches Wissen derwichtigsten Themen, Begriffe und Zusammenhänge in Forschungsmethoden prüfungsorientiertzu unterstützen. Um dies zu gewährleisten, haben wir eine Vielfalt von Fragentypen entwickelt,die Dein inhaltliches Verständnis umfassend abrunden und verbessern.

Die Karteikarten enthalten zum einen die wichtigsten Definitionen, Vorgehensweisen und For-meln. Zum anderen haben wir Dir aber auch relevante Verständnisfragen und kurze Rechen-aufgaben erstellt um Dein erlerntes Wissen selbstständig und umfassend abzufragen. Denn ander Prüfung musst Du nicht nur wichtige Formeln auswendig können, sondern die Thematikumfassend verstehen. Formeln, die an der Prüfung ausgeteilt werden oder mitgenommen wer-den dürfen, sind deshalb in den Karteikarten konsequenterweise nicht enthalten.

Ziel ist es folglich, den kompletten prüfungsrelevanten Lehrstoff in Forschungsmethoden aufmöglichst kompakte Art und Weise auf Karteikarten zusammenzufassen, sodass Du Dich inkurzer Zeit effizient auf die Prüfungen vorbereiten kannst. Lerne also gleichzeitig mit demOrdner und den Karteikarten von Uniseminar um optimal auf die Prüfungen vorbereitet zusein.

Seminare

Sämtliche Kurse von Uniseminar werden von erfahrenen Doktoranden geleitet und betreut. AlleDozenten verfügen über langjährige Unterrichtserfahrung an diversen Universitäten und wissendeshalb genau Bescheid, wo Probleme bei den Studierenden auftreten können.

Oberstes Ziel unserer Seminare ist es den prüfungsrelevanten Stoff anschaulich und verständlichin zwei vierstündigen Seminarblöcken zu vermitteln. Zuerst werden die wichtigsten mathema-tischen Grundlagen und Themen der Vorlesung besprochen, um danach auf die häufigst auftre-tenden Aufgabentypen einzugehen und geeignete Vorgehensweisen an der Prüfung zu erklären.

Während den Seminaren werden zu 30% theoretische Vorlesungsinhalte behandelt und Grund-kenntnisse erarbeitet. 70% der Zeit nehmen wir uns, um reale Prüfungsaufgaben zu bearbeitenund effiziente Prüfungsstrategien zu besprechen. Es wird somit in den Seminaren zuerst eintheoretisches Fundament gelegt, da grundlegende theoretische Kenntnisse beim Lösen von Prü-fungsaufgaben von grosser Bedeutung sind.

Es ist also unser Ziel nicht nur den prüfungsrelevanten Stoff anschaulich zu erklären, sondernauch theoretische Kenntnisse zu vermitteln, die nötig sind, um fachliche Zusammenhänge auch

-3-


Aufbau

Dieser Ordner soll Dir als Lernhilfe zur effizienten Prüfungsvorbereitung der Forschungsmetho-den Prüfungen dienen und umfasst 5 Teile. Wir möchten Dir im Folgenden einen Überblicküber den Aufbau des Ordners geben.

1. Theorie: Die Theorieskripte fassen in einfacher und übersichtlicher Form den gesamtenStoff des Herbstsemesters 2012/2013 zusammen und erklären diesen anhand anschaulicherBeispiele. Am Ende findest Du jeweils ein Stichwortverzeichnis, welches Dir bei allfälligenFragen schnellstmöglich Zugriff auf das erforderliche Wissen verschafft. Das Theorieskriptzum quantitativen Teil umfasst 9 Kapitel, diese werden im Seminar der Reihe nach bear-beitet. Das kleinere Skript zum qualitativen Teil umfasst drei Kapitel, die zum Teil mitdem quantitativen Teil überlappen.

2. Aufgaben: Zu allen Kapiteln in unseren Theorieskripten haben wir abgestimmte Übungs-aufgaben erstellt. Wir empfehlen Dir diese Aufgaben gleich nach den erfolgten Seminar-blöcken zu lösen, um anschliessend Fragen an unsere Dozenten stellen zu können. Diesesind gerne während den Pausen und auch nach den offiziellen Seminarstunden für Dichda, um Dir bei Deinen persönlichen Problembereichen weiterzuhelfen.

3. Übungen: In den vergangenen Jahren hat es sich gezeigt, dass die Übungsserien der Uni-versität St. Gallen (HSG) zunehmend wichtiger für das erfolgreiche Bestehen der Prüfunggeworden sind. Die Professoren haben die aktuellsten Prüfungsaufgaben vermehrt unterBerücksichtigung der Serien konzipiert. Der Grund dafür liegt darin, dass die Anwesenheitder Studenten während der Übungen sich lohnen und auszahlen soll. Aus diesem Grundhaben wir Dir sämtliche Übungsaufgaben mit ausführlichen Lösungswegen zusammenge-stellt.

4. Prüfungen: Beginne früh damit bisherige Prüfungen zu lösen, denn nur so gewinnst Dudas nötige Verständnis für deren Aufbau. Du wirst erkennen, was für die Prüfung relevantist und kannst Dich gezielt darauf vorbereiten. Dazu haben wir Dir alle verfügbaren Prü-fungen aus beiden Vorlesungsteilen mit ausführlichen Lösungswegen zusammengestellt.

5. Formeln: Die Formelsammlung stellt die wichtigen Formeln der Vorlesung sowie dasVorgehen bei den Hypothesentests übersichtlich zusammen. Nimm Dir nach dem Durch-arbeiten der Theorieskripte die Formelsammlung öfter vor, um sie zeilenweise abzulesenund die Formeln zu memorieren. Jede Formel, die im Kopf verfügbar ist und nicht wäh-rend der Prüfung nachgeschlagen werden muss, spart wertvolle Zeit. Verwende die Ta-bellen mit den Übungsaufgaben und den Musterprüfungen, um das schnelle Ablesen vonWahrscheinlichkeiten und Quantilen zu üben.

-5-


Vorgehensweise

Wir empfehlen Dir mit dem Ordner und den Karteikarten wie folgt schrittweise vorzugehen umeinen perfekten Lernerfolg zu erzielen:

1. Theorie: Lies als erstes ein Theoriekapitel aufmerksam durch und versuche die theoreti-schen Inhalte zu verstehen.

2. Karteikarten: Schaue Dir anschliessend die passenden Karteikarten an, welche wir Diram Ende des Theoriekapitels empfehlen und versuche die wichtigsten Punkte zu memo-rieren. Die Karteikarten runden Dein bereits erlerntes Wissen perfekt ab und zeigen Dirauf, wo du allenfalls noch Schwächen hast.

3. Aufgaben: Löse nun einige oder am besten alle unsere eigens erstellten Aufgaben passendzum soeben gelesenen Theoriekapitel komplett durch. Diese umfassen exakt den in diesemTheoriekapitel erlernten Stoff. So siehst Du gleich, an welchen Stellen Du allenfalls einTheoriekapitel nochmals gründlicher durchlesen solltest.

4. Prüfungen: Mit Deinem aktuellen theoretischen Wissensstand kannst Du nun ideal aus-gewählte Prüfungsaufgaben lösen. So siehst Du gleich was Dich an der Prüfung erwartetund kannst Dich bereits jetzt perfekt darauf einstellen. Dazu haben wir Dir am Ende vonjedem Theoriekapitel einige ausgewählte Prüfungsaufgaben zusammengestellt, die sich aufdas soeben behandelte Thema beziehen.

5. Mache eine Pause und beginne danach wieder mit einem weiteren Theoriekapitel.

-6-

Sem

inar

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

S

Seminar

Forschungsmethoden

Bachelor


Seminar uniseminar.ch

Ziel und Inhalt

Am Ende des Semesters empfehlen wir Dir unsere gezielten Prüfungsvorbereitungsseminare zu

besuchen. In zwei vierstündigen Seminarblöcken zeigen wir Dir dabei welche Themen für das

erfolgreiche Bestehen Deiner Prüfung essentiell sind und erarbeiten mit Dir gemeinsam effizi-

ente Strategien um die spezifischen Aufgabentypen gezielt anzugehen. Dabei wird Dir nur das

Allerwichtigste an Theorie kurz und prägnant erklärt und repetiert. Der Fokus des Seminars

liegt im Lösen alter Prüfungsaufgaben wobei wir Dir mit strukturierten Vorgehensweisen einen

zielgerichteten Ansatz aufzeigen, wie Du die Prüfung optimal lösen kannst.

Während des Seminars werden deshalb zu 30% Grundkenntnisse und theoretische Vorlesungs-

inhalte behandelt und erarbeitet. 70% der Zeit nehmen wir uns, um reale Prüfungsaufgaben zu

bearbeiten und effiziente Prüfungsstrategien zu besprechen.

Unsere erfahrenen Dozenten zeigen Dir auch wichtige Tipps und Tricks um Deine Prüfungs-

chancen zu optimieren. In den Pausen und nach Seminarende hast Du zudem die Möglichkeit,

dem Dozenten individuelle Fragen zu stellen, um letzte Unklarheiten zu beseitigen.

Seminarleitung

Sämtliche Kurse von Uniseminar werden von erfahrenen Doktoranden geleitet und betreut. Al-

le Dozenten verfügen über langjährige Unterrichtserfahrung an diversen schweizerischen und

europäischen Universitäten und wissen deshalb genau Bescheid, wo Probleme bei den Studie-

renden auftreten können. Weitere Infos zu Deinem persönlichen Seminarleiter und zu unseren

Dozenten im Allgemeinen findest Du auf unserer Webseite www.uniseminar.ch in der Rubrik

“Über uns”.

Anmeldung

Unter www.uniseminar.ch kannst Du Dich jederzeit für die Seminare anmelden.

Notizen uniseminar.ch

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

T

Theorie (quantitativer Teil)

Forschungsmethoden

Bachelor


Inhaltsverzeichnis

1 Grundlagen der Wahrscheinlichkeitstheorie 1

1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Wahrscheinlichkeitsbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Diskrete Wahrscheinlichkeitsverteilungen 15

2.1 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Kenngrössen diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 18

2.3 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.4 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.5 Mehrdimensionale Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . 27

2.6 Kenngrössen mehrerer Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 30

3 Stetige Wahrscheinlichkeitsverteilungen 37

3.1 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2 Kenngrössen stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . 39

3.3 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4 Normalapproximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.5 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.6 Lognormalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.7 Die Ungleichung von Tschebyscheff . . . . . . . . . . . . . . . . . . . . . . . . . 52

4 Stichprobenverteilungen 55

4.1 Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Stichprobenverteilung des Mittelwerts . . . . . . . . . . . . . . . . . . . . . . . . 57

4.3 Stichprobenverteilung des Anteilwertes . . . . . . . . . . . . . . . . . . . . . . . 61

5 Schätzungen aus Stichproben 65

5.1 Punktschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 Konfidenzintervalle für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . 67

5.3 Konfidenzintervalle für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . 70

5.4 Konfidenzintervalle für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . 73

5.5 Bestimmung des notwendigen Stichprobenumfangs . . . . . . . . . . . . . . . . . 75

5.6 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6 Das Testen von Hypothesen 80

6.1 Einseitige und zweiseitige Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6.2 Hypothesentest für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . . . 84

6.3 Hypothesentest für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . . . 86

6.4 Hypothesentest für den Anteilswert . . . . . . . . . . . . . . . . . . . . . . . . . 88

6.5 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.6 Testentscheid mit dem p -Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6.7 Fehlerarten bei Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

7 Das Testen von Hypothesen, Zweistichprobentests 103

7.1 Hypothesentest für Mittelwertdifferenz mit bekannten Standardabweichungen . . 103

7.2 Hypothesentest für Mittelwertdifferenz mit unbekannten Standardabweichungen 106

7.3 Hypothesentest für Gleichheit der Anteilswerte . . . . . . . . . . . . . . . . . . . 111

7.4 Hypothesentest für Gleichheit der Varianzen . . . . . . . . . . . . . . . . . . . . 113

7.5 Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

8 Varianzanalyse (ANOVA) 121

8.1 Einfaktorielle Varianzanalyse (1-Weg ANOVA) . . . . . . . . . . . . . . . . . . . 121

8.2 Randomized Block Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

8.3 Zweifaktorielle Varianzanalyse (2-Weg ANOVA) . . . . . . . . . . . . . . . . . . 129

8.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

9 Anwendungen der χ2-Verteilung 137

9.1 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

9.2 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

9.3 Der χ2-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

9.4 Der χ2-Homogenitätstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

9.5 Schätz- und Testverfahren für die Varianz . . . . . . . . . . . . . . . . . . . . . 146

Stichwortverzeichnis 152

Quantitative Theorie uniseminar.ch

• Das unmögliche Ereignis ist die leere Menge

∅ = . Das unmögliche Ereignis tritt nie ein,

weil es keine Elementarereignisse enthält.

Ω

• Ω Das sichere Ereignis ist der komplette Er-

eignisraum Ω. Im Beispiel wäre Ω = r, b, g das

sichere Ereignis.

Ω

• Das zu A komplementäre Ereignis besteht aus

den Elementarereignissen, die nicht in A liegen.

Im Beispiel: Wenn A = r das Ereignis „roter

Würfel“ ist, dann ist A = b, g das Gegenteil

„nicht roter Würfel“.

ΩA

A

• Der Durchschnitt der Ereignisse A1 und A2

wird mit A1 ∩ A2 notiert, er enthält die Elemen-

tarereignisse, die sowohl in A1 als auch in A2 ent-

halten sind. Im Beispiel ist der Durchschnitt von

A = g, b und B = b dann A ∩ B = b.

ΩA1

A2

A1 ∩ A2

• Die Vereinigung von Ereignissen A1 und A2 ist

A1 ∪ A2. Das ist die Menge der Elementarereig-

nisse, die in A1 oder A2 liegen. Ist beispielsweise

A = g und B = b, dann ist A ∪ B = g, b.

ΩA1 A2

• Zwei Ereignisse A1 und A2 sind unverträglich

(oder disjunkt), falls sie kein gemeinsames Ele-

ment haben: A1 ∩ A2 = ∅. Dann können die

beiden Ereignisse nicht gleichzeitig eintreten. Im

Beispiel sind B = b und C = g disjunkt,

nicht aber B und C = b, g.

ΩA1 A2

1.2 Wahrscheinlichkeitsbegriffe

Den Begriff der Wahrscheinlichkeit kann man auf drei Arten einführen. Jede entspricht irgend-

wie unserer Vorstellung davon, wie wahrscheinlich es ist, dass ein Ereignis eintritt:

-2-


Mittelwert: E(X) = nπ

Varianz: Var(X) = nπ(1 − π)

Standardabweichung: σ(X) =√

nπ(1 − π)

Im folgenden Bild sieht man die Binomialverteilung B(10, 0.3). Bei dem Mittelwert 3 ist die

Wahrscheinlichkeit am grössten. Wenn der Parameter π vergrössert wird, verschieben sich die

maximalen Werte weiter nach rechts. Wenn die Anzahl Versuche erhöht wird, nähert sich die

Form einer Glocke an.

X ∼ B(10, 0.3)

x

P (X = x)

0 1 2 3 4 5 6 7 8 9 10

0.05

0.10

0.15

0.20

0.25

0.30

Beispiel

60% der HSG-Absolventen haben im letzten Jahr ehrenamtliche Arbeit verrichtet. Wählen wir

zufällig 4 Absolventen. Wie hoch ist die Wahrscheinlichkeit, dass keiner von ihnen im letzten

Jahr ehrenamtliche Arbeit verrichtet hatte? Wie hoch ist die Wahrscheinlichkeit, dass zwei oder

mehr dabei sind?

Die Zufallsvariable X (Anzahl ehrenamtlich tätiger Absolventen) ist binomialverteilt: X ∼

-22-


Fläche

P (a ≤ X ≤ b)

a b x

1

f(x)

Der Parameter λ (mittlere Wartezeit auf einen Erfolg) hat genau die umgekehrte Bedeutung

des Parameters µ der Poissonverteilung (mittlere Anzahl Erfolge pro Zeiteinheit). Deshalb hat

die Exponentialverteilung diese Kenngrössen:

Mittelwert: E(X) = 1λ

Varianz: Var(X) = 1λ2

Standardabweichung: σ(X) = 1λ

Die Verteilungsfunktion der Exponentialverteilung ist besonders einfach und wird deshalb nicht

tabelliert:

F (x) = 1 − e−λx

Beispiel

Im Mittel wartet man an einer Kasse am Supermarkt 2 Minuten, angenommen die Wartezeit

ist exponentialverteilt (mit Wartezeit im Mittel λ = 2). Dann ist die Wahrscheinlichkeit, 3 oder

mehr Minuten zu warten

P (X ≥ 3) = 1 − P (X < 3) = 1 − F (3) = 1 − (1 − e−2·3) = e−6 = 0.0025 .

-49-


3.6 Lognormalverteilung

Die Zufallsvariable X heisst lognormalverteilt, wenn die Zufallsvariable Y = ln(X) normal-

verteilt ist mit Y ∼ N(µY , σY ). Diese Verteilung hängt von zwei Parametern ab. Wir müssen

hier aber unterscheiden zwischen den Parametern für X und Y :

• µY ist der Erwartungswert von Y und

• σY ist die Standardabweichung von Y .

Zu einer Lognormalverteilung mit diesen Parametern gehört die Dichtefunktion

f(x) =1

x· 1

σY

√2π

e− 1

2

“

ln(x)−µYσY

”2

σY = 1 σY → 0f(x)

x

Sie besitzt die folgenden Kenngrössen:

Mittelwert: E(X) = eµY +σ2

Y2

Varianz: Var(X) = e2(µY +σ2Y ) − e2µY +σ2

Y

Standardabweichung: σ(X) =√

Var(X)

Insbesondere darf man die Kenngrössen für Y nicht einfach auf X umrechnen wie bei der

Standardisierung. Bei der Berechnung der Wahrscheinlichkeiten darf man aber wie bei der

Standardisierung vorgehen, indem man die Umformung (hier: Logarithmus ziehen) auf alle

Seiten der Ungleichung durchführt:

• P (X ≤ b) = P (eY ≤ b) = P (Y ≤ ln b) = Φ(

ln b−µY

σY

)

;

-50-


Normalverteilung Lognormalverteilung

Anwendung als Modell für Zufallsvariablen, Anwendung als Modell für Zufallsvariablen,

die sowohl positive als auch negative Werte die nur positive Werte annehmen können

annehmen können (Bsp. Renditen) (Bsp. Aktienkurse)

Geeignet für Daten mit einer Geeignet für Daten mit einer

symmetrischen Verteilung schiefen Verteilung

Verteilungsfunktion symmetrisch Verteilungsfunktion asymmetrisch

Die nichtsymmetrische Lognormalverteilung ist links steiler als die Normalverteilung

⇒ der Erwartungswert der Lognormalverteilung ist grösser als der transformierte der

Normalverteilung: E(X) = eµY +σ2

Y2 > eµY

Wenn σ2Y ≈ 0 ⇒ Gestalt der Lognormalverteilung und Normalverteilung wird ähnlich.

3.7 Die Ungleichung von Tschebyscheff

Bei den hier vorgestellten Verteilungen konzentriert sich die Wahrscheinlichkeitsmasse (also die

Fläche unter der Dichtefunktion) um den Mittelwert µ der Verteilung. Das ist zwar nicht bei

jeder Verteilung der Fall, aber es gibt eine Grenze, wie weit sich der Grossteil der Wahrschein-

lichkeitsmasse vom Mittelwert höchstens entfernen kann. Sie hängt nur von der Standardab-

weichung ab und gilt für alle Verteilungen (stetig und diskret) und damit für alle möglichen

Zufallsvariablen. Die Ungleichung von Tschebyscheff1 besagt, dass für alle k ≥ 1 gilt:

P (µ − kσ ≤ X ≤ µ + kσ) ≥ 1 − 1

k2.

Oder in Worten: Die Wahrscheinlichkeitsmasse, die vom Mittelwert um mehr als kσ entfernt

ist, beträgt höchstens 1k2 .

1Der Name wird eigentlich kyrillisch geschrieben, und hat mehrere mögliche Übersetzungen in lateinischeBuchstaben wie beispielsweise Tschebyschow oder Chebyshev.

-52-


6.5 Überblick

Hypothesentest I,

eine Stichprobe,

ein Parameter

Mittelwert, µ Anteilswert, π

σ bekannt σ unbekanntIst nπ ≥ 5 und

n(1 − π) ≥ 5?

Ist n ≥ 30?

Ja Nein Ja Nein

Ist die Population

wirklich oder

approximativ

normalverteilt?

Ist die Population

wirklich oder

approximativ

normalverteilt?

Nein Nein

Ist n ≥ 30?

Ja Nein Ja

z -Test

z = x−µ0

σ

√n

wobei

µ0 ist von H0

t -Test

t = x−µ0

s

√n

wobei

df = n − 1µ0 ist von H0

z -Test

z = p−π0

σp

wobei

σp =

√π0(1−π0)

n

π0 ist von H0

z -Test

z = x−µ0

s

√n

wobei

µ0 ist von H0

-91-

Theorie (qualitativer Teil)

Forschungsmethoden

Bachelor


Inhaltsverzeichnis

1 Einleitung - Qualitativer Teil 1

1.1 Business Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Deskriptive und induktive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Sozialforschung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Kausalität und Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Statistische Hilfsmittel 9

2.1 Darstellung von Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2 Statistische Beschreibung von Daten . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3 Zusammenhangsmass . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4 Datenerfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3 Regressionsanalyse 35

3.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2 Einfache lineare Regression: Idee . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3 Vorgehen: Schätzer für β1 und β2 . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.4 Qualität des Modells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.5 Statistische Tests für Signifikanz . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.6 Konfidenzintervalle für β1 und β2 . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.7 F -Tests für das ganze Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.8 Überprüfen der Modellannahmen . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.9 Multiple Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Stichwortverzeichnis 69

Qualitative Theorie uniseminar.ch

Abbildung 1: Durchschnittliches pro Kopf Monatseinkommen in USD gegliedert nach den 50

Bundesstaaten plus Washington DC (aus dem Jahre 1970). Quelle: Anscombe, F. J. (1981)

Computing in Statistical Science Through APL. Springer-Verlag.

Wir können also ablesen, dass das durchschnittliche pro Kopf Monatseinkommen zwischen USD

3’000 und USD 3’500 liegt.

Im Zusammenhang mit einem Histogramm spricht man oft auch von der kumulierten Häufig-

keitsverteilung. Wir betrachten dazu nicht jede Klasse einzeln, sondern sind lediglich daran

interessiert, wie viele Datenpunkte kleiner als eine bestimmte Beobachtungsklasse sind. Folg-

lich addieren wir zu den in der uns interessierenden Klasse liegenden Datenpunkte die Anzahl

Datenpunkte in den links davon liegenden Klassen hinzu, und teilen diese Zahl durch die Ge-

samtzahl aller erhobenen Datenpunkte. In unserem Beispiel mit dem Einkommen der jeweiligen

Bundesstaaten kann man mit dieser kumulierten Häufigkeit zum Beispiel aussagen, wie wahr-

scheinlich es ist, dass man in den USA weniger oder gleich USD 3’000 verdient. Wir summieren

dazu die Anzahl der Datenpunkte in den Klassen von 2000 bis 3000 zusammen und teilen durch

die gesamte Anzahl der vorhandenen Datenpunkte. Da gemäss Diagramm ungefähr 18 von 51

-11-


Abbildung 10: Verschiedene mögliche Abhängigkeiten von zwei verschiedenenen Variablen.

-28-


Abbildung 14: Einfache Lineare Regression: Darstellung der Regressionsgeraden mit einem

Punkt aus dem Datensatz. yi: beobachteter Wert, yi: geschätzter Wert auf der Gerade.

Abbildung 14 zeigt uns die Situation, wenn wir nur ein Datenpaar unserer Beobachtungen be-

trachten. Der Punkt P (xi, yi) stellt unsere gemachte Beobachtung dar. Wir nehmen nun an,

dass wir bereits eine gute Schätzung für den Achsenabschnitt β1 und die Steigung β2 unseres

Modells aus (1) gefunden haben. Diese Schätzungen haben wir auf Grund unserer Daten ge-

macht. Wir bezeichnen diese Schätzungen jeweils mit β1 und β2 (das Hut-Symbol ˆ steht in

der Statistik immer dafür, dass ein wahrer Wert a durch a geschätzt wurde). Wir können also

nun berechnen, welchen Wert wir für yi erhalten hätten, falls wir diesen durch unsere gewählte

Gerade geschätzt hätten. Wir bestimmen dazu den Wert von xi auf unserer Regressionsgerade:

yi = β1 + β2 · xi

Für x-Werte, zu welchen wir keine y Beobachtung haben, ist dies genau die lineare Pro-

gnose gemäss unserem Modell. Im Beispiel mit den Filialen fragen wir uns also, was für einen

Jahresumsatz wir von einer neuen Filiale erwarten können, wenn wir die Verkaufsfläche kennen.

Der Punkt Q(xi, yi) liegt nun also auf unserer Regressionsgerade und wir können die Distanz

zwischen P und Q betrachten. Wir bezeichnen diese Distanz durch:

ei = yi − yi ist die Fehlerabweichung oder das Residuum, welche durch die Schätzung

-42-


für die statistische Auswertung der Regressionsanalyse ist dieser jedoch irrelevant.

3.4 Qualität des Modells

Wir wenden uns im Folgenden der Qualität unseres linearen Modells zu. Wir fragen uns,

wie genau unsere geschätzten Werte yi sind und somit auch, welche Genauigkeit wir für eine

Prognose erwarten können. Dazu rufen wir uns die statistischen Hilfsmittel der Lage- und

Streuparameter in Erinnerung (siehe Abschnitt 2.2). Wir betrachten den Lageparameter y der

wahren Werte, um so die Streuung der Daten zu betrachten. Für jeden Wert yi müssen wir mit

unserem Modell die Abweichung vom Mittelwert yi− y erklären. Betrachten wir dazu wiederum

die Situation für ein Datenpaar (xi, yi):

Abbildung 16: Zerlegung der Abweichung

Wir betrachten in der Abbildung 16 drei verschiedenene Arten von Abweichungen:

• die zu erklärende Abweichung yi − y,

• die durch unser Modell erklärte Abweichung yi − y,

• sowie die durch unser Modell nicht erklärte Abweichung yi − yi.

-46-


Werte β1 und β2 als „realistic Case“ und die oberen Grenzen als „best case“ Szenario.

Wenn wir also z.B. annehmen, dass 1′000m2 zusätzliche Verkaufsfläche zu einem Kostenanstieg

von 5 Mio. führen, gleicht das erwartete Jahresumsatzplus von 4.563 Mio. im Worst Case die

zusätzlichen Kosten nicht aus. Im Realistic und Best Case ist jedoch ein Umsatzplus zu erwar-

ten, das grösser ist als die zusätzlichen Kosten. Graphisch können wir diese Szenarien durch

Einzeichnen von zwei weiteren Geraden in unserem Regressionsmodell darstellen. Die beiden

neuen Geraden haben jeweils den gleichen Achsenabschnitt β1 wie unsere Regressionsgerade,

jedoch die beiden Grenzen des Konfidenzintervalles für β2 als Steigung:

Abbildung 21: Ein 95% Konfidenzintervall für die Steigung der Regressionsgerade

-60-

Stichwortverzeichnis uniseminar.ch

StichwortverzeichnisF -Test, 61

R2 angepasst, 65

R2-Koeffizient, 48

Ablehnbereich, 52

Abweichung

erklärte, 46

nicht erklärte, 46

zu erklärened, 46

Achsenabschnitt, 44, 55

Alternativhypothese, 52

Annahmebereich, 52

Autokorrelation, 63

Balkendiagramm, 12

Befragung

einmalig, 31

mündlich, 31

Panel, 31

schriftlich, 31

telefonisch, 31

Befragungstechnik, 31

Beibehaltungsbereich, 52

Beobachtungs-Studien, 32

bias, 32

Boxplot, 14

Business Statistics, 1

Census, 3

Conjointanalyse, 7

Datenerfassung, 30

Dezil, 22

Dichtefunktion, 23

Diskriminantanalyse, 7

Empirisches Signifikanzniveau, 57

Fehlerabweichung, 42

Geschichtete Stichprobe, 34

Grundgleichung, 47

Häufigkeit

absolut, 10

relativ, 10

Häufigkeitsverteilung

kumuliert, 11

Heteroskedastie, 63

Histogramm, 9

Homoskedastie, 38

Hypothese, 5

Interpretation der Regressionsgeraden, 45

Interquartile Range, 22

Intervallskala, 7

IQR, 22

Kausalität, 8

Klasse, 10

Klassenbreite, 10

Klassengrenzen, 10

Klumpenverfahren, 33

Konfidenzintervall, 59

Kontingenzanalyse, 7

Konzentrationsverfahren, 34

Korrelation, 8

-69-

Aufgaben

Übu

ngen

Prüfung

enExtras

A

Aufgaben

Forschungsmethoden

Bachelor


Inhaltsverzeichnis

1 Grundlagen der Wahrscheinlichkeitstheorie 1

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2


Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11


Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18


Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25


Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

6 Das Testen von Hypothesen 37

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

7 Das Testen von Hypothesen, Zweistichprobentests 45

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47


Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

9 Anwendungen χ2-Verteilung 63

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Varianzanalyse (ANOVA): Aufgaben uniseminar.ch

8 Varianzanalyse (ANOVA)

Aufgabe 27: Konzept der einfaktoriellen Varianzanalyse

Eine Universitätspräsidentin untersucht die Anzahl der Fehltage des letzten akademischen

Jahres. Hierzu wählt sie zufällig 6 ProfessorInnen der Ingenieurwissenschaften, 9 ProfessorInnen

der Wirtschaftswissenschaften und 8 ProfessorInnen der Kunstwissenschaften aus.

1. Handelt es sich hierbei um ein konstruiertes Experiment?

(Bei einem konstruierten Experiment werden den Testobjekten die Stufen des Faktors

(treatments) zufällig zugeordnet.)

2. Identifizieren Sie die abhängige und die unabhängige Variablen des Experiments. Geben

Sie jeweils an, ob die Variable quantitativ oder qualitativ ist.

Aufgabe 28: Einfaktorielle Varianzanalyse

Betrachten Sie das Experiment aus der vorigen Aufgabe. Wie lautet eine geeignete Nullhypo-

these, um mit einer einfaktoriellen Varianzanalyse die Daten zu analysieren? Welche Schlussfol-

gerung wird bei den nachfolgenden Daten bei einem Signifikanzniveau von 5% gezogen? Welche

Abschätzung für den p-Wert können Sie anhand der Tabellen für die F -Verteilung geben?

Ing.-Wiss. Wi.-Wiss. Kunstwiss.

9 4 11

10 5 10

6 6 10

8 7 9

4 7 7

8 6 5

8 13

8 7

3

Fehltage von ProfessorInnen der Fachrichtungen

-50-

Varianzanalyse (ANOVA): Lösungen uniseminar.ch

Variation Quadratsumme Freiheitsg. mittl. Quadrats. F -Wert

Faktor SSTR = 38.152 2 MSTR = 19.076 F = 4.080

Rest SSE = 93.500 20 MSE = 4.675

Total SST = 131.652 22

Der kritische Wert der F -Verteilung für ν1 = dfZähler = 2, ν2 = dfNenner = 20 und α = 0.05

ist laut Tabelle Fα = 3.49. Wegen F = 4.080 > 3.49 = Fα wird die Nullhypothese verworfen,

d.h. es ist ein signifikanter Unterschied für die mittlere Anzahl der Fehltage zwischen den

ProfessorInnen der unterschiedlichen Fachbereiche nachweisbar.

Die kritischen Werte der F -Verteilung zu den Signifikanzniveaus α = 0.025 und α = 0.01 sind

laut Tabelle F0.025 = 4.46 und F0.01 = 5.85. Wegen F0.05 < F < F0.025 lässt sich daraus die

Abschätzung herleiten, dass der p-Wert des Tests zwischen 0.025 und 0.05 liegen muss.

Aufgabe 29: Randomized Block Design

Bei einem Randomized Block Design gibt es drei Einkommensklassen als Blöcke. Es wurden

Personen jedes Blocks zufällig zwei verschiedenen Stufen eines Faktors zugeordnet. Untersuchen

Sie anhand der vorliegenden Daten, ob ein signifikanter Einfluss des Faktors vorliegt (α = 0.01).

Liegt ein signifikanter Einfluss der Blockvariable vor (α = 0.01)?

Block Stufe 1 Stufe 2

A 46 31

B 37 26

C 44 35

Lösung:

Es liegen t = 2 Stichproben vor, und in jeder Stichprobe gibt es n = 3 gruppierte Beobachtun-

gen.

1. Um den Einfluss des Faktors zu untersuchen betrachten wir die Hypothesen

-55-

Varianzanalyse (ANOVA): Lösungen uniseminar.ch

Wir führen eine zweifaktorielle Varianzanalyse gemäss dem Vorgehen im Theorieskript durch.

Wir haben k = 2 Stufen von Faktor A und p = 3 Stufen von Faktor B, ferner n = 2 Beobach-

tungen je Faktorkombination. Die Mittelwerttabelle lautet:

Faktor B

1 2 3

Faktor A 1 11.5 17 18 x1,•,• = 15.5

2 15 20.5 16.5 x2,•,• = 17.33

x•,1,• = 13.25 x•,2,• = 18.75 x•,3,• = 17.25 x•,•,• = 16.42

Für die Quadratsummen ergibt sich hieraus

SSA = 3 · 2 ·((15.5 − 16.42)2 + (17.33 − 16.42)2

)= 10.08

SSB = 2 · 2 ·((13.25 − 16.42)2 + (18.75 − 16.42)2 + (17.25 − 16.42)2

)= 64.67

SSAB = 2 ·((11.5 − 15.5 − 18.75 + 16.42)2 + . . .

)= 16.67

SST = (13 − 16.42)2 + (10 − 16.42)2 + · · ·+ (17 − 16.42)2 = 110.92 ,

also ist SSE = SST − SSA − SSB − SSAB = 110.92 − 10.08 − 64.67 − 16.67 = 19.5.

Die mittleren Quadratsummen lauten

MSA =10.08

1= 10.08 , MSB =

64.67

2= 32.33 , MSAB =

16.67

1 · 2 = 8.33

und MSE =19.5

2 · 3 · 1 = 3.25. Damit sind die Testgrössen

FA =MSAMSE

=10.08

3.25= 3.10 , FB =

MSBMSE

=32.33

3.25= 9.95 ,

FAB =MSABMSE

=8.33

3.25= 2.56 .

Zusammenfassung der Ergebnisse in der ANOVA-Tabelle:

-59-

Anwendungen χ2-Verteilung: Aufgaben uniseminar.ch

9 Anwendungen χ2-Verteilung

Aufgabe 31: Der χ2-Anpassungstest

Anhand von Stichprobendaten soll folgende Nullhypothese

H0 : es liegt eine Normalverteilung mit Mittelwert µ = 120 vor

überprüft werden. Dazu werden die Daten in 8 Kategorien eingeteilt.

1. Wie viele Freiheitsgrade gehören zum entsprechenden χ2-Anpassungstest?

2. Was ist der kritische Wert der χ2-Verteilung zum Signifikanzniveau α = 0.05?

3. Welche Schlussfolgerung wird bei einer Testgrösse von 11.25 gezogen?

Aufgabe 32: Der χ2-Anpassungstest

Bei einer Studie zum Fahrzeugbesitz ergab eine Stichprobe von 100 zufällig gewählten Haus-

halten einer US-amerikanischen Kleinstadt die folgende Häufigkeitstabelle:

Anzahl Fahrzeuge Anzahl Haushalte

0 20

1 35

2 23

≥ 3 22

Testen Sie zum Signifikanzniveau α = 0.05, ob die Grundgesamtheit einer Poisson-Verteilung

mit Parameter µ = 1.5 folgt.

Aufgabe 33: Der χ2-Unabhängigkeitstest

In einer Studie wurde bei 100 Kunden verschiedener Altersstufen die Art und Weise beobachtet,

wie diese beim Eingang eines grossen Discounters begrüsst werden. Die folgende Tabelle zeigt

das Ergebnis:

-61-

Übu

ngen

Prüfung

enExtras

Ü

Übungen

Forschungsmethoden

Bachelor


Inhaltsverzeichnis

1 Statistische Masszahlen 1

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Einführung in die Wahrscheinlichkeitsrechnung 6

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9


Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20


Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26


Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33


Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

7 Hypothesentests I und II 47

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51


Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

9 Anwendungen der χ2-Verteilung 75

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Statistische Masszahlen: Lösungen uniseminar.ch

Lösungen: Statistische Masszahlen

Aufgabe 1: Lage- und Streuparameter

Der folgende Datensatz zeige eine repräsentative Auswahl der Monatseinkommen von Saison-

arbeitskräften (bereits der Grösse nach geordnet). Ermitteln Sie Median, die Quartile sowie das

erste Dezil.

2’200 2’200 2’269 2’286 2’302 2’308 2’335 2’344 2’353 2’375

2’467 2’502 2’507 2’534 2’562 2’572 2’598 2’600 2’606 2’614

2’669 2’678 2’691 2’706 2’708 2’712 2’770 2’791 2’798 2’826

2’827 2’858 2’867 2’873 2’876 2’905 2’969 2’978 2’989 2’996

3’000 3’007 3’020 3’200 3’229 3’252 3’506 3’506 3’582 3’609

Zeichnen Sie ferner die (empirische) Verteilungsfunktion, einen Boxplot sowie das Histogramm.

Lösung:

Median ist der Wert, der sich in der Mitte aller Daten befindet, d.h. es sind genau so viele

Daten grösser wie kleiner als der Median, je 50%. Der Median ist das 12· (n+1) = 25.5-te

Element der sortierten Daten. Da dies keine ganze Zahl ist, nehmen wir entsprechend der

Nachkommazahl je 50% der umgebenden Werte x[25] und x[26]:

Median = x[ 1

2·(n+1)] = x[25.50] = 0.50 · x[25] + 0.50 · x[26] = 0.50 · 2′708 + 0.50 · 2′712 = 2′710.

Quartile Q1, Q2 und Q3 teilen die Wertemenge in vier gleich grosse Teilmengen ein. Sie be-

finden sich also an den Stellen 14· (n+1), 2

4· (n+1) und 3

4· (n+1) in der Datenfolge. Das

erste Dezil grenzt das erste Zehntel der Datenmenge ab und befindet sich somit an der

Stelle 110

· (n + 1). Falls diese Stellen nicht ganzzahlig sind, dann müssen den Nachkom-

mastellen entsprechende Prozentsätze der nächstgrösseren und -kleineren Datenelemente

genommen werden:

Q1 = x[ 1

4·(n+1)] = x[12.75] = 0.25 · x[12] + 0.75 · x[13] = 0.25 · 2′502 + 0.75 · 2′507 = 2′505.75.

Q2 = x[ 2

4·(n+1)] = x[25.50] = Median = 2′710.

Q3 = x[ 3

4·(n+1)] = x[38.25] = 0.75 · x[38] + 0.25 · x[39] = 0.75 · 2′978 + 0.25 · 2′989 = 2′980.75.

D1 = x[ 1

10·(n+1)] = x[5.10] = 0.90 · x[5] + 0.10 · x[6] = 0.90 · 2′302 + 0.10 · 2′308 = 2′302.6.

-2-


Hier wurden die Werte der Tabelle entnommen:

2’200 2’200 2’269 2’286 2′302 2′308 2’335 2’344 2’353 2’375

2’467 2′502 2′507 2’534 2’562 2’572 2’598 2’600 2’606 2’614

2’669 2’678 2’691 2’706 2′708 2′712 2’770 2’791 2’798 2’826

2’827 2’858 2’867 2’873 2’876 2’905 2’969 2′978 2′989 2’996

3’000 3’007 3’020 3’200 3’229 3’252 3’506 3’506 3’582 3’609

Empirische Verteilungsfunktion:

2500 3000 3500

0.00.2

0.40.6

0.81.0

Empirische Verteilungsfunktion

x

Fn(x)

Boxplot:

22

00

24

00

26

00

28

00

30

00

32

00

34

00

36

00

Boxplot

Histogramm:

-3-


Einkommen

Anzah

l

2000 2500 3000 3500 4000

02

46

810

12

Aufgabe 2: Mittelwert und Standardabweichung

Während der letztjährigen Olma-Messe führte die St. Galler Kantonspolizei verstärkt Alko-

holkontrollen bei Autofahrern rund um das Messegeländer durch. Bei 25 Autofahrern wurden

folgende Werte gemessen:

0.00% 0.08% 0.15% 0.18% 0.02%

0.04% 0.00% 0.03% 0.11% 0.17%

0.05% 0.21% 0.01% 0.10% 0.19%

0.00% 0.09% 0.05% 0.03% 0.00%

0.03% 0.00% 0.16% 0.04% 0.10%

1. Bestimmen Sie den Mittelwert und die Standardabweichung für diese Stichprobe.

2. Bestimmen Sie mit Hilfe der Ungleichung von Tschebyscheff den (theoretischen) Min-

destanteil an Beobachtungen, der innerhalb k = 1.50 Standardabweichungen rund

um den Mittelwert fällt. Unterstützen die Ergebnisse der Stichprobe die Aussage der

Tschebyscheff-Ungleichung?

Lösung:

1. Der Stichprobenmittelwert ist das arithmetische Mittel der Daten:

x =

n∑

i=1

xi

n=

0.00

25+

0.08

25+

0.15

25+ · · ·+ 0.04

25+

0.10

25=

1.84

25= 0.0736%

-4-

Hypothesentests I und II: Aufgaben uniseminar.ch

Universität Anzahl der befragten Anzahl der Anteil der

Personen ni Anhänger Anhänger pi

Bern 1’200 672 0.56

HSG 900 549 0.61

Prüfen Sie, ob ein Unterschied im Anteil der Befürworter fortschrittlicher Zahlungmittel an der

beiden Unis besteht (Signifikanzniveau α = 0.05).

Aufgabe 35: Test, Varianzen

Die Firma T-fix verpackt Tee zu 100 g-Packungen. Tee hat die unangenehme Eigenschaft, je

nach Luftfeuchtigkeit mehr oder weniger in seinem Gewicht zu schwanken. Eine Stichprobe

ergab folgende Packungsgewichte (in g):

100.3 99.9 102.0 98.7 103.2 101.1 100.8 99.2

98.7 100.5 100.1 97.9 101.3 100.1 98.2 101.2

Arithmetisches Mittel dieser Stichprobe: 100.2, Stichprobenvarianz: 2.04.

(a) Wenn man die Grundgesamtheit als normalverteilt ansieht, kann man die Nullhypothese,

dass das mittlere Packungsgewicht 100 g beträgt zum Niveau α = 0.05 verwerfen?

(b) Nach der Beschaffung einer neuen Abfüllanlage ermittelt man in einer einfachen Zufall-

stichprobe folgende Packungsgewichte (in g):

99.9 100.3 100.2 100.0 100.5 100.0

100.1 99.5 100.2 100.4 99.6 101.1

Testen Sie H0 : σ21 ≤ σ2

2 vs. H1 : σ21 > σ2

2 zum Niveau α = 0.05.

-50-

Prüfung

enExtras

P

Prüfungen

ForschungsmethodenBachelor


Inhaltsverzeichnis

Quantitativer Teil 1

Prüfung (Quantitativ) Wintersemester 2004/05 1Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3


Nachhol-Prüfung (Quantitativ) Wintersemester 2005/06 21Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24


Nachhol-Prüfung (Quantitativ) Wintersemester 2006/07 40Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Prüfung (Quantitativ) Herbstsemester 2007 50Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Nachhol-Prüfung (Quantitativ) Herbstsemester 2007 62Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64









Testprüfung (Quantitativ) 163Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

Qualitativer Teil 171

Prüfung (Qualitativ) Wintersemester 2005/06 171Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

Prüfung (Qualitativ) Wintersemester 2006/07 177Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

Prüfung (Qualitativ) Herbstsemester 2007 183Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186





Lösungsvorschläge für Verständnisfragen 215

Prüfung (Quantitativ) Wintersemester 2004/05: Lösung uniseminar.ch

2. (14 P.) Angenommen, die Tagesrenditen des Dow Jones seien approximativ normalver-teilt. Bestimmen Sie ein 90%-Konfidenzintervall auf Basis der 10 realisiertenTagesrenditen vom 26.10.-08.11.2004.Begründen Sie ausführlich Ihr Vorgehen.

Lösung:Wir gehen analog zur ersten Teilaufgabe - oder der Theorie zu den Konfidenzintervallen - vor.Hier müssen wir aufpassen, denn die Varianz der Stichprobe ist nicht gegeben. Wir müsen diesedurch die Stichprobenvarianz s2 zuerst schätzen. Wenn wir jedoch mit dieser geschätzten Grössearbeiten, ist

√n(x−µ)s

∼ tn−1 also t verteilt mit n− 1 Freiheitsgrade df . In diesem Fall ist n = 10

also df = 9. Zuerst berechnen wir s2 durch:

s2 =1

n− 1

n∑i=1

x2i −

1

n

(n∑i=1

xi

)2 (1)

Dazu brauchen wir die Daten:

Tagesrenditexi x2

i

26.10.2004 0.38% 0.1444%27.10.2004 0.84% 0.7056%28.10.2004 0.73% 0.5329%29.10.2004 -0.94% 0.8836%01.11.2004 1.10% 1.2100%02.11.2004 1.18% 1.3924%03.11.2004 0.96% 0.9216%04.11.2004 0.20% 0.0400%05.11.2004 1.23% 1.5129%08.11.2004 -0.28% 0.0784%Total: 5.4% 7.4218%

Mit Hilfe dieser Hilfsrechnung können wir nun gemäss (1) s2 berechnen:

s2 =1

10− 1

(7.4218− 1

10(5.4)2

)= 0.5006

Also ist s =√

0.5006 = 0.7075.

-4-

Prüfung (Quantitativ) Herbstsemester 2008: Lösung uniseminar.ch

xu = −3− 2.262 · 2.91√10

= −5.08

Das Konfidenzintervall für x ist also gegeben durch [−0.921,−5.08]

2. (5 P) Testen Sie auf einem Signifikanzniveau von α = 0.05, ob die Kur tatsächlichzu einem Gewichtsverlust geführt hat. Tragen sie näherungsweise den kritischenBereich sowie die Prüfgrösse und deren p-Wert graphisch ein.

Lösung:Wir testen also, ob die Kur zu einem Gewichtsverlust führt. Dazu stellen wir die Hypotheseauf, dass die Kur nicht hilft, denn dies wollen wir verwerfen:

H0 : µ > µ0 = 0

H1 : µ ≤ µ0 = 0

Es handelt sich also um einen linksseitigen Test für den Mittelwert mit unbekannter Varianz.Also um einen t-Test. Die Teststatistik berechnet sich aus:

t =x− µ0

s√n

=−3

0.919= −3.264

Der kritischeWert tc für einen linksseitigen Test erhalten wieder aus der Tabelle der t-Verteilung.Es gilt tc = t0.05,9 = 1.833. Da nun t = −3.264 < −1.833 = −tc verwerfen wir die Nullhypotheseauf dem Niveau α = 0.05. Die Kur hat also einen signifikanten Effekt.

-79-

Prüfung (Quantitativ) Herbstsemester 2010: Lösung uniseminar.ch

Toranzahl i 5 6 7 8 9 ≥ 10

P (X = i) 0.1163 0.0628 0.0290 0.0117 0.0042 0.0019

Wir interpretieren jetzt die Wahrscheinlichkeiten als relative Häufigkeiten der i-ten Klasse vonErgebnissen. Zu den unter H0 erwarteten absoluten Häufigkeiten Ek kommt man durch Multi-plikation der Wahrscheinlichkeiten mit der Stichprobenzahl n = 76. Bei den erwarteten Häu-figkeiten entstehen Nachkommastellen, wir dürfen sie aber nicht zu ganzen Zahlen runden:

Toranzahl i 0 1 2 3 4P (X = i) 0.0393 0.1272 0.2058 0.2221 0.1797

Ei 2.9868 9.6672 15.6408 16.8796 13.6572

Toranzahl i 5 6 7 8 9 ≥ 10

P (X = i) 0.1163 0.0628 0.0290 0.0117 0.0042 0.0019Ei 8.8388 4.7728 2.2040 0.8892 0.3192 0.1444

Es gibt Klassen, deren erwartete Häufigkeit unter der Grenze 5 liegt, also müssen wir dieKlassen neu einteilen, Wir fassen die Klassen i = 0, 1 sowie die Klassen i = 6, 7, 8, 9,≥ 10

jeweils zusammen, um E ≥ 5 für alle Klassen zu erreichen. Die Kenngrössen für die neuenKlassen entstehen durch Addieren der Werte aus den Teilklassen:

E0,1 = E0 + E1 = 12.654 , O0,1 = O0 +O1 = 12 .

Für die zweite neue Klasse gilt

E≥6 = E6 + E7 + E8 + E9 + E≥10 = 8.3296 , O≥6 = O6 +O7 +O8 +O9 +O≥10 = 8 .

Für die neuen Klasseneinteilung stellen wird die erwarteten Häufigkeiten Ei den beobachtetenHäufigkeiten Oi gegenüber:

Toranzahl i 0,1 2 3 4 5 ≥ 6

Ei 12.6540 15.6408 16.8796 13.6572 8.8388 8.3296Oi 12 15 20 12 9 8

Die Ei unterscheiden sich von den Oi, aber ob der Unterschied signifikant gegen H0 sprichtkönnen wir erst entscheiden, nachdem wir die standardisierte Testgrösse berechnet haben. Beiden χ2-Tests ist das der Wert

χ2 =∑i

(Oi − Ei)2

Ei∼ χ2

df .

-127-

Prüfung (Qualitativ) Wintersemester 2005/06: Lösung uniseminar.ch

Lösung

Aufgabe 1

Die Globale Erwärmung, Orkane und alle anderen Naturkatastrophen sind monokausal auf diesinkende Zahl von Piraten seit Beginn des 19. Jahrhunderts zurückzuführen. Ein entsprechen-der empirischer Beweis in Form eines Graphen wurde vor kurzem veröffentlicht.

1. Wie steht es um die theoretische Begründung dieses Zusammenhangs?Wie ist es möglich, dass zwischen diesen beiden Variablen ein Zusammenhangbesteht?Was ist der Unterschied zwischen Korrelation und Kausalität?

Lösung:Im Scatterplot wurden die Variablen Anzahl Piraten und durchschnittliche Erdtemperatur dar-gestellt. Man kann in diesem Plot einen linearen Zusammenhang zwischen den Daten erkennen.Die durchschnittliche Erdtemperatur nahm proportional zum Rückgang der Piraten zu. Mankann also klar eine Korrelation zwischen diesen beiden Daten erkennen.

-154-


Lösung

Aufgabe 1

Arbeitslose nach Bildungsab-schluss, insgesamt 151.661.

Die Grafik des Arbeitsmarkt-service zeigt’s deutlich: Je höherder Bildungsgrad, umso geringerdie Wahrscheinlichkeit, keinenJob zu bekommen. Mehr als viervon zehn Arbeitslosen haben nurdie Pflichtschule abgeschlossen.Erschreckend, dass sich fastgenauso viele Lehrlinge unter denErwerbslosen finden, wo in vielenBranchen Facharbeiter fehlen.

(Quelle: Kronen-Zeitung vom 12.8.2000)

1. Was ist die Grundgesamtheit, auf die sich diese Auswertung bezieht?

Lösung:

Die Auswertung bezieht sich auf die Zahl der arbeitslosen Bürger eines Landes (hier Österreich).

2. Welche zusätzlichen Informationen braucht man, um etwas über die Arbeitslosenund den Bildungsabschluss aussagen zu können?

Lösung:Wir müssten noch das Verhältnis zwischen den einzelnen Bereichen der Ausbildung und derGesamtbevölkerung kennen. Wir können alleine aus dem Diagramm keine Aussagen machen,denn wir wissen de facto nicht, wie gross zum Beispiel der Anteil der Uni-Absolventen in derGesamtbevölkerung ist. Der Anteil dieser Absolventen an der Zahl der Arbeitslosen beträgt lautDiagramm 4%, also gut 6′066 Leute. Wenn nun aber nur gerade 10′000 der Gesamtbevölkerung

-160-


Bruch des R2 Koeffizienten ändert sich dann nicht, da e2k = (yk − yk)

2 = 0. Der Mittelwertder y wird zwar durch die neue Beobachtungen nach oben gezogen, aber die zu erklärendeAbweichung yk − y ist sicherlich grösser als 0. Das heisst, dass sich der Nenner im Bruch desR2 Koeffizienten vergrössert. Beides führt dazu, dass der ganze Bruch kleiner wird und somitR2 grösser wird. Der andere Fall, dass sich der R2 Koeffizient beim Hinzufügen einer weiterenBeobachtung verkleinern kann, ist ziemlich offensichtlich. Wenn die neue Beobachtung ziemlichextrem, das heisst viel grösser als y ist und sich zusätzlich die Regressionsgerade nicht zu sehrverändert, wird der Bruch in der zweiten Form von (10) grösser. Wir ziehen also eine grössereZahl von Eins ab und erhalten somit einen kleineren R2 Koeffizienten. Die Abbildung zeigtdiese beiden Fälle. Ohne eine zusätzliche Beobachtung (durch den fetten Punkt bei x = 6

dargestellt) erhalten wir für den R2 Koeffizient einen Wert von 0.542. Im ersten Fall fällt dieneue Beobachtung gerade auf die Regressionsgerade, welche sich nicht verändert. In diesemFall berechnet man R2 = 0.5814. Man erhält also einen grösseren Wert und somit ein besseresModell. Im zweiten Fall unterscheidet sich die neue Beobachtung von den bisherigen Werten.Die neue Regressionsgerade führt zu einem Modell mit R2 = 0.07383. Dieser Wert ist vielkleiner und somit ist das Modell viel schlechter.

Abbildung 3: Die neue Beobachtung ist jeweils durch einen ausgefüllten Punkt gekennzeichnet.

-163-

Prüfung (Qualitativ) Herbstsemester 2007: Lösung uniseminar.ch

Aufgabe 4

Abbildung 7: Quelle: Vorlesungsskript von Dr. A. Herrman

1. Erläutern sie die Grundprobleme, die bei der multiplen Regression auftretenkönnen.

Lösung:Wenn wir ein Regressionsmodell auf beobachtete Daten anwenden, müssen wir uns immer dieAnnahmen an die Daten y in Erinnerung rufen. Diese findet man im Selbststudium Skript imAbschnitt 3.2.Wichtig ist, dass ein linearer Zusammenhang der Daten logisch erscheint. Dies überprüft mananhand eines Scatterplots. Falls der Plot eine nichtlineare Struktur (also zum Beispiel die Formeiner Parabel) besitzt, deutet dies auf eine Verletzung dieser Modellannahme hin. Weiter nimmtman an, dass die Varianz der Fehlerterme konstant ist (Homoskedastie). Dies überprüft man anHand eines Scatterplotes der Residuen (ei). Diese sollten so gestreut sein, dass keine Strukturerkennbar ist. Weiter macht man auch die Annahme, dass die Fehlerterme zu einander unkorre-liert sind. Im Fall von Beobachtungen, die aus Zeitreihen stammen (siehe Aufgabe 4.1.1), wirddiese Annahme oftmals verletzt, da solche Daten stark autokorreliert sein können.

2. Die beiden Abbildungen zeigen jeweils den Zusammenhang zwischen den Resi-duen und der x-Variable einer Regression.Was folgern Sie aus diesen Abbildungen?

Lösung:Die Plots zeigen klar, dass im ersten Fall die Annahme der Homoskedastie verletzt ist. Imzweiten Fall kann man vermuten, dass der Zusammenhang zwischen den Variablen nicht linear,sondern quadratisch ist.

-170-

EExtras

Formeln

Forschungsmethoden

Bachelor


Inhaltsverzeichnis

Kenngrössen der Wahrscheinlichkeitstheorie 1

Wahrscheinlichkeitsverteilungen 3

Streuungsanalyse (ANOVA) 5

Lineare Regression 8

Ablaufschemas für statistische Tests 10

Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

χ2-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Tabelle der Binomialverteilung 18

Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Tabelle der Poisson-Verteilung 24

Wahrscheinlichkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24


Tabelle der Standardnormalverteilung 28


Weiersfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Quantile der Studentsche t-Verteilung 30

Quantile der F -Verteilung 31

Quantile der χ2-Verteilung 34

Hier haben wir alle wichtigen Formeln und Tabellen zur Vorlesung kurz und übersichtlich

zusammen gestellt. Zudem findest Du die Schemas aus den Theorieskripten zu den jeweiligen

Tests. Diese helfen Dir schneller voran zu kommen und einen guten Überblick zu erhalten.

Formeln uniseminar.ch

Kenngrössen der Wahrscheinlichkeitstheorie

Kenngrösse Diskrete ZV X Stetige ZV X

Erwartungswert µX

∑

xi · P (X = xi)

∫ ∞

−∞xf(x)dx

Erwartungsoperator E[g(X)]∑

g(xi) · P (X = xi)

∫ ∞

−∞g(x)f(x)dx

Varianz σ2X

∑

(xi − µX)2 · P (X = xi)

∫ ∞

−∞(x − µX)2f(x)dx

Std-Abweichung σX

√

σ2X

√

σ2X

lowertail-Quantil xα

∑

xj≤xα

P (X = xj) = α

∫ xα

−∞f(x)dx = α

uppertail-Quantil xα

∑

xj≥xα

P (X = xj) = α

∫ ∞

xα

f(x)dx = α

Die Kenngrössen für Stichproben x1, . . . , xn sind leicht anders definiert:

Arithmetisches Mittel x =1

n

n∑

i=1

xi

Varianz s2 =1

n − 1

n∑

i=1

(xi − x)2

Std-Abweichung s =√

s2

Kovarianz Cov(X, Y ) =1

n − 1

n∑

i=1

(xi − x)(yi − y)

Korrelationskoeffizient r =Cov(X, Y )

s(X) · s(Y )

-1-


Wahrscheinlichkeitsverteilungen

Diskrete Wahrscheinlichkeitsverteilungen

Verteilung Notation Wahrscheinlichkeit µX σ2X

Binomial X ∼ B(n, π) P (X = x) =

(n

x

)

· πx · (1 − π)n−x nπ nπ(1 − π)

Poisson X ∼ Po(µ) P (X = x) =e−µ · µx

x!µ µ

Stetige Wahrscheinlichkeitsverteilungen

Verteilung Notation Dichtefunktion µX σ2X

Normalverteilt X ∼ N(µ, σ2) f(x) =1√2πσ

e−1

2(x−µ

σ)2 µ σ2

Exponentialverteilt X ∼ Exp(λ) f(x) = λe−λx 1λ

1λ2

Lognormalverteilt X ∼ logN(µY , σ2Y ) µX = eµY +

σ2

Y2

Y = log(X) ∼ N(µY , σ2Y ) σX = e2(µY +σ2

Y) − e2µY +σ2

Y

Berechnung der Wahrscheinlichkeit stetiger Verteilungen

Linksseitig P (X ≤ b) =∫ b

−∞f(x)dx = F (b) → Tabellenwert

Rechtsseitig P (X ≥ a) =∫ ∞

a

f(x)dx = 1 − F (a)

Zweiseitig P (a ≤ X ≤ b) =∫ b

a

f(x)dx = F (b) − F (a)

-3-


Konfidenzintervalle

Konfidenzintervalle,

Konfidenzkoeffizient 1 − α

Mittelwert, µ Anteilswert, π

σ bekannt σ unbekanntIst nπ ≥ 5 und

n(1 − π) ≥ 5?

Ist n ≥ 30?

Ja Nein Ja Nein

Ist die Population

wirklich oder

approximativ

normalverteilt?

Ist die Population

wirklich oder

approximativ

normalverteilt?

Nein Nein

Ist n ≥ 30?

Ja Nein Ja

z-Intervall

x ± zα/2 · σ√n

wobei

zα/2 aus der Tabelle

abgelesen wird.

t-Intervall

x ± tα/2 · s√n

wobei

s =

√

nP

x2

i−(P

xi)2

n(n−1)

und tα/2 aus der

Tabelle abgelesen

wird mit df = n − 1.

z-Intervall

p ± zα/2 · σp

wobei

σp =

√p(1−p)

n


abgelesen wird.

z-Intervall

x ± zα/2 · s√n

wobei

s =

√

nP

x2

i−(

P

xi)2

n(n−1)


abgelesen wird.

-11-


χ2-Test

Nullhypothese H0 formulieren

Signifikanzniveau α wählen

Anzahl Freiheitsgrade dffür den Test bestimmen

Anpassungs-,

Unabhängigkeits-

oder Homogenitätstest

Hypothesentest

für die Varianz

Tabelle der beobachteten

Häufigkeiten Oij erstellen

Tabelle der unter H0 erwarteten

Häufigkeiten Eij erstellen

Testgrösse χ2 =r∑

i=1

k∑

j=1

(Oij−Eij)2

Eij

r = Anzahl Zeilen

k = Anzahl Spalten

Testgrösse χ2 = (n−1)s2

σ2

0

n = Stichprobenumfang

s2 = Stichprobenvarianz

σ20 = hypothetische Varianz

χ2 > χ2α ? χ2 im Verwerfungsbereich?

Nein Ja Nein Ja

H0 nicht verwerfen H0 verwerfen H0 nicht verwerfen H0 verwerfen

-17-

Tabellen uniseminar.ch

BinomialverteilungWahrscheinlichkeitsfunktion

n Versuche, Erfolgswahrscheinlichkeit π

P (X = x) =

(n

x

)

πx (1 − π)n−x

n x π = 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

2 0 0.8100 0.6400 0.4900 0.3600 0.2500 0.1600 0.0900 0.0400 0.0100

1 0.1800 0.3200 0.4200 0.4800 0.5000 0.4800 0.4200 0.3200 0.1800

2 0.0100 0.0400 0.0900 0.1600 0.2500 0.3600 0.4900 0.6400 0.8100

3 0 0.7290 0.5120 0.3430 0.2160 0.1250 0.0640 0.0270 0.0080 0.0010

1 0.2430 0.3840 0.4410 0.4320 0.3750 0.2880 0.1890 0.0960 0.0270

2 0.0270 0.0960 0.1890 0.2880 0.3750 0.4320 0.4410 0.3840 0.2430

3 0.0010 0.0080 0.0270 0.0640 0.1250 0.2160 0.3430 0.5120 0.7290

4 0 0.6561 0.4096 0.2401 0.1296 0.0625 0.0256 0.0081 0.0016 0.0001

1 0.2916 0.4096 0.4116 0.3456 0.2500 0.1536 0.0756 0.0256 0.0036

2 0.0486 0.1536 0.2646 0.3456 0.3750 0.3456 0.2646 0.1536 0.0486

3 0.0036 0.0256 0.0756 0.1536 0.2500 0.3456 0.4116 0.4096 0.2916

4 0.0001 0.0016 0.0081 0.0256 0.0625 0.1296 0.2401 0.4096 0.6561

5 0 0.5905 0.3277 0.1681 0.0778 0.0313 0.0102 0.0024 0.0003 0.0000

1 0.3281 0.4096 0.3601 0.2592 0.1563 0.0768 0.0284 0.0064 0.0004

2 0.0729 0.2048 0.3087 0.3456 0.3125 0.2304 0.1323 0.0512 0.0081

3 0.0081 0.0512 0.1323 0.2304 0.3125 0.3456 0.3087 0.2048 0.0729

4 0.0005 0.0064 0.0283 0.0768 0.1563 0.2592 0.3601 0.4096 0.3280

5 0.0000 0.0003 0.0024 0.0102 0.0313 0.0778 0.1681 0.3277 0.5905

6 0 0.5314 0.2621 0.1176 0.0467 0.0156 0.0041 0.0007 0.0001 0.0000

1 0.3543 0.3932 0.3025 0.1866 0.0938 0.0369 0.0102 0.0015 0.0001

2 0.0984 0.2458 0.3241 0.3110 0.2344 0.1382 0.0595 0.0154 0.0012

3 0.0146 0.0819 0.1852 0.2765 0.3125 0.2765 0.1852 0.0819 0.0146

4 0.0012 0.0154 0.0595 0.1382 0.2344 0.3110 0.3241 0.2458 0.0984

5 0.0001 0.0015 0.0102 0.0369 0.0938 0.1866 0.3025 0.3932 0.3543

6 0.0000 0.0001 0.0007 0.0041 0.0156 0.0467 0.1176 0.2621 0.5314

7 0 0.4783 0.2097 0.0824 0.0280 0.0078 0.0016 0.0002 0.0000

1 0.3720 0.3670 0.2471 0.1306 0.0547 0.0172 0.0036 0.0004 0.0000

2 0.1240 0.2753 0.3177 0.2613 0.1641 0.0774 0.0250 0.0043 0.0002

3 0.0230 0.1147 0.2269 0.2903 0.2734 0.1935 0.0972 0.0287 0.0026

4 0.0026 0.0287 0.0972 0.1935 0.2734 0.2903 0.2269 0.1147 0.0230

5 0.0002 0.0043 0.0250 0.0774 0.1641 0.2613 0.3177 0.2753 0.1240

6 0.0000 0.0004 0.0036 0.0172 0.0547 0.1306 0.2471 0.3670 0.3720

7 0.0000 0.0002 0.0016 0.0078 0.0280 0.0824 0.2097 0.4783

8 0 0.4305 0.1678 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000

1 0.3826 0.3355 0.1977 0.0896 0.0313 0.0079 0.0012 0.0001

2 0.1488 0.2936 0.2965 0.2090 0.1094 0.0413 0.0100 0.0011 0.0000

3 0.0331 0.1468 0.2541 0.2787 0.2188 0.1239 0.0467 0.0092 0.0004

4 0.0046 0.0459 0.1361 0.2322 0.2734 0.2322 0.1361 0.0459 0.0046

5 0.0004 0.0092 0.0467 0.1239 0.2188 0.2787 0.2541 0.1468 0.0331

6 0.0000 0.0011 0.0100 0.0413 0.1094 0.2090 0.2965 0.2936 0.1488

7 0.0001 0.0012 0.0079 0.0313 0.0896 0.1977 0.3355 0.3826

8 0.0000 0.0001 0.0007 0.0039 0.0168 0.0576 0.1678 0.4305

-18-

Documents

HSG_Fometh_Ordner_Issuu