Upload
wenda
View
84
Download
0
Embed Size (px)
DESCRIPTION
TESTS. TESTS. TESTS. TESTS. TESTS. TESTS. TESTS. Worum es geht. Man möchte „testen“, ob eine bestimmte Annahme ( Hypothese ) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Nullhypothese. In der Statistik kann man nie ganz sicher sein. - PowerPoint PPT Presentation
Citation preview
TESTS
TESTS
TESTS
TESTSTESTS
TESTS
TESTS
Worum es geht
Man möchte „testen“, ob eine bestimmteAnnahme (Hypothese) über Parameter der Realität entspricht oder nicht.
Beobachtung(Stichprobe)
EntscheidungEntscheidungVorgabe:
„Irrtumswahr-scheinlichkeit“
Formulierung einer
HypotheseNullhypotheseNullhypothese
In der Statistik kann man nie ganz sichersein. Die „Irrtumswahr-scheinlichkeit“ solltewenigstens klein sein.
Mathematischer Rahmen ITESTS
Statistische Struktur
Testproblem(Hypothese)
NullhypotheseNullhypothese
Niveau
Gegeben sind:
Stetiger Fall Diskreter Fall
Mathematischer Rahmen IITESTS
TestTest gegeben durch:
Ablehnungsbereich
Teilmenge der Grund-gesamtheit :
Menge aller Beobachtungen ,die zur Ablehnung der Hypothese führen
Mathematischer Rahmen IIITESTS
Beobachtung (Stichprobe)(Stichprobe)
Entweder Oder
Beobachtung liegtim Annahmebereich
Beobachtung liegtim Ablehnungsbereich
Hypotheseannehmen!
Hypothese ablehnen!
Fehler erster und zweiter Art
Hypotheseakzeptiert
Hypotheseabgelehnt
Hypothesewahr
Hypothesefalsch
Entschei-Entschei-dungdung
RealitätRealität
Fehler 1. Art
Fehler 2. Art
Niveau und Macht
Obere Grenze für die Wahr-scheinlichkeit, einen FehlerFehler1. Art1. Art zu begehen
NiveauNiveau
1 - Wahrscheinlichkeit, einenFehler 2. ArtFehler 2. Art zu begehen,wenn der wahre Parameter-wert in dem Punkt liegt
MachtMacht in einem
Punkt der Alter-native
Neyman-Pearson-Test
Für einen Test mit
gilt immer:
Sei * ein Neyman-Pearson Test vom Niveau :
Jeder Test, der vom Niveau eines gegebenen Neyman-Pearson-Tests ist, besitzt
höchstens die Machthöchstens die Macht dieses Neyman-Pearson-Tests.
Tafel für die Verteilungsfunktionbei Normalverteilung
Approximative Konfidenzintervalleim Bernoulli-Fall II
Vereinfachung für großes n(n 100)
BeispielKaufhaus-Konzern
Kauf würde in Erwägung
gezogen
Kauf würde nicht in Erwägung
gezogen
572 1428
Tafel für die Verteilungsfunktionbei Normalverteilung
ZusammenhangKonfidenzintervalle - Tests
Gegeben sei ein KonfidenzintervallKonfidenzintervallC() vom Niveau
ist dann mit dem AblehnungsbereichAblehnungsbereich
Für eine einfache Hypothese
ein Test Test vom Niveau gegeben, denn:
Konfidenzintervalle
Intervallschätzung
Jeder Beobachtung wirdein Intervall C()
der reellen Zahlen zugeordnet
Niveau
Dabei ist die Wahrscheinlichkeit.eine Beobachtung zu machen,für die der wahre Parameter
im zugehörigen Intervall liegt, größer oder gleich 1 -
Tafel für die Verteilungsfunktionbei Normalverteilung
Rechenbeispiel
Stichprobe vom Umfang n = 5
3.5 7.2 5.0 4.3 7.9
Stichprobenfunktionen
Konfidenzintervallefür diese konkrete Stichprobe
1.Fall
2.Fall
3.Fall
4.Fall
5.Fall
6.Fall
18.28
BeispielGewicht von ÄpfelnÄpfeln
Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet
Konfidenzintervallefür diese konkrete Stichprobe
2.Fall
5.Fall
Tafel für die Verteilungsfunktionbei Normalverteilung
Student-Verteilung
Testfür den Erwartungswert
Varianz bekannt
Fall Normalverteilung
Testfür den Erwartungswert
Varianz unbekannt
Fall Normalverteilung
Vergleich zweier unabhängigerStichproben 1. Fall
2 unabhängige Stichprobenmit Stichprobenvariablen X und Y
Annahmen:
X und Y normalverteilt
Varianz von X = Varianz von Y
Hypothese:
Erwartungswert von X = Erwartungswert von Y
Für n unabhängigeunabhängige Zufallsvariablen
mit
hat man:
Mathematische Bedeutung der Chi-Quadrat-Verteilung
Für unabhängigeunabhängige ZufallsvariablenW und U mit
hat man:
Mathematische Bedeutung der t-Verteilung
Vergleich zweier unabhängigerStichproben 1. Fall
Prüfgröße
n: Umfang der Stichprobe 1(Stichprobenvariable X)
m: Umfang der Stichprobe 2(Stichprobenvariable Y)
Ablehnungsbereich
bestimmt durch
Vergleich zweier unabhängigerStichproben 2. Fall
2 unabhängige Stichprobenmit Stichprobenvariablen X und Y
Annahmen:
X und Y normalverteilt
n und m groß (> 30), damitApproximation der Varianzensinnvoll
Hypothese:
Erwartungswert von X = Erwartungswert von Y
Vergleich zweier unabhängigerStichproben 2. Fall
Ausgangspunkt
Approximation
Prüfgröße
Ablehnungsbereich
bestimmt durch
Chi-Quadrat-Tests
Satz von Karl Pearson I
X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann:
Die Verteilung von X ist durch einenWahrscheinlichkeitsvektor
gegeben.
Stichprobe vom Umfang n:
Satz von Karl Pearson II
Dann hat man:
Dabei ist:
1857 - 1936
Geboren in London. Er versuchte, statistische Methoden auf biologische Probleme der Ver-erbung und der Evolution anzuwenden. In 18Veröffentlichungen mit dem Titel „MathematicalContributions to the Theory of Evolution“ führteer die Regressions-Analyse, den Korrelationsko-effizienten und den Chi-Quadrat-Test ein.
1895 - 1980
Geboren in London als Sohn von Karl Pearson.Egon Pearson arbeitete ab 1921 im Institut seinesVaters am University College in London. Er be-suchte zunächst alle Vorlesungen seines Vaters mit dem Erfolg, dass er bald selbst hervorragende Arbei-ten auf dem Gebiet der Statistik produzierte. S. Neyman war 1925 - 26 als Stipendiat am UniversityCollege. Die Zusammenarbeit mit Egon Pearson begann.
Geboren in Bendery, Moldavien. Als Jerzy Neymansein Stipendium in London antrat, um mit KarlPearson zusammenzuarbeiten, war er enttäuscht als erfeststellte, dass Karl Pearson die moderne Mathematikignorierte. Er kooperierte dann mit Egon Pearson undrevolutionierte durch seine Ergebnisse die Statistik.
1876 - 1937
William Gosset, der unter dem Namen Student ver-öffentlichte, entdeckte die Gestalt der t-Verteilung(Student-Verteilung) durch eine Kombination mathe-matischer und empirischer Methoden. Er war Chemiker in der Guiness-Brauerei in Dublin 1899und erfand die t-Verteilung, um die Qualitätskontrolledurchführen zu können.
Chi-Quadrat-Testauf Anpassung
Hypothese
Ablehnungsbereich
Fairer Würfel?
Hypothese verwerfen!Hypothese verwerfen!
Chi-Quadrat-Verteilung
falsch0.831
Bakterielle InfektionBakterielle Infektiondurch Stämme I, II, IIIdurch Stämme I, II, III
Vermutung
Konkrete Stichprobe (80 Infektionen)
(siehe: Gelbrich)
Typ
Prozentsatz
I II III
30 50 20
Anzahl
I II IIITyp
30 32 18
Chi-Quadrat-Verteilung
falsch0.831
Mendelsche Gesetze
rund und gelbrunzeligrunzelig und gelbrund und grünrunzeligrunzelig und grün
0.56250.18750.18750.0625
rund und gelbrunzeligrunzelig und gelbrund und grünrunzeligrunzelig und grün
271889328
Prozentsätze nach der Theorie
Beobachtete Häufigkeiten
Summe 480
Chi-Quadrat-Verteilung
falsch0.831
Krankmeldungen
Wochentag Mo Di Mi Do Fr n
44 28 24 20 34 150 AnzahlKrankmeldungen
Chi-Quadrat-Verteilung
falsch0.831