Wahrscheinlichkeitsrechnung und Statistik für Biologen...

Wahrscheinlichkeitsrechnung undStatistik fur Biologen

Spezielle Verteilungen

Noemie Becker & Dirk Metzler

http://evol.bio.lmu.de/_statgen

7. Juni 2013

1 Binomialverteilung

2 Normalverteilung

3 T-Verteilung

4 Chi-Quadrat-Verteilung

5 F-Verteilung

Binomialverteilung

Inhalt

2 Normalverteilung

3 T-Verteilung

5 F-Verteilung

Binomialverteilung

Sei X die Anzahl der Erfolge bei n unabhangigen Versuchen mitErfolgswahrscheinlichkeit von jeweils p. Dann gilt fur k ∈ {0,1, . . . ,n}

Pr(X = k) =(

)pk · (1− p)n−k

und X heißt binomialverteilt, kurz:

X ∼ bin(n,p).

Eine Ja/Nein-Zufallsgroße nennt man auch eineBernoulli-Zufallsgroße.

EX = np

Var X = n · p · (1− p)

Binomialverteilung

Dichte der Binomialverteilung

●●●●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

0 20 40 60 80 100

Binomial Verteilung mit n=100 und P=0.2

Binomialverteilung

Benutzung der Binomialverteilung

Das Problem bei der Binomialverteilung ist:(n

)exakt zu berechnen,

ist fur große n sehr aufwandig. Deshalb:

Die Binomialverteilung wird oftdurch andere Verteilungen approximiert.

Normalverteilung

Inhalt

2 Normalverteilung

3 T-Verteilung

5 F-Verteilung

Normalverteilung

NormalverteilungEine Zufallsvariable Z mit der Dichte

f (x) =1√2π· e−

heißt standardnormalverteilt.kurz: Z ∼ N (0,1)

EZ = 0

Var Z = 1

Ist Z N (0,1)-verteilt, so ist X = σ · Z + µ normalverteilt mit Mittelwertµ und Varianz σ2, kurz:

X ∼ N (µ, σ2)

X hat dann die Dichte

f (x) =1√2πσ

· e−(x−µ)2

2σ2 .

Normalverteilung

NormalverteilungEine Zufallsvariable Z mit der Dichte

f (x) =1√2π· e−

heißt standardnormalverteilt.kurz: Z ∼ N (0,1)

EZ = 0

Var Z = 1

Ist Z N (0,1)-verteilt, so ist X = σ · Z + µ normalverteilt mit Mittelwertµ und Varianz σ2, kurz:

X ∼ N (µ, σ2)

X hat dann die Dichte

f (x) =1√2πσ

· e−(x−µ)2

2σ2 .

Normalverteilung

Dichte der Normalverteilung

−4 −2 0 2 4

Standardnormalverteilung

Normalverteilung

Merkregeln der Normalverteilung

Ist Z ∼ N (µ, σ2), so gilt:

Pr(|Z − µ| > σ) ≈ 33%

Pr(|Z − µ| > 1.96 · σ) ≈ 5%

Pr(|Z − µ| > 3 · σ) ≈ 0.3%

Normalverteilung

Berechnung von QuantilenSei Z ∼ N (µ = 0, σ2 = 1) standardnormalverteilt. Fur welchen Wert zgilt Pr(|Z | > z) = 5%?

−4 −2 0 2 4

2.5%2.5%

Wegen der Symmetrie bzgl der y-Achse gilt

Pr(|Z | > z) = Pr(Z < −z) + Pr(Z > z) = 2 · Pr(Z < −z)

Finde also z > 0, so dass Pr(Z < −z) = 2.5%.> qnorm(0.025,mean=0,sd=1)

[1] -1.959964

Antwort: z ≈ 1.96, also knapp 2 Standardabweichungen

Normalverteilung

Normalapproximation

Fur große n und p, die nicht zu nahe bei 0 oder 1 liegen, kann man dieBinomialverteilung durch die Normalverteilung mit dementsprechenden Erwartungswert und der entsprechenden Varianzapproximieren:

Ist X ∼ bin(n,p) und Z ∼ N (µ =

n · p

, σ2 =

n · p · (1− p)

), so gilt

Pr(X ∈ [a,b]) ≈ Pr(Z ∈ [a,b])

(eine Faustregel: fur den Hausgebrauch meist okay, wennn · p · (1− p) ≥ 9)

Normalverteilung

Normalapproximation

Ist X ∼ bin(n,p) und Z ∼ N (µ =

n · p

, σ2 =

n · p · (1− p)

), so gilt

Pr(X ∈ [a,b]) ≈ Pr(Z ∈ [a,b])

Normalverteilung

Normalapproximation

Ist X ∼ bin(n,p) und Z ∼ N (µ = n · p, σ2 =

n · p · (1− p)

), so gilt

Pr(X ∈ [a,b]) ≈ Pr(Z ∈ [a,b])

Normalverteilung

Normalapproximation

Ist X ∼ bin(n,p) und Z ∼ N (µ = n · p, σ2 = n · p · (1− p)), so gilt

Pr(X ∈ [a,b]) ≈ Pr(Z ∈ [a,b])

Normalverteilung

Normalapproximation

Ist X ∼ bin(n,p) und Z ∼ N (µ = n · p, σ2 = n · p · (1− p)), so gilt

Pr(X ∈ [a,b]) ≈ Pr(Z ∈ [a,b])

Normalverteilung

Zentraler Grenzwertsatz

Eine etwas allgemeinere Normalapproximation beschreibt derZentraler Grenzwertsatz.

Der zentrale Grenzwertsatz besagt,dass die Verteilung von Summen

unabhangiger und identisch verteilterZufallsvariablen in etwadie Normalverteilung ist.

Normalverteilung

Zentraler GrenzwertsatzDie R-wertigen Zufallsgroßen X1,X2, . . . seien unabhangig undidentisch verteilt mit endlicher Varianz 0 < Var Xi <∞. Sei außerdem

Zn := X1 + X2 + · · ·+ Xn

die Summe der ersten n Variablen.Dann ist die zentrierte und reskalierte Summe im Limes n→∞standardnormalverteilt, d.h.

Zn − EZn√Var Zn

∼ N (µ = 0, σ2 = 1)

bei n→∞.Formal: Es gilt fur alle −∞ ≤ a < b ≤ ∞

limn→∞

a ≤ Zn − EZn√Var Zn

≤ b)= Pr(a ≤ Z ≤ b),

wobei Z eine standardnormalverteilte Zufallsvariable ist.

T-Verteilung

Inhalt

2 Normalverteilung

3 T-Verteilung

5 F-Verteilung

T-Verteilung

Sind X1, . . . ,Xn unabhangig aus einer Normalverteilung mitMittelwert µ gezogen, so ist

X − µs/√

t-verteilt mit n − 1 Freiheitsgraden (df=degrees of freedom).Eine t-verteilte Zufallsvariable bezeichnen wir meist mit T .

Die t-Verteilung heißt auch Student-Verteilung. Die t-Verteilung wurde1908 von William Gosset veroffentlicht, wahrend Gosset in einerGuinness-Brauerei arbeitete. Da sein Arbeitgeber die Veroffentlichungnicht gestattete, veroffentlichte Gosset sie unter dem PseudonymStudent.

T-Verteilung

Dichte der t-Verteilung

−4 −2 0 2 4

dnorm()dt(,df=4)

T-Verteilung

−4 −2 0 2 4

dnorm()dt(,df=4)dt(,df=8)

T-Verteilung

−4 −2 0 2 4

dnorm()dt(,df=4)dt(,df=8)dt(,df=16)

T-Verteilung

−4 −2 0 2 4

dnorm()dt(,df=30)

T-Verteilung

T-Test

Gepaarter t-test

Ein-Stichproben t-test

Zwei-Stichproben t-Test, ungepaart mit gleichen Varianzen

Welch-t-Test, die Varianzen durfen ungleich sein

T-Verteilung

T test : Zweiseitig oder einseitig testen?

In den meisten Fallen will man testen, ob zwei Stichproben sichsignifikant unterscheiden. zweiseitiger Test

In manchen Fallenkann man von vornherein ausschließen, dass die ersteStichprobe kleinere Werte als die zweite Stichprobe hat.Dann will man testen, ob die erste Stichprobe signifikantgroßer ist.will man nur testen, ob die erste Stichprobe signifikantgroßer ist.will man nur testen, ob die erste Stichprobe signifikantkleiner ist.

einseitiger Test

T-Verteilung

T test : Zweiseitig oder einseitig testen?

Wir beobachten einen Wert x , der deutlich großer als derH0-Erwartungswert µ ist.

−4 −2 0 2 4

density

2.5%2.5%

p-Wert=PrH0(|X − µ| ≥ |x − µ|)

−4 −2 0 2 4

density

5.0%p-Wert=PrH0(X − µ ≥ x − µ)

Chi-Quadrat-Verteilung

Inhalt

2 Normalverteilung

3 T-Verteilung

5 F-Verteilung

Seien X1,X2, . . . ,Xn n unabhangige standardnormalverteilteZufallsvariablen, so ist

Y =∑

Chi-Quadrat-verteilt mit n Freiheitsgraden.

EY = n

Var Y = 2n

Dichte der Chi-Quadrat-Verteilung

0 2 4 6 8 10 12

Chi−Quadrat Verteilung mit df=3

p Wert

Chi-Quadrat-Test

Gegeben Abweichungen zwischen Daten und eine Verteilungoder zwischen zwei Verteilungen. Wir messen dieAbweichungen durch die X 2-Statistic:

X 2 =∑

(Oi − Ei)2

wobei Ei = erwartet Anzahl in Klasse i und Oi = beobachtete(engl. observed) Anzahl in Klasse i .

Falls die Nullhypothese gilt und die Erwartungswerte Ei nicht zuklein sind (Faustregel: sie sollten alle ≥ 5 sein), ist X 2 ungefahrχ2-verteilt.Die χ2-Verteilung hangt ab von der Anzahl der Freiheitsgrade df.

F-Verteilung

Inhalt

2 Normalverteilung

3 T-Verteilung

5 F-Verteilung

F-Verteilung

Sind X und Y unabhangige χ2-verteilte Zufallsvariablen mitFreiheitsgraden m fur X und n fur Y, so ist

F =X/mY/n

F-verteilt mit m und n Freiheitsgraden.

F-Verteilung

Dichte der F-Verteilung

0 1 2 3 4

F Verteilung mit 3,20 Freiheitsgraden

95% Quantil

F-Verteilung

F -TestXij = j-te Beobachtung in der i-ten Gruppe, j = 1, . . . ,ni ,Modellannahme: Xij = µi + εij .E[εij ] = 0, Var[εij ] = σ2

SSinnerh =I∑

ni∑j=1

(Xij − X i·)2 Quadratsumme innerhalb d. Gruppen,

n − I Freiheitsgrade

SSzw =I∑

i=1ni(X i· − X ··)2 Quadratsumme zwischen d. Gruppen,

I − 1 Freiheitsgrade

F =SSzw/(I − 1)

SSinnerh/(n − I)Unter der Hypothese H0 : µ1 = · · · = µI (”alle µi sind gleich“)ist F Fisher-verteilt mit I − 1 und n − I Freiheitsgraden(unabhangig vom tatsachlichen gemeinsamen Wert der µi ).F -Test: Wir lehnen H0 zum Signifikanzniveau α ab, wennF ≥ qα, wobei qα das (1− α)-Quantil der Fisher-Verteilung mitI − 1 und n − I Freiheitsgraden ist.

Wahrscheinlichkeitsrechnung und Statistik für Biologen...

Documents

ERGEBNISSE DER ANALYSE DER QUANTITATIVEN … · wurden Chi-Quadrat-Tests für nominal- und ordinalskalierte Variablen sowie Vari-anzanalysen (ANOVA) für intervallskalierte Variablen

C-QUADRAT ACTIVE Dynamic

El senyor quadrat

Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Quadrat ημερίδα 12/12/2014 Λίτσας Ιγνάτιος

Einfluss des invasiven Drüsigen Springkrauts auf die ober ... · Anzahl Pflanzenarten pro Quadrat Anzahl Pflanzenarten pro Quadrat Unterirdische Pflanzenvielfalt Einige Pflanzen

Chi-Quadrat-Test auf Unabhängigkeit I. Chi-Quadrat-Test auf Unabhängigkeit II Hypothese Ablehnungsbereich

Medienmündig im Quadrat Medienkompetenzförderung UND

Catàleg sema publicitat quadrat

QUADRAT D `OR MODERNISTA BARCELONA 8 PRESENTACIÓN

ON ESTÀ EL QUADRAT?

Statistik im Bachelor-Studium - pearson.ch · 7.9 Chi-Quadrat-Verteilung 232 7.10 t-Verteilung 233 7.11 F-Verteilung 234 7.12 Zentraler Grenzwertsatz 235 7.12.1 Grundlegendes 235

Quadrat - VERITAS Verlag

Wahrscheinlichkeitsrechnung und Statistik für Biologen 6 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/kontingenz_slides.pdf · Allgemein gilt beim Chi-Quadrat-Anpassungtest mit k Klassen

Herzlich willkommen zur - Universität Siegen · • Der Chi-Quadrat-Test ist ein „Omnibus-Test“: Er sagt nur, dass irgendwelche empirischen Werte von den erwarteten Werten abweichen

Querschnittlähmung in Deutschland Eine nationale Befragung ... · Chi-Quadrat-Test vergli-chen. Für die Darstellung der Effektstärke des ermittelten Unterschieds kam Cohen’s

C-QUADRAT ARTS Total Return Garant C-QUADRAT Kapitalanlage AG Stubenring 2, 1010 Wien Rechenschaftsbericht über das Rechnungsjahr vom 01. Dezember 2012 bis 30. November 2013 des C-QUADRAT

Contrast khi-quadrat contrast d ... - 84.89.132.1

Benutzermanual zum SAS-Programm KFA-SAS · 1: Nutzung der Chi-Quadrat-Statistik, 2: Anwendung der LQ-Statistik. In dem hier beschriebenen Beispiel werden für die globalen Variablen

Der Chi-Quadrat Test Beispieleismi/wakolbinger/teaching/Stat03/... · Der Chi-Quadrat Test testet H 0 gegen die Welt. (Z.B. für ihn ist jede Permutation von B gleich auffällig.)