View
214
Download
0
Category
Preview:
Citation preview
Vergleich von Gruppen It-Test und einfache Varianzanalyse (One Way ANOVA)
Werner Brannath
VO Biostatistik im WS 2006/2007
Inhalt
Der unverbundene t-Test mit homogener VarianzBeispielModellTeststatistik und p-WertNullverteilung
Einfache Varianzanalyse (One Way ANOVA)Vom t-Test zur ANOVAOne Way ANOVA für drei GruppenOne Way ANOVA für k Gruppen
Der unverbundene t-Test für homogene Varianzen
I Zum Vergleich zweier unverbundener Stichprobenbezüglich eines metrischen Merkmals.
I Testet ob die Mittelwerte der Grundgesamtheit(Erwartungswerte) verschieden sind.
I Setzt voraus, dass die arithmetischen Mittelwerte in jederGruppe normalverteilt sind.
I Setzt voraus, dass die Varianzen der Beobachtungenin beiden Gruppen gleich gross sind, d.h. die Varianzenhomogen sind.
Beispiel für t-Test für zwei unverbundene Stichproben
Geburtsgewicht von 50 Kindern mit schwerem „idiopathicrespiratory distress syndrom”
Überlebende Kinder (n1 = 23)1.130 1.575 1.680 1.760 1.930 2.015 2.0902.600 2.700 2.950 3.160 3.400 3.640 2.8301.410 1.715 1.720 2.040 2.200 2.400 2.5502.570 3.005
Verstorbene Kinder (n2 = 27)1.050 1.175 1.230 1.310 1.500 1.600 1.7201.750 1.770 2.275 2.500 1.030 1.100 1.1851.225 1.262 1.295 1.300 1.550 1.820 1.8901.940 2.200 2.270 2.440 2.560 2.730
Mittelwerte und Standardabweichungen
Überlebende Kinder (n1 = 23):
Mittelwert y1 =Pn1
j=1 y1j
n1= 2.307
Standardabweichung s1 =
√Pn1j=1(y1j−y1)2
n1−1 = 0.665
Verstorbene Kinder (n2 = 27):
Mittelwert y2 =Pn2
j=1 y2j
n1= 1.692
Standardabweichung s2 =
√Pn2j=1(y2j−y2)2
n2−1 = 0.518
Fragestellung im Beispiel
Sind die Unterschiede im mittleren Geburtsgewicht durchreinen Zufall erklärbar, d.h. gilt . . .
H0 : Die beiden Gruppen haben (in Wirklichkeit) ein identischesmittleres Geburtsgewicht.
oder sind die Unterschiede nicht alleine durch Zufall erklärbar,d.h. gilt . . .
H1 : Die beiden Gruppen unterscheiden sich in ihrem mittlerenGeburtsgewicht.
Vergleich der Gruppen
I Differenz der Mittelwerte: y1 − y2 = 0.615
I Gemeinsame Varianz
s2 =(n1 − 1) · s2
1 + (n2 − 1) · s22
n1 + n2 − 2
=22 · 0.6652 + 26 · 0.5182
48= 0.348
I Gemeinsame Standardabweichung: s =√
s2 = 0.590
Zweiseitiger unverbundener t-Test mit homogenenVarianzen (Software R)
> t.test(sirdsa,sirdsd,var.equal=T)
Two Sample t-test
data: sirdsa and sirdsdt = 3.6797, df = 48, p-value = 0.0005902alternative hypothesis: true differencein means is not equal to 0
sample estimates:mean of x mean of y2.307391 1.691741
Modell = Annahmen über Grundgesamtheit
Überlebende Kinder:
Geburtsgewicht normalverteiltErwartungswert (Mittelwert) µ1Standardabweichung σ
Gewicht (kg)
Dic
hte
0 1 2 3 4
0.0
0.2
0.4
0.6
0.8
Verstorbene Kinder:
Geburtsgewicht normalverteiltErwartungswert (Mittelwert) µ2Standardabweichung σ
Gewicht (kg)D
icht
e0 1 2 3 4
0.0
0.2
0.4
0.6
0.8
Geburtsgewichte unabhängig
Dichten der Normalverteilung
−10 −5 0 5 10
0.0
0.1
0.2
0.3
0.4
Dic
hte
versch. Mittelwerte
−2 0 4
−10 −5 0 5 10
0.0
0.2
0.4
0.6
0.8
Dic
hte
versch. Standardabw.
0.51 1.5
Teststatistik t
n1, n2 Stichprobenumfänge; y1, y2 die Mittelwerte
s die gemeinsame Standardabweichung
Teststatistik des unverbundenen t-Tests
t =1√
1n1
+ 1n2
· (y1 − y2)/s
Je grösser der Absolutwert von t desto unplausibler H0.
Der p-Wert als Plausibilitätswert für H0
Man denke an zweite unabhängige Studie ebenfalls mitzwei Stichproben der Größe n1 = 23 und n2 = 27,
Stichproben aus einer Grundgesamtheit in der
I die Nullhypothese H0 : µ1 = µ2 gilt,
I ansonsten alles wie in der Grundgesamtheitunserer Studie ist, d.h.:
die Geburtsgewichte normalverteilt sind unddie Varianz σ2 wie in unserer Studie ist.
Der p-Wert als Plausibilitätswert für H0
Bezeichnen mit t∗ die t-Teststatistik der zweiten Studie.
Defintion des p-Werts
Mit welcher Wahrscheinlichkeit ist der Absolutwert von t∗
grösser als der Absolutwert von t?
p −Wert = P(t2∗ > t2)
Welche Verteilung hat t2∗ ?
Bestimmung der H0-Verteilung von t2
Quadrat der t-Teststatistik
t2 =(y1 − y2)
2(1n1
+ 1n2
)· s2
=(y1 − y2)
2
σ2 ·(
1n1
+ 1n2
) /s2
σ2
= Zähler/Nenner
Verteilung vom Zähler
y1 − y2 normalverteilt mit E(y1 − y2) = µ1 − µ2
und Var(y1 − y2) = Var(y1) + Var(y2) = σ2
n1+ σ2
n2.
Falls H0 : µ1 = µ2, dann
√Zähler =
y1 − y2√σ2
n1+ σ2
n2
∼ N(0, 1)
Damit ist auch die H0-Verteilung vom Zähler bekannt!
Definition der χ2k -Verteilung
DefinitionZ1, Z2, . . . , Zk unabhäng und N(0, 1)-verteilt
Man nennt die Verteilung der Zufallsvariablen
X 2 = Z 21 + Z 2
2 + . . . + Z 2k
die χ2-Verteilung mit k Freiheitsgraden, kurz X 2 ∼ χ2k
BeispielWenn H0 : µ1 = µ2 dann Zähler ∼ χ2
1
Summeneigenschaft
Summeneigenschaft der χ2-VerteilungenWenn
X 21 ∼ χ2
k1und X 2
2 ∼ χ2k2
und X 21 und X 2
2 sind unabhängig, dann ist
X 21 + X 2
2 ∼ χ2k1+k2
BeispielX 2
1 ∼ χ222 und X 2
2 ∼ χ226, dann X 2
1 + X 22 ∼ χ2
48
Verteilung vom Nenner
Nenner:s2
σ2 =(n1 − 1) · s2
1σ2 + (n2 − 1) · s2
2σ2
n1 + n2 − 2
Es ist bekannt, dass
(n1 − 1) ·s2
1σ2 ∼ χ2
n1−1 und (n2 − 1) ·s2
2σ2 ∼ χ2
n2−1
Ausserdem sind s1 und s2 unabhängig.
Verteilung vom Nenner
Wegen der Summeneigenschaft der χ2-Verteilung
X 2 = (n1 − 1) ·s2
1σ2 + (n2 − 1) ·
s22
σ2 ∼ χ2n1+n2−2
Somit ist die Verteilung von
Nenner = {(n1 − 1) ·s2
1σ2 + (n2 − 1) ·
s22
σ2 }/(n1 + n2 − 2)
die χ2-Verteilung mit n1 + n2 − 2 Freiheitsgraden geteilt durchn1 + n2 − 2
Symbolisch: Nenner ∼ χ2n1+n2−2/(n1 + n2 − 2).
Verteilung von t2
t2 = Zähler/Nenner
I Zähler ∼ χ21
I Nenner ∼ χ2n1+n2−2/(n1 + n2 − 2),
I Zähler und Nenner sind unabhängig.
Die Verteilung von t2 heißt
F -Verteilung mit 1 und n1 + n2 − 2 Freiheitsgraden.
ANOVA für Geburtsgewichte
> summary(aov(sirds ∼ Gruppe))
Df Sum Sq Mean Sq F value Pr(>F)Gruppe 1 4.71 4.71 13.5 0.0006Residuals 48 16.69 0.35
ANOVA für zwei Gruppen ist equivalent zum t-Test:
F value . . . ist identisch zu t2 = 3.862
Pr(>F) . . . ist identisch zum p-Wert des t-Tests
Erkläre als nächstes Mean Sq und Sum Sq !
Definition von Mean Sq
t2 =(y1 − y2)
2/
( 1n1
+ 1n2
)
{(n1 − 1) · s21 + (n2 − 1) · s2
2}/(n1 + n2 − 2)
=Mean Sq Gruppe
Mean Sq Residuals=
4.710.35
= 13.5
Defintion von Sum Sq Residual
Sum Sq Residuals
Sum Sq Residuals = (n1 − 1) · s21 + (n2 − 1) · s2
2
=
n1∑j=1
(y1j − y1)2 +
n2∑j=1
(y2j − y2)2
I . . . ist Summe der Abweichungsquadrate der individuellenBeobachtungen vom jeweiligen Gruppenmittelwert;
I . . . wird auch Quadratsumme innerhalb der Gruppen (sumof squares within groups) genannt.
Sum Sq Gruppe bei zwei Gruppen
Betrachten den Gesamtmittelwert:
y =
∑n1j=1 y1j +
∑n2j=1 y2j
n1 + n2=
n1
n1 + n2· y1j +
n2
n1 + n2· y2j
Man kann ausrechnen, dass
Sum Sq Gruppe = (y1 − y2)2/
(1n1
+1n2
)
= n1 · (y1 − y)2 + n2 · (y2 − y)2
Definition Sum Sq Gruppe
Sum Sq Gruppe
Sum Sq Gruppe = n1 · (y1 − y)2 + n2 · (y2 − y)2
I . . . ist Summe der Abweichungsquadrate der zweiGruppenmittelwerte zum Gesamtmittelwert;
I . . . wird Quadratsumme zwischen den Gruppen (sum ofsquares between groups) genannt.
Beziehung zwischen Sum Sq und Mean Sq
Mean Sq Gruppe =Sum Sq Gruppe
1
Mean Sq Residuals =Sum Sq Residuals
(n1 + n2 − 2)
F Statistic =Mean Sq Gruppe
Mean Sq Residual
Verteilungen unter H0 : µ1 = µ2
Mean Sq Gruppe ∼ χ21/1
Mean Sq Residuals ∼ χ2n1+n2−2/(n1 + n2 − 2)
F Statistic ∼χ2
n1+n2−2/(n1 + n2 − 2)
χ21/1
= F1,n1+n2−2
Vergleich von drei Gruppen - Beispiel
22 Patienten mit künstlicher Beatmung wurdendrei Beatmungsgruppen per Zufall zugeteilt (randomisiert)
I Gruppe A: 50% Stickoxid und 50% Sauerstoffgemisch für24 Stunden.
I Gruppe B: 50% Stickoxid und 50% Sauerstoffgemisch nurwärend der Operation.
I Gruppe C: kein Stickoxid, 35-50% Sauerstoff für 24Stunden.
Endpunkt: Die Wirkung der Beatmung wird durch dieBlutplättchenzahl nach 24 stündiger Beatmung beurteilt.
Beispiel: Fragestellung
Unterscheiden sich die drei Methoden inihrer Wirkung auf die Bluttplättchenzahl?
Beispiel: Blutplättchenzahl
Gruppe A Gruppe B Gruppe Bn = 8 n = 9 n = 5
243 206 241251 210 258275 226 270291 249 293347 255 328354 273380 285392 295
309
arithm. Mittel 316.6 256.4 278.0Standardabw. 58.7 37.1 33.8
Beispiel: Vergleich der Mittelwerte
Sind die Unterschiede in der mittleren Blutplättchenzahl durchreinen Zufall erklärbar, d.h. gilt . . .
H0 : Die drei Beatmungsmethoden wirken (in Wirklichkeit)gleich auf die durchschnittliche Blutplättchenzahl.
oder sind die Unterschiede nicht alleine durch Zufall erklärbar,d.h. gilt . . .
H1 : Die Beatmungsmethoden unterscheiden sich in ihrerWirkung auf die durchschnittliche Blutplättchenzahl.
ANOVA für Blutplättchenzahl
> summary(aov(Foliate Group,data=redcell))
Df Sum Sq Mean Sq F value Pr(>F)Group 2 15516 7758 3.7113 0.04359Residuals 19 39716 2090
Im folgenden betrachten wir:I Sum Sq Group und Sum Sq GroupI Mean Sq Group und Mean Sq GroupI F value und seine Verteilung.
Defintion der Qudratsummen
Quadratsumme zwischen den Gruppen
Sum Sq Gruppe = n1 · (y1− y)2 +n2 · (y2− y)2 +n3 · (y3− y)2
Quadratsumme innerhalb der Gruppen
Sum Sq Residuals =
= (n1 − 1) · s21 + (n2 − 1) · s2
2 + (n3 − 1) · s23
=
n1∑j=1
(y1j − y1)2 +
n2∑j=1
(y2j − y2)2 +
n3∑j=1
(y3j − y3)2
Mittlere Qudratsummen
Mean Sq Gruppe =Sum Sq Gruppe
2
Mean Sq Residuals =Sum Sq Residuals
(n1 + n2 + n3 − 3)
F Statistic =Mean Sq Gruppe
Mean Sq Residual
Verteilungen unter H0 : µ1 = µ2 = µ3
Mean Sq Gruppe ∼ χ22/2
Mean Sq Residuals ∼ χ2n1+n2+n3−3/(n1 + n2 + n3 − 3)
F Statistic ∼ F2,n1+n2+n3−3
ANOVA mit k Gruppen
k . . . Gruppen
ni . . . Stichprobengrösse der Gruppe i (i = 1, . . . , k )
N =∑k
i=1 ni . . . Gesamtzahl der Beobachtungseinheiten
µi . . . Mittelwert der Grundegesamtheit in Gruppe i
σ2 . . . gemeinsame Varianz in der Grundgesamtheit
Modell
yij = µi + εij , εij ∼ N(0, σ2) unabhängig
Hypothesen
H0 : µ1 = · · · = µk , H1 : µi 6= µj für mind. eine i und j
Defintion der Qudratsummen bei k Gruppen
Quadratsumme zwischen Gruppen (between groups)
Sum Sq Gruppe =k∑
i=1
ni · (yi − y)2
Quadratsumme innerhalb der Gruppen (within groups)
Sum Sq Residuals =k∑i1
(ni − 1) · s2i =
k∑i=1
ni∑j=1
(yij − yi)2
Mittlere Qudratsummen
Mean Sq Gruppe =Sum Sq Gruppe
k − 1
Mean Sq Residuals =Sum Sq Residuals
(N − k)
F Statistic =Mean Sq Gruppe
Mean Sq Residual
Recommended