Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Statystyka matematyczna. Wykład V.
Parametryczne testy istotności
Edward Kozłowski
e-mail:[email protected]
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Spis treści
1 Weryfikacja hipotezy o równości wartości średnich w dwóchpopulacjach
2 Weryfikacja hipotezy o równości wariancji w dwóch populacjach
3 Weryfikacja hipotezy o równości wariancji w wielu populacjach
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Weryfikacja hipotezy o równości wartości średnich
Na poziomie istotności α konstrujemy hipotezę roboczą
H0 : µ1 = µ2
wobec hipotezy alternatywnej
H1 : µ1 6= µ2
(lub H1 : µ < µ0, H1 : µ > µ0).
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Cechy X1 i X2 mają rozkłady normalne N(µ1, σ
21
)i N
(µ2, σ
22
),
gdzie znane są ochylenia standardowe σ1 i σ2.Statystyka
U =X1 − X2√σ21n1
+ σ22n2
ma rozkład normalny N (0, 1). Zbiór krytyczny(−∞,−u
(1− α
2
)]∪[u(1− α
2
),∞).
Jeżeli −u(1− α
2
)< U < u
(1− α
2
)to na poziomie istotności α nie ma
podstaw do odrzucenia hipotezy roboczej H0, co nie oznacza że hipotezaH0 jest prawdziwa (na podstawie jednej próby przy przyjętym ryzykubłędu α stwierdzamy tylko że wyniki tej próby nie przeczą hipotezie H0).Jeżeli natomiast U ∈
(−∞,−u
(1− α
2
)]∪[u(1− α
2
),∞)
to hipotezęroboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.
W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−u (1− α)], w przypadku hipotezy alternatywnejH1 : µ1 > µ2 zbiór krytyczny określamy jako (u (1− α) ,∞].
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Cechy X1 i X2 mają rozkłady normalne N(µ1, σ
21
)i N
(µ2, σ
22
),
gdzie nieznane są ochylenia standardowe σ1 i σ2, natomiastmożemy założyć σ1=σ2Statystyka
t =X1 − X2√
n1+n2n1n2
n1S21+n2S22
n1+n2−2
ma rozklad t-Studenta o n1 + n2 − 2 stopniach swobody, gdzie
X1 =1n1
n1∑i=1
Xi1, X2 =1n2
n2∑i=1
Xi2
S21 =1
n1 − 1
n1∑i=1
(Xi1 − X1
)2, S22 =
1n2 − 1
n2∑i=1
(Xi2 − X2
)2Zbiór krytyczny (−∞,−t∗] ∪ [t∗,∞) , gdzie t∗ = t
(1− α
2 , n1 + n2 − 2)
jest kwantylem rzędu 1− α2 rozkładu t-Studenta o n1 + n2 − 2 stopniach
swobody.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Jeżeli −t∗ < t < t∗ to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiastt ∈ (−∞,−t∗] ∪ [t∗,∞) to hipotezę roboczą odrzucamy na korzyśćhipotezy alternatywnej H1.
W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−t (1− α, n1 + n2 − 2)], w przypadku hipotezyalternatywnej H1 : µ1 > µ2 zbiór krytyczny określamy jako(t (1− α, n1 + n2 − 2) ,∞]
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Cechy X1 i X2 mają dowolne rozkłady o nieznanych wartościachśrednich µ1,µ2 i nieznanych odchyleniach standardowych σ1 i σ2.Dla dużych prób n1 100 i n2 100 statystyka
U =X1 − X2√S21n1
+ S22n2
ma asymptotyczny rozkład N (0, 1)Jeżeli −u
(1− α
2
)< U < u
(1− α
2
)to na poziomie istotności α nie ma
podstaw do odrzucenia hipotezy roboczej H0, jeżeli natomiastU ∈
(−∞,−u
(1− α
2
)]∪[u(1− α
2
),∞)
to hipotezę robocząodrzucamy na korzyść hipotezy alternatywnej H1.
W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−u (1− α)], w przypadku hipotezy alternatywnejH1 : µ1 > µ2 zbiór krytyczny określamy jako (u (1− α) ,∞].
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Jeżeli obserwację cech X1 i X2 prowadzimy jednocześnie, to napodstawie próby (xi1, xi2) dla i = 1, 2, ..., n (liczebności prób cech X1 iX2 są jednakowe) definiujemy ciąg różnic zi = xi1 − xi2. Wartości ciągu{zi}1¬i¬n traktujemy jako wartości cechy Z o rozkładzie normalnymN(µ, σ2
)i nieznanym odchyleniu stantardowym σ.
Statystyka
t =Z − µ0S
√n− 1
ma rozklad t-Studenta o n− 1 stopniach swobody, gdzie
Z =1n
n∑i=1
zi,
S2 =1n
n∑i=1
(zi − Z
)2.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Zbiór krytyczny (−∞,−t∗] ∪ [t∗,∞) , gdzie t∗ = t(1− α
2 , n− 1)
jestkwantylem rzędu 1− α
2 rozkładu t-Studenta o n− 1 stopniach swobody.Jeżeli −t∗ < t < t∗ to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiastt ∈ (−∞,−t∗] ∪ [t∗,∞) to hipotezę roboczą odrzucamy na korzyśćhipotezy alternatywnej H1.
W przypadku hipotezy alternatywnej H1 : µ < µ0 zbiór krytycznyokreślamy jako (−∞,−t (1− α, n− 1)], w przypadku hipotezyalternatywnej H1 : µ > µ0 zbiór krytyczny określamy jako(t (1− α, n− 1) ,∞)
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Weryfikacja hipotezy o równości wariancji w dwóchpopulacjach
Cechy X1 i X2 mają rozkłady normalne N(µ1, σ
21
)i N
(µ2, σ
22
),
gdzie nieznane są ochylenia standardowe σ1 i σ2Na poziomie istotności α konstrujemy hipotezę roboczą
H0 : σ1 = σ2
wobec hipotezy alternatywnej
H1 : σ1 6= σ2
Statystyka
F =S21
S22
ma rozkład Fishera Snedecora o n1 − 1 i n2 − 1 stopniach swobody.Wyznaczamy kwantyle rzędu α
2 i 1− α2 postaci fα
2(n1 − 1, n2 − 1) i
f1−α2 (n1 − 1, n2 − 1) odpowiednio.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Jeżeli fα2
(n1 − 1, n2 − 1) < F < f1−α2 (n1 − 1, n2 − 1) to na poziomieistotności α nie ma podstaw do odrzucenia hipotezy roboczej H0, jeżelinatomiast F ∈
(−∞, fα
2(n1 − 1, n2 − 1)
]∪[f1−α2 (n1 − 1, n2 − 1) ,∞
)to hipotezę roboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.
W przypadku hipotezy alternatywnej H1 : σ1 < σ2 zbiór krytycznyokreślamy jako (−∞, fα (n1 − 1, n2 − 1)), w przypadku hipotezyalternatywnej H1 : σ1 > σ2 zbiór krytyczny określamy jako[f1−α2 (n1 − 1, n2 − 1) ,∞
)
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Weryfikacja hipotezy o równości wariancji w wielupopulacjach
Na poziomie istotności α konstrujemy hipotezę roboczą
H0 : σ1 = σ2 = ... = σk
(wariancje/odchylenia standardowe są równe), wobec hipotezyalternatywnej
H1 : nie wszystkie wariancje/odchylenia standardowe są równe
Test BartlettaZakładamy: niezależność prób, liczba populacji k > 2, liczności pób dlakażdej populacji co najmniej 5.Niech wielkość ni oznacza liczebność i–tej próby,
S2i =1
ni − 1
ni∑j=1
(Xji − Xj
)2oznacza estymator nieobciążony wariancji dla i–tej próby.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
n = n1 + ...+ nk,
S2 =1
n− k
k∑j=1
(nj − 1) S2j
oraz
c = 1 +1
3 (k − 1)
k∑j=1
1nj − 1
− 1n− k
dla dowolnego i = 1, ..., k.Jeżeli liczności próbek są jednakowe (n1 = ... = nk), to przyjmujemy
c = 1 +1
3 (n− k)
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Statystyka
χ2 =2.303c
((n− k) lnS2 −
k∑i=1
(ni − 1) ln S2i
),
ma asymptotyczny rozkład chi-kwadrat o k − 1 stopniach swobody.
Dla rozkładu chi-kwadrat wyznaczamy kwantyl rzędu 1− α o k − 1stopniach swobody oraz oznaczamy χ21−α (k − 1). Jeżeliχ2 < χ21−α (k − 1) to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiast χ2 χ21−α (k − 1) tohipotezę roboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Test HartleyaZakładamy: niezależność prób, liczba populacji 2 ¬ k ¬ 12 oraz licznościprób dla każdej z populacji są jednakowe (n 5).
Statystyka testowa
Fmax =max
(S21 , S
22 , ..., S
2k
)min
(S21 , S
22 , ..., S
2k
) .Z tablic dla testu Harleya odczytujemy wartość krytyczną f1−α (k, n− 1)– kwantyl rzędu 1− α dla liczby populacji k i (n− 1) stopniach swobody.
Jeżeli Fmax < f1−α (k, n− 1) to na poziomie istotności α nie mapodstaw do odrzucenia hipotezy roboczej H0, jeżeli natomiastFmax f1−α (k, n− 1) to hipotezę roboczą H0 odrzucamy na korzyśćhipotezy alternatywnej H1.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Table Critical values for the Hartley test (right-sided)
Level of significance αααα = 0.01 k
n - 1 2 3 4 5 6 7 8 9 10 11 12 2345678910 12 15 20 30 60 ∞
199 47.5 23.2 14.9 11.1 8.89 7.50 6.54 5.85 4.91 4.07 3.32 2.63 1.96 1.00
448 85 37 22
15.5 12.1 9.9 8.5 7.4 6.1 4.9 3.8 3.0 2.2 1.0
729 120 49 28
19.1 14.5 11.7 9.9 8.6 6.9 5.5 4.3 3.3 2.3 1.0
1036 151 59 33 22
16.5 13.2 11.1 9.6 7.6 6.0 4.6 3.4 2.4 1.0
1362 184 69 38 25
18.4 14.5 12.1 10.4 8.2 6.4 4.9 3.6 2.4 1.0
1705 216* 79 42 27 20
15.8 13.1 11.1 8.7 6.7 5.1 3.7 2.5 1.0
2069 249* 89 46 30 22
16.9 13.9 11.8 9.1 7.1 5.3 3.8 2.5 1.0
2432 281* 97 50 32 23
17.9 14.7 12.4 9.5 7.3 5.5 3.9 2.6 1.0
2813 310* 106 54 34 24
18.9 15.3 12.9 9.9 7.5 5.6 4.0 2.6 1.0
3204 337* 113 57 36 26
19.8 16.0 13.4 10.2 7.8 5.8 4.1 2.7 1.0
3605 361* 120 60 37 27 21
16.6 13.9 10.6 8.0 5.9 4.2 2.7 1.0
*The third-digit figures for n - 1 = 3 are uncertain.
Level of significance αααα = 0.05 k
n - 1 2 3 4 5 6 7 8 9 10 11 12 2345678910 12 15 20 30 60 ∞
39.0 15.4 9.6 7.15 5.82 4.99 4.43 4.03 3.72 3.28 2.86 2.46 2.07 1.67 1.00
87.5 27.8 15.5 10.8 8.38 6.94 6.00 5.34 4.85 4.16 3.54 2.95 2.40 1.85 1.00
142 39.2 20.6 13.7 10.4 8.44 7.18 6.31 5.67 4.79 4.01 3.29 2.61 1.96 1.00
202 50.7 25.2 16.3 12.1 9.70 8.12 7.11 6.34 5.30 4.37 3.54 2.78 2.04 1.00
266 62.0 29.5 18.7 13.7 10.8 9.03 7.80 6.92 5.72 4.68 3.76 2.91 2.11 1.00
333 72.9 33.6 20.8 15.0 11.8 9.78 8.41 7.42 6.09 4.95 3.94 3.02 2.17 1.00
403 83.5 37.5 22.9 16.3 12.7 10.5 8.95 7.87 6.42 5.19 4.10 3.12 2.22 1.00
475 93.9 41.1 24.7 17.5 13.5 11.1 9.45 8.28 6.72 5.40 4.24 3.21 2.26 1.00
550 104 44.6 26.5 18.6 14.3 11.7 9.91 8.66 7.00 5.59 4.37 3.29 2.30 1.00
626 114 48.0 28.2 19.7 15.1 12.2 10.3 9.01 7.25 5.77 4.49 3.36 2.33 1.00
704 124 51.4 29.9 20.7 15.8 12.7 10.7 9.34 7.48 5.93 4.59 3.39 2.36 1.00
Kanji, Gopal K. 100 Statistical Tests. London : SAGE Publication Ltd., 1993.
Rysunek: Wartości krytyczne dla testu Hartleya.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Test CochranaZakładamy: niezależność prób, liczba populacji k 3 oraz liczności próbdla każdej z populacji są jednakowe (n 4).
Statystyka testowa
G =max
(S21 , S
22 , ..., S
2k
)S21 + S22 + ...+ S2k
.
Z tablic dla testu Cochrana odczytujemy wartość krytycznąg1−α (k, n− 1) – kwantyl rzędu 1− α dla liczby populacji k i (n− 1)stopniach swobody.
Jeżeli G < g1−α (k, n− 1) to na poziomie istotności α nie ma podstawdo odrzucenia hipotezy roboczej H0, jeżeli natomiastG g1−α (k, n− 1) to hipotezę roboczą H0 odrzucamy na korzyśćhipotezy alternatywnej H1.
Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Rysunek: Wartości krytyczne dla testu Cochrana.Edward Kozłowski Parametryczne testy istotności
Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach
Weryfikacja hipotezy o równości wariancji w wielu populacjach
Funkcje w R
test równości wartości średnich w dwóch populacjach> t.test(x,y)
test równości wariancji w dwóch populacjach> var.test(x,y)
test równości wariancji w wielu populacjach> bartlett.test(data,nazwy)
Edward Kozłowski Parametryczne testy istotności