Statystyka matematyczna. Wykład V.Statystyka matematyczna. Wykład V. Parametryczne testy istotności Edward Kozłowski e-mail:[email protected] Edward Kozłowski Parametryczne

Weryfikacja hipotezy o równości wartości średnich w dwóch populacjachWeryfikacja hipotezy o równości wariancji w dwóch populacjach

Weryfikacja hipotezy o równości wariancji w wielu populacjach

Statystyka matematyczna. Wykład V.

Parametryczne testy istotności

Edward Kozłowski

e-mail:[email protected]

Edward Kozłowski Parametryczne testy istotności



Spis treści

1 Weryfikacja hipotezy o równości wartości średnich w dwóchpopulacjach

2 Weryfikacja hipotezy o równości wariancji w dwóch populacjach

3 Weryfikacja hipotezy o równości wariancji w wielu populacjach




Weryfikacja hipotezy o równości wartości średnich

Na poziomie istotności α konstrujemy hipotezę roboczą

H0 : µ1 = µ2

wobec hipotezy alternatywnej

H1 : µ1 6= µ2

(lub H1 : µ < µ0, H1 : µ > µ0).




Cechy X1 i X2 mają rozkłady normalne N(µ1, σ

21

)i N

(µ2, σ

22

),

gdzie znane są ochylenia standardowe σ1 i σ2.Statystyka

U =X1 − X2√σ21n1

+ σ22n2

ma rozkład normalny N (0, 1). Zbiór krytyczny(−∞,−u

(1− α

2

)]∪[u(1− α

2

),∞).

Jeżeli −u(1− α

2

)< U < u

(1− α

2

)to na poziomie istotności α nie ma

podstaw do odrzucenia hipotezy roboczej H0, co nie oznacza że hipotezaH0 jest prawdziwa (na podstawie jednej próby przy przyjętym ryzykubłędu α stwierdzamy tylko że wyniki tej próby nie przeczą hipotezie H0).Jeżeli natomiast U ∈

(−∞,−u

(1− α

2

)]∪[u(1− α

2

),∞)

to hipotezęroboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.

W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−u (1− α)], w przypadku hipotezy alternatywnejH1 : µ1 > µ2 zbiór krytyczny określamy jako (u (1− α) ,∞].





21

)i N

(µ2, σ

22

),

gdzie nieznane są ochylenia standardowe σ1 i σ2, natomiastmożemy założyć σ1=σ2Statystyka

t =X1 − X2√

n1+n2n1n2

n1S21+n2S22

n1+n2−2

ma rozklad t-Studenta o n1 + n2 − 2 stopniach swobody, gdzie

X1 =1n1

n1∑i=1

Xi1, X2 =1n2

n2∑i=1

Xi2

S21 =1

n1 − 1

n1∑i=1

(Xi1 − X1

)2, S22 =

1n2 − 1

n2∑i=1

(Xi2 − X2

)2Zbiór krytyczny (−∞,−t∗] ∪ [t∗,∞) , gdzie t∗ = t

(1− α

2 , n1 + n2 − 2)

jest kwantylem rzędu 1− α2 rozkładu t-Studenta o n1 + n2 − 2 stopniach

swobody.




Jeżeli −t∗ < t < t∗ to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiastt ∈ (−∞,−t∗] ∪ [t∗,∞) to hipotezę roboczą odrzucamy na korzyśćhipotezy alternatywnej H1.

W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−t (1− α, n1 + n2 − 2)], w przypadku hipotezyalternatywnej H1 : µ1 > µ2 zbiór krytyczny określamy jako(t (1− α, n1 + n2 − 2) ,∞]




Cechy X1 i X2 mają dowolne rozkłady o nieznanych wartościachśrednich µ1,µ2 i nieznanych odchyleniach standardowych σ1 i σ2.Dla dużych prób n1 100 i n2 100 statystyka

U =X1 − X2√S21n1

+ S22n2

ma asymptotyczny rozkład N (0, 1)Jeżeli −u

(1− α

2

)< U < u

(1− α

2

)to na poziomie istotności α nie ma

podstaw do odrzucenia hipotezy roboczej H0, jeżeli natomiastU ∈

(−∞,−u

(1− α

2

)]∪[u(1− α

2

),∞)

to hipotezę robocząodrzucamy na korzyść hipotezy alternatywnej H1.

W przypadku hipotezy alternatywnej H1 : µ1 < µ2 zbiór krytycznyokreślamy jako (−∞,−u (1− α)], w przypadku hipotezy alternatywnejH1 : µ1 > µ2 zbiór krytyczny określamy jako (u (1− α) ,∞].




Jeżeli obserwację cech X1 i X2 prowadzimy jednocześnie, to napodstawie próby (xi1, xi2) dla i = 1, 2, ..., n (liczebności prób cech X1 iX2 są jednakowe) definiujemy ciąg różnic zi = xi1 − xi2. Wartości ciągu{zi}1¬i¬n traktujemy jako wartości cechy Z o rozkładzie normalnymN(µ, σ2

)i nieznanym odchyleniu stantardowym σ.

Statystyka

t =Z − µ0S

√n− 1

ma rozklad t-Studenta o n− 1 stopniach swobody, gdzie

Z =1n

n∑i=1

zi,

S2 =1n

n∑i=1

(zi − Z

)2.




Zbiór krytyczny (−∞,−t∗] ∪ [t∗,∞) , gdzie t∗ = t(1− α

2 , n− 1)

jestkwantylem rzędu 1− α

2 rozkładu t-Studenta o n− 1 stopniach swobody.Jeżeli −t∗ < t < t∗ to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiastt ∈ (−∞,−t∗] ∪ [t∗,∞) to hipotezę roboczą odrzucamy na korzyśćhipotezy alternatywnej H1.

W przypadku hipotezy alternatywnej H1 : µ < µ0 zbiór krytycznyokreślamy jako (−∞,−t (1− α, n− 1)], w przypadku hipotezyalternatywnej H1 : µ > µ0 zbiór krytyczny określamy jako(t (1− α, n− 1) ,∞)




Weryfikacja hipotezy o równości wariancji w dwóchpopulacjach


21

)i N

(µ2, σ

22

),

gdzie nieznane są ochylenia standardowe σ1 i σ2Na poziomie istotności α konstrujemy hipotezę roboczą

H0 : σ1 = σ2

wobec hipotezy alternatywnej

H1 : σ1 6= σ2

Statystyka

F =S21

S22

ma rozkład Fishera Snedecora o n1 − 1 i n2 − 1 stopniach swobody.Wyznaczamy kwantyle rzędu α

2 i 1− α2 postaci fα

2(n1 − 1, n2 − 1) i

f1−α2 (n1 − 1, n2 − 1) odpowiednio.




Jeżeli fα2

(n1 − 1, n2 − 1) < F < f1−α2 (n1 − 1, n2 − 1) to na poziomieistotności α nie ma podstaw do odrzucenia hipotezy roboczej H0, jeżelinatomiast F ∈

(−∞, fα

2(n1 − 1, n2 − 1)

]∪[f1−α2 (n1 − 1, n2 − 1) ,∞

)to hipotezę roboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.

W przypadku hipotezy alternatywnej H1 : σ1 < σ2 zbiór krytycznyokreślamy jako (−∞, fα (n1 − 1, n2 − 1)), w przypadku hipotezyalternatywnej H1 : σ1 > σ2 zbiór krytyczny określamy jako[f1−α2 (n1 − 1, n2 − 1) ,∞

)




Weryfikacja hipotezy o równości wariancji w wielupopulacjach

Na poziomie istotności α konstrujemy hipotezę roboczą

H0 : σ1 = σ2 = ... = σk

(wariancje/odchylenia standardowe są równe), wobec hipotezyalternatywnej

H1 : nie wszystkie wariancje/odchylenia standardowe są równe

Test BartlettaZakładamy: niezależność prób, liczba populacji k > 2, liczności pób dlakażdej populacji co najmniej 5.Niech wielkość ni oznacza liczebność i–tej próby,

S2i =1

ni − 1

ni∑j=1

(Xji − Xj

)2oznacza estymator nieobciążony wariancji dla i–tej próby.




n = n1 + ...+ nk,

S2 =1

n− k

k∑j=1

(nj − 1) S2j

oraz

c = 1 +1

3 (k − 1)

k∑j=1

1nj − 1

− 1n− k

dla dowolnego i = 1, ..., k.Jeżeli liczności próbek są jednakowe (n1 = ... = nk), to przyjmujemy

c = 1 +1

3 (n− k)




Statystyka

χ2 =2.303c

((n− k) lnS2 −

k∑i=1

(ni − 1) ln S2i

),

ma asymptotyczny rozkład chi-kwadrat o k − 1 stopniach swobody.

Dla rozkładu chi-kwadrat wyznaczamy kwantyl rzędu 1− α o k − 1stopniach swobody oraz oznaczamy χ21−α (k − 1). Jeżeliχ2 < χ21−α (k − 1) to na poziomie istotności α nie ma podstaw doodrzucenia hipotezy roboczej H0, jeżeli natomiast χ2 χ21−α (k − 1) tohipotezę roboczą H0 odrzucamy na korzyść hipotezy alternatywnej H1.




Test HartleyaZakładamy: niezależność prób, liczba populacji 2 ¬ k ¬ 12 oraz licznościprób dla każdej z populacji są jednakowe (n 5).

Statystyka testowa

Fmax =max

(S21 , S

22 , ..., S

2k

)min

(S21 , S

22 , ..., S

2k

) .Z tablic dla testu Harleya odczytujemy wartość krytyczną f1−α (k, n− 1)– kwantyl rzędu 1− α dla liczby populacji k i (n− 1) stopniach swobody.

Jeżeli Fmax < f1−α (k, n− 1) to na poziomie istotności α nie mapodstaw do odrzucenia hipotezy roboczej H0, jeżeli natomiastFmax f1−α (k, n− 1) to hipotezę roboczą H0 odrzucamy na korzyśćhipotezy alternatywnej H1.




Table Critical values for the Hartley test (right-sided)

Level of significance αααα = 0.01 k

n - 1 2 3 4 5 6 7 8 9 10 11 12 2345678910 12 15 20 30 60 ∞

199 47.5 23.2 14.9 11.1 8.89 7.50 6.54 5.85 4.91 4.07 3.32 2.63 1.96 1.00

448 85 37 22

15.5 12.1 9.9 8.5 7.4 6.1 4.9 3.8 3.0 2.2 1.0

729 120 49 28

19.1 14.5 11.7 9.9 8.6 6.9 5.5 4.3 3.3 2.3 1.0

1036 151 59 33 22

16.5 13.2 11.1 9.6 7.6 6.0 4.6 3.4 2.4 1.0

1362 184 69 38 25

18.4 14.5 12.1 10.4 8.2 6.4 4.9 3.6 2.4 1.0

1705 216* 79 42 27 20

15.8 13.1 11.1 8.7 6.7 5.1 3.7 2.5 1.0

2069 249* 89 46 30 22

16.9 13.9 11.8 9.1 7.1 5.3 3.8 2.5 1.0

2432 281* 97 50 32 23

17.9 14.7 12.4 9.5 7.3 5.5 3.9 2.6 1.0

2813 310* 106 54 34 24

18.9 15.3 12.9 9.9 7.5 5.6 4.0 2.6 1.0

3204 337* 113 57 36 26

19.8 16.0 13.4 10.2 7.8 5.8 4.1 2.7 1.0

3605 361* 120 60 37 27 21

16.6 13.9 10.6 8.0 5.9 4.2 2.7 1.0

*The third-digit figures for n - 1 = 3 are uncertain.

Level of significance αααα = 0.05 k

n - 1 2 3 4 5 6 7 8 9 10 11 12 2345678910 12 15 20 30 60 ∞

39.0 15.4 9.6 7.15 5.82 4.99 4.43 4.03 3.72 3.28 2.86 2.46 2.07 1.67 1.00

87.5 27.8 15.5 10.8 8.38 6.94 6.00 5.34 4.85 4.16 3.54 2.95 2.40 1.85 1.00

142 39.2 20.6 13.7 10.4 8.44 7.18 6.31 5.67 4.79 4.01 3.29 2.61 1.96 1.00

202 50.7 25.2 16.3 12.1 9.70 8.12 7.11 6.34 5.30 4.37 3.54 2.78 2.04 1.00

266 62.0 29.5 18.7 13.7 10.8 9.03 7.80 6.92 5.72 4.68 3.76 2.91 2.11 1.00

333 72.9 33.6 20.8 15.0 11.8 9.78 8.41 7.42 6.09 4.95 3.94 3.02 2.17 1.00

403 83.5 37.5 22.9 16.3 12.7 10.5 8.95 7.87 6.42 5.19 4.10 3.12 2.22 1.00

475 93.9 41.1 24.7 17.5 13.5 11.1 9.45 8.28 6.72 5.40 4.24 3.21 2.26 1.00

550 104 44.6 26.5 18.6 14.3 11.7 9.91 8.66 7.00 5.59 4.37 3.29 2.30 1.00

626 114 48.0 28.2 19.7 15.1 12.2 10.3 9.01 7.25 5.77 4.49 3.36 2.33 1.00

704 124 51.4 29.9 20.7 15.8 12.7 10.7 9.34 7.48 5.93 4.59 3.39 2.36 1.00

Kanji, Gopal K. 100 Statistical Tests. London : SAGE Publication Ltd., 1993.

Rysunek: Wartości krytyczne dla testu Hartleya.




Test CochranaZakładamy: niezależność prób, liczba populacji k 3 oraz liczności próbdla każdej z populacji są jednakowe (n 4).

Statystyka testowa

G =max

(S21 , S

22 , ..., S

2k

)S21 + S22 + ...+ S2k

.

Z tablic dla testu Cochrana odczytujemy wartość krytycznąg1−α (k, n− 1) – kwantyl rzędu 1− α dla liczby populacji k i (n− 1)stopniach swobody.

Jeżeli G < g1−α (k, n− 1) to na poziomie istotności α nie ma podstawdo odrzucenia hipotezy roboczej H0, jeżeli natomiastG g1−α (k, n− 1) to hipotezę roboczą H0 odrzucamy na korzyśćhipotezy alternatywnej H1.




Rysunek: Wartości krytyczne dla testu Cochrana.Edward Kozłowski Parametryczne testy istotności



Funkcje w R

test równości wartości średnich w dwóch populacjach> t.test(x,y)

test równości wariancji w dwóch populacjach> var.test(x,y)

test równości wariancji w wielu populacjach> bartlett.test(data,nazwy)


Documents

Statystyka matematyczna. Wykład V.Statystyka matematyczna. Wykład V. Parametryczne testy istotności Edward Kozłowski e-mail:[email protected] Edward Kozłowski Parametryczne