72
CHƯƠNG 5 KIM ĐỊNH PHI THAM SThS HUNH TUYÊN 1

Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Embed Size (px)

Citation preview

Page 1: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

CHƯƠNG 5

KIỂM ĐỊNH PHI THAM SỐ

ThS HUỲNH TỐ UYÊN1

Page 2: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2

KHI NÀO SỬ DỤNG KIỂM ĐỊNH THAM SỐ& PHI THAM SỐ ?Kiểm định phi tham số là một dạng kiểm định khi các điều kiện dành

cho kiểm định tham số không phù hợp như: tổng thể không có phân phốichuẩn, dữ liệu thuộc vào các thang đo định danh, thứ bậc,…. hoặc khi dữliệu xuất hiện nhiều các giá trị bất thường (ngoại lệ).

Việc sử dụng kiểm định tham số hay phi tham số phụ thuộc rất nhiềuvào điều kiện tổng thể có hay không phân phối chuẩn như bảng so sánhdưới đây:

Chú ý rằng các KĐPTS thì không mạnh bằng các KĐ cótham số. Thành thử nếu điều kiện cho phép dùng KĐTS đượcthỏa mãn, thì ta nên dùng KĐ có tham số.=> Để định nghĩaKĐ phi Ts ta xét các ví dụ sau:

Kiểm định phi tham số Kiểm định tham số

1. Kiểm định sự bằng nhau của 2 trung vị (Med)

trong trường hợp 2 mẫu độc lập.

1. Kiểm định sự bằng nhau của 2 trị trung bình trong

trường hợp 2 mẫu độc lập.

2. Kiểm định trung vị (Med) 2. Kiểm định về giá trị trung bình trên 1 mẫu

3. Kiểm định sự bằng nhau của 2 trị trung vị trong

trường hợp mẫu phối hợp từng cặp

3. Kiểm định sự bằng nhau của 2 trị trung bình trong

trường hợp mẫu phối hợp từng cặp

4. Kiểm định Kruskal- Wallis 4. Phân tích phương sai 1 yếu tố (ANOVA)

Page 3: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Để kiểm định xem việc làm thêm có ảnh hưởngđến kết quả học tập không người ta chọn ngẫunhiên một số sinh viên và hỏi họ về kết quả học tậpvới thời gian làm thêm trong các khoảng : < 8 giờ/tuần; 8 – 16 giờ/tuần; >16 giờ/tuần. Nếu cácgiả định về các tổng thể có phân phối chuẩn vàphương sai bằng nhau không được thỏa mãn thìviệc kiểm định sẽ thực hiện như thế nào ?

• Để đánh giá xem chương trình quảng cáo mới cócải thiện doanh số bán hàng của các cửa hàngtrong cùng 1 tập đoàn không, người ta chọn ngẫunhiên 8 cửa hàng và quan sát doanh số theo thángcủa các cửa hàng này trước và sau khi áp dụngchương trình quảng cáo mới. Nếu giả định rằng cỡmẫu không thể điều tra thêm và doanh số khôngtuân theo luật phân phối chuẩn thì việc kiểm địnhsẽ tiến hành như thế nào?

Các ví dụ mở đầu

3

Page 4: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Giám đốc 1 trung tâm hỗ trợ việc làm muốn kiểmtra xem mức thu nhập của sinh viên sau khi tốtnghiệp 2 năm có đạt được mức lương tối thiểu là350 (USD) hay không với giả định rằng thu nhậpcủa sinh viên không tuân theo phân phối chuẩn.

• Để đánh giá xem phương thức bán hàng mới có cảithiện doanh số bán hàng của các cửa hàng trongcùng 1 tập đoàn không người ta đã chọn ngẫunhiên 8 cửa hàng và quan sát doanh số theo thángcủa các cửa hàng này trước và sau khi áp dụngphương thức bán hàng mới ? Nếu giả định rằng cỡmẫu không thể điều tra thêm và doanh số khôngtuân theo phân phối chuẩn thì việc kiểm định sẽtiến hành như thế nào ?

Các ví dụ mở đầu

4

Page 5: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Khái niệm: Là kiểm định được xây dựng khi các giả thuyếtcủa kiểm định tham số bị vi phạm hoặc trên 1 cỡ mẫu nhỏhoặc trên các thang đo không có độ tin cậy cao.

Khái niệm về KĐ phi tham số

5

Page 6: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

BÀI TOÁN KĐ PHI THAM SỐ

• Trên 1 mẫu: �� � ��• Trên 2 mẫu phụ thuộc: �� � ��(có thể đưa về 1 mẫu để KĐ

trung vị)

Kiểm định dấu và hạng Wilcoxon

• Trên 2 mẫu độc lập �� � ��Kiểm định tổng hạng Wilcoxon

• Trường hợp � 3ẫ�độ��ậ��Nếu xếp hạng được).

Kiểm định Kruskal Wallis

• Trường hợp � 2ẫ�độ��ậ��Nếu không xếp hạng được) (các dâu hiệu định tính).

Kiểm định Khi bình phương

6

Page 7: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

7

Kiểm định phi tham số Kiểm định tham số

Kiẻm định trung vị (Med) Kiểm định về giá trị TB trên 1 mẫu

Kiểm định sự bằng nhau của 2 trungvị trong trường hợp mẫu phối hợptừng cặp

Kiểm định sự bằng nhau của 2 trungbình trong trường hợp mẫu phối hợptừng cặp

0 0

1 0

:

:

H Med Med

H Med Med

=

0 0

1 0

:

:

H

H

µ µ

µ µ

=

0

1

: 0

: 0d

d

H Med

H Med

=

0

1

: 0

: 0d

d

H

H

µ

µ

=

Page 8: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

8

B5:Tính giá trị kiểm định W

Kiểm định 2 bên (1):

Kiểmđịnh bên phải (2):

Kiểmđịnh bên trái (3):

B6:Tra bảng 6 Wilcoxon tìm giá trị

cận dưới và cận trên �� ,�� �ủ���

� �� �KĐ2bên)%&ặ��(���) (KĐ 1 bên)

{ }W= min coät R+; coät R-∑ ∑W= coät R+∑

W= coät R-∑

Page 9: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Với Wα(n’) :cận dưới ở bảng tra số 6,

n’ = sốlượngDi≠≠≠≠0

9

Ta chỉ xét cận dưới vì kiểm định này luôn thựchiện ở bên trái

Bác bỏ )� nếu � * �(;�,Quy tắc bác bỏ

Page 10: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Trường hợp mẫu lớn (n>20)

10

Trường hợp 2: mẫu lớn ( n’ > 20) giá trị kiểm

định W sẽ xấp xỉ phân phối chuẩn với giá trị

kiểm định Z tính theo công thức sau:

B5:

Với

-W

W

WZ

µ

σ=

( )' ' 1

4W

n nµ

+=

( )( )' ' 1 2 ' 1

24W

n n nσ

+ +=

Page 11: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Quy tắc bác bỏ cho trường hợp mẫu lớn

(KĐ dấu và hạng Wilcoxon cho 2 mẫu phụ thuộc)

11

B6: Quy tắc bác bỏ

Kiểm định (1): Bác bỏ H0 khi |Z|>Zα/2

Kiểm định (2): Bác bỏ H0 khi Z >Zα

Kiểm định (3): Bác bỏ H0 khi Z < -Zα

Page 12: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

12

Ví dụ:Kiểm tra trọng lượng của 1 số quả, người ta có bảng kết quả:Với mức ý nghĩa 5%, có thể chorằng Med = 350?Đặt giả thiết:

Xi (g)

300

320

340

380

420

400

300

340

360

400

410

0

1

3 5 0

3 5 0

H

H

=

Page 13: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

13

Trường hợp1: Mẫunhỏ(n≤≤≤≤20)B1:Tính chênhlệch Di giữagiá trị quan sátvà giá trị trungvịDi = Xi –-./�B2:Lấy trịtuyệt đối |Di |

Xi (g)

300

320

340

380

420

400

300

340

360

400

410

Di

-50

-30

-10

30

70

50

-50

-10

10

50

60

|Di|

50

30

10

30

70

50

50

10

10

50

60

Page 14: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

14

B3:Xếp hạngcho |Di|, + nếu |Di|=0 thìkhông xếp hạng+ nếu |Di|00 thì nguyên tắcxếp hạng nhưsau:

Xi (g) Di |Di|

300 -50 50

320 -30 30

340 -10 10

380 30 30

420 70 70

400 50 50

300 -50 50

340 -10 10

360 10 10

400 50 50

410 60 60

Page 15: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

15

Nguyên tắc xếp hạng+ Giá trị 12 nhỏ nhất xếp hạng1, lớn nhất xếp hạng n, + Nếu tồn tại các 12 bằng nhau thì tính hạng trung bình chotất cả các 12 này.+ Nếu 12 =0 thì không được xếp hạng

Xếpthứtụ 12 Hạng

1 10

2 10

3 10

4 30

5 30

6 50

7 50

8 50

9 50

10 60

11 70 11

7,5

4,5

2

107,5

2

4,5

7,5

2

7,5

Page 16: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

16

B3: Xếp hạngcho |Di|, nếu|Di|=0 thì khôngxếp hạngB4: Thêm 2 cộtR+ và R-R+ : gồmnhững hạng củaDi >0R- : gồm nhữnghạng của Di <0

Xi (g) Di |Di|

300 -50 50

320 -30 30

340 -10 10

380 30 30

420 70 70

400 50 50

300 -50 50

340 -10 10

360 10 10

400 50 50

410 60 60

Hạng |Di|

7,5

4,5

2

4,5

11

7,5

7,5

2

2

7,5

10

R+

4,5

11

7,5

2

7,5

10

R-

7,5

4,5

2

7,5

2

Page 17: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

17

B5:Tính W (do KĐ 2 bên nên)

Kiểm định (1) :

Ta cóWα(n)= W0,05(11)= (13, 53)=>23,5 ∈(13, 53)

Quy tắc bác bỏ : 5��ó� 7 �(⇒chấpnhận H0

{ } =0

W = min 42, 5 ; 23, 5 23, 5

{ }∑ ∑0W = min coät R+; coät R-

Page 18: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ

18

Giám đốc 1 trung tâm hỗ trợ việc làm muốn kiểm tra xem mứcthu nhập của sinh viên sau khi tốt nghiệp 2 năm có đạt đượcmức lương tối thiểu là 350 (USD) hay không với giả định rằngthu nhập của sinh viên không tuân theo phân phối chuẩn.Kiểm tra ngẫu nhiên 10 SV cũ của trường với giá trị được cho ở bảng

SV 1 2 3 4 5 6 7 8 9 10

Lương 364 385 270 350 290 400 520 340 389 410

Với mức ý nghĩa 5% hãy cho kết luận về giả thiết chorằng giá trị trung vị về thu nhập SV tốt nghiệp sau 2 nămlàm việc vượt quá con số 350USD

Page 19: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Giải

19

Kiểm định trung vị (Med)Đặt giả thiết: )�: -./ � 350, )�:-./ * 350

Lương �:;) <; � :; = >?@ |<;| Hạng R+ R-

364 14

385 35

270 -80

350 0

290 -60

400 50

520 170

340 -10

389 39

410 60

Giá trị KĐ bên trái: �� � ∑�ộCD =� 15,5Tra bảng wilcoxon ta có � F; G, � � 0,05; 9 � 8; 37⟹ �� 7 8 ⇒ �%ấ�G%ậG)�. Oá�Oỏ)�Kết luận: với mức ý nghĩa 5% không thể nói rằng lương trung vị của SV...

Page 20: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Lưu ý khi KĐ trung vị của 1 tổng thể

20

Trường hợp 2: Mẫu lớn (n>20)B5: tính Z

Trong đó

B6: Kiểm định 1 bên: Z < -Zα ⇒Bác bỏ H0

Kiểm định 2 bên: Z < -Zα/2 ⇒Bác bỏ H0

( )

( )( )

n n+1W-

4Z= 1 2 1

24

n n n+ +

W= coät R+∑

Page 21: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• TH KĐ sự bằng nhau 2 trị TB cho TH 2 mẫuphụ thuộc (mẫu phối hợp từng cặp)

1. Kiểm định dấu và hạng Wilcoxon

21

( ) 0

1

: 01

: 0d

d

H M

H M

=

( ) 0

1

: 02

: 0d

d

H M

H M

>

( ) 0

1

: 03

: 0d

d

H M

H M

<

Với-R � -./� = Med�Đưa về bài toán KĐ trung vị

B1: Đặt giả thiết

Page 22: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Bước 2: Tính giá trị chênhlệch giữa 2 2 2.

• Bước 3: Tính | 2 |=> Xếp hạngcác giá trị này (theo nguyêntắc xếp hạng).

• Bước 4:Với giá trị 2 thìta đặt hạng của nó vào cột R+ và ngược lại thì vào cột R-

1. Kiểm định dấu và hạng Wilcoxon

(TH KĐ 2 mẫu phụ th uộc)

22

Page 23: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

1. Kiểm định dấu và hạngWilcoxon về trung vị của 1 tổng thể

23

B5:Tính giá trị kiểm định W

Kiểm định 2 bên :

Kiểmđịnh bên phải:

Kiểmđịnh bên trái:

B6:Tra bảng 6 Wilcoxon tìm giá trị

cận dưới và cận trên �� ,�� �ủ���

� �� �KĐ2bên)%&ặ��(���) (KĐ 1 bên)

{ }W= min coät R+; coät R-∑ ∑W= coät R+∑

W= coät R-∑

Page 24: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Với Wα(n’) :cậndưới ở bảngtrasố 6, n’ = sốlượngDi≠≠≠≠0

24

Ta chỉ xét cận dưới vì kiểm định này luôn thực hiện ở bên trái

Bác bỏ )� nếu � * �(;�,

Quy tắc bác bỏ

Page 25: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định dấu và hạngWilcoxon cho 2 mẫu phụ thuộc

25

Ví dụ:Để kiểm tra hiệu quả của 1 khóa học, ta theo dõi kĩkhả năng đọc của trẻ emtrước và sau khi học. Kếtquả như sau:Với mức ý nghĩa 5%, khóahọc này có hiệu quả hay không ? Giải: -R � CVướ� = Y��

Trước Sau

60 63

40 38

78 77

53 50

67 74

88 96

77 80

60 70

64 65

75 750

1

: 0

: 0d

d

H M

H M

<

Page 26: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

3. Kiểm định dấu và hạngWilcoxon cho 2 mẫu phụ thuộc

26

Trường hợp 1: mẫunhỏ (n’≤≤≤≤20)B1:ĐặtZ�: CVướ�Z�: sau

Di = X1i – X2iB2:|Di|

B3: Xếp hạng cho|Di|, |Di|=0 thìkhôngxếphạngB4:ThêmcộtR+

gồmhạngcủanhữngDi> 0

Trước Sau

60 63

40 38

78 77

53 50

67 74

88 96

77 80

60 70

64 65

75 75

Di

-3

2

1

3

-7

-8

-3

-10

-1

0

|Di|

3

2

1

3

7

8

3

10

1

0

Hạng

5

3

1,5

5

7

8

5

9

1,5

R+

3

1,5

5

Page 27: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

27

B5:

B6: Quy tắc bác bỏ : Tra bảng 6 để tìm giới hạntrênvà giới hạn dướiWα(n’)=���,�[;\)=(8,37)

Kiểmđịnh (3): (KĐ bêntrái)

Ta có �� � 35,5 7 �� � 8 ⇒ �%ấ�G%ậG)�

0W = coät R- 35, 5=∑

Page 28: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định dấu và hạngWilcoxon cho 2 mẫu phụ thuộc

28

Trường hợp 2: mẫu lớn ( n’ > 20) giá trị kiểm

định W sẽ xấp xỉ phân phối chuẩn với giá trị

kiểm định Z tính theo công thức sau:

B5:

Với

-W

W

WZ

µ

σ=

( )' ' 1

4W

n nµ

+=

( )( )' ' 1 2 ' 1

24W

n n nσ

+ +=

Page 29: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Quy tắc bác bỏ cho trường hợp mẫu lớn

(KĐ dấu và hạng Wilcoxon cho 2 mẫu phụ thuộc)

29

B6: Quy tắc bác bỏ

Kiểm định (1): Bác bỏ H0 khi |Z|>Zα/2

Kiểm định (2): Bác bỏ H0 khi Z >Zα

Kiểm định (3): Bác bỏ H0 khi Z < -Zα

Page 30: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ

30

Một mẫu gồm 9 khách hàng được chọn ngẫu nhiên và yêucầu họ cho biết về sở thích của 2 loại kem đánh răng A và B thông qua thang điểm từ 1 (thấp nhất) đến 5 (cao nhất). Kếtquả thu thập số liệu như sau:

Khách hàng 1 2 3 4 5 6 7 8 9

Sản phẩm A 4 5 2 3 3 1 3 2 2

Sản phẩm B 3 5 5 2 5 5 3 5 5

Với mức ý nghĩa 5% hãy kiểm định giả thuyết kem đánh răng A được ưa thích hơn kem đánh răng B.

Đặt giả thiết ])�:-./R ^ 0)�: -./R 7 0_ớ`-./R � -./a =-./b

Page 31: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Giải

31

Khách hàng 1 2 3 4 5 6 7 8 9

Sản phẩm A 4 5 2 3 3 1 3 2 2

Sản phẩm B 3 5 5 2 5 5 3 5 5

Bài toán kiểm định sự bằng nhau của 2 trị trung bình trong TH mẫu phốihợp từng cặp.

B1: Đặt gả thiết: ])�:-./R ^ 0)�: -./R 7 0_ớ`-./R � -./a =-./bTa có:

Khách hàng 1 2 3 4 5 6 7 8 9 Tổng

Sản phẩm A(ca) 4 5 2 3 3 1 3 2 2

Sản phẩm B(cb) 3 5 5 2 5 5 3 5 5

/2 � ca = cb 1 0 -3 1 -2 -4 0 -3 -3

|/2| 1 3 1 2 4 3 3

Hạng

R+

R-

Page 32: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Tính giá trị kiểm địnhKiểm định bên phải: �� � ∑�ộCD d� 3Tra bảng Wilcoxon ta tìm được�(,�, � ��,�[;e � 2; 26

⇒ �� 7 2 ⇒ �%ấ�G%ậG)�Kết luậnVới mức ý nghĩa 0,05 không thể nói rằng khách hàngưa thích sản phẩm kem đánh răng A hơn B

32

Page 33: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• (Mann – Whitney)

2. Kiểm định tổng hạng Wilcoxon cho trung bình 2 mẫu độc lập

33

Page 34: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

3. Kiểm định tổng hạng Wilcoxon cho trungbình 2 mẫu độc lập (Mann-Whitney)

34

Kiểm định tổng hạng có dấu Wilcoxon được sử dụng trong trườnghợp sau đây:+ Mục đích nghiên cứu nhằm so sánh 2 tổng thể.+ Số liệu định lượng nhưng giả thuyết về phân phối chuẩn của�� = �� bị vi phạm.+ Hai mẫu độc lập.

Các bước kiểm địnhBước 1: Đặt giả thuyết

Bước2: xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận giá trị trung bình.Bước 3: có 2 trườnghợp

( ) ( ) ( )0 1 2 0 1 2 0 1 2

1 1 2 1 1 2 1 1 2

: : :1 2 3

: : :

H H H

H H H

µ µ µ µ µ µ

µ µ µ µ µ µ

= ≥ ≤

≠ < >

Page 35: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

3. Kiểm định tổng hạng Wilcoxon cho trung bình 2 mẫu độc lập

35

Trườnghợp 1 (mẫu nhỏ(gh, gi ^ h@) Trường hợp 2 mẫu lớn

(gh d gi 7 i@)Lấy tổng hạng T1 của mẫu nhỏ. Nếu2 mẫu bằng nhau thì lấy tổng hạngcủa mẫu nào cũng được.

B3: Quy tắc bác bỏ

Dùng bảng tra 7 để tìm giới hạn trên

và dưới

Kiểm định (1):Bác bỏ H0 khi T1 ≤giới hạn dưới hoặc T1 ≥giới hạn trên

Kiểmđịnh (2):Bác bỏ H0 khi T1

≥giới hạn trên

Kiểmđịnh (3):Bác bỏ H0 khi T1 ≤

giới hạn dưới

phân phối của 5�được xem nhưchuẩn với

�jk � G��G d 1)2 ; ljk � G�G��G d 1)12

Tínhm � jknopkqpk B3:Quy tắc bác bỏ

Kiểmđịnh (1):Bác bỏ H0 khi |Z|>Zα/2

Kiểmđịnh (2):Bác bỏ H0 khi

Z > Zα

Kiểmđịnh (3):Bác bỏ H0 khi

Z <- Zα

Page 36: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định tổng hạng Wilcoxoncho trung bình 2 mẫu độc lập

36

Ví dụ: Theo dõi doanh thubán hàng của 2 nhân viên. Với mức ý nghĩa 5%, cóthể cho rằng doanh thubán hàng là như nhau?Đặt giả thiết

]-./� � -./�-./� 0 -./�

NV1 NV2

60 63

61 64

63 67

72 40

68 50

70 90

80 80

90 70

85 85

93

Page 37: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định tổng hạng Wilcoxoncho trung bình 2 mẫu độc lập

37

NV1 Hạng NV2 Hạng

60 63

61 64

63 67

72 40

68 50

70 90

80 80

90 70

85 85

93

Trường hợp 1: Mẫu nhỏ (n1,n2≤≤≤≤10) B1: Xếp hạngB2: Lấy tổng hạng

T1 của mẫu nhỏ.

Nếu 2 mẫu bằngnhau thì lấy tổnghạng của mẫu nàocũng được.

Hạng

3

4

5,5

12

9

10,5

13,5

17,5

15,5

Hạng

5,5

7

8

1

2

17,5

13,5

10,5

15,5

1990,5

Page 38: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Giải

38

B3: Quy tắc bác bỏ

Dùng bảng tra 7 để tìm giới hạn trên và dưới

Kiểm định (1): Bác bỏ H0 khiT1 ≤≤≤≤ giới hạn dưới hoặc T1 ≥≥≥≥ giới hạn trênTức ta bác bỏ r@ khi sh ∉ �uv;uw)Theo đề bài ta có 5� � 90Tra bảng 7 ta có cận trên = 115, cận dưới = 65 .65 < T1 < 115 ⇒ Chấp nhận H0Chú ý + Khi tra bảng giá trị G� tương ứng với 5�+ Giá trị chênh lệch giữa G�_à�á�Gy không quá nhiều vàgiá trị cũng không có nhiều giá trị đột biến (điều này khác vớiANOVA và Kruskall Wallis)

Page 39: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định tổng hạng Wilcoxoncho trung bình 2 mẫu độc lập

39

Trường hợp 2: Mẫu lớn (n1 + n2 >20)

B2: tính Z

Với

1

1

1 T

T

TZ

µ

σ

−=

( )1

1

1

2T

n nµ

+=

( )1 2

1

1

1 2T

n n nσ

+=

Page 40: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

2. Kiểm định tổng hạng Wilcoxoncho trung bình 2 mẫu độc lập

40

B3: Quy tắc bác bỏ

Kiểm định (1): Bác bỏ H0 khi |Z|>Zα/2

Kiểm định (2): Bác bỏ H0 khi Z > Zα

Kiểm định (3): Bác bỏ H0 khi Z < -Zα

Page 41: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ148� Để kiểm định xem việc trưng bày hàng hóa có tác động

đến doanh số không người ta chọn ngẫu nhiên 2 mẫu, mẫu thứ 1 gồm 10 cửa hàng trưng bày bình thường, mẫuthứ 2 cũng gồm 10 cửa hàng trưng bày đặc biệt sau đóquan sát doanh số của các cửa hàng này (đơn vị: triệuđồng/tháng) ta được bảng số liệu sau:

41

Doanh số (t.bày BT) 22 34 52 62 30 40 64 84 56 59

Doanh số (t.bày ĐB) 52 71 76 54 67 83 66 90 77 84

Page 42: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Giải

42

Doanh số (t.bày BT) 22 34 52 62 30 40 64 84 56 59

Doanh số (t.bày ĐB) 52 71 76 54 67 83 66 90 77 84

Đặt giả thiết: ]-./� � -./�-./� 0 -./� ta có

Doanh số Hạng kết hợp

22 1

30 2

34 3

40 4

52 5,5

52 5,5

54 7

56 8

59 9

62 10

Doanh số Hạng kết hợp

64 11

66 12

67 13

71 14

72 15

77 16

83 17

84 18,5

84 18,5

90 20

Page 43: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Giải

43

Doanh số (t.bày BT) 22 34 52 62 30 40 64 84 56 59 zHạng (trưng bày BT) 1 3 5,5 10 2 4 11 18,5 8 9 72

Doanh số (t.bày ĐB) 52 71 76 54 67 83 66 90 77 84

Hạng (trung bày ĐB) 5,5 14 15 7 13 17 12 20 16 18,5 138

Doanh số Hạng kết hợp

22 1

30 2

34 3

40 4

52 5,5

52 5,5

54 7

56 8

59 9

62 10

Doanh số Hạng kết hợp

64 11

66 12

67 13

71 14

72 15

77 16

83 17

84 18,5

84 18,5

90 20

Page 44: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

GiảiChọn 5� � 72Tra bảng Wilcoxon tìm giá trị�(�;�k;�� � ��,��[;��;�� � 78; 132Ta có 5� ∉ �78; 132)=> bác bỏ )�Kết luậnVới mức ý nghĩa 0,05 có sự khác biệt về doanh sốgiữa trưng bày bình thường và trưng bày đặc biệt.

44

Page 45: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

45

4. Kiểm định Kruskal Wallis

Giả sử ta có k mẫu gồm phần tửđược chọn từ k tổng thể.

là các trung bình của k tổng thể đó

1 2, ,..., kn n n

µ µ µ1 2, ,..., k

NHÓM1 2 … k

… ……………

…11x

11nx

21x

22nx

1kx

kknx

k tổng thể chưa biết phân phối , không có giảthiết phương sai bằng nhau

0 1 2

1

: ...

: toàn taïi ít nhaát 1 caëp trung bình khaùc nhaukH

H

µ µ µ= = =

Page 46: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

•Kiểm định Kruskal_Walis•- Phân tích phương sai 1 yếu tố (ANOVA)

•- Phân tích sâu ANOVA (Tukey)

4. Kiểm định Kruskal Wallis

46

Kiểm định phi tham số Kiểm định tham số

Kiểm định Kruskal_Walis - Phân tích phương sai 1 yếu tố(ANOVA)- Phân tích sâu ANOVA (Tukey)

Kiểm định Kruskal_Walis về tính độc lập

Kểm định K-W là phương pháp phân tích phương sai sử dụnghạng của các giá trị quan sát, dùng để so sánh trung bình của k tổng thể.Khi chỉ có 2 tổng thể, kiểm định K-W tương tự như kiểm địnhM_W (đã học)

Page 47: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4. KIỂM ĐỊNH K-W

47

Các bước kiểm địnhBước 1: Đặt giả thuyết

])�: �� � �� � ⋯ � �y)�: ∃! �2 0 �~�` 0 �)Bước2: xếp hạng tất cả các giá trị của k mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận hạng trung bình.Bước 3: Cộng các hạng của tất cả các giá trị của từng mẫu lại, kýhiệu R1,R2,…, R3

Bước4: Tính giá trị kiểm định

u � �i � hig�g d h)z

�;ig; = >�g d h)�

;�hBước5: So sánh và kết luậnQui tắc quyết định: Bác bỏ gt r@ nếu �i 7 ��nhi

(với �yn�� có phân phối ��với (k-1) bậc tự do.

Tồn tại ít nhất một cặp trung bình khác nhau

Page 48: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4. Kiểm định Kruskal Wallis

48

Ví dụ 1: Để xét xemthời gian làmthêm có ảnhhưởng đếnkết quả họctập hay không, ngườita điều tramẫu sau:

Nhóm 1: làmthêm ít<6 giờ /tuần

Nhóm 2: làmthêm TB 6-12 giờ/tuần

Nhóm 3: làmthêm nhiều>12 giờ/tuần

6.3 7.2 6.3

7.0 6.6 5.8

6.5 6.1 6.0

6.6 5.8 5.5

7.3 6.8 5.3

6.9 7.1 6.5

6.4 5.9 5.4

6.2

Kiểm định xem thời gian làm thêm có ảnh hưởngđến kết quả học tập không?

Page 49: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

49

4.1. Phương pháp xếp hạngBước 1: Xếp hạng

Nguyên tắc xếp hạng: giá trị xij nhỏ nhất xếp hạng1, lớn nhất xếp hạng n, nếu tồn tại các xij bằng nhauthì tính hạng trung bình cho tất cả các xij này

Nhóm 1: Hạng Nhóm 2: Hạng Nhóm 3: Hạng

6.3 7.2 6.3

7.0 6.6 5.8

6.5 6.1 6.0

6.6 5.8 5.5

7.3 6.8 5.3

6.9 7.1 6.5

6.4 5.9 5.4

6.2

4,5

1

2

34,5

6

78

9

10,510,5

12

13,5

13,5

15,5

15,5

17

18

19

20

21

22

Page 50: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4.1. Phương pháp kiểm định K-W

50

Bước 2: Tính W

Trong đó Ri là tổng hạng của nhóm thứ i

Ví dụ:

2

1

123( 1)

( 1)

ki

ii

RW n

n n n=

= − ++ ∑

( )2 2 212 110,5 92 50,5

3 22 122(22 1) 7 7 8

8,6

W

= + + − + +

=

Page 51: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4.1 Phương pháp kiểm định K-W

51

Bước 3:

Nếu W > ⇒ Bác bỏ H0

Trong đó, tra bảng chi bình phương

Ví dụ:

Bác bỏ Ho. Vậy với độ tin cậy 95%, thời gian làm

thêm có ảnh hưởng đến kết quả học tập của sinh

viên.

21,k αχ −

21,k αχ −

22;0.058,6 5,99W χ= > =

Page 52: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4.2. Phân tích sâu K-W

52

Bước 1: tính hạngtrung bình

Bước 2: tính chênhlệch hạng trung bình

ii

i

RR

n=

jij iD R R= −

Ví dụ:

11

1

2

110, 515, 786

7

13,143

RR

n

R

= = =

=

1 2 2, 643D =

0 1 2

1 1 2

:

:

H

H

µ µ

µ µ

=

Page 53: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4.2. Phân tích sâu K-W

53

Bước 3: tính Ck

( )21,

1 1 1

12ki j

k

n nC

n nαχ −

+ = +

Ví dụ:

( )22 22 1 1 15, 99 8, 5

12 7 7kC+

= + =

Page 54: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

4.2. Phân tích sâu K-W

54

Bước 4: Bác bỏ Ho khi Dij > Ck

Ví dụ:

12 2, 643 8, 5

chaáp nhaän HokD C= < =

Page 55: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• 5.1 Kiểm định Chi bình phương (�i)về tínhđộc lập

• 5.2 Kiểm định Chi bình phương (�i)về sự phùhợp.

� )5. Kiểm định Chi bình phương (�i)

55

Page 56: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương (�i)về tính độc lập

56

Phần này ta sẽ nói đến phương pháp kiểm địnhdùng phân phối��, với dữ liệu là số đếm hoặc tầnsố. Trong nhiều trường hợp, phân tích�� trở nênphổ biến và tiện lợi khi dữ liệu thu thập ở dạng sốđếm – chẳng hạn, số lượng người ở những độ tuổi , giới tính, nghề nghiệp, hoặc thu nhậpkhác nhau; sốlượng sản phẩm sản xuất với số lỗi khác nhau,…

Page 57: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

57

Kiểm định sự độc lập của 2 biến định tínhVí dụ: Nghiên cứu ảnh hưởng của thời gian tự học đến kếtquả học tập; hoàn cảnh gia đình đến tình trạngphạm tội ở trẻ em; thời gian tìm hiểu trước hônnhân (ngắn, dài,…) đến tình trạng hôn nhân (hạnhphúc, không hạnh phúc,…)

Page 58: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

58

Giả sử ta cần nghiên cứu xem 2 yếu tố A và B cóảnh hưởng đến nhau hay không

Xij gọi là tần số thực tế

B A

1 2 … k Tổng

1 X11 X12 … X1k A1

2 X21 X22 … X2k A2

… … … … … …

h Xh1 Xh2 … Xhk Ah

Tổng B1 B2 … Bk n

i jX

Page 59: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

59

0

1

: 2 bieán ñònh tính A vaø B ñoäc laäp

: 2 bieán ñònh tính A vaø B phuï thuoäc

H

H

( )Böôùc 1: goïi laø taàn soá lyù thuyeáti j

ij ij

A BE E

n

×=

( )2

2

1 1Böôùc 2:

k h ij ij

i j ij

X E

= =

−=∑∑

2 2

( 1) ( 1);B öôùc 3 : B aùc b oû H o k h i

h k αχ χ

− × −>

Page 60: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

60

Ví dụ: Trang 298Nghiên cứu về mối liên hệ giữa thời gian tìm hiểutrước hôn nhân (ngắn , dài, trung bình) và tình trạnghôn nhân hiện tại (hạnh phúc, không hạnh phúc, li dị)Thời gian

tìm hiểuCuộc sốnghiện tại

Ngắn Trungbình

Dài Tổng hàng

Hạnh phúc 38 58 54 150

Không hạnh phúc 12 14 4 30

Li dị 10 8 2 20

Tổng cột 60 80 60 200

Page 61: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

61

0

1

: khoâng coù lieân heä giöõa thôøi gian tìm hieåu tröôùc

hoân nhaân vaø tình traïng hieän taïi cuûa hoân nhaân

: coù lieân heä giöõa thôøi gian tìm hieåu tröôùc hoân

nhaân vaø tình traïng hieän taïi

H

H

cuûa hoân nhaân

Page 62: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

62

Bước 1: tính Eij (tần số lý thuyết)

Thời giantìm hiểu

Cuộc sốnghiện tại

Ngắn Trungbình

Dài Tổng hàng

Hạnh phúc 45 60 45 150

Không hạnh phúc 9 12 9 30

Li dị 6 8 6 20

Tổng cột 60 80 60 200

1 212

150 80

200

A BE

n

× ×= =

Page 63: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5. Kiểm định Chi bình phương

63

Bước 2:

Bước 3:

⇒ Bác bỏ Ho. Vậy với độ tin cậy 95%, có thểkết luận có mối liên hệ giữa thời gian tìm hiểutrước hôn nhân và tình trạng hôn nhân hiện tại.

( ) ( ) ( )2 2 2

2 38 45 58 60 2 6... 12, 4

45 60 6χ

− − −= + + + =

2 2( 3 1) ( 3 1);0 ,05 4;0 ,05

2 12, 4 9, 48χ χ χ− × −= > = =

Page 64: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

5.2 Kiểm định Chi bình phương (�i)về sự phù hợp

64

Kiểm định Chi bình phương được sử dụng khá phổbiến đối với các biến định tính (phân loại).

Phần trước ta đã xét tính độc lập của 2 biến địnhtính (tức xét mối liên hệ giữa biến định tính này với biếnđịnh tính khác).

Trong thực tế, các kiểm định tham số đã nghiên cứuđều có giả định các dữ liệu lấy từ tổng thể có phân phốichuẩn.

Vậy, vấn đề đặt ra là làm thế nào để kiểm tra dữliệu của chúng ta có phân phối chuẩn hay không hay nótheo một phân phối dự kiến nào đó. Muốn làm được điềunày chúng ta sẽ xét đến bài toán kiểm định Chi bìnhphương về sự phù hợp để xem xét dữ liệu của chúng ta thích hợp (phù hợp) đến mức độ nào với giả thuyết vềphân phối của tổng thể.

Page 65: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ

65

Thứ Thực tếSố vụ

Hai 7Ba 3Tư 3Năm 2Sáu 5Bảy 12Total 32

Một công ty muốn nghiên cứu các vụ tai nạn lao động có xảy ra nhưnhau vào các ngày làm việc trong tuần hay không hay là nó có xu

hướng tăng cao vào các ngày thứ Hai và các ngày cuối tuần. Điều tra

một mẫu được cho ở bảng sau:

Nhận xét: Nếu giả thiết cho rằng “ các vụ tai nạn xảy ra với xác suất nhưnhau trong 6 ngày làm việc của tuần là đúng thì số tai nạn phải có phânphối đều với xác suất mỗi ngày là 1/6.Với tổng số 32 vụ tai nạn lao động công ty đó thu thập được trong vòng 5 năm qua tại các nhà máy của công ty, số lượng các vụ tai nạn trong từngngày phải bằng nhau và phải bằng 1/6.32=5,33 vụ.

Page 66: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

66

Theo bảng số liệu trên dường như các vụ tai nạn xảy ra không đều nhau giữa 6 ngày làm việc trong tuần.Đặt giả thuyết)�: tai nạn lao động các ngày trong tuần có phân phối đều.)�:tai nạn lao động các ngày trong tuần không có phân phối đều.

Thứ Thực tế (�;) Giả thiết (�2) �2 = �2 � �2 = �2 ��2

Số vụ % Số vụ %Hai 7 21,9 5,33 16,66 2,79 0,523Ba 3 9,4 5,33 16,66 5,29 0,998Tư 3 9,4 5,33 16,66 5,29 0,998Năm 2 6,3 5,33 16,66 10,89 2,055Sáu 5 15,6 5,33 16,66 0,09 0,017Bảy 12 37,5 5,33 16,66 44,89 8,470Total 32 100,0 32 100,0 13,061

Page 67: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

67

Chú ýTần số lý thuyết là tần số xảy ra nếu giả thiết )� đúng (trong ví dụ trên thì tần sốlý thuyết là 5,33 vụ tai nạn/ngày).Đại lượng thống kê Chi bình phương được tính như sau:

���� �z �2 = �2 ��2

y

2��Trong đó:+ �2: �àCầGYố���GYáCC%ự�Cế�ủ��&ạ`C%ứ` ởđâ��àG�à� .+ �2: là tần số lý thuyết của loại thứ i.+ �: �àYố�%âG�&ạ`�YốG�à��à_`ệ�CV&G�C�ầG� � 6).Bác bỏ r@ khi

���i 7 ��nh;�iTa có ���� � 13,061 7 ��n�;�,�[� � 11,07 → Oá�Oỏ)�Như vậy, tai nạn lao động các ngày trong tuần không có phân phối đều.Do đó, ta có bằng chứng để bác bỏ giả thiết tai nạn lao động các ngày trong tuầncó phân phối đều. Theo bảng tổng hợp, căn cứ vào cột �2 ta thấy tai nạn có nhiềukhả năng xảy ra vào đầu tuần và nhất là 2 ngày cuối tuần. Vì vậy, công ty nên ápdụng các biện pháp đặc biệt để đề phòng tai nạn lao động vào những ngày này.

Page 68: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

PHÂN BIỆT 2 DẠNG KIỂM ĐỊNH

68

1)Kiểm định chi bình phương về sự độc lập của 2 biến định tính:

Đây là bài toán xét đồng thời hai dấu hiệu địnhtính (2 mẫu ngẫu nhiên độc lập được xét) trên 1 tổng thể.

2) Kiểm định chi bình phương về sự phù hợpĐây là bài toán kiểm định một một mẫu ngẫu

nhiên được thu thập (sau đó phân nhóm theo nhiềuđặc điểm) có tuân theo phân phối A hay không (tứclà một dấu hiệu định tính được phân ra nhiều nhómđịnh tính)

Page 69: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Công ty hóa mỹ phẩm A vừa đưa vào thị trườngloại dầu gội đầu mới, dành riêng cho phái Nam. Có ý kiến cho rằng, chỉ có 30% Nam giới sẽ ưachuộng loại sản phẩm mới này. Chọn ngẫu nhiên20 người (nam) đã dùng qua sản phẩm và hỏi ý kiến, chỉ có 3 người ưa thích loại dầu gội mớinày, còn lại 17 người là không thích. Như vậy ý kiến trên có đúng không với mức ý nghĩa 5%?

Ví dụ:

69

Page 70: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

• Đặt giả thiết• )�: � � 0,03• )�: � 0 0,03• Theo nhận định có 30% trong tổng số 20 người

nam ưa thích dầu gội tức là có: 20x0,3=6• Ta có:

Giải (KĐ chi bình phương về sự phù hợp)

70

Ưa thích Không ưa thích Tổng cộng5%ự�Cế��2) 3 17 20�`ảC%`ếC��2) 6 14 20

Giá trị kiểm định

���� �z �2 = �2 ��2 � 3 = 6 �

6 d 17 = 14 �14 �

2��2,14

Khi đó ���� � 2,14 * ��n�;�,�[� � 3,84 → �%ấ�G%ậG)�Vậy, với mức ý nghĩa 5% không thể bác bỏ giả thiết cho rằng 30% nam giói ưachuộng dầu gội đàu mới A (mặc dù tỉ lệ mẫu chỉ là 15%).

Page 71: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ

71

Vẫn giống ví dụ trên nhưng cho nội dung như sau:Giả sử có 2 loại dầu gội mới dành cho phái nam. Vói mẫu ngẫunhiên 20 người Nam trong số những người đã từng dùng sản phẩmthứ nhất, có 3 người ưa thích loại dầu gội này; mẫu thứ 2 cũng gồm20 người nam đã từng dùng qua sản phẩm thứ hai, có 9 người ưathích loại dầu gội mới này.Câu hỏi đặt ra là: Có thể cho rằng đối với 2 sản phẩm mới này, tỉ lệkhách hàng nam ưa thích chúng là bằng nhau với mứ ý nghĩa 5% ?

Page 72: Chuong5 KIỂM ĐỊNH PHI THAM SỐ

Ví dụ

72

Giải Áp dụng KĐ chi bình phương về tính độc lậpGọi ��, �� lần lượt là tỉ lệ khách hàng nam ưa thíchloại dầu gội 1 và 2.Đặt giả thuyết: )�: �� � ��)�: �� 0 ��Kết quả tính tần số lý thuyết được cho trong bảngsau: Ưa thích Không ưa thích�2 �2 �2 �2

Loại dầu gội 1 3 6 17 14Loại dầu gội 2 9 6 11 14

Giá trị kiểm định

���� � 3 = 6 �6 d 9 = 6 �

6 d 17 = 14 �14 d 11 = 14 �

14 � 4,28Vì ���� � 4,28 7 ��;�,�[� � 3,84. Do đó ở mức ý nghĩa 5%,

bác bỏ giả thiết )� cho rằng tỉ lệ khách hàng nam ưa thích 2 loạidầu gội này là bằng nhau.