18
1 PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống 1 TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM Khoa KTXD - Bộ môn KTTNN Giảng viên: PGS. TS. NGUYỄN THỐNG E-mail: [email protected] or [email protected] Web: http://www4.hcmut.edu.vn/~nguyenthong/ Tél. (08) 38 640 979 - 098 99 66 719 PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả (ôn). Chương 1bis. Xác suất & phân phối thống kê (ôn).. Chương 2. Khoảng tin cậy . Chương 3. Kiểm định thống kê. Chương 4. Phân loại dữ liệu (Classification). Chương 5. Phân nhóm dữ liệu (Cluster). Chương 6. Phân tích thành phần chính (PCA). Chương 7. Phân tích chuỗi thời gian. Chương 8. Hồi quy tuyến tính. Chương 9. Xử số liệu thực nghiệm. Chương 10. Giới thiệu phần mềm SPSS or R PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống 3 KIỂM ĐỊNH THỐNG KÊ Đưc sử dng khi phải đưa ra cc kết luận liên quan đến cc biến thống dạng xc suất. V d: So snh 2 gi trị ca biến thống Xét 2 biến thống dạng liên tc Xác suất để 2 biến này BẰNG nhau là bằng 0 ! PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống 4 PHÂN PHỐI CHUẨN N(0,1) biến liên tc 0 -2.5 -1.5 -0.5 0.5 1.5 2.5 p(t) t t0 vôùi Haøm maät ñoä xaùc suaát S 1 S 2 t 1 t 2 2 t 2 1 p(t) e 2 t [ , ] Gi trị TB Độ lệch chuẩn PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống 5 KIỂM ĐỊNH THỐNG KÊ Hoc xc định quy luật ca một biến quan st c bản chất l biến xc suất so với một quy luật xc suất D KIN. So sánh giá trị TB từ mẫu khảo sát so với giá trị giả thiết đưa ra. PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 3: Kiểm định giả thuyết thống 6 Kiểm định giả thiết một kỹ thuật cho phép đưa ra các kết luận, với một độ tin cậy cho trước, khi tiến hành so sánh giữa các biến thống kê. Các bước kiểm định: Bước 1: Thành lập giả thiết H0 và phản giả thiết H1. Bước 2: Đề xuất ngưỡng chấp nhận ca kiểm định. Bước 3: Chọn lựa tham số thống kê thích hp cho kiểm định. Bước 4: Xác định giá trị tới hạn thống ca kiểm định. Bước 5: Thiết lập gi trị đưc lấy bi kiểm định. Bước 6: Ra quyết định.

Hypothesis Review

Embed Size (px)

DESCRIPTION

Hypothesis Review.

Citation preview

1

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

1

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM

Khoa KTXD - Bộ môn KTTNN

Giảng viên: PGS. TS. NGUYỄN THỐNG

E-mail: [email protected] or [email protected]

Web: http://www4.hcmut.edu.vn/~nguyenthong/

Tél. (08) 38 640 979 - 098 99 66 719 PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả (ôn).

Chương 1bis. Xác suất & phân phối thống kê (ôn)..

Chương 2. Khoảng tin cậy.

Chương 3. Kiểm định thống kê.

Chương 4. Phân loại dữ liệu (Classification).

Chương 5. Phân nhóm dữ liệu (Cluster).

Chương 6. Phân tích thành phần chính (PCA).

Chương 7. Phân tích chuỗi thời gian.

Chương 8. Hồi quy tuyến tính.

Chương 9. Xử lý số liệu thực nghiệm.

Chương 10. Giới thiệu phần mềm SPSS or R

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

3

KIỂM ĐỊNH THỐNG KÊ

Đươc sử dung khi phải đưa ra cac

kết luận liên quan đến cac biến

thống kê ơ dạng xac suất.

Vi du: So sanh 2 gia trị cua biến

thống kê Xét 2 biến thống kê dạng

liên tuc Xác suất để 2 biến này BẰNG

nhau là bằng 0 !

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

4

PHÂN PHỐI CHUẨN N(0,1) biến liên tuc

0

-2.5 -1.5 -0.5 0.5 1.5 2.5

p(t)

tt0

vôùi

Haøm maät ñoä

xaùc suaát

S1

S2

t1 t

2

2t

21

p(t) e2

t [ , ]

Gia trị TB Độ lệch

chuẩn

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

5

KIỂM ĐỊNH THỐNG KÊ

Hoăc xac định quy luật cua

một biến quan sat co bản chất

la biến xac suất so với một quy

luật xac suất DƯ KIÊN.

So sánh giá trị TB từ mẫu

khảo sát so với giá trị giả thiết

đưa ra. PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

6

Kiểm định giả thiết là một kỹ thuật cho phép đưa ra các

kết luận, với một độ tin cậy cho trước, khi tiến hành

so sánh giữa các biến thống kê.

Các bước kiểm định:

• Bước 1: Thành lập giả thiết H0 và phản giả thiết H1.

• Bước 2: Đề xuất ngưỡng chấp nhận cua kiểm định.

• Bước 3: Chọn lựa tham số thống kê thích hơp cho

kiểm định.

• Bước 4: Xác định giá trị tới hạn thống kê cua kiểm

định.

• Bước 5: Thiết lập gia trị đươc lấy bơi kiểm định.

• Bước 6: Ra quyết định.

2

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

7

KIỂM ĐỊNH GIÁ TRỊ

TRUNG BÌNH THỐNG KÊ

Để kiểm định người ta dùng

hoăc:

Phân phối chuẩn.

Dùng phân phối Student.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

8

KIỂM ĐỊNH GIÁ TRỊ

TRUNG BÌNH VỚI P/P CHUẨN.

T/hơp sử dung:

n > 30

Hoăc n < 30, tập hơp mẹ theo

phân phối chuẩn và biết σ.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

9

Ví du. Keát quaû chòu löïc trung bình cuûa vaät lieäu

Z ñöôïc coâng boá laø 15000N/cm2. Giaû thieát giaù

trò trung bình theo phaân phoái chuaån.

Ñeå kieåm ñònh giaù trò trung bình, ngöôøi ta laáy

ngaãu nhieân n=60 maãu vaø keát quaû tính cho

thaáy giaù trò chòu löïc trung bình laø

14000N/cm2, = 4000N/cm

2. Haõy kieåm ñònh sự sai biệt vôùi möùc ñoä ruûi ro

=5% (ñoä tin caäy 95%).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

10

H0: : giá trị chịu lực trung bình là bằng

15000N/m2.

H1: : giá trị chịu lực trung bình là khác

15000N/m2.

a : tham số cần xac định.

x a

x a

0

-2.5 -1.5 -0.5 0.5 1.5 2.5

p(t)

tt0-t0

H0: (1-) H

1 :α%

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

11

Ta coù:

1 0Pr H \ H Pr \x a x

1 Pr a x a

x x x

a x -μ a= Pr(- < < )

σ σ σ

x x

a a0.95 = Pr(- < t < )

σ σx

xt

96.1x

a

Tra baûng

vôùi

Giaù trò tra töø p/p

chuaån N(0,1)

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

12

HD:

0

-2.5 -1.5 -0.5 0.5 1.5 2.5

p(t)

tt0-t0

00 tttPr95.0

0ttPr025.0

3

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

13

Töø ñoù:

a=1012,14

Ngoai ra từ số liệu mẫu ta thấy:

Giả thiết H0 đươc chấp nhận.

Kết luận: Với mức độ rui ro là 5% (độ tin

cậy 95%) ta có thể kết luận giá trị chịu

lực trung bình là 15000N/m2.

n*96,196,1a x

x a 1000 1012 14,

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

14

Bài tập. Keát quaû trọng löôïng töï nhieân trung

bình cuûa ñaát trong thiết kế ñöôïc coâng boá laø

16kN/m3.

Ñeå kieåm ñònh soá lieäu, ngöôøi ta laáy ngaãu nhieân

n=36 maãu vaø keát quaû tính cho thaáy giaù trò

trung bình vaø ñoä leäch chuaån laø 14.8kN/m3,

s= = 2kN/m3.

Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro laø

=5% (ñoä tin caäy 95%).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

15

KIEÅM ÑÒNH GIAÙ TRÒ

TRUNG BÌNH

VÔÙI PHAÂN PHOÁI

STUDENT

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

16

Phân phối Student đươc áp dung

thay thế phân phối chuẩn trong

kiểm định giá trị trung bình khi:

Mẫu có kích thước bé (n < 30);

Phân phối mẹ là phân phối

chuẩn nhưng độ lệch chuẩn

không biết.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

17

Ví du. Keát quaû chòu löïc trung bình cuûa vaät

lieäu Z ñöôïc coâng boá laø 15000N/cm2.

Ñeå kieåm ñònh giaù trò trung bình coâng boá neâu

treân, ngöôøi ta laáy maãu ngaãu nhieân n=16

maãu vaø keát quaû tính cho thaáy giaù trò chòu

löïc trung bình vaø ñoä leäch chuaån cuûa maãu

laø 14000N/cm2

vaø =1500N/cm2

.

Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro

laø =5% (ñoä tin caäy 95%).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

18

Ví du. Cơ quan thống kê thành phố A cho

biết thu nhập trung bình cua dân thành

phố là 15000$/năm.

Để kiểm định kết quả này, người ta lấy một

mẫu ngẫu nhiên n =16 gia đình và kết

quả tính cho giá trị trung bình là 13500$

và độ lệch chuẩn cua mẫu là 4000$.

Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro laø

=5% (ñoä tin caäy 95%).

4

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

19

Ta coù:

Với α=5% và df=(16-1)=15, tra bảng phân

phối Student ta có:

1 0Pr H \ H

Pr \ Pr Pr( )x x x

x a ax a x t

x

a2.131

2131

16

4000*131,2 a

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

20

Ngoai ra từ số liệu mẫu ta thấy:

Giả thiết H0 đươc chấp nhận.

Kết luận: Với một độ tin cậy 95% (hay với mức độ

rui ro là 5%) ta có thể nói là thu nhập bình

quân cua dân thành phố A là 15000$.

Ví du: Tương tự bài trên với n=26 và giá trị độ

lệch chuẩn tính từ mẫu là 3000$.

Đap số: Kết luận: H1 chấp nhận thu nhập trung

bình khác 15000$.

x 1500 a 2131

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

21

KIỂM ĐỊNH GIẢ THIÊT

VỀ SƯ SAI BIỆT CỦA

GIÁ TRỊ TRUNG BÌNH VÀ 0

VỚI PHÂN PHỐI STUDENT.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

22

Ví du. Nghieân cöùu moät bieán thoáng keâ töø

moät maãu ngaãu nhieân goàm n=16 phaàn

töû, ngöôøi ta xaùc ñònh ñöôïc giaù trò trung

bình X laø 1,5 vaø ñoä leäch chuaån töø maãu

laø 2.

Haõy kieåm ñònh sự sai biệt cuûa giaù trò trung

bình noùi treân vaø giaù trò 0 vôùi ñoä ruõi ro

laø 5% (ñoä tin caäy 95%).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

23

Giaûi

H0:

Giá trị TB BẰNG giá trị 0 theo quan điểm

thống kê.

H1:

Giá trị TB KHÁC giá trị 0 theo quan điểm

thống kê.

0x a x 0

x a x 0

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

24

YÙ nghóa ñoà thò:

0

-2.5 -1.5 -0.5 0.5 1.5 2.5

p(t)

ta-a

H0

H1: α%

1 0Pr( \ ) Pr( 0 )H H x a

5

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

25

Töø ñoù:

Từ bảng tra phân phối Student với bậc tự do df=16-1=15 và α=5%, ta có:

Ta thaáy:

Keát luaän: Vôùi ñoä tin caäy 95%, giaù trò X laø khaùc 0

theo quan ñieåm thoáng keâ.

Pr( ) Pr( )x x x

x a at

H1 chaáp nhaän

131,2a

X

065,116

2131,2131,2a

X

1H065.15,1X

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

26

CHÚ Ý

Người ta gọi tỷ số

tỷ Student cua X.

Trong thực hành nguời ta hay

kiểm định giá trị TB cua 1 biến

thống kê là KHÁC hay BẰNG 0.

Gọi là T test !

X/X

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

27

Baøi taäp 1: Nghieân cöùu bieán thoáng keâ töø

maãu n=9 cho thaáy giaù trò trung bình X

laø 3,5 vaø ñoä leäch chuaån cuûa maãu laø 4.

Kieåm ñònh giaû thieát söï sai bieät giöõa X

vaø giaù trò 0 vôùi ñoä tin caäy 95% (H1).

(Kiểm định xem gía trị X là KHÁC 0 hay

BẰNG 0 theo quan điểm thống kê).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

28

Baøi taäp 2: Töông töï baøi treân vôùi n=9,

X=5,2 vaø =9 (H0).

Anh (Chò) ruùt ra keát luaän gì töø 2 baøi taäp

neâu treân trong keát luaän giaù trò trung

bình cuûa bieán thoáng keâ laø khaùc hay

baèng giaù trò 0 ?

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

29

CHÚ Ý

Giá trị TB cua 1 biến thống kê sẽ

khác 0 hay bằng 0 phu thuộc

vào:

Bản thân giá trị TB tính ra

Độ lệch chuẩn cua biến thống

kê nghiên cứu.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

30

Ví du: Khảo sát một mẫu thống kê có kích

thước n=10, cho thấy giá trị trung bình là

xtb=10 và độ lệch chuẩn là s=6. Với rũi ro

5%, so sánh giá trị trung bình nêu trên

với 0.

H0:

H1:

0x a x 0

x a x 0

6

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

31

YÙ nghóa ñoà thò:

0

-2.5 -1.5 -0.5 0.5 1.5 2.5

p(t)

ta-a

H0

H1: α%

1 0Pr( \ ) Pr( 0 )H H x a

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

32

Töø ñoù:

Từ bảng tra phân phối Student với bậc tự

do df=10-1=9 và α=5%, ta có:

Ta thaáy:

Pr( ) Pr( )x x x

x a at

2.262x

a

62.262* 2.262 4.29

10xa

10 4.29x a H1 chaáp nhaän

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

33

Kết luận: Với độ tin cậy là 95%, ta có thể

kết luận là giá trị là khác 0.

Ví du: Tương tự bài trên với n=6 và s=15.

Đap số: Với độ tin cậy là 95%, ta có thể kết

luận là giá trị là bằng 0.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

34

Baøi taäp: Với rũi ro 5%, so sánh các giá trị trung bình cua một biến thống kê khảo sát tính đươc sau đây với 0:

a.

b.

Giả thiết biến khảo sát tuân theo phân phối Student có bậc tự do df=10.

Chuù yù: Giaù trò trung bình cuûa 1 ñaïi löôïng thoáng

keâ seõ khaùc 0 hay baèng 0 phuï thuoäc khoâng

nhöõng vaøo giaù trò cuûa noù maø coøn phuï thuoäc

vaøo ñoä leäch chuaån cuûa noù.

xx 1; 0.4

xx 1.5; 0.7

(H1)

(H0)

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

35

KIỂM ĐỊNH GIẢ THUYÊT

VỀ SƯ SAI BIỆT

CỦA 2 GIÁ TRỊ TRUNG BÌNH

VỚI PHÂN PHỐI STUDENT

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

36

ÑAËT VAÁN ÑEÀ

Trong thöïc haønh, khi nghieân cöùu giaù

trò trung bình cuûa moät bieán thoáng

keâ ta caàn xem xeùt söï sai bieät cuûa 2

giaù trò naøy coù nghóa (khaùc 0) hay

khoâng.

7

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

37

Ví duï: Ñeå xaùc ñònh giaù trò ma saùt trong

trung bình cuûa moät taàng ñòa chaát, ngöôøi

ta tieán haønh laáy maãu vaø thí nghieäm hai

laàn khaùc nhau.

Laàn 1: n1=16 coù

1=22,3

0 vaø

1=2

0.

Laàn 2: n2=12 coù

2=24,0

0 vaø

2=1.8

0.

Haõy kieåm ñònh giaû thieát veà söï khaùc bieät

cuûa 2 giaù trò treân vôùi ñoä ruõi ro = 5%.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

38

Giaûi:

H0: KHOÂNG COÙ söï khaùc

bieät giöõa 2 giaù trò trung bình.

H1: COÙ söï khaùc bieät giöõa 2 giaù

trò trung bình.

aXX 21

aXX 21

aXXPr0H\1HPr 21

212121 XXXXXX

21 atPr

aXXPr

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

39

Öôùc löôïng ñoä leäch chuaån cuûa taäp hôïp meï:

Ñoä leäch chuaån cuûa bieán thoáng keâ laø hieäu 2 giaù

trò trung bình, theo lyù thuyeát thoáng keâ:

68.3

2nn

s)1n(s)1n(

21

2

22

2

112

73.0

n

1

n

1

21

XX 21

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

40

Töø baûng tra phaân phoái Student vôùi df=n1+n

2-2

vaø =5%, ta xaùc ñònh ñöôïc:

Töø ñoù

Keát luaän: COÙ söï khaùc bieät giöõa 2 giaù trò

trung bình. Keát luaän treân vôùi ruõi ro 5%.

501.1a056,2a

21 XX

1Ha7.121

XX

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

41

Baøi taäp: Gioáng nhö baøi taäp treân nhöng vôùi

dung troïng trung bình:

Laàn 1: n1=20 coù

1=18.0kN/m

3 vaø

1=

1.5kN/m3

Laàn 2: n2=16 coù

2=16.5kN/m

3 vaø

2=

1.0kN/m3

Haõy kieåm ñònh giaû thieát veà söï khaùc bieät

cuûa 2 giaù trò treân vôùi ñoä ruõi ro = 5%.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

42

KIEÅM ÑÒNH GIAÛ THUYEÁT THOÁNG KEÂ

CUÛA TOÅNG BÌNH PHÖÔNG

BIEÁN THOÁNG KEÂ

VÔÙI HAØM PHAÂN PHOÁI XAÙC SUAÁT 2

(xem baûng tra sau)

8

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

43

Đăt vấn đề: Xét một đại lương là

tổng các giá trị bình phương. Mỗi

giá trị bình phương là một biến

thống kế.

Trong một số trường hơp ta cần

kiểm định xem một đại lương này

BẰNG zero hay KHÔNG theo quan

đểm thống kê. PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

44

Haøm maät ñoä xaùc suaát 2 ñöôïc söû duïng ñeå kieåm

ñònh caùc bieán thoáng keâ coù daïng laø moät

TOÅNG BÌNH PHÖÔNG.

p

2 0

Dạng ham mật độ xac

suất 2 với bậc tự do df

e

2(%,df)

H0 2 = 0

H1 2 > 0

S= = Pr(2 > e2)

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

45

KIEÅM ÑÒNH VÔÙI 2

Ví dụ 1: Kiểm định sự phù hợp (bài toán 1D)

• Một nhà cung cấp tủ lạnh phân chia vùng kinh

doanh ra làm 4 khu vực. Người ta muốn kiểm tra

xem số tủ lạnh bán ra có bằng nhau ở 4 khu vực

này hay không?

Để kiểm tra giả thuyết này, người ta lấy một mẫu

ngẫu nhiên gồm 40 hồ sơ khách hàng đã mua ở

năm trước.

Kết quả ghi nhận từng khu vực phân bố như sau:

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

46

Khu vực Tổng

A B C D

Gia trị quan sat (f0) 6 12 14 8 40

Gia trị lý thuyết (fe)

KHÔNG co sự khac

biệt về doanh số cua

4 khu vực (H0)

10 10

(=40/4)

10 10 40

2

0 e2

i 1,4 e

f f4

f

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

47

Để đanh giá có sự khác biệt hay không, ta sẽ

so sánh với giá trị lý thuyết:

• Nếu : : kết luận có sự khác biệt ơ

các khu A, B, C, D

• Nếu : : kết luận không có sự khác

biệt ơ các khu A, B, C, D

Trong đo đươc xác định từ phân phối

có bậc tự do dl=k-m-1 và ngưỡng rui ro α

(thường là 5%).

(k=4 số khu vực khảo sát, số tham số tính từ

số liệu mẫu khảo sát)

2

022

e

2

2

e

2

2

e

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

48

Với = 5 %, và dl =k-m-1 = 3 (mảng 1D)

Ta có:

Ta thấy: , ta chấp nhận H0

Kết luận: Với mức độ rui ro là 5 %, ta có

thể nói số lương tu lạnh bán cho 4 khu

vực là như nhau.

e

2 7 81 ,

2

e

2 4

9

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

49

CHÚ Ý

Để áp dung kiểm định 2

chính xác, KINH NGHIỆM

yêu cầu SĨ SỐ cua các lớp

LỚN HƠN 4 5 QUAN

SÁT.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

50

KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)

Ví du. Người ta muốn kiểm tra xem

có liên hệ hay không giữa chế

độ tưới nước nhằm bảo dưỡng

bê tông sau khi đổ & cường độ.

Kết quả thí nghiệm đươc trình

bày trong bảng sau. Kiểm định

giả thiết với độ tin cậy 99%.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

51

KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)

Soá ngaøy töôùi

nöôùc sau khi ñoå

Cường độ

3-5

ngaøy

6-9

ngaøy

Toång

85-90kg/cm2 60 50 110

90-95kg/cm2

80 10 90

Toång coäng 140 60 200

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

52

KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D): fe

Soá ngaøy töôùi nöôùc

sau khi ñoå

Cường độ

3-5 ngaøy 6-9

ngaøy

Toång

85-90kg/cm2 77=140*110/200 33 110

90-95kg/cm2

63 27 90

Toång coäng 140 60 200

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

53

Baäc töï do (maûng 2D): dl = (r - 1)(k -1) = (2 -1)(2 -1) = 1

Vôùi r, k soá phaân loaïi cho moãi bieán xeùt.

Vôùi = 1% vaø dl =1, tra töø baûng phaân phoái 2, ta coù:

Keát luaän: Vôùi ñoä tin caäy laø 99%, ta coù theå keát luaän

cheá ñoä baûo döôõng vaø cöôøng ñoä chòu löïc beâ toâng laø

KHOÂNG ÑOÄC LAÄP.

8.27

f

ff

i e

2

eo2

63,62

0 2

0

2 Nhaän H1

fe: l/thuyeát

f0: q/saùt

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

54

KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)

Baøi taäp. Moät cöûa haøng baùn ñóa nhaïc khaûo

saùt 200 khaùch haøng moät caùch ngaãu

nhieân ñeå ñaùnh giaù xem coù söï lieân quan

hay khoâng giöõa tuoåi taùc & giôùi tính ñoái

vôùi ngöôøi ñi mua nhaïc vôùi ñoä tin caäy

95%.

Soá lieäu quan saùt (f0) ñược ghi nhận nhö

sau:

10

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

55

KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)

Tuoåi Nam Nöõ Toång

< 30 tuoåi 40 70 110

30 30 60 90

Toång coäng 70 130 200

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

56

Bai tập: Trương phong tổ chức một Công ty

muốn biết xem co sự quan hệ hay không giữa

những người “găn bo” với Công ty va hoan

cảnh gia đình (số lương con phải nuôi). Hồ sơ

lưu cua Công ty cho cac kết quả sau:

Hay kiểm định giả thiết với rũi ro =5%

Thời gian \Số con nuôi >=3 <3

<= 5 năm 40 70

> 5 năm 65 25

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

57

Baøi taäp. Moät thaêm doø veà thu nhaäp haøng thaùng ñöôïc

thöïc hieän treân 3 loaïi ñoái töôïng khaùc. Kieåm tra

xem coù söï khaùc bieät löông trong caùc lónh vöïc:

Löông CN. May CN. XD. N. daân Toång

25 - 30 10 13 8 31

30 - 35 17 17 8 42

35 - 40 26 16 10 52

40 - 45 24 7 13 44

45 - 50 18 6 5 29

Toång 95 59 44 198

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

58

Bài tập: Ngöôøi ta muoán bieát caùc taàng lôùp xaõ hoäi khaùc

nhau (A,B,C) nghieân cöùu khaùc nhau naøy coù aûnh

höôûng ñeán thu nhaäp cuûa hoï hay khoâng.

Q/Saùt L/T

Tuoåi A B C A B C

25 - 30 10 13 8 31 14,9 9,2 6,9

30 - 35 17 17 8 42 20,2 12,5 9,3

35 - 40 26 16 10 52 24,9 15,5 11,6

40 - 45 24 7 13 44 21,1 13,1 9,8

45 - 50 18 6 5 29 13,9 8,7 6,4

Toång 95 59 44 198 95 59 44

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

59

Töø ñoù:

Baäc töï do = (k -1)(n - 1) vaø = 5%. Ta coù:

H0 chaáp nhaän

Keát luaän: Vôùi ñoä ruõi ro =5%, ta coù theå noùi laø

löông nhaän ñöôïc cuûa caùc ñoái töôïng nghieân

cöùu thì ñoäc laäp vôùi 3 loaïi ngaønh ngheà ôû treân.

e

2

eo2

f

ff =12,4

5,154,12 2

e

2

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

60

KIỂM ĐỊNH THỐNG KÊ

DÙNG TRONG

XÁC ĐỊNH

QUY LUẬT

PHÂN PHỐI

XÁC SUẤT

11

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

61

KIEÅM ÑÒNH VÔÙI PHAÂN PHOÁI 2

Baøi taäp. Ngöôøi ta giaû thieát soá söï coá xaûy ra cho

caùc thieát bò hoaït ñoäng trong moät nhaø maùy

tuaân theo phaân phoái Poisson. Baûng soá lieäu

sau ghi ñöôïc soá laàn söï coá xaûy ra trong thôøi

gian 40 chu kyø quan saùt ngaãu nhieân, moãi chu

kyø quan saùt daøi 1 giôø.

a. Xaùc ñònh soá söï coá trung bình ( thoâng soá

trong phaân phoái Poisson). Giaù trò naøy seõ

ñöôïc duøng ñeå kieåm ñònh giaû thieát laø soá löôïng

söï coá thì phaân boá theo moät phaân phoái

Poisson.

PGS. Dr. Nguyễn Thống

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

62

b. Xaùc ñònh soá löôïng söï coá lyù thuyeát töø phaân

phoái Poisson noùi ôû caâu (a) cho maãu khaûo saùt

goàm 40 chu kyø naøy .

c. Kieåm ñònh giaû thieát laø soá löôïng söï coá xaûy ra

tuaân theo phaân phoái Poisson vôùi ñoä ruõi ro

=5%.

(Xem baûng tra phaân phoái Poisson ôû sau)

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

63

Soá lieäu quan saùt thöïc

Giaù trò

bieán (x) Soá laàn

quan

saùt (f0)

f0 .x Giaù trò

bieán

(x)

Soá laàn

quan

saùt (f0)

f0 .x

0 0 0 4 7 28

1 6 6 5 4 20

2 8 16 6 3 18

3 11 33 7 1 7

Toång 40 128

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

64

GIAÛI:

a. Öôùc löôïng giaù trò trung bình cuûa söï coá töø soá

lieäu:

Giaù trò trung bình cuûa p/phoái Poisson seõ laø: =

3,2

b. Soá laàn söï coá lyù thuyeát ñöôïc tính töø baûng tra

phaân phoái Poisson vôùi = 3,2 vaø n = 40 cho ta:

)h/co_su(2,340

128xx

ff

0

0

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

65

Ta coù:

(x) (p) (fe =

np) (x) (p) (fe =

np)

0 0,0400 1,6 7 0,027 1,1

1 0,1300 5,2 8 0,011 0,4

2 0,208 8,3 9 0,004 0,2

3 0,222 8,9 10 0,0013 0,1

4 0,178 7,1 11 0,0004 0

5 0,114 4,6 12 0,0001 0

6 0,060 2,4 13 0,000 0

Toång 1,000 39,9

Tra töø p/p Poisson vôùi =3.2

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

66

Giaù trò bieán Số lần quan

sát f0

Số lần theo lý

thuyết fe

(f0-fe)2/fe

0 0 1,6 0,094

1 6 (0+6=6) 5,2

2 8 8,3 0,011

3 11 8,9 0,496

4 7 7,1 0,001

5 4 4,6

6 3 2,4

7 1 1,1 0,073

8 0 0,4

9 0 0,2

10 0 0,1

(4+3+1=8)

(6.8)

(8.8)

12

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

67

Chuù yù: Neáu soá löôïng quan saùt nhoû hôn 5, ta seõ tieán

haønh goäp laïi tröôùc khi tính 2 .

Ta coù:

Baäc töï do dl = k - m -1 = 5 -1 -1 = 3 (m = 1 vì ta ñaõ duøng

soá lieäu quan saùt ñeå öôùc tính giaù trò trung bình ) vaø

vôùi = 5%, tra töø baûng tra phaân phoái ta coù:

Do ñoù: ta chaáp nhaän H0.

Keát luaän: Vôùi ñoä ruûi ro = 5%, soá löôïng söï coá trong 1h, xaûy ra

trong nhaø maùy laø tuaân theo p/phoái Poisson coù =3,2.

675,02

0

e

27 81 ,

22

0e

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

68

KIEÅM ÑÒNH VÔÙI PHAÂN PHOÁI 2

Baøi taäp. Ngöôøi ta giaû thieát soá söï coá xaûy ra

cho caùc maùy tính trong moät Coâng ty

tuaân theo phaân phoái Poisson. Baûng soá

lieäu sau ghi ñöôïc soá laàn söï coá xaûy ra

trong thôøi gian 100 chu kyø quan saùt

ngaãu nhieân, moãi chu kyø quan saùt daøi 1

giôø.

Kieåm ñònh vôùi ñoä tin caäy 95%.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

69

Soá lieäu quan saùt thöïc

Giaù trò

bieán (x) Soá laàn quan

saùt (f0) Giaù trò

bieán (x)

Soá laàn quan

saùt (f0)

0 2 4 15

1 15 5 9

2 24 6 3

3 30 7 2

Toång 100

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

70

Baøi taäp. Baûng soá lieäu sau ñaây ghi laïi soá tai naïn

trung bình X tính treân 1000 ngöôøi ñaøn oâng

treân moät giôø. Soá lieäu naøy laáy töø moät maãu

goàm 50 Xí nghieäp treân cuøng moät ngaønh.

Töø soá lieäu tính ñöôïc giaù trò trung bình Xtb

= 2,32

vaø độ lệch chuẩn của tập hợp mẹ ước lượng

từ mẫu là s = 0,42.

Kieåm ñònh giaû thieát laø phaân phoái naøy tuaân theo

moät phaân phoái chuaån vôùi ñoä ruõi ro =5%.

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

71

YÙ nghóa ñoà thò:

Số sự cố (X)

Số lương quan sat (fo)

Xtb

Phân phối

chuẩn (Xtb, s) ??

0 x1 x2

s=Pr(x1<x<x2)

=Pr(x<x2)-

Pr(x<x1)

s

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

72

Soá lieäu quan saùt ñöôïc:

Soá tai naïn trung bình X

(nghìn ngöôøi/giôø) Soá Xí nghieäp ñöôïc quan saùt

ñöôïc

1,45 - 1,7 3

1,8 - 2,0 12

2,1 - 2,3 14

2,4 - 2,6 9

2,7 - 2,9 7

3,0 - 3,25 5

50

13

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

73

ÔÛ ñaây ta coù hai thoâng soá laø vaø s tính töø maãu

khaûo saùt, do ñoù baäc töï do seõ laø:

dl = k - m -1 = 4 -2 -1 = 1

Vôùi dl = 1 vaø d = 5%, tra töø phaân phoái 2 ta coù:

Tính giaù trò .

Xaùc ñònh soá Xí nghieäp lyù thuyeát töø 50 Xí nghieäp.

x

`

e

23 84 ,

0

2

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

74

Soá tai naïn

TB/nghìn

ngöôøi/giôø, X

Giaù trò bieán

chuaån

töông öùng, t

Xaùc suaát

cho töøng

khoaûng(p)

Soá Xí

nghieäp lyù

thuyeát

(*) (**) (***) (50p)

1,45 1,75 -2,07 -1,36 0,085 4,5

1,75 2,05 -1,36 -0,64 0,17 8,5

2,05 2,35 -0,64 0,07 0,27 13,5

2,35 2,65 0,07 0,79 0,26 13,0

2,65 2,95 0,79 1,50 0,15 7,0

2,95 3,25 1,50 2,24 0,065 3,5

1,0 50.0

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

75

(*) giaù trò bieân laáy chính laø giaù trò trung bình caùc bieân

ôû soá lieäu ban ñaàu.

(**) vôùi , s = 0,42 vaø x=1.45 ta coù t=-2.07:

(***) Tra töø baûng phaân phoái chuaån.

Ta coù:

Ta thaáy: : giaû thieát H0 ñöôïc chaáp nhaän.

Keát luaän: Vôùi ñoä ruõi ro =5%, soá löôïng tai naïn trong

caùc Xí nghieäp quan traéc (döïa vaøo soá tai naïn trung

bình xaûy ra) tuaân theo quy luaät phaân phoái chuaån coù

giaù trò TB laø 2,32 vaø ñoä leäch chuaån s = 0,42.

x 2 32,

s

x

45.107.2

0

21 65 ,

0

2 2

e

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

76

Bài tập: Để đanh giá chất lương đề

thi cua một môn học người ta

muốn kiểm định xem điểm kết

quả thi cua thí sinh có tuân theo

một phân phối chuẩn?. Hãy kiểm

định với độ tin cậy 95%. Số liệu

xem sau (giá trị TB & độ lệch

chuẩn ước lương từ mẫu).

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

77

Số liệu: Điểm X Số lương ghi nhận

X <=2 10

2< . <=3 15

3< . <=4 30

4< . <=5 55

5< . <=6 84

6< . <=7 50

7< . <=8

. > 8

20

6

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

78

KIEÅM ÑÒNH THOÁNG KEÂ

CUÛA GIAÙ TRÒ LAØ TỶ SỐ 2 TOÅNG BÌNH

PHÖÔNG BIEÁN THOÁNG KEÂ

VÔÙI HAØM PHAÂN PHOÁI XAÙC SUAÁT FISHER

(xem baûng tra sau)

14

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

79

ĐÂY LÀ KIỂM ĐỊNH XEM XÉT GIÁ TRỊ BIÊN F LÀ TỶ SỐ GIỮA 2 ĐẠI LƯỢNG THỐNG KÊ:

BẬC TƯ DO CỦA A & B

MỖI ĐẠI LƯỢNG THỐNG KÊ LÀ TỔNG CỦA CÁC BÌNH PHƯƠNG CỦA CÁC GIÁ TRỊ THỐNG KÊ.

j

2

2

j

i

1

2

i

21)(B

)(A

),(F

21,

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

80

XEM XÉT ĐẠI LƯỢNG F NÀY LÀ KHÁC 0 HAY

BẰNG 0 THEO QUAN ĐIỂM THỐNG KÊ ?

TRÌNH TƯ GIẢI QUYÊT VẦN ĐỀ GIỐNG NHƯ

BÀI TOÁN VỚI CỦA PHÂN PHỐI 2

VỚI TRA BẢNG PHÂN PHỐI FISHER

F0:

NÊU F > F0 ĐẠI LƯỢNG F KHÁC 0 THEO

QUAN ĐIỂM THỐNG KÊ

NÊU F < F0 ĐẠI LƯỢNG X BẰNG 0 THEO

QUAN ĐIỂM THỐNG KÊ

21,

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

81

Kieåm ñònh giaù trò F khaùc 0 vôùi

phaân phoái Fisher

0

p

H0

(đại lượng kiểm tra=0)

H1 (đại lượng kiểm tra khác 0)

F0(1; 2)

=Pr(Fi>F

0)

F

Ham mật độ xac suất

p cua Fisher(1; 2)

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

82

Bài tập: Một đại lương thống kê F=4.2, đươc

xác định từ tỷ số cua 2 tổng các giá trị

thống kê dạng bình phương A & B

(F=A2 / B2). Biết rằng A có bậc tự do là

5 và B có bậc tự do là 12.

Với mức rũi ro 5%, hãy kiểm định giá trị F

khác 0 hay bằng 0 theo quan điểm thống

kê.

HD: Tra bảng F0=3.11 < F=4.2 H1 chọn

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

83

Bài tập: Xét đại lương thống kê F là tỷ số

cua hai đại lương thống kê với mỗi đại

lương là tổng các giá trị bình phương:

A=50 với bậc tự do là 5 và B có giá trị là

20 với bậc tự do là 8.

Với mức rũi ro 5%, hãy kiểm định giá trị F

so với 0 theo quan điểm thống kê.

HD: Tra bảng F0=3.69 > F=50/20=2.5 H0 chọn

F=0 theo quan điểm thống kê !

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

84

TÓM TẮT VỀ

KIỂM ĐỊNH

GIẢ THIÊT

THỐNG KÊ

15

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

85

CHUÙ YÙ

Kieåm ñònh giaù trò trung bình cuûa ñaïi löôïng

thoáng keâ khaùc 0 duøng kieåm ñònh vôùi phaân

phoái Chuaån (hoaëc phaân phoái Student). T test.

Kieåm ñònh giaù trò toång caùc bình phöông cuûa

ñaïi löôïng thoáng keâ khaùc 0 duøng kieåm ñònh

vôùi 2.

Kieåm ñònh giaù trò laø tyû soá cuûa 2 ñaïi löôïng laø

toång caùc bình phöông cuûa ñaïi löôïng thoáng keâ

khaùc 0 duøng kieåm ñònh vôùi phaân phoái

Fisher. F test PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

86

Phân phối Chuẩn

t

α=Pr(X>t)

0

p Hàm mật độ xác suất p

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

87

t 0 1 2 3 4 5 6 7 8 9

0 5000 4960 4920 4880 4840 4801 4761 4721 4681 4641

0.1 4602 4562 4522 4483 4443 4404 4364 4325 4686 4247

0.2 4207 4168 4129 4090 4052 4013 3974 3936 3897 3859

0.3 3821 3873 3745 3707 3669 3632 3594 3557 3520 3483

0.4 3446 3409 3372 3336 3300 3264 3228 3192 3156 3121

0.5 3085 3050 3015 2981 2946 2912 2877 2843 2810 2776

0.6 2743 2709 2676 2643 2611 2578 2546 2514 2483 2451

0.7 2420 2389 2358 2327 2296 2266 2236 2206 2217 2148

0.8 2119 2090 2061 2033 2005 1977 1949 1922 1894 1867

0.9 1841 1814 1788 1762 1736 1711 1685 1660 1635 1611

1 1587 1562 1539 1515 1492 1469 1446 1423 1401 1379

1.1 1357 1335 1314 1292 1271 1251 1230 1210 1190 1170

1.2 1151 1131 1112 1093 1075 1056 1038 1020 1003 985

1.3 968 951 934 918 901 885 869 853 838 823

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

88

1.4 808 793 778 764 749 735 721 708 694 681

1.5 668 655 643 630 618 606 594 582 571 559

1.6 548 537 526 516 505 495 485 475 465 455

1.7 446 436 427 418 409 401 392 384 375 367

1.8 359 351 344 366 329 322 314 307 301 294

1.9 287 281 274 268 262 256 250 244 239 233

2 228 222 217 212 207 202 197 192 188 183

2.1 179 174 170 166 162 158 154 150 146 143

2.2 139 136 132 129 125 122 119 116 113 110

2.3 107 104 102 99 96 94 91 89 87 84

2.4 82 80 78 75 73 71 69 68 66 64

2.5 62 60 59 57 55 54 52 51 49 48

2.6 47 45 44 43 41 40 39 38 37 36

2.7 35 34 33 32 31 30 29 28 27 26

2.8 26 25 24 23 23 22 21 20 20 19

2.9 19 18 18 17 16 16 15 15 14 14

3 13 13 13 12 12 11 11 10 11 10

t 0 1 2 3 4 5 6 7 8 9

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

89

PHAÂN PHOÁI

LUAÄT STUDENT

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

90

Phân phối Student

t 0

p Hàm mật độ xác suất p

-t

Pr( X t)

16

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

91

dl (df) 80 60 40 20 10 5 2 1

1 ,325 ,727 1,376 3,078 3,314 12,706 31,821 63,657

2 ,289 ,617 1,061 1,886 2,920 4,303 6,965 9,925

3 ,277 ,584 ,978 1,638 2,353 3,182 4,541 5,841

4 ,271 ,569 ,941 1,533 2,132 2,776 3,747 4,604

5 ,267 ,559 ,920 1,476 2,015 2,571 3,365 4,032

6 ,265 ,553 ,906 1,440 1,943 2,447 3,143 3,707

7 ,263 ,549 ,896 1,415 1,895 2,365 2,998 3,499

8 ,262 ,546 ,889 1,397 1,860 2,306 2,896 3,355

9 ,261 ,543 ,883 1,383 1,833 2,262 2,821 3,250

10 ,260 ,542 ,879 1,372 1,812 2,228 2,764 3,169

11 ,260 ,540 ,876 1,363 1,796 2,201 2,718 3,106

12 ,259 ,539 ,873 1,356 1,782 2,179 2,681 3,055

13 ,259 ,538 ,870 1,350 1,771 2,160 2,650 3,012

14 ,258 ,537 ,868 1,345 1,761 2,145 2,624 2,977

15 ,258 ,536 ,866 1,341 1,753 2,131 2,602 2,947

16 ,258 ,535 ,865 1,337 1,746 2,120 2,583 2,921

17 ,257 ,534 ,863 1,333 1,740 2,110 2,567 2,898

Baäc töï do

t

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

92

16 ,258 ,535 ,865 1,337 1,746 2,120 2,583 2,921

17 ,257 ,534 ,863 1,333 1,740 2,110 2,567 2,898

18 ,257 ,534 ,862 1,330 1,734 2,101 2,552 2,878

19 ,257 ,533 ,861 1,328 1,729 2,093 2,539 2,861

20 ,257 ,533 ,860 1,325 1,725 2,086 2,528 2,845

21 ,257 ,532 ,859 1,323 1,721 2,080 2,518 2,831

22 ,256 ,532 ,858 1,321 1,717 2,074 2,508 2,819

23 ,256 ,532 ,858 1,319 1,714 2,069 2,500 2,807

24 ,256 ,531 ,857 1,318 1,711 2,064 2,492 2,797

25 ,256 ,531 ,856 1,316 1,708 2,060 2,485 2,787

26 ,256 ,531 ,856 1,315 1,706 2,056 2,479 2,779

27 ,256 ,531 ,855 1,314 1,703 2,052 2,473 2,771

28 ,256 ,530 ,855 1,313 1,701 2,048 2,467 2,763

29 ,256 ,530 ,854 1,311 1,699 2,045 2,462 2,756

30 ,256 ,530 ,854 1,310 1,697 2,042 2,457 2,750

40 ,255 ,529 ,851 1,303 1,684 2,021 2,423 2,704

60 ,254 ,527 ,848 1,296 1,671 2,000 2,390 2,660

120 ,254 ,526 ,845 1,289 1,658 1,980 2,358 2,617

,253 ,524 ,842 1,282 1,645 1,960 2,326 2,576

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

93

PHAÂN PHOÁI

LUAÄT 2

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

94

• Phân phối 2

2

0Pr(X )

2

00

p

H0

(đại lượng kiểm tra=0)

H1 (đại lượng kiểm tra khác 0)

x

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

95

df (α%)

99.5 99 97.5 95 90 10 5 2.5 1 0.5

1 0 0.0002 0.001 0.0039 0.0158 2.71 3.84 5.02 6.63 7.88

2 0.01 0.0201 0.0506 0.1026 0.2107 4.61 5.99 7.38 9.21 10.6

3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84

4 0.207 0.297 0.484 0.711 1.064 7.78 9.49 11.14 13.28 14.86

5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75

6 0.676 0.872 1.24 1.64 2.2 10.64 12.59 14.45 16.81 18.55

7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28

8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.96

9 1.73 2.09 2.7 3.33 4.17 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19

11 2.6 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.73 26.76

12 3.07 3.57 4.4 5.23 6.3 18.55 21.03 23.34 26.22 28.3

13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82

2

0

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

96

df (α%)

99.5 99 97.5 95 90 10 5 2.5 1 0.5

14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32

15 4.6 5.23 6.26 7.26 8.55 22.31 25 27.49 30.58 32.8

16 5.14 5.81 6.91 7.96 9.31 23.54 26.3 28.85 32 34.27

18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16

20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40

24 9.89 10.86 12.4 13.85 15.66 33.2 36.42 39.36 42.98 45.56

30 13.79 14.95 16.79 18.49 20.6 40.26 43.77 47.98 50.89 53.67

40 20.71 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77

60 35.53 37.48 40.48 43.19 46.46 74.4 79.08 83.3 88.38 91.95

120 83.85 86.92 91.58 95.7 100.6 140.2 146.5 152.2 158.9 163.6

17

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

97

PHAÂN PHOÁI

LUAÄT POISSON

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

98

DAÏNG TOÅNG QUAÙT PHAÂN PHOÁI POISSON

(Bieán rôøi raïc)

p

X 0 1 2 3 4 5 6 .

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

99

• Luật Poisson

Có k và , tính xac suất

Pr!

k

X k ek

0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45

k

0 0,951 0,9048 0,8607 0,8187 0,7788 0,7408 0,7047 0,670 0,6376

1 0,047 0,0905 0,1291 0,1637 0,1947 0,2222 0,2466 0,268 0,2869

2 0,001 0,0045 0,0097 0,0164 0,0243 0,0333 0,0432 0,0536 0,0646

3 0,000 0,0002 0,0005 0,0011 0,0020 0,0033 0,0050 0,007 0,0097

4 0,0000 0,0000 0,0001 0,0001 0,0003 0,0004 0,0007 0,0011

5 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

100

0,5 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9

k

0 0,6065 0,5769 0,5488 0,5220 0,4966 0,4724 0,4493 0,4274 0,4066

1 0,3033 0,3173 0,3293 0,3393 0,3476 0,3543 0,3595 0,3633 0,3659

2 0,0758 0,0873 0,0988 0,1103 0,1217 0,1329 0,1438 0,1544 0,1647

3 0,0126 0,0160 0,0198 0,0239 0,0284 0,0332 0,0383 0,0437 0,0494

4 0,0016 0,0022 0,0030 0,0039 0,0050 0,0062 0,0077 0,0093 0,0111

5 0,0002 0,0002 0,0004 0,0005 0,0007 0,0009 0,0012 0,0016 0,0020

6 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

101

1 1,5 2 2,5 3 3,5 4 4,5 5

k

0 0,3679 0,2231 0,1353 0,0821 0,0498 0,0302 0,0183 0,0111 0,0067

1 0,3679 0,3347 0,2707 0,2052 0,1494 0,1057 0,0733 0,0500 0,0337

2 0,1839 0,2510 0,2707 0,2565 0,2240 0,1850 0,1465 0,1125 0,0842

3 0,0613 0,1255 0,1804 0,2138 0,2240 0,2158 0,1954 0,1687 0,1404

4 0,0153 0,0471 0,0902 0,1336 0,1680 0,1888 0,1954 0,1898 0,1755

5 0,0031 0,0141 0,0361 0,0668 0,1008 0,1322 0,1563 0,1708 0,1755

6 0,0005 0,0035 0,0120 0,0278 0,0504 0,0771 0,1042 0,1281 0,1462

7 0,0001 0,0008 0,0034 0,0099 0,0216 0,0385 0,0595 0,0824 0,1044

8 0,0000 0,0001 0,0009 0,0031 0,0081 0,0169 0,0298 0,0463 0,0653

9 0,0000 0,0002 0,0009 0,0027 0,0066 0,0132 0,0232 0,0363

10 0,0000 0,0002 0,0008 0,0023 0,0053 0,0104 0,0181

11 0,0000 0,0002 0,0007 0,0019 0,0043 0,0082

12 0,0001 0,0002 0,0006 0,0016 0,0034

13 0,0000 0,0001 0,0002 0,0006 0,0013

14 0,0000 0,0001 0,0002 0,0005

15 0,0000 0,0001 0,0002 PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

102

PHAÂN PHOÁI

LUAÄT FISHER

18

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

103

0

p

F0(1; 2)

=5%

F

Ham mật độ xac suất

p cua Fisher(1; 2)

Xem bảng sau PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

104

Gia trị F0 Fisher với α=5%

2\ν1 1 2 3 4 5 6 7 8 9

1 161 200 216 225 230 234 237 239 241

2 18.5 19 19.2 19.2 19.3 19.3 19.4 19.4 19.4

3 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.1

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68

8 5.32 4.46 4.07 3.84 3.69 3.58 3.5 3.44 3.39

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18

10 4.96 4.1 3.71 3.48 3.33 3.22 3.14 3.07 3.02

11 4.84 3.98 3.59 3.36 3.2 3.09 3.01 2.95 2.9

12 4.75 3.89 3.49 3.26 3.11 3.0 2.91 2.85 2.8

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71

14 4.6 3.74 3.34 3.11 2.96 2.85 2.76 2.7 2.65

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

105 Fisher với α=5%

15 4.54 3.68 3.29 3.06 2.9 2.79 2.71 2.64 2.59

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54

17 4.45 3.59 3.2 2.96 2.81 2.7 2.61 2.55 2.48

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46

19 4.38 3.52 3.13 2.9 2.74 2.63 2.54 2.48 2.42

20 4.35 3.49 3.1 2.87 2.71 2.6 2.51 2.45 2.39

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37

22 4.3 3.44 3.05 2.82 2.66 2.55 2.46 2.4 2.34

23 4.28 3.42 3.03 2.8 2.64 2.53 2.44 2.37 2.32

24 4.26 3.4 3.01 2.78 2.62 2.51 2.42 2.36 2.3

25 4.24 3.39 2.99 2.76 2.6 2.49 2.4 2.34 2.28

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12

60 4 3.15 2.76 2.53 2.37 2.25 2.17 2.1 2.04

120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96

3.84 3 2.6 2.37 2.21 2.1 2.01 1.94 1.88

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

106

10 12 15 20 24 30 40 60 120

242 244 246 248 249 250 251 252 253 254

19.4 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.5 19.5

8.79 8.74 8.7 8.66 8.64 8.62 8.59 8.57 8.55 8.53

5.96 5.91 5.86 5.8 5.77 5.75 5.72 5.69 5.66 5.63

4.74 4.68 4.62 4.56 4.53 4.5 4.46 4.43 4.4 4.37

4.06 4 3.94 3.87 3.84 3.81 3.77 3.74 3.7 3.67

3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.3 3.27 3.23

3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93

3.14 3.07 3.01 2.94 2.9 2.86 2.83 2.79 2.75 2.71

2.98 2.91 2.85 2.77 2.74 2.7 2.66 2.62 2.58 2.54

2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.4

2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.3

2.67 2.6 2.53 2.46 2.42 2.38 2.34 2.3 2.25 2.21

2.6 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13

2.54 2.48 2.4 2.33 2.29 2.25 2.2 2.16 2.11 2.07

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

107

2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01

2.45 2.38 2.31 2.23 2.19 2.15 2.1 2.06 2.01 1.96

2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92

2.39 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88

2.35 2.28 2.2 2.12 2.08 2.04 1.99 1.95 1.9 1.84

2.32 2.25 2.18 2.1 2.05 2.01 1.96 1.92 1.87 1.81

2.3 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78

2.27 2.2 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76

2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73

2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71

2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62

2.08 2 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51

1.99 1.92 1.84 1.75 1.7 1.65 1.59 1.53 1.47 1.39

1.91 1.83 1.75 1.66 1.61 1.55 1.5 1.43 1.35 1.25

1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU

Chương 3: Kiểm định giả thuyết thống kê

108

HEÁT CHÖÔNG