41
KIỂM ĐỊNH THỐNG KÊ Giáo trình điện tử Biên soạn bởi: Nguyễn Minh Toàn Trường Đại Học Công nghiệp Tp. Hồ Chí Minh Khoa Quản trị Kinh doanh 1

Chapter 4 kiem dinh thong ke

Embed Size (px)

Citation preview

Page 1: Chapter 4 kiem dinh thong ke

KIỂM ĐỊNH THỐNG KÊ

Giáo trình điện tử

Biên soạn bởi: Nguyễn Minh Toàn

Trường Đại Học Công nghiệp Tp. Hồ Chí Minh

Khoa Quản trị Kinh doanh

1

Page 2: Chapter 4 kiem dinh thong ke

KIỂM NGHIỆM SỰ KHÁC NHAU GIỮA 2 GIÁ TRỊ TRUNG BÌNH

44

Page 3: Chapter 4 kiem dinh thong ke

45

Nội dung

• Các vấn đề chung về kiểm định

• Kiểm định mối quan hệ giữa hai biến dữ liệu định tính: kiểmnghiệm mối quan hệ giữa 2 biến trong bản chéo. Sử dụng kiểm nghiệm Chi bình phương.

• Kiểm nghiệm sự khác nhau giữa 2 giá trị trung bình

– Kiểm nghiệm Student’s t cho 1 mẫu và giá trị cụ thể(One-Sample T-Test)

– Kiểm nghiệm Student’s t cho 2 mẫu độc lập(Independent samples t test)

– Kiểm nghiệm Student’s t cho cặp mẫu(Paired samples t test)

Page 4: Chapter 4 kiem dinh thong ke

Quy trình kiểm định giả thiết

1. Phát biểu giả thiết và giả thiết thay thế

2. Chọn loại kiểm định thống kê

3. Chọn mức ý nghĩa mong muốn

4. Tính giá trị khác biệt

5. Có được giá trị kiểm định

6. Diễn giải kết quả kiểm nghiệm

46

Tầm quan trọng

Page 5: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Các thử nghiệm thể hiện sự khác biệt giữa trung bình mẫu và giá trị cụthể đã biết hoặc đưa ra giả định.

• Cho phép bạn xác định mức độ tín nhiệm đối với sự khác biệt

• Tạo một bảng thống kê mô tả cho mỗi biến thử nghiệm.

47

Page 6: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Ví dụ: Vấn đề về một dây chuyền sản xuất– Một nhà máy sản xuất xe ô tô, sản xuất các hệ

thống phanh đĩa mà đường kính phải đo là322 mm.

– Kiểm tra chất lượng ngẫu nhiên rút ra từ 16 cái trong 8 đầu máy sản xuất, xác định có haykhông có đường kính trung bình của hệ thốngphanh trong mỗi mẫu khác biệt đáng kể so với 322 mm.

48

Page 7: Chapter 4 kiem dinh thong ke

Đường kính trung bình của phanh đĩatrong mỗi mẫu là 322 mm.

Hệ thống sản xuất phanh đĩa không đạt yêu cầu,cần điều chỉnh.

H0: = 3

Ha: ≠ 3

Với: = đường kính trung bình của phanh đĩa(theo tổng thể).

Ví dụ: Vấn đề về một dây chuyền sảnxuất

49

Page 8: Chapter 4 kiem dinh thong ke

1. Xây dựng giả thuyết.

2. Xác định mức ý nghĩa. a = .1

H0: = 3Ha: ≠ 3

Ví dụ: Vấn đề về một dây chuyền sản xuất

One-Sample T-Test

3. Thực hiện.

50

Page 9: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Thực hiện

– Phân tích file brakes.sav

– Chia tập tin đầu tiên thành các nhóm theo số máy(Machine Number).

• Data\Split File.

– Compare groups.

– Analyze\ Compare Means\ One-Sample T-Test

• Test Variable: Đường kính phanh đĩa (Disc Brake Diameter)

• Test value: 322

• Khoảng phần trăm tin cậy: 90%

51

Page 10: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Output

– One-Sample Statistics

52

Page 11: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Output

– One-Sample Test

53

Page 12: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Một số vấn đề

– Sử dụng khi trung bình mẫu phải được so sánh với một giá trị thử nghiệm được biết.

– Kiểm tra có những giá trị ngoại lệ không. (skewness, Exploratory Data Analysis hay boxplots)

– Kiểm tra các giả định rằng giá trị của biến thửnghiệm thì độc lập của trật tự quan sát.

54

Page 13: Chapter 4 kiem dinh thong ke

One-Sample T-Test

• Ví dụ: Kiểm định giả thuyết: Tuổi trung bình của độc giả báo SGTT là 30 tuổi.– Đặt giả thuyết ��: Tuổi trung bình của độc giả báo

SGTT =30.– Options..

• Confidence Interval: Khoảng tin cậy cho sự khác biệt giữa trung bình và giá trị giả thuyết kiểm tra.

• Missing Values:– Exclude cases analysis by analysis: Mỗi kiểm định T sử dụng tất

cả các trường hợp chứa giá trị có ý nghĩa đối với biến được kiểm định

– Exclude cases listwise: Mỗi kiểm định T chỉ sử dụng trường hợp chỉ có dữ liệu hợp lệ cho tất cả các biến được sử dụng trong bất kỳ yêu cầu kiểm tra T.

55

Page 14: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

56

• Hiển thị:

– Mô tả số liệu thống kê cho mỗi biến thửnghiệm

– Kiểm tra về tính ngang bằng của phương sai

– Một khoảng tin cậy cho sự khác biệt giữa haibiến (95% hoặc giá trị được chỉ định)

Page 15: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

• Ví dụ: hãy xem xét điểm thi môn toán và kiểm tramiệng. Bạn muốn thực hiện thử nghiệm trên điểmsố miệng, bằng cách sử dụng các sinh viên ở trênvà dưới bằng cách chia làm các nhóm độc lập.

• Với thủ tục Independent-sample T-Test, cần phảicung cấp điểm cắt. Chương trình sẽ phân chiamẫu thành hai tại điểm cắt và thực hiện các kiểmtra t. Đặc tính của phương pháp này là điểm cắtcó thể dễ dàng được thay đổi mà không cần đểtạo ra các biến nhóm bằng tay cho mỗi lần.

57

Page 16: Chapter 4 kiem dinh thong ke

Kiểm định một phía vàkiểm định hai phía

• Kiểm định hai phía: Tìm ra sự khác nhau giữahai trung bình tổng thể mà không quan tâmđến chiều hướng của sự khác biệt.

• Kiểm định một phía: giống kiểm định hai phíanhưng giá trị xác suất thì chia cho hai, giảthuyết bằng nhau bị bác bỏ chỉ khi giá trịthống kê tính ra quá lớn ở về phía cần quantâm.

58

Page 17: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

59

• Ví dụ: Phân tích một cửa hàng, muốnđánh giá chương trình khuyến mãi thẻ tíndụng gần đây. Chương trình này đã kếtthúc, 500 chủ thẻ đã được lựa chọn ngẫunhiên. Một nửa nhận được một quảngcáo giảm khi mua hàng được thực hiệntrong vòng ba tháng, và một nửa nhậnquảng cáo theo mùa.

Page 18: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

60

• Thực hiện

– Phân tích file creditpromo.sav

– Analyze\ Compare Means\ Independent-Sample T-Test

• Test Variable(s): $ spent during promotional period

• Grouping Variable: Type of mail insert received

• Define Groups: – Group1: 0

– Group2: 1

Page 19: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

61

• Output

– Group Statistics

– Independent Samples Test

Page 20: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

• Output

62

Page 21: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

63

• Output

Page 22: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

64

• Output

Page 23: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

65

• Ví dụ: Một cuộc khảo sát xu hướng ngưng sửdụng được áp dụng cho các tài khoản tạimột công ty điện thoại di động. Thước đotừ 0-100 điểm, một tài khoản chọn điểm 50trở lên có thể họ đang tìm kiếm thay đổinhà cung cấp. Một nhà quản lý đã khảo sátvà có được 50 khách hàng trên 200 mẫungẫu nhiên, muốn so sánh chúng với sốphút sử dụng trung bình mỗi tháng.

Page 24: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

66

• Thực hiện

– Phân tích file cellular.sav

– Analyze\ Compare Means\ Independent-Sample T-Test

• Test Variable(s): Avg monthly minutes

• Grouping Variable: Propensity to leave

• Define Groups: – Cut point: 50

Page 25: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

67

Page 26: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

68

Page 27: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

69

• Thích hợp cho hai trung bình rút ra từ những mẫu độclập cần so sánh. Các biến được sử dụng để hình thành các nhóm có thể đã tồn tại, tuynhiên, mộtđiểm cắt trên một biến liên tục có thể cung cấp tựđộng tạo ra các nhóm trong quá trình phân tích.

• Giống như với tất cả các T-Test, independent-samples T-Test giả định rằng mỗi mẫu trung bình thì xuất pháttừ một tập hợp bình thường. Biến kiểm tra với các giátrị xa nhất hoặc xa trung tâm nên được kiểm tra cẩnthận; sử dụng boxplots cho việc này.

Page 28: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

70

• Các thủ tục khác có thể sử dụng để kiểm tracác số liệu có đặc biệt không. Dùng phân tíchdữ liệu Exploratory để biết thêm thông tin.

• Nếu biến nhóm của bạn có nhiều hơn hainhóm, hãy thử các thủ tục One-Way ANOVA.

Page 29: Chapter 4 kiem dinh thong ke

Independent-Sample T-Test

• Ví dụ: So sánh giữa 2 khu vực HN và HCM vềsố nhân khẩu trung bình của hộ gia đình.

• Kết luận: số nhân khẩu trung bình trong hộ giađình ở Tp.HCM lớn hơn một cách có ý nghĩathống kê so với HN (dựa trên giá trị trung bìnhcủa mẫu).

71

Page 30: Chapter 4 kiem dinh thong ke

72

• Một trong những thiết kế thử nghiệm phổ biến nhất là thiết kế "pre-post“.

• Kiểm tra giả thuyết có sự khác biệt giữa 2 biếnhay không. Dữ liệu bao gồm 2 phép đo được thựchiện trên cùng 1 chủ đề hay đo lường được thựchiện trên 1 đôi của chủ đề.

• Quá trình kiểm nghiệm sẽ bắt đầu từ tính toánchênh lệch giá trị từng cặp, sau đó xem chênhlệch trung bình của tổng thể có khác 0 không, nếukhác 0 tức là có khác biệt .

Paired-Sample T-Test

Page 31: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

73

• Cung cấp thông tin

– Mô tả số liệu thống kê cho mỗi biến thử nghiệm

– Mối tương quan Pearson giữa mỗi cặp và ý nghĩa của nó

– Một khoảng tin cậy của trung bình sự khácbiệt (95% hoặc một giá trị cụ thể)

Page 32: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

74

• Ví dụ: Một bác sĩ muốn đánh giá một chế độăn mới cho các bệnh nhân có tiền sử mắcbệnh tim. Để kiểm tra hiệu quả của chế độ ănuống này, 16 bệnh nhân được đặt vào chế độăn uống trong 6 tháng. Trọng lượng và mức độmỡ của họ được đo trước và sau khi nghiêncứu.

– Bác sĩ muốn biết trước và sau của các phép đo đãcó thay đổi không?

Page 33: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

75

• Thực hiện

– Phân tích file dietstudy.sav

– Analyze\ Compare Means\ Paired-Sample T-Test

• Paired Variables (Các biến kết hợp):– Triglyceride, Final Triglyceride

– Weight, Final Weight

• Khoảng phần trăm tin cậy: 95%

Page 34: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

• Output

– Paired Samples Statistics

– Paired Samples Correlations

– Paired Samples Test

76

Page 35: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

77

• Output

Page 36: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

78

• Output

Page 37: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

79

• Output

Page 38: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

• Thích hợp cho hai mẫu trung bình cóliên quan được so sánh.

• Trước khi chạy T-Test, phải đánh giá sự phânbố của điểm khác biệt bằng cách dùng biểu đồhistogram, dùng boxplots kiểm tra các giá trịngoại lệ hoặc xa trung tâm, hoặc dùng phântích dữ liệu bằng Exploratory.

80

Page 39: Chapter 4 kiem dinh thong ke

Paired-Sample T-Test

81

• Ví dụ: Công ty chế biến thực phẩm muốn khảosát sự đánh giá của người tiêu dùng về loạiđậu phộng chế biến sẵn vừa được cải tiếnthành phần nước bột áo. Tổ chức cho dùngthử sản phẩm trên cùng 1 nhóm người thuđược những thông tin xác thực về đánh giámùi vị, độ ngon.

Page 40: Chapter 4 kiem dinh thong ke

Kiểm định trung bình tổng thể

• Phân tích liên hệ giữa biến nguyên nhân định tínhvà biến kết quả định lượng.(Analyze\Compare Means\)– So sánh trị trung bình của 1 tổng thể với 1 giá trị cụ

thể. Thực hiện phép kiểm định giả thuyết về trungbình của tổng thể(One-Sample T-Test).

– So sánh 2 trị trung bình của 2 nhóm tổng thể riêngbiệt. Thực hiện phép kiểm định giả thuyết về sự bằngnhau của 2 trung bình của tổng thể dựa trên 2 mẫuđộc lập rút từ 2 tổng thể (Independent-Sample T-Test).

82

Page 41: Chapter 4 kiem dinh thong ke

Kiểm định trung bình tổng thể

So sánh 2 trị trung bình của 2 nhóm tổng thể riêngbiệt (mỗi phần tử quan sát có sự tương đồng theocặp với 1 phần tử ở tổng bên kia). Sử dụng phépkiểm định giả thuyết về sự bằng nhau của 2 trungbình tổng thể dự trên dl mẫu rút theo cách phối hợp từng cặp (Paired-Sample T-Test).

• So sánh cho trị trung bình của nhiều nhómtổng thể độc lập. Sử dụng pp kiểm định giảthuyết về sự bằng nhau của trung bình nhiềutổng thể (One-way ANOVA) (phân tíchphương sai).

83