Chapter 4 kiem dinh thong ke

Preview:

Citation preview

KIỂM ĐỊNH THỐNG KÊ

Giáo trình điện tử

Biên soạn bởi: Nguyễn Minh Toàn

Trường Đại Học Công nghiệp Tp. Hồ Chí Minh

Khoa Quản trị Kinh doanh

1

KIỂM NGHIỆM SỰ KHÁC NHAU GIỮA 2 GIÁ TRỊ TRUNG BÌNH

44

45

Nội dung

• Các vấn đề chung về kiểm định

• Kiểm định mối quan hệ giữa hai biến dữ liệu định tính: kiểmnghiệm mối quan hệ giữa 2 biến trong bản chéo. Sử dụng kiểm nghiệm Chi bình phương.

• Kiểm nghiệm sự khác nhau giữa 2 giá trị trung bình

– Kiểm nghiệm Student’s t cho 1 mẫu và giá trị cụ thể(One-Sample T-Test)

– Kiểm nghiệm Student’s t cho 2 mẫu độc lập(Independent samples t test)

– Kiểm nghiệm Student’s t cho cặp mẫu(Paired samples t test)

Quy trình kiểm định giả thiết

1. Phát biểu giả thiết và giả thiết thay thế

2. Chọn loại kiểm định thống kê

3. Chọn mức ý nghĩa mong muốn

4. Tính giá trị khác biệt

5. Có được giá trị kiểm định

6. Diễn giải kết quả kiểm nghiệm

46

Tầm quan trọng

One-Sample T-Test

• Các thử nghiệm thể hiện sự khác biệt giữa trung bình mẫu và giá trị cụthể đã biết hoặc đưa ra giả định.

• Cho phép bạn xác định mức độ tín nhiệm đối với sự khác biệt

• Tạo một bảng thống kê mô tả cho mỗi biến thử nghiệm.

47

One-Sample T-Test

• Ví dụ: Vấn đề về một dây chuyền sản xuất– Một nhà máy sản xuất xe ô tô, sản xuất các hệ

thống phanh đĩa mà đường kính phải đo là322 mm.

– Kiểm tra chất lượng ngẫu nhiên rút ra từ 16 cái trong 8 đầu máy sản xuất, xác định có haykhông có đường kính trung bình của hệ thốngphanh trong mỗi mẫu khác biệt đáng kể so với 322 mm.

48

Đường kính trung bình của phanh đĩatrong mỗi mẫu là 322 mm.

Hệ thống sản xuất phanh đĩa không đạt yêu cầu,cần điều chỉnh.

H0: = 3

Ha: ≠ 3

Với: = đường kính trung bình của phanh đĩa(theo tổng thể).

Ví dụ: Vấn đề về một dây chuyền sảnxuất

49

1. Xây dựng giả thuyết.

2. Xác định mức ý nghĩa. a = .1

H0: = 3Ha: ≠ 3

Ví dụ: Vấn đề về một dây chuyền sản xuất

One-Sample T-Test

3. Thực hiện.

50

One-Sample T-Test

• Thực hiện

– Phân tích file brakes.sav

– Chia tập tin đầu tiên thành các nhóm theo số máy(Machine Number).

• Data\Split File.

– Compare groups.

– Analyze\ Compare Means\ One-Sample T-Test

• Test Variable: Đường kính phanh đĩa (Disc Brake Diameter)

• Test value: 322

• Khoảng phần trăm tin cậy: 90%

51

One-Sample T-Test

• Output

– One-Sample Statistics

52

One-Sample T-Test

• Output

– One-Sample Test

53

One-Sample T-Test

• Một số vấn đề

– Sử dụng khi trung bình mẫu phải được so sánh với một giá trị thử nghiệm được biết.

– Kiểm tra có những giá trị ngoại lệ không. (skewness, Exploratory Data Analysis hay boxplots)

– Kiểm tra các giả định rằng giá trị của biến thửnghiệm thì độc lập của trật tự quan sát.

54

One-Sample T-Test

• Ví dụ: Kiểm định giả thuyết: Tuổi trung bình của độc giả báo SGTT là 30 tuổi.– Đặt giả thuyết ��: Tuổi trung bình của độc giả báo

SGTT =30.– Options..

• Confidence Interval: Khoảng tin cậy cho sự khác biệt giữa trung bình và giá trị giả thuyết kiểm tra.

• Missing Values:– Exclude cases analysis by analysis: Mỗi kiểm định T sử dụng tất

cả các trường hợp chứa giá trị có ý nghĩa đối với biến được kiểm định

– Exclude cases listwise: Mỗi kiểm định T chỉ sử dụng trường hợp chỉ có dữ liệu hợp lệ cho tất cả các biến được sử dụng trong bất kỳ yêu cầu kiểm tra T.

55

Independent-Sample T-Test

56

• Hiển thị:

– Mô tả số liệu thống kê cho mỗi biến thửnghiệm

– Kiểm tra về tính ngang bằng của phương sai

– Một khoảng tin cậy cho sự khác biệt giữa haibiến (95% hoặc giá trị được chỉ định)

Independent-Sample T-Test

• Ví dụ: hãy xem xét điểm thi môn toán và kiểm tramiệng. Bạn muốn thực hiện thử nghiệm trên điểmsố miệng, bằng cách sử dụng các sinh viên ở trênvà dưới bằng cách chia làm các nhóm độc lập.

• Với thủ tục Independent-sample T-Test, cần phảicung cấp điểm cắt. Chương trình sẽ phân chiamẫu thành hai tại điểm cắt và thực hiện các kiểmtra t. Đặc tính của phương pháp này là điểm cắtcó thể dễ dàng được thay đổi mà không cần đểtạo ra các biến nhóm bằng tay cho mỗi lần.

57

Kiểm định một phía vàkiểm định hai phía

• Kiểm định hai phía: Tìm ra sự khác nhau giữahai trung bình tổng thể mà không quan tâmđến chiều hướng của sự khác biệt.

• Kiểm định một phía: giống kiểm định hai phíanhưng giá trị xác suất thì chia cho hai, giảthuyết bằng nhau bị bác bỏ chỉ khi giá trịthống kê tính ra quá lớn ở về phía cần quantâm.

58

Independent-Sample T-Test

59

• Ví dụ: Phân tích một cửa hàng, muốnđánh giá chương trình khuyến mãi thẻ tíndụng gần đây. Chương trình này đã kếtthúc, 500 chủ thẻ đã được lựa chọn ngẫunhiên. Một nửa nhận được một quảngcáo giảm khi mua hàng được thực hiệntrong vòng ba tháng, và một nửa nhậnquảng cáo theo mùa.

Independent-Sample T-Test

60

• Thực hiện

– Phân tích file creditpromo.sav

– Analyze\ Compare Means\ Independent-Sample T-Test

• Test Variable(s): $ spent during promotional period

• Grouping Variable: Type of mail insert received

• Define Groups: – Group1: 0

– Group2: 1

Independent-Sample T-Test

61

• Output

– Group Statistics

– Independent Samples Test

Independent-Sample T-Test

• Output

62

Independent-Sample T-Test

63

• Output

Independent-Sample T-Test

64

• Output

Independent-Sample T-Test

65

• Ví dụ: Một cuộc khảo sát xu hướng ngưng sửdụng được áp dụng cho các tài khoản tạimột công ty điện thoại di động. Thước đotừ 0-100 điểm, một tài khoản chọn điểm 50trở lên có thể họ đang tìm kiếm thay đổinhà cung cấp. Một nhà quản lý đã khảo sátvà có được 50 khách hàng trên 200 mẫungẫu nhiên, muốn so sánh chúng với sốphút sử dụng trung bình mỗi tháng.

Independent-Sample T-Test

66

• Thực hiện

– Phân tích file cellular.sav

– Analyze\ Compare Means\ Independent-Sample T-Test

• Test Variable(s): Avg monthly minutes

• Grouping Variable: Propensity to leave

• Define Groups: – Cut point: 50

Independent-Sample T-Test

67

Independent-Sample T-Test

68

Independent-Sample T-Test

69

• Thích hợp cho hai trung bình rút ra từ những mẫu độclập cần so sánh. Các biến được sử dụng để hình thành các nhóm có thể đã tồn tại, tuynhiên, mộtđiểm cắt trên một biến liên tục có thể cung cấp tựđộng tạo ra các nhóm trong quá trình phân tích.

• Giống như với tất cả các T-Test, independent-samples T-Test giả định rằng mỗi mẫu trung bình thì xuất pháttừ một tập hợp bình thường. Biến kiểm tra với các giátrị xa nhất hoặc xa trung tâm nên được kiểm tra cẩnthận; sử dụng boxplots cho việc này.

Independent-Sample T-Test

70

• Các thủ tục khác có thể sử dụng để kiểm tracác số liệu có đặc biệt không. Dùng phân tíchdữ liệu Exploratory để biết thêm thông tin.

• Nếu biến nhóm của bạn có nhiều hơn hainhóm, hãy thử các thủ tục One-Way ANOVA.

Independent-Sample T-Test

• Ví dụ: So sánh giữa 2 khu vực HN và HCM vềsố nhân khẩu trung bình của hộ gia đình.

• Kết luận: số nhân khẩu trung bình trong hộ giađình ở Tp.HCM lớn hơn một cách có ý nghĩathống kê so với HN (dựa trên giá trị trung bìnhcủa mẫu).

71

72

• Một trong những thiết kế thử nghiệm phổ biến nhất là thiết kế "pre-post“.

• Kiểm tra giả thuyết có sự khác biệt giữa 2 biếnhay không. Dữ liệu bao gồm 2 phép đo được thựchiện trên cùng 1 chủ đề hay đo lường được thựchiện trên 1 đôi của chủ đề.

• Quá trình kiểm nghiệm sẽ bắt đầu từ tính toánchênh lệch giá trị từng cặp, sau đó xem chênhlệch trung bình của tổng thể có khác 0 không, nếukhác 0 tức là có khác biệt .

Paired-Sample T-Test

Paired-Sample T-Test

73

• Cung cấp thông tin

– Mô tả số liệu thống kê cho mỗi biến thử nghiệm

– Mối tương quan Pearson giữa mỗi cặp và ý nghĩa của nó

– Một khoảng tin cậy của trung bình sự khácbiệt (95% hoặc một giá trị cụ thể)

Paired-Sample T-Test

74

• Ví dụ: Một bác sĩ muốn đánh giá một chế độăn mới cho các bệnh nhân có tiền sử mắcbệnh tim. Để kiểm tra hiệu quả của chế độ ănuống này, 16 bệnh nhân được đặt vào chế độăn uống trong 6 tháng. Trọng lượng và mức độmỡ của họ được đo trước và sau khi nghiêncứu.

– Bác sĩ muốn biết trước và sau của các phép đo đãcó thay đổi không?

Paired-Sample T-Test

75

• Thực hiện

– Phân tích file dietstudy.sav

– Analyze\ Compare Means\ Paired-Sample T-Test

• Paired Variables (Các biến kết hợp):– Triglyceride, Final Triglyceride

– Weight, Final Weight

• Khoảng phần trăm tin cậy: 95%

Paired-Sample T-Test

• Output

– Paired Samples Statistics

– Paired Samples Correlations

– Paired Samples Test

76

Paired-Sample T-Test

77

• Output

Paired-Sample T-Test

78

• Output

Paired-Sample T-Test

79

• Output

Paired-Sample T-Test

• Thích hợp cho hai mẫu trung bình cóliên quan được so sánh.

• Trước khi chạy T-Test, phải đánh giá sự phânbố của điểm khác biệt bằng cách dùng biểu đồhistogram, dùng boxplots kiểm tra các giá trịngoại lệ hoặc xa trung tâm, hoặc dùng phântích dữ liệu bằng Exploratory.

80

Paired-Sample T-Test

81

• Ví dụ: Công ty chế biến thực phẩm muốn khảosát sự đánh giá của người tiêu dùng về loạiđậu phộng chế biến sẵn vừa được cải tiếnthành phần nước bột áo. Tổ chức cho dùngthử sản phẩm trên cùng 1 nhóm người thuđược những thông tin xác thực về đánh giámùi vị, độ ngon.

Kiểm định trung bình tổng thể

• Phân tích liên hệ giữa biến nguyên nhân định tínhvà biến kết quả định lượng.(Analyze\Compare Means\)– So sánh trị trung bình của 1 tổng thể với 1 giá trị cụ

thể. Thực hiện phép kiểm định giả thuyết về trungbình của tổng thể(One-Sample T-Test).

– So sánh 2 trị trung bình của 2 nhóm tổng thể riêngbiệt. Thực hiện phép kiểm định giả thuyết về sự bằngnhau của 2 trung bình của tổng thể dựa trên 2 mẫuđộc lập rút từ 2 tổng thể (Independent-Sample T-Test).

82

Kiểm định trung bình tổng thể

So sánh 2 trị trung bình của 2 nhóm tổng thể riêngbiệt (mỗi phần tử quan sát có sự tương đồng theocặp với 1 phần tử ở tổng bên kia). Sử dụng phépkiểm định giả thuyết về sự bằng nhau của 2 trungbình tổng thể dự trên dl mẫu rút theo cách phối hợp từng cặp (Paired-Sample T-Test).

• So sánh cho trị trung bình của nhiều nhómtổng thể độc lập. Sử dụng pp kiểm định giảthuyết về sự bằng nhau của trung bình nhiềutổng thể (One-way ANOVA) (phân tíchphương sai).

83