28
Đại học Quốc Gia TP. HCM ĐẠI HỌC BÁCH KHOA ------oOo------ Chương trình Kỹ sư CLC Việt - Pháp LỚP VP2009/2 NHÓM 6 Sinh viên: Phạm Minh Nhật MSSV: 40901843 GVGD: PGS.TS Nguyễn Đình Huy

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

  • Upload
    nhat

  • View
    2.863

  • Download
    20

Embed Size (px)

Citation preview

Page 1: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Đại học Quốc Gia TP. HCMĐẠI HỌC BÁCH KHOA

------oOo------Chương trình Kỹ sư CLC Việt - Pháp

LỚP VP2009/2NHÓM 6

Sinh viên: Phạm Minh Nhật MSSV: 40901843 GVGD: PGS.TS Nguyễn Đình Huy

Page 2: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

TP.HCM 06/2010

3

Page 3: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

BÀI I: Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK 2009.

Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phẩn ứng ?

BÀI LÀM

1/ Cơ sở lí thuyết: Phân tích phương sai ba yếu tố:

- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát G (yếu tố A:i=1..r, yếu tố B: j=1..r, yếu tố C: k=1..r)

- Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô hình hình vuông la tinh n n. Ví dụ:

B C D AC D A BD A B CA B C D

- Mô hình vuông la tinh 3 yếu tố được trình bày như sau:yếu tố C (T..k : vd T..1 = Y111+Y421+Y331+Y241)

Yếu tốA

Yếu tố BB1 B2 B3 B4 Ti…

A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1..

A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2..

A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3..

A4 C4 Y414 C1 Y421 C2 Y412 C3 Y443 T4..

T.j. T.1. T.2. T.3. T.4.

Yếu tốA

Yếu tố BB1 B2 B3 B4

A1 C1 9 C2 14 C3 16 C4 12A2 C2 12 C3 15 C4 12 C1 10A3 C3 13 C4 14 C1 11 C2 14A4 C4 10 C1 11 C2 13 C3 13

4

Page 4: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

- Bảng Anova

Trắc nghiệm:Giả thiết H0: μ1 = μ2= …μk “Các giá trị trung bình bằng nhau”

H1: μi ≠ μj “Có ít nhất 2 giá trị trung bình khác nhau”

Giá trị thống kê: và

Biện luận: Nếu (chấp nhận H0 (yếu tố A) )

Nếu (chấp nhận H0 (yếu tố B) )

Nếu (chấp nhận H0 (yếu tố C) )

2/ Áp dụng Excel:Nhập dữ liệu vào bảng :Thiết lập các biểu thức và tính các giá trị thống kê

Tính Ti: Chọn ô B7 và nhập biểu thức = SUM(B2:E2) Chọn ô C7 và nhập biểu thức = SUM(B3:E3) Chọn ô D7 và nhập biểu thức = SUM(B4:E4) Chọn ô E7 và nhập biểu thức = SUM(B5:E5) Tính Tj: Chọn ô b8 và nhập biểu thức =SUM(B2:B5) Dùng con trỏ kéo kí hiệu từ điền từ ô B8 đến ô E8 Tính Tk: Chọn ô B9 và nhập biểu thức = SUM(B2, C5,D4,E3) Chọn ô C9 và nhập biểu thức = SUM(B3, C2,D5,E4) Chọn ô D9 và nhập biểu thức = SUM(B4, C3,D2,E5) Chọn ô E9 và nhập biểu thức = SUM(B5, C4,D3,E2) Tính T: Chọn ô B10 và nhập biểu thức =SUM(B2:E5) Tính các giá trị của ô G: Chọn ô G và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 Chọn ô G10 và nhập biểu thức =POWER(B10,2) Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5) Tính các giá trị SSR, SSC,SST, SSE Kết quả và biện luận: FR=3.106< F0.05(3.6)= 4.76, nên chấp nhận H0 (pH)

Nguồn sai số

Bậc tự do Tổng số bình phươgBình phương trung

bìnhGiá trị thống kê

Yếu tố A(hàng)

r-1 SSR= MSR= FR=

Yếu tố B(cột)

r-1 SSC= MSC= FC=

Yếu tố C r-1 SSF= MSF= F=

Sai số (r-1)(r-2)SSE=SST-

(SSF+SSR+SSC)

MSE=

Tổng cộng (r2-1)

SST=

5

Page 5: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

FC=11.95> F0.05(3.6)= 4.76 ,nên bác bỏ H0 (nhiệt độ) F=30.05> F0.05(3.6)= 4.76, nên bác bỏ H0 (chất xúc tác)

Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất

6

Page 6: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Ví dụ 4.2: Người ta dùng ba mức nhiệt độ gồm 105, 120, 135oC kết hợp với ba khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của các phản ứng (%) được trình bày trong bảng sau :

Thời gian (phút)

Nhiệt độ (oC)

Hiệu suất (%)

X1 X2 Y15 105 1,8730 105 2,0260 105 3,2815 120 3,0530 120 4,0760 120 5,5415 135 5,0330 135 6,4560 135 7,26

Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì với điều kiện nhiệt độ 115oC trong vòng 50 phút, hiệu suất phản ứng sẽ là bao nhiêu?

BÀI LÀM

1/ Cơ sở lý thuyết: Đây là một bài toán hồi quy tuyến tính đa tham số, trong đó, Y (hiệu suất) liên quan đến hai biến số X1 (thời gian), X2 ( nhiệt độ). Sau khi tìm các giá trị thống kê, ta sẽ có hai phần trắc nghiệm hồi quy gồm :- Trắc nghiệm t: so sánh giá trị t với giá trị t0,05, bậc tự do là γ = N-k-1 (k là số biến) (tra bảng Student)Kiểm định các giả thuyết: H0: “ Các hệ số hồi quy không có ý nghĩa”

H1:”Có ít nhất vài hệ số hồi quy có ý nghĩa”- Trắc nghiệm F: so sánh giá trị F với giá trị F0,05, bậc tự do là n1=1, n2=N-k-1 (tra bảng Fisher)Kiểm định các giả thuyết: H0: “Phương trình hồi quy không thích hợp”

H1: “Phương trình hồi quy thích hợp”2/ Áp dụng Excel:Nhập bảng dữ liệu:Dữ liệu bắt buộc phải được nhập theo cột.

7

Page 7: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Sử dụng công cụ Regression:Vào Data > Data Analysis. Chọn mục Regression

Trong cửa sổ Regression, nhập vào các dữ liệu sau: Input Y range (phạm vi biến số Y) Input X range (phạm vi biến số X) Labels (nhãn dữ liệu) Confidence Level (mức tin cậy) Ouput Range (tọa độ đầu ra) Một vài tùy chọn khác: Line Fit Plots ( đường hồi quy), Residual Plots ( biểu thức sai số)

8

Page 8: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

1. Phương trình hồi quy của Y theo X1Phương trình hồi quy : Y = 2.7367 +0.04454X1 (R2=0.2139, S=1.8112); N=9; k=1;

t0=t Stat(Intercept)=2.129 < t0,05(7)=2.365 (hay P value=0.0708 > α=0.05)

=>Chấp nhận giả thiết H0.

t1=t Stat(X1)=1.3802< t0,05(7)=2.365 (hay P value=0.2099>α=0.05)=>Chấp nhận giả thiết H0.

F=1.9049<F0,05(1.7)=5.59 (hay FS=Significance F=0.2099>α=0.05)

=>Chấp nhận giả thiết H0

Vậy các hệ số của phương trình hồi quy Y = 2.7367 +0.04454X1 đều không có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này không thích hợp.Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng tổng hợp

2. Phương trình hồi quy của Y theo X2

Phương trình hồi quy: Y = -11.1411 +0.12856X2 (R2=0.7638; S=0.9929);N=9; k=1;

t0= t Stat(Intercept) =3.4178 > t0,05(7)=2.365 (hay P value=0.0112 < α=0.05)

=>Bác bỏ giả thiết H0.

t1= t Stat(X1) =4.7572 > t0,05(7)=2.365 (hay P value=0.0021 < α=0.05)=> Bác bỏ giả thiết H0.

F=22.6309 > F0,05(1.7)=5.59 (hay FS=Significance F=0.0021 < α=0.05)

=>Bác bỏ giả thiết H0

Vậy các hệ số của phương trình hồi quy Y = -11.1411 +0.12856X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp

3. Phương trình hồi quy của Y theo X1 và X2

Phương trình hồi quy : Y = -12.7 + 0.0445X1 + 0.1286X2 (R2=0.9777; S=0.3297); N=9; k=2;

t0= t Stat(Intercept) =1.1016 > t0,05(6)=2.447 (hay P value=0.000026 < α=0.05)

=>Bác bỏ giả thiết H0.

t1= t Stat(X1) = 7.5827 > t0,05(6)=2.447 (hay P value=0.0002736 < α=0.05)=> Bác bỏ giả thiết H0.

t2= t Stat(X2) = 14.3278 > t0,05(6)=2.447 (hay P value=0.000007 < α=0.05)=> Bác bỏ giả thiết H0.

F=131.3921> F0,05(1.6)=5.99 (hay FS=Significance F=0.0021 < α=0.05)

=>Bác bỏ giả thiết H0

Vậy các hệ số của phương trình hồi quy Y = -12.7 + 0.0445X1 + 0.1286X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.Kết luận: Cả hai yếu tố nhiệt độ và thời gian cùng đồng thời liên quan tuyến tính với hiệu suất phản ứng tổng hợp

9

Page 9: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Để dự đoán hiệu suất của phản ứng bằng phương pháp hồi quy Y = -12.7 + 0.0445X1 + 0.1286X2 , ta thay các giá trị X1, X2, thì sẽ được kết quảX1=50, X2=115 : Chọn ô bất kỳ, nhập vào công thức =B66+B67*50+B68*115Vậy với X1=50, X2=115, Y= 4.310873016

10

Page 10: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

BÀI II   : Laäp baûng ANOVA cho baûng soá lieäu sau ñaây: Nhoùm 1 Nhoùm 2 Nhoùm 3 Nhoùm 4

1216121426

1920189

2219

3429311926

19211714

Giaû thieát Ho coù bò baùc boû ôû möùc 5% hay khoâng?

BÀI LÀM

1/ Cơ sở lý thuyết:

Để kiểm định giả thiết Ho có bị bác bỏ ở mức 5% hay không, ta phải thực hiện phép phân tích phương sai (phân tích phương sai 1 yếu tố)

-Khái niệm thống kê:

+Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng của trắc nghiệm t hay z (so sánh hai giá trị trung bình).

+Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố(nhân tạo hay tự nhiên) nào đó đến các giá trị quan sát,Yi,(i=1,2,…..,k).

Mô hình

Yếu tố thí nghiệm

1 2 … K

Y11

Y12

Y1n

Y21

Y22

Y2n

Yk1

Yk2

Ykn

Tổng cộng trung bình T1

1

T2

2

Tk

k

T

11

Page 11: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Bảng Anova:

Nguồn sai số Bậc tự do Tổng số bình phương

Bình phương trung bình

Giá trị thống kê

Yếu tố

Sai số

k-1

N-kMSF=

MSE=

Tổng cộng

Trắc nghiệm:

+Giả thiết: H0: ”Các giá trị trung bình bằng nhau”

H1: ”Ít nhất có hai giá trị trung bình khác nhau”

+Giá trị thống kê:

+Biện luận:

Nếu F<F (k-1;N-k) chấp nhận giả thiết H0

2/ Áp dụng Excel:

Nhập dữ liệu vào bảng tính

Áp dụng “Anova:single Factor”

Nhấp chuột đơn lệnh tools và lệnh Data Analysis.

Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK.

Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu (Input range).

Cách sắp xếp theo hang hay cột (Group by).

Nhấn dữ liệu (Labels in Fisrt Row/Column).

12

Page 12: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Kết quả:

Kết quả và biện luận: F=5.814789 > F0,05=3.238872

Vậy: Bác bỏ giả thuyết H0

13

Page 13: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

BÀI III : Moät nhaø taâm lyù hoïc muoán nghieân cöùu aûnh höôûng cuûa queâ quaùn ñoái thôøi gian caàn thieát (tính baèng phuùt) ñeå moät sinh vieân coù theá traû lôøi moät caâu ñoá 4 boán nhoùm sinh vieân töø 4 vuøng khaùc nhau (noäi thaønh, ngoaïi thaønh, thò traán, noâng thoân) ñöôïc khaûo saùt vôùi keát quaû thu ñöôïc nhö sau:

Noäi thaønh: 16,5 5,2 12,1 14,3Ngoaïi thaønh: 10,9 5,2 10,8 8,9 16,1 Thò traán: 18,6 8,1 6,4Noâng thoân: 14,2 24,5 14,8 24,9 5,1

Haõy laäp baûng ANOVA cho soá lieäu treân.

BÀI LÀM

1/ Cơ sở lý thuyết:

Phân tích sự ảnh hưởng của quê quán đến thời gian cần thiết để sinh viên trả lời câu hỏi (Chỉ duy nhất 1 yếu tố quê quán) => Chọn phân tích phương sai 1 yếu tố.

-Khái niệm thống kê:

+Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng của trắc nghiệm t hay z (so sánh hai giá trị trung bình).

+Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố(nhân tạo hay tự nhiên) nào đó đến các giá trị quan sát,Yi,(i=1,2,…..,k).

Mô hình

Yếu tố thí nghiệm

1 2 … K

Y11

Y12

Y1n

Y21

Y22

Y2n

Yk1

Yk2

Ykn

Tổng cộng trung bình T1

1

T2

2

Tk

k

T

Bảng Anova:

Nguồn sai số Bậc tự do Tổng số bình phương

Bình phương trung bình

Giá trị thống kê

Yếu tố

Sai số

k-1

N-kMSF=

14

Page 14: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

MSE=

Tổng cộng

Trắc nghiệm:

+Giả thiết: H0: ”Các giá trị trung bình bằng nhau”

H1: ”Ít nhất có hai giá trị trung bình khác nhau”

+Giá trị thống kê:

+Biện luận:

Nếu F<F (k-1;N-k) chấp nhận giả thiết H0

2/ Áp dụng Excel:

Nhập dữ liệu vào bảng tính:

Áp dụng “Anova:single Factor”:

Nhấp chuột đơn lệnh tools và lệnh Data Analysis.

Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK.

Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu(input range).

Cách sắp xếp theo hang hay cột(group by).

Nhấn dữ liệu(Labels in Fisrt Row/Column).

15

Page 15: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Kết quả:

Kết quả và biện luận: F=1.027069 < Fc=3.410534 =>Chấp nhận giả thiết H

Vậy quê quán khong ảnh hưởng đến thời gian trả lời câu hỏi của sinh viên

16

Page 16: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

BÀI IV : Tính tyû soá töông quan cuûa Y ñoái vôùi X vaø heä soá xaùc ñònh cuûa taäp soá lieäu sau ñaây:

(X, Y) = (15, 13), (25, 22), (10, 6), (15, 17), (20, 21), (10, 10), (20, 25), (25, 18), (30, 14), (30, 10). Coù nhaän xeùt gì veà moái quan heä giöõa X vaø Y?

BÀI LÀM

1/ Cơ sở lí thuyết:

Phân tích tương quan – Khái niệm thống kê:Hệ số tương quan Pearson:

;

Sự phân tích tương quan (correlation) khảo sát khuynh hướng và mức độ của sự liên quan, trong sự phân tích hồi quy (regrestion) xác định sự liên quan định lượng giữa hai biến số ngẫu nhiên Y và X. Hệ số tương quan có thể được ước tính bởi biểu thức:

Hệ số tương quan được dung trong việc đánh giá mức độ liên quan:Giá trị IRI Mức độ

< 0,70 Nghèo nàn0,70 - 0,80 Khá0,80 – 0,90 Tốt

< 0,90 Xuất sắcPhân tích hồi quy – Khái niệm thống kê:Phép phân tích hồi quy tuyến tính (liner regression) hay được áp dụng trong khoa học. ví dụ, đường hồi quy (regression line / line of best fit) thường dung để dự đoán tuổi thọ hay hạn dùng của thuốc.Phương trình hồi quy có thể được ước tính bằng phương pháp bình phương cực tiểu (least square estimation).Hồi quy tuyến tính đơn giảnPhương trình tổng quátYX=Bo+BXBo=

B=

Y - biến số phụ thuộc (dependent/response variable)X - biến số độc lập (independent/predictor variable)B0 và B – các hệ số hồi quy (regression coefficients)Bảng anovaNguồn sai số Bậc tự do Tổng số bình

phươngBình phương trung bình

Giá trị thống kê

Hồi quy 1 SSR=∑(

)2

MSR=SSR F=MSR/MSE

Sai số N-2 SSE=∑( ) MSE=SSE/(N-

17

Page 17: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

2 2)Tổng cộng N-1 SST=∑( )

2 = SSR+SSE

Giá trị thống kê:Giá trị R-bình phương (R-square):R=SSR/SST (100R2: % của biến đổi trên Y được giải thích bởi X)Độ lệch chuẩn (Standard error):

S=

(Sự phân tán của dữ liệu càng ít thì giá trị của S càng gần zero).Trắc nghiệm thống kê:Đối với một phương trình hồi quy, YX = B0 + BX, ý nghĩa thống kê của các số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình YX = f(x) được đánh giá bằng trắc nghiệm F (phân bố Fischer).Trắc nghiệm t

Giả thiết: H0: Bi=0 “Hệ số hồi quy không có ý nghĩa” H0: Bi<>0 “Hệ số hồi quy có ý nghĩa”Giá trị thống kê:

t= ;

Phân bố student gamma = N – 2Biện luận:Nếu t < tα(N-2) => chấp nhận giả thiết H0.

Trắc nghiệm FGiả thiết: H0: Bi=0 “Phương trình hồi quy không thích hợp”

H0: Bi<>0 “Phương trình hồi quy thích hợp”Giá trị thống kê:F=MSR/MSEPhân bố Fischer v1=1, v2=N-2Kết luận:Nếu F<Fα(1,N-2) => chấp nhận giả thiết H0.

2/ Áp dụng Excel:

Nhập bảng giữ liệu theo hàng:

18

Page 18: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Áp dụng “Correlation” tính hệ số tương quan:

Trên thanh công cụ chọn Tools-> Data Analysis

Chọn “Correlation” rồi Ok

Nhập đầu vào (input range)

Cách sắp xếp theo hàng / cột (group by),ở đây ta chon theo hàng

Nhập đầu ra (output range)

Nhấn ENTER

Áp dụng “Regresson” tìm sự tương quan tuyến tính:

Trên thanh công cụ chon Tools-> Data Analysis

Chọn “Regresson” rồi Ok

Nhập đầu vào biến Y (input Y range)

Nhập đầu vào biến X (input X range)

Nhãn dữ liệu (label)

Mức tin cậy (confidence lever)

Nhập đầu ra (output range)

Đường hồi quy (line fit plot)

Biểu thức sai số (residuals plots)

Nhấn ENTER

19

Page 19: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Ta được kết quả:

Kết luận:Hệ số hồi quy A: t0= 1,8 < t0,05=2,776, chấp nhận H0 (hệ số A có ý nghĩa)

Hệ số hồi quy B: t0= 0,955 < t0,05=2,776, chấp nhận H0 (hệ số B có ý nghĩa)

Phương trình hồi quy Y= 10,4+0,26 X thích hợp

Vậy 2 biến X, Y có tương quan tuyến tính

20

Page 20: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

BÀI V : Theo doõi soá hoïc sinh ñeán lôùp muoän cuûa naêm tröôøng PTTH vaøo caùc ngaøy khaùc nhau trong tuaàn ngöôøi ta thu ñöôïc soá lieäu veà soá löôïng hoïc sinh trung bình ñeán lôùp muoän cuûa caùc tröôøng ñoù vaøo moät ngaøy tieâu bieåu trong tuaàn nhö sau:

Ngaøy trong tuaàn

Tröôøng PTTHA B C D

Thöù haiThöù tö

Thöù saùuThöù baûy

5444

4534

5343

7252

Baïn coù nhaän xeùt gì veà soá löôïng hoïc sinh ñeán lôùp muoän cuûa caùc tröôøng. Coù söï khaùc bieät gì veà soá löôïng hoïc sinh ñeán lôùp muoän vaøo caùc ngaøy khaùc nhau trong tuaàn?

BÀI LÀM

1/ Cơ sở lý thuyết: Phân tích phương sai hai yếu tố (không lặp)Khái niệm thống kêSự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1.2…r: yếu tố A; j=1.2…c: yếu tố B).Mô hình

Yếu tố A

Yếu tố B Tổng cộng

Trung bình1 2 … c

1 Y11 Y12 … Y1c Y1. Y12 Y12 Y22 … Y2c Y2. Y2… … … … … … …r Yr1 Yr2 … Yrc Yr. Yr

Tổng cộng

T.1 T.2 … T.c T..

Trung bình

Y.1 Y.2 … Y.c Y..

Bảng AnovaNguồn sai

sốBậc tự do Tổng số bình phươg

Bình phương trung bình

Giá trị thống kê

Yếu tố A(hàng)

r-1 SSB= MSB= FR=

Yếu tố B(cột)

Sai số

r-1

(r-1)(c-1)

SSB=

SSE=SST – (SSF + SSB)

MSF=

MSB=

FC=

21

Page 21: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Tổng cộng rc-1SST=

Trắc nghiệm:Giả thiết: H0: μ1 = μ2= …=μk “Các giá trị trung bình bằng nhau”

H1: μi ≠ μj “Có ít nhất 2 giá trị trung bình khác nhau”

Giá trị thống kê: FR= và FC=

Biện luận: Nếu FR < Fa[b-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố A) Nếu FC < Fa[k-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố B)2/ Áp dụng Excel: Nhập bảng dữ liệu:

Áp dụng bảng Anova: Two-Factor Without Replication:Vào Tools > Data Analysis. Chọn mục Anova: Two-Factor Without Replication

Xuất hiện bảng:

22

Page 22: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

OK > ta được kết quả:

Kết quả và biện luận: FR=2.036 < F0.05=3.863 => chấp nhận giả thiết H0 (trường) FC=0.107 < F0.05=3.863 => chấp nhận giả thiết H0 (ngày trong tuần)

Vậy số lượng học sinh đến lớp muộn không khác nhau giữa các trường cũng như các ngày trong tuần.

HẾT

23