21
YÊU CU CHUNG 1. Mi nhóm SV np lại 1 file word qua địa chemail ca cô: [email protected], trước bui báo cáo 3 ngày , và np 1 bn in vào ngày báo cáo. Sau bui báo cáo, cuốn đề tài chđể lưu trữ nên để tránh lãng phí, các nhóm có thin trên c2 mt giy A4, đóng bìa giấy, không cn in màu, không đóng bìa mica. Sau khi np file lần đầu để không btrđiểm thi hn, SV vn có thchnh sửa để hoàn thin bài báo cáo và np li ln cuối ngay trước bui báo cáo. trang bìa, SV cần lưu ý ghi đầy đủ danh sách SV, in đậm tên nhóm trưởng (hoặc có đánh dấu), sp xếp tên các thành viên theo thtabc, đánh số thttrong danh sách các thành viên. ( Khicô nhập điểm mà thy nhóm nào trình bày bìa không đúng yêu cầu thì cô strbớt 0.5 đ của nhóm đó nhé). 2. SV thc hin các bài tập trong Excel, sau đó mô tả các bước thc hin (viết gn thôi), có copy hình nh các kết quminh ha vào word. 3. Bài 1 không phải trình bày cơ sở lý thuyết. Các bài khác phải trình bày cơ slý thuyết ca bài (viết gn). Mt sbài khi thc hin cn bsung githiết thích hp vsliu mu. Lưu ý đối vi mi bài kiểm định, da vào kết qusau khi thc hin trên Excel, SV cn trình bày li theo đầy đủ các bước: Đặt các githiết kim định; các min bác btương ứng; các tiêu chun kiểm định ( hoc giá trP); và kết lun. 4. Điểm nội dung đề tài + nộp đúng hạn + trlời đúng các câu hỏi liên quan đến đề tài: 7 điểm. 5. Điểm thc hành : nhn dng bài toán + thc hành bài cth(tương tự các bài trong 10 đề tài) + trli câu hi trc tiếp: 3 điểm. Hình thc kim tra thc hành: Mi nhóm scó t2-4 SV được gi ngu nhiên để kim tra thc hành. Mi SV sbốc thăm 1 câu hỏi cha mt trong các ni dung sau: - Nhp trc tiếp vào Excel 1 mẫu định lượng bt k, dùng chức năng Data Analysic/ Descriptive Statistics để tìm các đặc trưng mẫu và gii thích các sliệu thu được, vđồ th. - Nhn dạng bài toán để chn test phù hp: t-test; z-test; F-test. - Nhn dạng bài toán để chọn phân tích phương sai 1 yếu t; 2 yếu t; - Kiểm định tính độc lp ( so sánh các tl). 6. Thi hn báo cáo: 2 tun cui cùng. Các nhóm sđăng ký hoc bốc thăm thtbáo cáo vào tun hc cui. 7. Điểm cng cho các nhóm ly ví dvtp dliu có ni dung liên quan rt gần đến chuyên ngành hc.

10 đề tổng hợp

Embed Size (px)

Citation preview

Page 1: 10 đề tổng hợp

YÊU CẦU CHUNG

1. Mỗi nhóm SV nộp lại 1 file word qua địa chỉ email của cô:

[email protected], trước buổi báo cáo 3 ngày , và nộp 1 bản in

vào ngày báo cáo. Sau buổi báo cáo, cuốn đề tài chỉ để lưu trữ nên để tránh

lãng phí, các nhóm có thể in trên cả 2 mặt giấy A4, đóng bìa giấy, không

cần in màu, không đóng bìa mica. Sau khi nộp file lần đầu để không bị trừ

điểm thời hạn, SV vẫn có thể chỉnh sửa để hoàn thiện bài báo cáo và nộp lại

lần cuối ngay trước buổi báo cáo.

Ở trang bìa, SV cần lưu ý ghi đầy đủ danh sách SV, in đậm tên nhóm trưởng

(hoặc có đánh dấu), sắp xếp tên các thành viên theo thứ tự abc, đánh số thứ

tự trong danh sách các thành viên. ( Khicô nhập điểm mà thấy nhóm nào

trình bày bìa không đúng yêu cầu thì cô sẽ trừ bớt 0.5 đ của nhóm đó nhé).

2. SV thực hiện các bài tập trong Excel, sau đó mô tả các bước thực hiện (viết

gọn thôi), có copy hình ảnh các kết quả minh họa vào word.

3. Bài 1 không phải trình bày cơ sở lý thuyết. Các bài khác phải trình bày cơ

sở lý thuyết của bài (viết gọn). Một số bài khi thực hiện cần bổ sung giả

thiết thích hợp về số liệu mẫu.

Lưu ý đối với mỗi bài kiểm định, dựa vào kết quả sau khi thực hiện trên

Excel, SV cần trình bày lại theo đầy đủ các bước: Đặt các giả thiết kiểm

định; các miền bác bỏ tương ứng; các tiêu chuẩn kiểm định ( hoặc giá trị P);

và kết luận.

4. Điểm nội dung đề tài + nộp đúng hạn + trả lời đúng các câu hỏi liên quan

đến đề tài: 7 điểm.

5. Điểm thực hành : nhận dạng bài toán + thực hành bài cụ thể (tương tự các

bài trong 10 đề tài) + trả lời câu hỏi trực tiếp: 3 điểm.

Hình thức kiểm tra thực hành: Mỗi nhóm sẽ có từ 2-4 SV được gọi ngẫu

nhiên để kiểm tra thực hành. Mỗi SV sẽ bốc thăm 1 câu hỏi chứa một trong

các nội dung sau:

- Nhập trực tiếp vào Excel 1 mẫu định lượng bất kỳ, dùng chức năng Data

Analysic/ Descriptive Statistics để tìm các đặc trưng mẫu và giải thích

các số liệu thu được, vẽ đồ thị.

- Nhận dạng bài toán để chọn test phù hợp: t-test; z-test; F-test.

- Nhận dạng bài toán để chọn phân tích phương sai 1 yếu tố; 2 yếu tố;

- Kiểm định tính độc lập ( so sánh các tỷ lệ).

6. Thời hạn báo cáo: 2 tuần cuối cùng. Các nhóm sẽ đăng ký hoặc bốc thăm

thứ tự báo cáo vào tuần học cuối.

7. Điểm cộng cho các nhóm lấy ví dụ về tập dữ liệu có nội dung liên quan rất

gần đến chuyên ngành học.

Page 2: 10 đề tổng hợp

ĐỀ TÀI 1

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1) Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 91% (A).

4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Theo dõi doanh số bán hàng ( triệu đồng/ ngày) của một cửa hàng trong 12 ngày của

tháng 4 và 12 ngày của tháng 10, người ta thu được kết quả sau:

Ngày trong

tháng 1 3 5 6 8 10 13 17 20 24 27 30

Tháng 4 7,6 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5

Tháng 10 6,3 8,8 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7

Với mức ý nghĩa 3%, có thể cho rằng doanh số bán trung bình hàng ngày trong tháng 10

có giảm sút so với tháng 4 hay không? Tìm thêm giá trị P trong kiểm định.

Bài 3:

Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành:

Ngày khảo sát Các quận nội thành

Quận 1 Quận 2 Quận 3 Quận 4 Quận 5

Thứ hai 254 236 267 223 245

Thứ ba 245 212 256 213 234

Thứ tư 236 223 245 230 232

Thứ năm 235 197 243 213 224

Thứ 6 250 210 232 215 233

Thứ 7 247 196 223 207 242

Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu

tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5 %.

Bài 4:

Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn,

chúng ta có số liệu:

Kết cục Vật liệu 1 Vật liệu 2 Vật liệu 3

Vỡ vụn 25 45 41

Bị phá hủy một phần 40 35 33

Còn toàn vẹn 35 20 26

Page 3: 10 đề tổng hợp

Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi

nhiệt độ không? Sử dụng mức ý nghĩa 2%.

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 4: 10 đề tổng hợp

ĐỀ TÀI 2

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 92% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Ở một nhà máy sản suất thuốc lá, người ta kiểm tra hàm lượng nicotine trong 2 hiệu

thuốc lá sợi khác nhau và có được các kết quả như sau ( đơn vị: mg/100 g).

Hiệu A: 24; 26; 25; 27; 28; 25; 21 ; 22,5; 25; 27

Hiệu B: 27; 24; 25; 23; 26; 24.5; 26; 25.5; 27

Với mức ý nghĩa 4%, có thể coi như hàm lượng nicotine trong thuốc lá hiệu A là cao

hơn so với hiệu B hay không? Tìm thêm giá trị P trong kiểm định.

Bài 3:

Với mức ý nghĩa 1%, hãy so sánh doanh thu (triệu đồng/ngày) của một số ngành nghề ở

4 quận nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:

Ngành nghề

Kinh doanh

Quận

Q1 Q2 Q3 Q4

Điện lạnh 2,5 ; 2,7;

2,0 ; 3,0

3,1 ; 3,5;

2,7 ; 3,2

2,2 ; 2,0;

9,5 ; 2,1

11,2 ; 12,0;

19,8 ; 15,8

Vật liệu xây

dựng

0,6 ; 10,4;

11,2 ; 8,3

1,2 ; 1,0;

9,8 ; 1,8

3,3 ; 2,3;

6,7 ; 1,9

4,2 ; 1,0;

3,8 ; 2,5

Dịch vụ tin

học

4,2 ; 5,0;

6,2 ; 3,3

3,2 ; 2,0;

7,8 ; 2,5

0,4 ; 3,0;

9,8 ; 2,8

3,1 ; 1,0;

3,6 ; 3,9

Cơ khí 0,6 ; 10,4;

11,3 ; 8,2

1,2 ; 1,0;

9,8 ; 1,7

3,3 ; 2,3;

6,7 ; 1,8

4,2 ; 1,0;

3,8 ; 2,4

Bài 4:

Quan sát 400 người về màu tóc và màu mắt, người ta được bảng số liệu sau:

Hoàn cảnh GĐ

Tình trạng

Vàng Nâu Đen

Đen 12 65 121 Nâu 38 59 105

Với mức ý nghĩa 0,05, có thể cho rằng màu tóc và màu mắt không có liên quan gì với

nhau hay không?

Page 5: 10 đề tổng hợp

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 6: 10 đề tổng hợp

ĐỀ TÀI 3

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 93% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn

về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các

nhân viên được cử đi tập huấn.

Tên nhân

viên

Số lần phàn nàn của khách hàng

3 tháng trước tập huấn 3 tháng sau tập huấn

A 3 2

B 5 4

C 12 10

D 8 6

E 6 6

F 5 3

G 7 3

H 9 4

Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong

kiểm định.

Bài 3:

Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành, số liệu lấy ở một

đại lý bán lẻ:

Ngày khảo sát Các quận nội thành

Quận 1 Quận 2 Quận 3 Quận 4 Quận 5

Thứ hai 254; 232 236;245 267;258 223;224 245;247

Thứ ba 245;235 212;246 256;276 213;219 234;251

Thứ tư 236;255 223;264 245;275 230;244 232;254

Thứ năm 235;209 197;223 243;234 213;223 224;242

Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu

tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5%.

Page 7: 10 đề tổng hợp

Bài 4:

Khảo sát ngẫu nhiên 300 sinh viên đã tốt nghiệp cùng một chuyên ngành từ 3 trường A,

B và C sau một năm ra trường, người ta có kết quả:

Trường Đã đi làm Học tiếp Chưa có việc làm

A 60 12 28 B 55 10 35 C 65 6 29

Với mức ý nghĩa 3%, hãy cho biết có thể coi tình trạng việc làm của sinh viên 3 trường

trên là như nhau không?

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 8: 10 đề tổng hợp

ĐỀ TÀI 4

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 94% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Hàm lượng (%) của chất C trong cùng một loại sản phẩm của 2 công ty được công bố

xấp xỉ nhau. Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được chọn ngẫu

nhiên trên thị trường, người ta thu được số liệu sau: Sản phẩm của

công ty A 37 38 35 40 42

34 37 39

Sản phẩm của

công ty B 42 35 40 38 36

43 38 41

Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản phẩm của 2 công ty

với mức ý nghĩa 3%. Giả thiết hàm lượng này phân bố theo quy luật chuẩn.

Bài 3:

Nồng độ chì trong không khí đo được ở một số giao lộ trong thành phố được thể hiện

trong kết quả sau:

Địa điểm Nồng độ chì ( mg/m3)

I 0,42 0,53 0,62 0,71 0,83 0,61 0,51 0,32

II 0,70 0,32 0,64 0,44 0,53

III 0,39 0,37 0,43 0,45 0.41 0,52 0.42

IV 0,35 0,45 0,54 0,56 0,6 0,62

Có thể coi nồng độ chì trong không khí ở các giao lộ là giống nhau hay không, với mức ý

nghĩa 5%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.

Bài 4:

Một nông trường nuôi 3 giống bò sữa A,B,C. Lượng sữa của các con bò này được thể

hiện trong bảng theo dõi sau:

Loại bò Lượng sữa

Ít Trung bình Nhiều

A

B

C

92

53

75

37

15

19

46

19

12

Page 9: 10 đề tổng hợp

Với mức ý nghĩa = 0,05, hãy nhận định xem có phải 3 giống bò này thuần như nhau về

phương diện sản lượng sữa hay không?

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 10: 10 đề tổng hợp

ĐỀ TÀI 5

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 95% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Theo dõi doanh số bán hang trong mỗi ngày của 2 cửa hàng, người ta thu được kết quả

sau:

Cửa hàng

1 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5 6,2 7,4 7,5

Cửa hàng

2 8,8 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7 7,6

Với mức ý nghĩa 3%, có thể cho rằng doanh số bán hàng của 2 cửa hàng có sự phân tán

như nhau hay không? Giả thiết doanh số bán hàng mỗi ngày của các cửa hàng tuân theo

quy luật chuẩn.

Bài 3:

Đo mức độ bụi trong không khí tại các khu vực trong thành phố tại cùng một thời điểm,

người ta được số liệu sau, ( đơn vị mg/m3):

Số thứ tự

quan sát

Các khu vực

KV1 KV2 KV3 KV4

1 0,54 0,48 0,56 0,47

2 0,60 0,49 0,62 0,52

3 0,72 0,55 0,60 0,56

4 0,67 0,62 0,71 0,53

5 0,83 0,57 0,73

6 0,63 0,59

Mức độ nhiễm bụi của các khu vực trên có được coi là như nhau hay không? Hãy kết

luận bằng giá trị P. Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.

Page 11: 10 đề tổng hợp

Bài 4:

Bảng số liệu sau cho biết số người chết về bệnh ung thư ở 3 nước Mỹ, Nhật, Anh trong

thời gian khảo sát. Người chết được phân loại theo cơ quan bị ung thư.

Bộ phận bị ung

thư

Nước

Mỹ Nhật Anh

Ruột

Ngực

Dạ dày

Bộ phận khác

11

15

3

41

5

3

22

30

5

7

3

15

Với mức ý nghĩa = 1%, hãy so sánh phân bố tỉ lệ chết về ung thư của 3 nước nói

trên.

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 12: 10 đề tổng hợp

ĐỀ TÀI 6

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 96% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Người ta dùng 2 loại nguyên liệu A và B để sản xuất thử đế của 10 đôi giày trẻ em, các

đôi có trọng lượng ban đầu như nhau. Sau đó người ta cho cho các em đi thử trong vòng

6 tháng với cường độ sử dụng tương tự như nhau. Sau thử nghiệm, trọng lượng đế giày

còn lại được cho trong bảng sau:

Thứ tự Loại vật liệu Giày trái Giày phải

1 A 180 183

2 A 162 154

3 A 203 189

4 A 194 181

5 A 205 200

6 B 189 185

7 B 168 171

8 B 185 179

9 B 176 175

10 B 169 173

Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày bền hơn dùng

loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định.

Bài 3:

Doanh số bán hàng ( triệu đồng) của 4 cửa hàng trong 6 tuần đầu của mùa hè được cho

trong bảng số liệu:

Tuần Cửa hàng 1 Cửa hàng 2 Cửa hàng 3 Cửa hàng 4

1 1430 980 1780 2300

2 2200 1400 2890 2682

3 1140 1200 1500 2000

Page 13: 10 đề tổng hợp

4 880 1300 1470 1900

5 1670 1350 2380 1540

6 990 650 1930 1900

Hãy sử dụng mức ý nghĩa 5% để so sánh doanh thu của các cửa hàng có như nhau

không; và có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian hay không.

Bài 4:

Trong một thí nghiệm khoa học, người ta đo độ dày của lớp mạ kền khi dùng 3 loại bể

mạ khác nhau. Sau một thời gian mạ, người ta đo được độ dày của lớp mạ nhận được ở

các bể như sau:

Độ dày lớp mạ kền

(m)

Số lần đo ở bể mạ

A B C

4 - 8 32 51 68

8 - 12 123 108 80

12 - 16 10 26 26

16 - 20 41 24 28

20 - 24 19 20 28

Hãy kiểm định giả thiết độ dày lớp mạ kền sau khoảng thời gian nói trên không phụ

thuộc loại bể mạ được dùng, với mức ý nghĩa = 0,05.

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 14: 10 đề tổng hợp

ĐỀ TÀI 7

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 97% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Trong một hội thảo định hướng nghề nghiệp, một trung tâm đào tạo chọn ngẫu nhiên 36

học sinh để tham khảo ý kiến về mức độ yêu thích các ngành nghề của trung tâm trước

và sau khi học sinh tham dự hội thảo. Mức độ yêu thích được đo bằng thang đo khoảng

cách 10 điểm, trong đó 1 là hoàn toàn không thích và 10 là rất thích. Các phiếu trả lời

được thu về như sau:

Trước 3 4 5 7 8 5 6 4 3 9 3 6

Sau 5 5 6 5 8 8 5 6 7 9 4 5

Trước 1 2 4 7 6 4 5 5 4 3 7 6

Sau 4 6 7 8 7 5 3 7 8 9 7 8

Trước 5 6 7 8 2 3 6 4 3 4 3 1

Sau 7 8 5 7 6 5 7 7 5 5 7 2

Hãy dùng một kiểm định phù hợp để xem việc tham dự hội thảo có làm tăng sự yêu thích

của học sinh đối với các ngành nghề mà trung tâm đào tạo hay không, với mức ý nghĩa

2%? Tìm thêm giá trị P trong kiểm định.

Bài 3:

Với mức ý nghĩa = 2%, hãy so sánh thu nhập hàng tháng của người lao động trên cơ

sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau

sau đây, (đơn vị USD/ 1 người):

Loại ngành

nghề

Nơi làm việc

V1 V2 V3 V4

1

2

3

4

212

222

241

240

200

205

250

228

230

222

245

230

220

225

235

240

Bài 4:

Nghiên cứu sự ảnh hưởng của gia đình đối với tình trạng phạm tội của trẻ em tuổi vị

thành niên qua 148 em nhỏ, người ta thu được số liệu:

Page 15: 10 đề tổng hợp

Hoàn cảnh GĐ

Tình trạng

Bố hoặc mẹ

đã chết

Bố mẹ đã ly hôn Còn cả bố mẹ

Không phạm tội 20 25 13 Phạm tội 29 43 18

Với mức ý nghĩa 0,05, có thể coi hoàn cảnh gia đình của trẻ em độc lập với tình trạng

phạm tội của trẻ hay không?

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 16: 10 đề tổng hợp

ĐỀ TÀI 8

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 98% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Điểm đánh giá của 20 người dùng thử về 2 loại sản phẩm đậu phộng trước và sau cải

tiến được thu thập trên thang điểm 10 như sau:

Trước cải tiến 7 8 6 8 7 7 7 6 8 6

Sau cải tiến 8 9 5 9 5 6 8 7 8 7

Trước cải tiến 6 9 6 4 6 7 8 5 4 3

Sau cải tiến 8 8 8 7 6 7 7 6 7 6

Hãy cho biết hiệu quả của việc cải tiến sản phẩm với mức ý nghĩa 6%. Tìm thêm giá trị P

trong kiểm định.

Bài 3:

Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái mùa (khô và mưa:

trong mỗi mùa lấy mẫu ba lần - đầu. giữa và cuối) và từ ba miền (nam. trung và bắc)

được tóm tắt như sau:

Mùa

Thời điểm

Miền

Nam Trung Bắc

Mùa khô

Đầu mùa 2.4 2.1 3.2

Giữa mùa 2.3 2.2 3.2

Cuối mùa 2.5 2.3 3.4

Mùa mưa

Đầu mùa 2.4 2.2 3.3

Giữa mùa 2.5 2.1 3.5

Cuối mùa 2.7 2.3 3.4

Hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền? Nếu có thì hai yếu

tố mùa và miền có sự tương tác với nhau hay không? Sử dụng mức ý nghĩa 2%.

Bài 4:

Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4. Một kết quả kiểm tra các bệnh

nhân đau mắt hột được cho trong bảng sau:

Page 17: 10 đề tổng hợp

Địa

phương

Mức độ đau mắt hột

T1 T2 T3 T4

A 47 189 807 1768

B 53 746 1387 946

C 16 228 438 115

Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương

trên có giống nhau hay không, sử dụng mức ý nghĩa 1%.

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 18: 10 đề tổng hợp

ĐỀ TÀI 9

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 96% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Hai máy cùng gia công một loại chi tiết. Để kiểm tra xem 2 máy này có củng độ chính

xác như nhau hay không, người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết, đem đo và thu

được kết quả sau (đơn vị mm):

Máy A 137 138 135 140 138 137 139

Máy B 142 135 140 138 136 138 141

Có thể cho rằng 2 máy có độ chính xác như nhau hay không, với mức ý nghĩa 2%? Giả

thiết rằng kích thước chi tiết có phân phối chuẩn.

Bài 3:

Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình của 4 loại xe ô tô

là như nhau. Sau một thời gian chạy xe, người ta đo lại trên các quãng đường như nhau

thì được kết quả sau:

Loại xe Mức tiêu thụ nhiên liệu

I 20 21,2 18,7 19,5 20,1 22 21 21,7

II 21,2 21,2 20,4 19.6 22 21,1 20

III 21,5 21,2 21 21,5 22 20,7

IV 19,9 22 21 23 21,2 20,6 21,3

Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này còn giống nhau hay không, với mức

ý nghĩa 4%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.

Bài 4:

Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A,B,C,D,E. Người ta yêu cầu

những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang

sống. Kết quả được cho như sau:

Thành phố Mức độ thỏa mãn

Rất thỏa

mãn

Tương đối Không

A

B

220

130

121

207

63

75

Page 19: 10 đề tổng hợp

C

D

E

84

156

122

54

95

164

24

43

73

Với mức ý nghĩa = 3%, Hãy kiểm định xem mức độ thỏa mãn có phân bố giống nhau ở 5

thành phố trên hay không?

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.

Page 20: 10 đề tổng hợp

ĐỀ TÀI 10

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng

các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát

với độ tin cậy 96% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

Bài 2:

Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn.

Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2

ngày liên tiếp:

Ngày 1: 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,95 4

Ngày 2: 4,5 3,8 4,1 3,9 4,5 3,8 4 4,2 đơn vị: kg.

Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2

ngày hay không, với mức ý nghĩa 1%.

Bài 3:

Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với

các loại tín hiệu khác nhau. Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được

yêu cầu nhấn nút ngay khi nhận biết có tín hiệu. Đây là bảng số liệu ghi lại thời gian

(giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời.

Âm thanh Ánh sáng Xung

Nam

10,0

7,2

6,8

6,0

5,0

6,0

3,7

5,1

4,0

3,2

9,1

5,8

6,0

4,0

5,1

Nữ

10,5

8,8

9,2

8,1

13,4

6,6

4,9

2,5

4,2

1,8

7,3

6,1

5,2

2,5

3,9

Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợpvới cơ sở số liệu trên và

mức ý nghĩa = 5%; trình bày các kết luận thu được.

Page 21: 10 đề tổng hợp

Bài 4:

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người

đi làm bằng xe máy, xe đạp, xe buýt. Việc điều tra được tiến hành trên 2 nhóm và có kết

quả như sau:

Xe máy Buýt Xe đạp

Nữ 25 100 125

Nam 75 120 205

Với mức ý nghĩa = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các

phương tiện giao thông đi làm trong 2 nhóm người lao động nam và nữ hay không.

Bài 5:

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn. Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y.

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

3) Tìm hệ số xác định R2.

4) Tìm sai số chuẩn của ước lượng.