8
2/16/2019 1 LÝ THUYẾT MẪU 1 Chương 5 Phương pháp mẫu Tổng thể (population) Mẫu (Sample) Tham số (parameter) Thống kê (statistic) 2 Nội dung Trong lý thuyết mẫu hay thống kê suy diễn ta thường dùng các đặc trưng của mẫu (statistic) để ước tính các đặc trưng của tổng thể (parameter) Nếu ta lấy mẫu cỡ n từ tổng thể thì điều gì sẽ xảy ra? Trung bình mẫu sẽ có quy luật phân phối gì? Tỷ lệ mẫu có quy luật gì? Để ước tính trung bình tổng thể ta dùng đặc trưng nào của mẫu? Tương tự cho các tham số khác như tỷ lệ và phương sai? Phải hiểu rõ quy luật phân phối của mẫu (sampling distribution) 3 Tổng thể Mẫu TQ Mẫu cụ thể Kích thước N n n Trung bình Phương sai Độ lệch chuẩn Tỷ lệ A Tóm tắt tổng thể và mẫu 4 EX 2 V X V X p PA X 2 2 2 * ; ; S S S * ; ; SSS F x 2 2 2 * ; ; s s s * ;; sss f Các thuật ngữ Tham số (Parameters) là các đại lượng số đặc trưng của tổng thể. Đây là các giá trị cố định. Thống kê (Statistics) là các đại lượng đặc trưng của mẫu. Chúng biến đổi từ mẫu này sang mẫu khác và nhìn chung là các biến ngẫu nhiên. Ta cố gắng xác định quy luật phân phối xác suất của các biến ngẫu nhiên này. Từ đó tìm ra cách suy diễn cho tổng thể. Sai số chuẩn (Standard error) là độ lệch chuẩn của một thống kê mẫu Độ lệch chuẩn (Standard deviation) liên quan đến một mẫu 5 Phân phối của trung bình mẫu Một bể cá lớn từ trại cá giống đang được chuyển đến hồ. Ta muốn biết chiều dài trung bình của cá trong bể. Thay vì đo chiều dài của toàn bộ cá trong bể ta chọn ngẫu nhiên một mẫu và sử dụng trung bình mẫu để ước lượng cho trung bình tổng thể. Đặt trung bình mẫu là . Giá trị của là ngẫu nhiên do phụ thuộc vào mẫu được chọn ra. Trung bình mẫu được gọi là một thống kê. Trung bình của tổng thể là cố định, ta ký hiệu là μ. Phân phối của trung bình mẫu cũng là phân phối của biến ngẫu nhiên . Thông thường, phân phối của trung bình mẫu rất phức tạp ngoại trừ trường hợp cỡ mẫu rất nhỏ hoặc rất lớn. Phương pháp chọn mẫu là ngẫu nhiên, không hoàn lại. 6

LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

1

LÝ THUYẾT MẪU

1

Chương 5 Phương pháp mẫu

Tổng thể (population)

Mẫu (Sample)

Tham số (parameter)

Thống kê (statistic)

2

Nội dung

• Trong lý thuyết mẫu hay thống kê suy diễn tathường dùng các đặc trưng của mẫu (statistic) đểước tính các đặc trưng của tổng thể (parameter)

• Nếu ta lấy mẫu cỡ n từ tổng thể thì điều gì sẽ xảyra? Trung bình mẫu sẽ có quy luật phân phối gì? Tỷlệ mẫu có quy luật gì?

• Để ước tính trung bình tổng thể ta dùng đặc trưngnào của mẫu? Tương tự cho các tham số khác nhưtỷ lệ và phương sai?

• Phải hiểu rõ quy luật phân phối của mẫu(sampling distribution)

3

Tổng thể Mẫu TQ Mẫu cụ thể

Kíchthước

N n n

Trungbình

Phươngsai

Độ lệchchuẩn

Tỷ lệ A

Tóm tắt tổng thể và mẫu

4

E X

2 V X

V X

p P A

X

2 2

2 *; ;S S S

*; ;S S S

F

x

2 2

2 *; ;s s s

*; ;s s s

f

Các thuật ngữ

• Tham số (Parameters) là các đại lượng số đặc trưngcủa tổng thể. Đây là các giá trị cố định.

• Thống kê (Statistics) là các đại lượng đặc trưng củamẫu. Chúng biến đổi từ mẫu này sang mẫu khác vànhìn chung là các biến ngẫu nhiên. Ta cố gắng xác địnhquy luật phân phối xác suất của các biến ngẫu nhiênnày. Từ đó tìm ra cách suy diễn cho tổng thể.

• Sai số chuẩn (Standard error) là độ lệch chuẩn của mộtthống kê mẫu

• Độ lệch chuẩn (Standard deviation) liên quan đến mộtmẫu

5

Phân phối của trung bình mẫu

• Một bể cá lớn từ trại cá giống đang được chuyển đến hồ.Ta muốn biết chiều dài trung bình của cá trong bể. Thay vìđo chiều dài của toàn bộ cá trong bể ta chọn ngẫu nhiênmột mẫu và sử dụng trung bình mẫu để ước lượng chotrung bình tổng thể.

• Đặt trung bình mẫu là 𝑋. Giá trị của 𝑋 là ngẫu nhiên dophụ thuộc vào mẫu được chọn ra.

• Trung bình mẫu 𝑋 được gọi là một thống kê.• Trung bình của tổng thể là cố định, ta ký hiệu là μ.• Phân phối của trung bình mẫu cũng là phân phối của biến

ngẫu nhiên 𝑋.• Thông thường, phân phối của trung bình mẫu rất phức tạp

ngoại trừ trường hợp cỡ mẫu rất nhỏ hoặc rất lớn.• Phương pháp chọn mẫu là ngẫu nhiên, không hoàn lại.

6

Page 2: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

2

Ví dụ minh họa

• Tổng thể là trọng lượng của sáu quả bí ngô (kg) đượctrưng bày trong một gian hàng trò chơi "đoán trọnglượng" của hội chợ. Bạn được yêu cầu đoán trọnglượng trung bình của sáu quả bí ngô bằng cách lấy mộtmẫu ngẫu nhiên mà không hoàn lại từ tổng thể.

7

Quả bí A B C D E F

Trọng lượng (kg) 19 14 15 9 10 17

Trung bình tổng thể: μ=14 (kg)

Chọn mẫu cỡ n=2

Sample Weight 𝑋 Probability

A, B 19, 14 16.5 1/15

A, C 19, 15 17.0 1/15

A, D 19, 9 14.0 1/15

A, E 19, 10 14.5 1/15

A, F 19, 17 18.0 1/15

B, C 14, 15 14.5 1/15

B, D 14, 9 11.5 1/15

B, E 14, 10 12.0 1/15

B, F 14, 17 15.5 1/15

8

𝑋 9.5 11.5 12.0 12.5 13.0 13.5 14.0 14.5 15.5 16.0 16.5 17.0 18.0

P 1/15 1/15 2/15 1/15 1/15 1/15 1/15 2/15 1/15 1/15 1/15 1/15 1/15

Sample Weight 𝑋 Probability

C, D 15, 9 12.0 1/15

C, E 15, 10 12.5 1/15

C, F 15, 17 16.0 1/15

D, E 9, 10 9.5 1/15

D, F 9, 17 13.0 1/15

E, F 10, 17 13.5 1/15

Bảng phân phối xác suất của trung bình mẫu:

14 E X

Chọn mẫu cỡ n=5

Sample Weight 𝑋 Probability

A, B, C, D, E 19, 14, 15, 9, 10 13.4 1/6

A, B, C, D, F 19, 14, 15, 9, 17 14.8 1/6

A, B, C, E, F 19, 14, 15, 10, 17 15.0 1/6

A, B, D, E, F 19, 14, 9, 10, 17 13.8 1/6

A, C, D, E, F 19, 15, 9, 10, 17 14.0 1/6

B, C, D, E, F 14, 15, 9, 10, 17 13.0 1/6

9

𝑋 13.0 13.4 13.8 14.0 14.8 15.0

P 1/6 1/6 1/6 1/6 1/6 1/6

14 E X

Tổng hợp

• Nếu cỡ mẫu lớn thì?

• Cần chọn mẫu cỡ bao nhiêu?

• Trung bình mẫu có quy luật phân phói như thế nào?

• Xu hướng trung tâm của trung bình mẫu là?

• Mức độ biến động của trung bình mẫu so với xuhướng trung tâm?

10

Phân phối xác suất của thống kê mẫu

• Bị ảnh hưởng bởi:

Cỡ mẫu

Phân phối của tổng thể

Cách thức chọn mẫu

11

Tổng thể và tham số tổng thể

• Kích thước N, gồm các phần tử có cùng một dấuhiệu nghiên cứu X

• X: bnn gốc của tổng thể

• PPXS của X cũng là ppxs của tổng thể

• Các tham số tổng thể tham số đặc trưng củabnn X

12

2; ; E X V X p P X

Page 3: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

3

Mẫu ngẫu nhiên – tổng quát

• Định nghĩa. Tập hợp n biến ngẫu nhiên độc lập X1, X2,…, Xn thành lập từ biến ngẫu nhiên gốc X được gọi làmẫu ngẫu nhiên cỡ n (kích thước n)

• Ký hiệu: W=(X1, X2, …, Xn) trong đó Xi là các bnn

• Xi có cùng quy luật phân phối với X

• Một phép thử với mẫu ngẫu nhiên là một mẫu cụ thểgồm n quan sát. w=(x1,x2,…,xn)

13

2

i iE X E X V X V X

Các đặc trưng mẫu (statistic)

• Trung bình mẫu:

• Phương sai mẫu: Tỷ lệ mẫu:

14

𝑆 2 =1

𝑛 − 1

𝑖=1

𝑛

𝑋𝑖 − 𝑋 2

𝑆2

=1

𝑛

𝑖=1

𝑛

𝑋𝑖 − 𝑋 2

𝑆∗ 2 =1

𝑛

𝑖=1

𝑛

𝑋𝑖 − 𝜇 2

𝑋 =𝑋1 + 𝑋2+. . . +𝑋𝑁

𝑛

YF

n

Tính chất các thống kê mẫu

• Trung bình mẫu:

• Phương sai mẫu:

• Tỷ lệ mẫu:

15

2

E X V X Xn n

*2 2E S 2

21nE S

n

2 2E S

1

p p

E F p V Fn

Thực hành tính thống kê mẫu

Điều tra thời gian sử dụng internet trong tuần của 90sinh viên một trường ta được bảng số liệu sau:

Hãy tính các thống kê mẫu sau:

a) Trung bình mẫu, phương sai mẫu (đã hiệu chỉnh),phương sai mẫu chưa hiệu chỉnh?

b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5giờ một tuần?

16

Thời gian (giờ) 3 4 5 6 7 8

Số sv 7 8 17 24 20 14

Cách 1_Lập bảng

17

xi ni xini (xi)2ni

…. …. …. ….

…. …. …. ….

Tổngin i ix n 2

i ix n

i ix nx

n

2

2 2i ix n

s xn

22

1

ns s

n

in n

Cách 1_Lập bảng

18

xi ni xini (xi)2ni

3 7 21 63

4 8 32 128

5 17 85 425

6 24 144 864

7 20 140 980

8 14 112 896

Tổng 90 534 3356

Page 4: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

4

Cách 1_Lập bảng

• Cỡ mẫu:

• Trung bình mẫu:

• Phương sai mẫu chưa hiệu chỉnh:

• Phương sai mẫu đã hiệu chỉnh:

19

90in n

5345,9333

90

i ix nx

n

2

2 2

... 2,0844 i ix n

s xn

2

2 2,10781

ns s

n 2,1078 1,4518 s

Độ lệch mẫu đã hiệuchỉnh:

Cách 2__dùng máy tính 570ES

1. Shift + 9 + 3 + = + =: Reset máy

2. Shift + Mode + + 4 + 1: bật tần số (frequency on)

3. Mode + 3 + 1: vào tính thống kê 1 biến (stat1-var)

4. Khi này ta có bảng sau:

20

X FREQ

1

2

3

Cách 2__dùng máy tính 570ES

• Ta nhập vào như sau:

• Nhấn AC để thoát.

21

X FREQ

1 3 7

2 4 8

3 5 17

4 6 24

5 7 20

6 8 14

Cách 2_dùng máy tính 570ES

6. Lấy số liệu thống kê: Shift + 1 + 5 (4) Chọn Var

Ta có bảng sau:

Tương ứng:

1: cỡ mẫu 2: trung bình mẫu

3. Độ lệch chuẩn mẫu.

4. Độ lệch chuẩn mẫu hiệu chỉnh.

22

1: n 2:

3: x 4: sx

x

Khôngphải

phươngsai

Ví dụ 1

Lượng xăng hao phí của một ô tô đi từ A đến B sau 30 lần

chạy kết quả cho trong bảng.

23

Lượng xănghao phí

Số lần tươngứng

9,6 – 9,8 3

9,8 – 10 5

10 – 10,2 10

10,2 – 10,4 8

10,4 – 10,6 4

a) Tính trung bình mẫu

b) Tính độ lệch chuẩnmẫu

c) Tính độ lệch chuẩnmẫu hiệu chỉnh

Mô phỏng phân phối mẫu

• http://onlinestatbook.com/stat_sim/sampling_dist/index.html

• http://www.jbstatistics.com/sampling-distributions/

• https://newonlinecourses.science.psu.edu/stat414/node/132/

• https://shiny.rit.albany.edu/stat/

24

Page 5: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

5

Phân phối xác suất của thống kê mẫu

• A. Biến ngẫu nhiên gốc có phân phối chuẩn

• B. Biến ngẫu nhiên gốc có phân phối B(1,p)

• C. Hai tổng thể có phân phối chuẩn

• D. Hai tần suất của hai tổng thể

25

1. Tổng thể có phân phối chuẩn

• Cho tổng thể có phân phối chuẩn.

• Biến nn gốc X~N(µ; σ2)

• Ta có:

26

2

2 2

2 2

2 2

~ , ~ 0;1

~ 1

* 1~ ~ 1

X nX N N

n

X nt n

S

n S n SZ n Z n

2. Tổng thể có phân phối nhị thức

• Gọi p là tỷ lệ một tính chất A nào đó của tổng thể.

• Khi này ppxs của bnn gốc X là: B(1;p) hay A(p)

• Lấy mẫu nn cỡ n, gọi F là tỷ lệ mẫu.

• Ta có:

27

1~ ; ~ 0;1

1

p p F p nF N p N

n p p

3. Hai tổng thể có phân phối chuẩn

• Cho hai tổng thể và 2 bnn gốc:

• Ta tiến hành lấy 2 mẫu độc lập:

• Các thống kê mẫu tương ứng:

28

2 2~ ; ; ~ ;X X Y YX N Y N

1 2 1 2W , ,..., W , ,...,n mn X X X m Y Y Y

1 2 1 2

2 2

... ...n m

X Y

X X X Y Y YX Y

n m

S S

3. Hai tổng thể có phân phối chuẩn

• Ta có:

• Do đó:

29

2 2

2 2

~ ; ; ~ ;

~ ;

X YX Y

X YX Y

X N Y Nn m

X Y Nn m

2 2~ 0;1

X Y

X Y

X YN

n m

3. Hai tổng thể có phân phối chuẩn

• Nếu chưa biết 2 phương sai nhưng mẫu lớn m>30,n>30 thì:

30

2 20;1

X Y

X Y

X YZ N

S S

n m

Page 6: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

6

3. Hai tổng thể có pp Chuẩn, mẫu nhỏ

• Hai tổng thể có phân phối chuẩn

• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giảthuyết 2 phương sai bằng nhau (chưa biết) ta có:

• Với S2 là phương sai chung được ước lượng như sau

31

2 2~ t 2

X YX YZ n m

S S

n m

2 2

2 2

2 1 11 1

2 2

n m

i iX Yi i

x x y yn S m S

Sn m n m

3. Hai tổng thể có pp Chuẩn, mẫu nhỏ

• Hai tổng thể có phân phối chuẩn

• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giảthuyết 2 phương sai khác nhau (chưa biết) ta có:

• Trong đó:

32

2 2

X Y

X Y

X YZ t k

S S

n m

22 2

2 22 2

/ /

/ /

1 1

X Y

X Y

S n S mk

S n S m

n m

3. Hai tổng thể có phân phối chuẩn

• Cho hai tổng thể và 2 bnn gốc:

• Ta tiến hành lấy 2 mẫu cỡ n và cỡ m.

• Ta có:

33

2 2~ ; ; ~ ;X X Y YX N Y N

1 2 1 2W , ,..., W ,Y ,...,Yn mn X X X m Y

2 2

2 2

2 2

2

2 2 2

2 2 2

2

1 1~ 1 ~ 1

1/ 1

/~ 1; 1

1 // 1

X Y

X Y

X Y

X

X X X

Y Y Y

Y

n S m SZ n Z m

n Sn

SF n m

m S Sm

3. Hai tổng thể có phân phối chuẩn

• Cho hai tổng thể và 2 bnn gốc:

• Ta tiến hành lấy 2 mẫu cỡ n và cỡ m.

• Tương tự:

34

2 2~ ; ; ~ ;X X Y YX N Y N

1 2 1 2W , ,..., W ,Y ,...,Yn mn X X X m Y

*2 2

1 1

*2 2

2 2

/~ ;

/

SF n m

S

4. Hai tổng thể chưa biết ppxs, mẫu lớn

• Hai tổng thể có ppxs chưa biết

• Kích thước mẫu lớn m>30, n>30

• Đã biết hai phương sai

• Chưa biết hai phương sai:

35

2 20;1

X Y

X Y

X YZ N

n m

2 20;1

X Y

X Y

X YZ N

S S

n m

5. Hai tổng thể có phân phối B(n,p)

• Cho hai tổng thể có tỷ lệ lần lượt là p1; p2.

• Lấy mẫu cỡ n từ tổng thể 1, tần suất mẫu F1=k1/n

• Lấy mẫu cỡ m từ tổng thể 2, tỷ lệ mẫu F2=k2/m

• Với n, m đủ lớn ta có:

36

1 2 1 2

1 1 2 2

~ 0;11 1

F F p pZ N

p p p p

n m

Page 7: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

7

Tổng thể Mẫu TQ Mẫu cụ thể

Kíchthước

N n n

Trungbình

Phươngsai

Độ lệchchuẩn

Tỷ lệ A

Tóm tắt tổng thể và mẫu

37

E X

2 V X

V X

p P A

X

2 2

2 *; ;S S S

*; ;S S S

F

x

2 2

2 *; ;s s s

*; ;s s s

f

, tN

2

N

Tổng thể Mẫu TQ Mẫu cụ thể

Trungbình

Phươngsai

Tỷ lệ

PPXS đối với hai mẫu độc lập

38

;X Y

2 2;X Y

1 2;p p

;X Y

2 2;X YS S

1 2;F F

;x y

2 2

2 *; ;s s s

1 2;f f

, tN

F

N

Tổng hợp phân phối mẫu

• Một tổng thể

• Hai tổng thể

39

2 *2

2 2

1. ~ ??? 2. ~ ???

13. ~ ??? 4. ~ ??? 5. ~ ???

1

X n X n

S

F p n n S nS

p p

1 1 1 2 1 1 1 2

2 2 *2 21 2 1 2 1 1 1 1

2 2 *2 2

2 2 2 2

1. ~ ??? 2. ~ ?????? ???

/ /3. ~ ??? 4. ~ ??? 5. ~ ???

??? / /

X X X X

F F p p S S

S S

Ví dụ 1

• Giả sử bạn lấy mẫu 100 giá trị từ tổng thể có trungbình 500 và độ lệch chuẩn 80. Tính xác suất đểtrung bình mẫu nằm trong khoảng (490, 510)

40

Ví dụ 2

Một mẫu kích thước n được rút ra từ tổng thể phân phốichuẩn với trung bình là μ và độ lệch chuẩn 10. Hãy xácđịnh n sao cho:

41

) 10 10 0,9544

) 2 2 0,9544

a P X

b P X

Ví dụ 3

Trọng lượng một loại sản phẩm là biến ngẫu nhiên phânphối chuẩn với trung bình là 20,5 và độ lệch chuẩn 2.Lấy ngẫu nhiên 4 sản phẩm để kiểm tra thì với xác suất0,95 trọng lượng trung bình của chúng sai lệch so vớitrọng lượng qui định tối đa là bao nhiêu?

42

Page 8: LÝ THUYẾT MẪU - nguyenvantien0405.files.wordpress.com · LÝ THUYẾT MẪU 1 Chương5 Phươngpháp mẫu Tổngthể(population) Mẫu(Sample) Tham số(parameter) Thốngkê

2/16/2019

8

Ví dụ 4

• Chiều dài của một loại sản phẩm là bnn pp chuẩnvới trung bình 20 m và độ lệch chuẩn 0,2 m. Lấymột mẫu ngẫu nhiên 25 sp.

a) Cho biết ppxs của trung bình mẫu. Tính kỳ vọngvà phương sai của nó.

b) Xs để trung bình mẫu tối thiểu 30,06m

c) Tìm số k để tỷ số giữa phương sai mẫu hiệuchỉnh và phương sai tổng thể ít nhất bằng k cóxác suất bằng 0,1.

43

Ví dụ 5

• Giả sử X là năng suất lúa vùng A có pp chuẩn vớiphương sai bằng 3 (tạ/ha)2. Lấy một mẫu ngẫunhiên kích thước 100. Tính xác suất để:

44

100 2

1

270i

i

P X X