57
  131  CHƯƠ NG TÁM 8  PHÂN TÍCH VÀ DIN GII DỮ  LIU TRONG NGHIÊN CỨ U MARKETING NI DUNG CHÍNH  N i dung chươ ng này bàn đế n bao g m: - Thế nào là gi thuyết nghiên cu - Các loi sai lm khi thc hin kim định gi thuyết - Các bướ c gii quyết mt bài toán kim định - Các phươ ng pháp ki m định tham s - Các phươ ng pháp ki m định phi tham s 

Chuong Viii

Embed Size (px)

Citation preview

Page 1: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 1/57

 

  131

 

CHƯƠ NG TÁM 8 

PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆUTRONG NGHIÊN CỨ U MARKETING

NỘI DUNG CHÍNH

 N ội dung chươ ng này bàn đế n bao g ồm: 

- Thế nào là giả thuyết nghiên cứu

- Các loại sai lầm khi thực hiện kiểm định giả thuyết

- Các bướ c giải quyết một bài toán kiểm định

- Các phươ ng pháp kiểm định tham số 

- Các phươ ng pháp kiểm định phi tham số 

Page 2: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 2/57

 

MÔ HÌNH LỰ A CHỌN PHƯƠ NG PHÁP KIỂM ĐỊNH

Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau:

(1) Tính độc lậ p hay phụ thuộc của đại lượ ng ngẫu nhiên cần nghiên cứu.

(2) Dạng của qui luật phân phối xác suất của đại lượ ng ngẫu nhiên.

(3) Giá tr ị của tham số của qui luật phân phối xác suất đã biết dạng.(1) & (2) là giả thiết phi tham số và (3) là giả thiết về tham số.

Trong phần này sẽ giớ i thiệu phươ ng pháp kiểm định giả thiết về tham số như tham số trung bìnhx trong qui luật phân phối chuẩn N(µ,σ2), tham số tỷ lệ p trong qui luật phân phối A(P), tham số chi bình phươ ng, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giớ i thiệu cáchthức áp dụng những phươ ng pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiêncứu tiế p thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể tham khảo thêm trong các giáo trình chuyên môn về thống kê toán.

Các khái niệm cơ bản

Gi ả thi ế t cần ki ể m đị nhGiả sử đại lượ ng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biếtdạng, nhưng chưa biết giá tr ị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu đượ c, tacó thể giả định r ằng θ = θ0, trong đó θ0 là số thực. Tất nhiên điều giả định θ = θ0 này có thể đúnghoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là{H0: θ = θ0}.

Các gi ả thi ế t đố i ( đố i thi ế t)

Vì giả thiết H0 cũng có thể đúng và cũng có thể sai vớ i một độ tin cậy nào đó, khi giả thiết H0 saithì ta phải bác bỏ nó. Khi đó phải chấ p nhận một trong ba giả thiết đối (ký hiệu: H1) sau đây:

- Trong tr ườ ng hợ  p kiểm định dạng "hai đuôi" (Two-tail test):

⎩⎨⎧

≠=

01

00

 :H

:

θ θ 

θ θ  H  

- Trong tr ườ ng hợ  p kiểm định dạng "một đuôi" (One-tail test):

⎩⎨⎧

>=

01

00

: H

:

θ θ 

θ θ  H hoặc

⎩⎨⎧

<=

01

00

: H

:

θ θ 

θ θ  H 

Do vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H0, ta cần phát biểu kèm một giả thiết đối H1 để khẳng định r ằng nếu như giả thiết H0 bị bác bỏ thì ta chấ p nhận

giả thiết đối kèm theo vớ i một mức ý ngh ĩ a α nào đấy (1- α đượ c gọi là độ tin cậy).Các loại sai l ầm 

Chú ý r ằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn đượ c đềuchứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặ p phải hai loại sai lầm sau:

- Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng.

- Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai.

132

Page 3: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 3/57

 

Trong khi tiến hành kiểm định, ngườ i ta thườ ng ấn định tr ướ c một xác suất mức sai lầm loại 1. Nếu xác suất này bằng α, thì α đượ c gọi là mức ý ngh ĩ a của kiểm định (thông thườ ng α phải khá bé, α = 0,05, α = 0,1).

Giả thiết H0 đúng Giả thiết H0 sai

Chấp nhận Quyết định đúng Sai lầm loại 2 (xác suất β)

Bác bỏ  Sai lầm loại 1 (xác suất α) Quyết định đúng

Tiêu chuẩ n ki ể m đị nh và mi ề n bác bỏ 

Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý ngh ĩ aα, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Vớ i một mức ý ngh ĩ aα xác định, ta luôn tìm đượ c mọi miền Wα, thỏa mãn điều kiện ( ) α α  =∈

0 H W  K  P  (xác suất để 

K thuộc miền miền bác bỏ Wα vớ i điều kiện H0 đúng bằng α).

Do α khá bé, nên ta có thể coi biến cố (K ∈Wα) là biến cố không thể có (vớ i điều kiện giả thiết H0 đúng). Vì vậy, trong thực tế nếu dựa vào giá tr ị x của mẫu ngẫu nhiên X, ta tính đượ c giá tr ị k qs của thống kê K mà lại thấy giá tr ị k qs∈Wα, thì điều này sẽ mâu thuẫn vớ i điều kiện nói trên. Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết r ằng H0 đúng. Để tránhmâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα đượ c gọi là miền bác bỏ và k qs đượ c gọi là tiêuchuẩn kiểm định.

Chú ý:

- Khi giả thiết H0 đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá tr ị k qs∈Wα vớ i xác suấtxảy ra là α. Vì vậy trong tr ườ ng hợ  p k qs∈Wα mà ta bác bỏ giả thiết H0 thì ta có thể mắc sailầm loại 1, vớ i xác suất mắc sai lầm loại 1 chính là α.

-  Nếu ta ký hiệu ( ) β α  =∈ 1 H W k  P  qs thì β là xác suất bác bỏ một giả thiết sai. Do đó, xác suất

không bác bỏ một giả thiết sai ( ) β α  −=∈ 11

 H W  K  P  qs là xác suất mắc sai lầm loại 2 và β sẽ 

đượ c gọi là xác suất không mắc sai lầm loại 2, ngườ i ta gọi β là hiệu lực của kiểm định.

- Vớ i kích thướ c mẫu n xác định thì vớ i mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ Wα thỏamãn điều kiện: ( ) α α  =∈ 0 H W  K  P  qs .

 Nếu tồn tại một tiêu chuẩn kiểm định k qs vớ i miền bác bỏ Wα sao cho (1-β) là nhỏ nhất và β lớ nnhất. Khi đó k qs đượ c gọi là tiêu chuẩn kiểm định mạnh nhất. Một tiêu chuẩn đượ c coi là mạnhnhất thì nó đảm bảo 3 yêu cầu:

- Xác suất mắc sai lầm loại 1 là α qui định tr ướ c.

- Xác suất mắc sai lầm loại 2 là nhỏ nhất.

- Khi bác bỏ giả thiết H0 thì ta có thể thừa nhận giả thiết đối H1.

 Như vậy chúng ta có thể xác định miền bác bỏ và miền chấ p nhận trong các tr ườ ng hợ  p kiểmđịnh một đuôi và hai đuôi là:

- Trong kiểm định hai đuôi:

133

Page 4: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 4/57

 

  134

 

- Trong kiểm định một đuôi:

Các bướ c chung để gi ải bài toán ki ể m đị nh

Bướ c 1: Phát biểu giả thiết và đối thiết

⎨⎧

≠=

01

00

 : H

:

θ θ 

θ θ  H hoặc hoặc

⎨⎧

>=

01

00

: H

:

θ θ 

θ θ  H 

⎨⎧

<=

01

00

 : H

:

θ θ 

θ θ  H 

Bướ c 2: Xác định mức ý ngh ĩ a và xây dựng miền bác bỏ 

+ Mức ý ngh ĩ a α 

+ Miền bác bỏ (tùy thuộc vào phươ ng pháp kiểm định, loại phân phối và mức ý ngh ĩ a).

Bướ c 2: Lựa chọn phươ ng pháp kiểm định và loại phân phối của nó.

Bướ c 4: Tính giá tr ị quan sát của tiêu chuẩn kiểm định k qs 

Bướ c 5: So sánh vớ i miền bác bỏ để k ết luận:

Miền bác bỏ Miền chấ p nhận

W1-α

Miền bác bỏ  Miền chấ p nhận

-W1-α

Miền bác bỏ  Miền bác bỏ Miền chấ p nhận

W1-α/2

 

-W1-α/2

Page 5: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 5/57

 

-  Nếu k qs∈ Wα ta sẽ bác bỏ giả thiết H0 và thừa nhận giả thiết H1.

-  Nếu k qs∉ Wα : Ta k ết luận r ằng chưa có cơ sở  để thừa nhận giả thiết H1.

Có thể tóm tắt các bướ c để giải bài toán kiểm định theo sơ  đồ sau:

B1: Phát biểu giả thiết và đối thiết

B2: Xác định mứ c ý ngh ĩ a

B3: Lự a chọn phươ ng pháp kiểm định và loại phân phối của nó

B4: Tính giá trị kiểm định (giá trị quan sát) k qs

B5: Tìm miền bác bỏ và k ết luận

CÁC PHƯƠ NG PHÁP KIỂM ĐỊNH THAM SỐ 

Kiểm định giả thiết về tham số trung bình µ của tổng thể 

Điều kiện: Biến định lượ ng và phân phối của biến phải tuân theo quy luật phân phối chuẩn. 

Tr ườ ng hợ  p đ ã bi ế t phươ ng sai ( σ2 ) hoặc độ l ệ ch chuẩ n của t ổ ng thể  

Đối vớ i tr ườ ng hợ  p kiểm định giả thiết về tham số trung bình của tổng thể, chúng ta có thể thựchiện thông qua các bướ c sau:

B1: Phát biểu giả thiết và đối thiết:

Đối xứng Phải Trái

Giả thiết H0: µ = µ0 H0: µ ≤µ0 H0: µ ≥ µ0

Đối thiết H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0

B2: Xác định mức ý ngh ĩ a α 

B3: Xác định phươ ng pháp kiểm định: Phươ ng pháp kiểm định tham số trung bình vớ i σ đã biết.

B 4: Tính tiêu chuẩn kiểm định

( )σ 

µ  n x

U  K qs

0−

=≡ , trong đó x là trung bình mẫu.

Bướ c 3: Xác định miền bác bỏ 

Miền bác bỏ Wα là tậ p hợ  p những điểm thoả mãn điều kiện:

( )⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −== −α α 

σ 

µ 1

0 ,U n x

U W   

hay2

1α 

−≥ U U  kiểm định đối xứng - bác bỏ H0, chấ p nhận H1 vớ i µ ≠ µ0.

135

Page 6: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 6/57

 

α −≥ 1U U  kiểm định phía phải - bác bỏ H0, chấ p nhận H1 vớ i µ > µ0.

kiểm định phía phải - bác bỏ Hα −−≤ 1U U  0, chấ p nhận H1 vớ i µ < µ0.

Chúng ta so sánh k qs vớ i Wα để đưa ra k ết luận

Để tiện cho việc theo dõi, có thể tóm lượ c những bướ c của bài toán kiểm định tham số trung bình

ở trên như bảng sau:

KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ (khi σ  đ ã biế t)

1. Giả thiết và đối thiết:

 Đố i xứ ng Phải Trái

Giả thiế t  H0: µ = µ0 H0: µ ≤ µ0 H0: µ ≥ µ0

 Đố i thiế t  H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0 2. Xác định mức ý ngh ĩ a

3. Phươ ng pháp kiểm nghiệm: Tham số trung bình tổng thể 4. Tiểu chuẩn kiểm định:

(khi chưa biết σ thay bằng s’)

5. Điểm tớ i hạn và miền bác bỏ:

Đối xứng Phải Trái

 Điể m t ớ i hạn - U1-α/2 và U1-α/2 U1-α - U1-α

Miề n bác bỏ  U<- U1-α/2 và U>U1-α/2 U>U1-α U<-U1-α

 Biể u hiện quahình vẽ  

BB CN BB

-U1-α/2 U1-α/2

BB

-U1-α

BB

U1-α

σ 

µ  n xU k qs

)( 0−=≡  

  Ví d ụ: Tr ọng l ượ ng một loại sản phẩ m do nhà máy sản xuấ t là đại l ượ ng ng ẫ u nhiên tuân theoqui luật phân phố i chuẩ n, có tr ọng l ượ ng qui định là 20kg và độ l ệch chuẩ n là 2kg. Có ý kiế n chor ằ ng: Do thiế t bị hoạt động không ổ n định nên tr ọng l ượ ng sản phẩ m đ ã thay đổ i, ng ườ i ta tiế nhành kiể m tra 100 sản phẩ m và đ o đượ c tr ọng l ượ ng trung bình là 20,35kg. V ớ i mứ c ý nghĩ a α =0,05. Hãy k ế t luận xem tr ọng l ượ ng của sản phẩ m đ ã thay đổ i chư a? Cho biế t U 0,975=1,96.

Giải: Gọi X là tr ọng l ượ ng sản phẩ m do nhà máy sản xuấ t. Theo giả thiế t X là đại l ượ ng ng ẫ unhiên tuân theo qui luật phân phố i chuẩ n, trong đ ó σ = 2(kg), M(X) = 20(kg).

Ta có bài toán kiể m định giả thiế t về giá tr ị tham số  µ của qui luật phân phố i chuẩ n.

 B1. Phát biể u giả thiế t:

 H 0 : µ = µ 0= 20(kg)

 H 1: µ  ≠  µ 0

 B2. M ứ c ý nghĩ a α =0,05

136

 B3. Phươ ng pháp kiể m định:  Đây là bài toán kiể m định tham số trung bình vớ i độ l ệch chuẩ n σ  đ ã biế t.

Page 7: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 7/57

 

 B4. Xác định tiêu chuẩ n kiể m định: Tiêu chuẩ n kiể m định đượ c chọn là:

( ) ( )75,1

2

5,3

2

1002035,200 ==−−

=≡σ 

µ  n xU k qs  

 B5. Xác định miề n bác bỏ và k ế t luận:

V ớ i mứ c ý nghĩ a α = 0,05, miề n bác bỏ t ươ ng ứ ng trong tr ườ ng hợ  p này có d ạng:

( )⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

==≥−

==−

96,1, 975,0

21

0 U U U n x

U W  α α σ 

µ  

Minh họa bằ ng hình vẽ :

 

1,75

Miền bác bỏ

1,96

Miền bác bỏ

 

 K ế t luận: Vì k qs∉ W α  nên chư a có cơ  sở  để  bác bỏ giả thiế t H 0 , t ứ c là ý kiế n cho r ằ ng tr ọng l ượ ng trung bình của sản phẩ m bị thay đổ i là chư a có cơ sở . 

Tr ườ ng hợ  p chư a bi ế t phươ ng sai ( σ2 ):

Đối vớ i tr ườ ng hợ  p chưa biết phươ ng sai tổng thể, cần phải xem xét hai tr ườ ng hợ  p sau:

a. Tr ườ ng hợ  p mẫ u nhỏ n<30

Trong tr ườ ng hợ  p chưa biết phươ ng sai, các giả thiết và đối thiết cũng giống như tr ườ ng hợ  p đã biết phươ ng sai. Tuy nhiên, để tính toán giá tr ị kiểm định, cần phải tìm độ lệch chuẩn điều chỉnh(s’) của mẫu để tiến hành phân tích. Vì mẫu khá nhỏ (n<30), có thể giả định hàm phân phối tuântheo hàm T-student. Khi đó, tiêu chuẩn kiểm định đượ c chọn là:

( )'0

 sn xT k qs

µ −=≡  

Vớ i x là trung bình mẫu và s’ là độ chênh lệch chuẩn điều chỉnh của mẫu.

Vớ i mức ý ngh ĩ a α, miền bác bỏ:

( ) ( )

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧ −

== −1'0 , nT 

 s

n xT W  α α 

µ  

Khi đó:( )1

2

n

T T  α  hoặc P(⏐T⏐)<α 

bác bỏ H0, chấ p nhận H1 (hay µ ≠ µ0).

( )1−≥ nT T  α  hoặc P(T)<2α  bác bỏ H0, chấ p nhận H1 (hay µ > µ0).

( )1−−≤ nT T  α  hoặc P(T)<2α  bác bỏ H0, chấ p nhận H1 (hay µ < µ0).

  Ví d ụ : M ột nhà sản xuấ t một loại bóng đ èn cho biế t tuổ i thọ trung bình thấ  p nhấ t của cácbóng đ èn là 150 giờ . Kiể m tra một cách ng ẫ u nhiên 25 bóng đ èn, ng ườ i ta đ o đượ c tuổ i thọ trung bình của chúng là 145 giờ . V ớ i độ tin cậ y 99%, có thể k ế t luận gì về l ờ i tuyên bố trên. Cho biế t,

137

Page 8: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 8/57

 

độ l ệch chuẩ n hiệu chỉ nh mẫ u là 6 giờ và tuổ i thọ trung bình của loại bóng đ èn trên là đại l ượ ng ng ẫ u nhiên phân phố i chuẩ n.

Giải:

Gọi µ là tuổ i thọ trung bình của loại bóng đ èn trên, theo giả thiế t µ là đại l ượ ng ng ẫ u nhiên phân phố i chuẩ n. Ta có bài toán kiể m định giả thiế t tham số  µ vớ i n ≤  30.

 B1. Phát biể u giả thiế t:

 H 0 : µ  ≥  µ 0 = 150

 H 1 : µ <µ 0 

 B2. Xác định mứ c ý nghĩ a α =0,05

  B3. Phươ ng pháp kiể m định:  Đây là tr ườ ng hợ   p kiể m định một  đ uôi bên trái vớ i mẫ u nhỏ , σ  chư a biế t.

 B4. Tính tiêu chuẩ n kiể m định:

Tiêu chuẩ n kiể m định là :

167,46

25)150145()('

−=−

=−

=≡ s

n xT k qs

µ 

V ớ i mứ c ý nghĩ a α = 0,01, miề n bác bỏ:

( ) ( )

⎭⎬⎫

⎩⎨⎧

−=−=−<′

µ−== −

αα 49,2TT,S

nXTW T

)24(

01,0

1n0  

Minh họa bằ ng hình vẽ  

Miền bác bỏ 

-2,49-4,167 

 K ế t luận: Vì k qs∈ W α  nên chúng ta bác bỏ giả thiế t H 0 và chấ  p nhận đố i thuyế t H 1 , nghĩ a là l ờ ituyên bố r ằ ng tuổ i thọ trung bình của loại bóng đ èn trên thấ  p nhấ t là 150 giờ là sai.

b. Tr ườ ng hợ  p mẫ u nhỏ n≥ 30 

 Nếu kích thướ c mẫu n ≥ 30, khi đó giá tr ị ( )1n

2

T −α sẽ tiến đến giá tr ị Uα/2, khi đó tiêu chuẩn kiểm

định trong tr ườ ng hợ  p này là:( )

'

0

 s

n xU k qs

µ −=≡  

  Ví d ụ: Công ty thiế t bị viễ n thông ATC đ ã tiế n hành một cuộc nghiên cứ u để tìm hiể u mứ c độ 

hài lòng của khách hàng sau khi thay đổ i, cải tiế n một số d ịch vụ nhằ m nâng cao khả nă ng đ ápứ ng yêu cầu khách hàng của họ. Tr ướ c khi cải tiế n các d ịch vụ , mứ c độ hài lòng của khách hàng trung bình là 75 (theo thang đ iể m t ừ 0 đế n 100). Chọn ng ẫ u nhiên 350 khách hàng để tham khảo ý kiế n của họ sau khi các d ịch vụ đượ c cải tiế n, mứ c độ hài lòng trung bình tính đượ c là 82 vớ iđộ l ệch đ iề u chỉ nh mẫ u là 8. V ớ i độ tin cậ y 95%, có thể k ế t luận r ằ ng khách hàng đ ã đượ c hàilòng ở mứ c độ cao hơ n không?

Giải:

 B1. Phát biể u giả thiế t và đố i thiế t:

138

Page 9: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 9/57

 

Vì công ty quan tâm đế n việc cải tiế n các d ịch vụ của công ty thiế t bị viễ n thông có làm thỏa mãnkhách hàng ở mứ c độ cao hơ n so vớ i tr ướ c hay không. Do đ ó ta đặ t giải thiế t:

 H 0: µ  ≤  µ 0 = 75

 H 1: µ >µ 0 = 75

 B2. Chọn mứ c ý nghĩ a α =0,05 B3. Xác định phươ ng pháp kiể m đ inh: Đây là bài toán kiể m định tham số trung bình, σ chư a biế t,mẫ u l ớ n hơ n 30

 B4. Tính giá tr ị kiể m định

( )2363,6

8

350)7582(,

0 =−

=−

=≡ s

n xU k qs

µ   

 B4. Tính giá tr ị kiể m định

V ớ i mứ c ý nghĩ a α = 0,05 và đ ây là bài toán kiể m định một đ uôi nên miề n bác bỏ t ươ ng ứ ng trong tr ườ ng hợ  p này có d ạng:

( )⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

==>−

== − 645,1, 95,01'

0 U U U  s

n xU W  α α 

µ   

V ớ i mứ c ý nghĩ a 5%,vì U 1-α =1,645

 

1,645 6,2363

Miền bác bỏ 

 K ế t luận: Vì k qs∈ W α  nên giả thiế t H 0 bị bác bỏ  , ta k ế t luận r ằ ng vớ i việc cải tiế n các d ịch vụ ,công ty thiế t bị viễ n thông ATC đ ã làm cho thỏa mãn khách hàng ở mứ c độ cao hơ n tr ướ c 

Kiểm định giả thiết tham số tỷ lệ 

Trong một số tr ườ ng hợ  p, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại

A (loại phần tử mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi f n là tỷ lệ của phần tử loại

A có trong mẫu và P0 là một tỷ lệ đã đượ c xác định tr ướ c. Quy trình kiểm định như sau:

B1. Phát biểu giả thiết và đối thiết

Đối xứng Phải Trái

Giả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0

Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0

B2. Lựa chọn mức ý ngh ĩ a α=0,05

B3. Phươ ng pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể.

B4. Tính giá tr ị kiểm định:

( )

( )00

0

1  P  P 

n P  f U k  n

qs−

−=≡  

B5. Miền bác bỏ và k ết luận:

139

Page 10: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 10/57

 

Vớ i α cho tr ướ c, ta có miền bác bỏ Wα là:

( )

( ) ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

−== −α α  1

00

0 ;1

U  P  P 

n P  f U W  n  

Khi đó: kiểm định phía phải - bác bỏ Hα −≥ 1U U  0 và chấ p nhậ p H1 (hay P > P0).

α −−≤ 1U U  kiểm định phía trái - bác bỏ H0 và chấ p nhận H1 (hay P < P0).

21α 

−≥ U U  kiểm định đối xứng – bác bỏ H0 và chấ p nhận H1 (hay P ≠ P0).

Chúng ta so sánh k qs vớ i Wα để đưa ra k ết luận

Các bướ c của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể đượ c thể hiệntrong bảng sau:

KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ 1. Giả thiết và đối thiết:

Đối xứng Phải TráiGiả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0

Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0

2. Xác định mức ý ngh ĩ a3. Phươ ng pháp kiểm nghiệm tham số tỷ lệ tổng thể 4. Tiểu chuẩn kiểm định:

5. Điểm tớ i hạn và miền bác bỏ:Đối xứng Phải Trái

Điểm tớ i hạn - U1-α/2 và U1-α/2 U1-α - U1-αMiền bác bỏ  P<- U1-α/2 và P>U1-α/2 P>U1-α P<-U1-α

Mô hình

 

BB CN BB

-U1-α/2 U1-α/2

BB

-U1-α

BB

U1-α

)1(

)(

00

0

 P  P 

n P  f  P  n

−−

=

 Ví d ụ: Giả sử một sản phẩ m của công ty sản xuấ t vỏ xe ô tô đ ã chiế m đượ c 42% thị tr ườ ng. Hiện t ại, tr ướ c sự cạnh tranh của đố i thủ và nhữ ng đ iề u kiện thay d ổ i của môi tr ườ ng, ban lãnhđạo công ty muố n kiể m tra l ại xem thị phần của công ty có còn là 42% hay không. Chọn ng ẫ unhiên 550 ô tô trên đườ ng, k ế t quả cho thấ  y 219 xe sử d ụng vỏ xe của công ty. Có k ế t luận gì ở  mứ c ý nghĩ a 5%.

Giải: Tr ườ ng hợ  p này ta chỉ quan tâm đế n thị phần của công ty có còn là 42% hay không. Khiđ ó:

 B1. Phát biể u giả thiế t và đố i thiế t:

 H o: P = P 0 = 0,42

 H 1: P ≠ P 0 = 0,42

 B2. Chọn mứ c ý nghĩ a α =0,01

 B3. Chọn phươ ng pháp kiể m định: Phươ ng pháp đ iể m định đố i xứ ng tham số t ỉ l ệ trong t ổ ng thể .140

Page 11: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 11/57

 

 B4. Tính tiêu chuẩ n kiể m định

037,1)42,01(42,0

550)42,0550

219(

)P1(P

n)Pf (Pk

00

0nqs −=

−=

−−

=≡

V ớ i mứ c ý nghĩ a 5%, ta có thể xác định miề n bác bỏ như sau:( )

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

==>−

−==

−96,1,

)1(975,0

21

00

0 U U U  P  P 

n P  f U W  n

α α  

Thể hiện qua hình vẽ  

141

  Miền bác bỏ 

-1,96-1,037

Miền bác bỏ 

-1,96

Vì kqs∈ W α nên chúng ta bác bỏ giả thiế t H0 và chấ  p nhậ p H1 có nghĩ a thị phần của công ty

đ ã thay đổ i so vớ i 42%.

Kiểm định sự khác nhau giữ a trung bình của hai tổng thể 

Điều kiện ứng dụng: Hai biến nghiên cứu (đại diện đo lườ ng hai mẫu) phải là biến định lượ ng,

tuân theo quy luật phân phối chuẩn và phươ ng sai bằng nhau.

 Ki ể m đị nh tham số trung bình d ự a trên hai bi ế n (mẫ u) độc l ậ p

a.Tr ườ ng hợ  p đ ã biế t phươ ng sai σ 2

của các mẫ u

Điều kiện để thực hiện phươ ng pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên

mẫu ngẫu nhiên độc lậ p) là dữ liệu mẫu phải theo luật phân phối chuẩn.

B1. Giả thiết và đối thiết:

Đối xứng Phải Trái

Giả thiết H0: µx - µy = D0 H0: µx - µy  ≤ D0 H0: µx - µy  ≥ D0

Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Chọn mức ý ngh ĩ a α 

B3. Xác định phươ ng pháp kiểm định : Phươ ng pháp kiểm định sự khác biệt tham số trung bình

giữa hai mẫu (độc lậ p) – Phân phối chuẩn.

B4. Xác định tiêu chuẩn kiểm định :

 y

 y

 x

 x

qs

nn

 D y xU k 

22

0

σ σ +

−−=≡  

B5. Miền bác bỏ và k ết luận: Miền bác bỏ vớ i α cho tr ướ c :

Page 12: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 12/57

 

 Nếu H1 đúng tức µx - µy > D0, khi đó Wα: α 

σ σ −>

+

−−= 1

22

0 U 

nn

 D y xU 

 y

 y

 x

 x

 

 Nếu H1 đúng tức µx - µy < D0, khi đó Wα:α 

σ σ −−<

+

−−

= 122

0

nn

 D y x

 y

 y

 x

 x

 

 Nếu H1 đúng tức µx - µy < D0, khi đó Wα :2

122

0α 

σ σ −

+

−−= U 

nn

 D y xU 

 y

 y

 x

 x

 

Tính hệ số quan sát, so sánh vớ i miền bác bỏ và k ết luận.

  Ví d ụ: Ng ườ i ta tiế n hành nghiên cứ u về thờ i gian sử d ụng trung bình của hai nhãn hiệu pin X và Y (cùng chủng loại) của hai nhà sản xuấ t khác nhau. Chọn ng ẫ u nhiên mỗ i nhãn hiệu 100 viên

 pin k ế t quả ghi nhận đượ c như sau: Pin X có thờ i gian sử d ụng trung bình là 308 phút, độ l ệchchuẩ n 84 phút, các chỉ số t ươ ng t ứ ng của pin Y l ần l ượ t là 254 phút và 67 phút. V ớ i mứ c ý nghĩ aα = 0,10 ,có thể k ế t luận thờ i gian sử d ụng trung bình của pin X l ớ n hơ n pin Y ít nhấ t là 45 phút đượ c không ? Biế t thờ i gian sử d ụng trung bình của hai nhãn hiệu pin trên là các đại l ượ ng ng ẫ unhiên phân phố i chuẩ n.

Giải: Áp d ụng phươ ng pháp kiể m định sự khác biệt giữ a hai trung bình t ổ ng thể theo luật phân phố i chuẩ n (chư a biế t σ và n x , n y <30).

Gọi thờ i gian sử d ụng trung bình của pin X và Y l ần l ượ t là µ  x ,µ  y; khi đ ó µ  x ,µ  y là các đại l ượ ng ng ẫ u nhiên phân phố i chuẩ n. Theo đề  bài, chúng ta cần quan tâm đế n việc thờ i gian sử  d ụng trung bình của pin X có l ớ n hơ n pin Y ít nhấ t là 45 phút hay không. Do vậ y, B1. Giả thiế t và đố i

thiế t:

 H 0: µ  x - µ  y  ≤  45

 H 1: µ  x - µ  y > 45

 B2. Chọn mứ c ý nghĩ a α =0.1

 B3. Phươ ng pháp kiể m định : Phươ ng pháp kiể m định sự khác biệt giữ a hai tham số  trung bìnhkhi σ  đ a biế t 

 B4. Tiêu chuẩ n kiể m định :

838,0

100

67

100

84

452543082222

0

=+

−−

=+

−−

=

 y

 y

 x

 x

qs

nn

 D y x

k  σ σ 

 B5. Miề n bác bỏ vớ i α =0,05 cho tr ướ c :

Ta có W α  : 28,190,0122

0 ==>

+

−−= − U U 

nn

 D y xU 

 y

 y

 x

 x

α 

σ σ 

 

142

Page 13: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 13/57

 

Minh họa bằ ng vẽ :

 K ế t luận: vì k qs ∉ W α  nên ta chư a thể bác bỏ H 0 và chấ  p nhận H 1 , t ứ c là chư a có cơ sở  để k ế t 

luận thờ i gian sử d ụng trung bình của pin X có l ớ n hơ n pin Y ít nhấ t là 45 phút.b.Tr ườ ng hợ  p chư a biế t σ 2:

• Tr ườ ng hợ  p kích thướ c mẫu lớ n (nx, ny ≥30):

Tr ườ ng hợ  p kích thướ c mẫu lớ n (nx, ny ≥30) vớ i giả định cả hai tổng thể X và Y phân phối chuẩn,ta có thể dùng công thức và quy tắc trên để kiểm định và vớ i phươ ng sai hiệu chỉnh mẫu s’2

x, s’2y 

thay cho phươ ng sai tổng thể k ể cả tr ườ ng hợ  p phân phối tổng thể không chuẩn.

• Tr ườ ng hợ  p kích thướ c mẫu nhỏ (nx<30; ny< 30):

Phươ ng pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên mẫu ngẫu nhiên độc

lậ p) theo luật phân phối Student (chưa biết σ):

143

 

Trong tr ườ ng hợ  p mẫu nhỏ (hoặc nx, hoặc ny <30, hoặc cả nx, ny <30). Chúng ta vẫn dùng s’2x và

s’2y thay cho phươ ng sai tổng thể.

nhưng khi đó tiêu chuẩn kiểm định sẽ theo phân phối Student vớ i số bậc tự do đượ c xác định theocông thức:

Miền bác bỏ 

 

1

)(

1

)(

)(

22'

22'

22'2'

−+

+

=

 y

 y

 y

 x

 x

 x

 y

 y

 x

 x

nn

 s

nn

 s

n

 s

n

 s

btd 

1,280,838

B1. Giả thiết và đối thiết:

Đối xứng Phải Trái

Giả thiết H0: µx - µy = D0 H0: µx - µy  ≤ D0 H0: µx - µy  ≥ D0

Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Chọn mức ý ngh ĩ a α 

B3. Xác định phươ ng pháp kiểm định : Phươ ng pháp kiểm định sự khác biệt tham số trung bìnhgiữa hai mẫu (độc lậ p).

B4. Tiêu chuẩn kiểm định :

 y

 y

 x

 x

n

 s

n

 s

 D y xT  K 

2'2'

0

+

−−=≡  

B5. Miền bác bỏ vớ i α cho tr ướ c:

Page 14: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 14/57

 

 

 Nếu H1 đúng tức µx - µy > D0, khi đó Wα:T 

 s s

btd 

 y

 y

 x

 x

nn

 D y xT 

α >

+

−−=

2,2,

0

 

 Nếu H1 đúng tức µx - µy < D0, khi đó Wα: btd 

 y

 y

 x

 x

n

 s

n

 s

 D y xT  α −<

+

−−=

2'2'

0  

 Nếu H1 đúng tức µx - µy ≠ D0, khi đó Wα:btd 

 y

 y

 x

 x

n

 s

n

 s

 D y xT 

22'2'

0α −<

+

−−=

 

Tính hệ số quan sát, so sánh vớ i Wα và k ết luận .

  Ví d ụ: Kiể m tra chiề u dài trung bình của một chi tiế t đượ c chế t ạo t ừ hai thiế t bị khác nhau

một cách ng ẫ u nhiên, ta có : mẫ u ng ẫ u nhiên 15 chi tiế t của thiế t bị thứ nhấ t có chiề u dài trung bình là 100 cm và độ l ệch chuẩ n hiệu chỉ nh là 5 cm ; mẫ u ng ẫ u nhiên 10 chi tiế t của thiế t bị thứ  hai có chiề u daì trung bình là 110 cm và độ l ệch chuẩ n hiệu chỉ nh là 3cm. V ớ i mứ c ý nghĩ a α =0,05, hãy k ế t luận xem kích thướ c trung bình của chi tiế t trên đượ c chế t ạo ở hai thiế t bị trên cónhư nhau hay không. Biế t chiề u dài trung bình của chi tiế t trên là đại l ượ ng ng ẫ u nhiên phân phố i chuẩ n.

Giải: Áp d ụng phươ ng pháp kiể m định sự khác biệt giữ a hai trung bình t ổ ng thể theo luật phân phố i chuẩ n (chư a biế t σ và n x , n y <30).

Gọi chiề u dài trung bình của chi tiế t đượ c chế t ạo trên hai thiế t bị l ần l ượ t là µ  x ,µ  y vớ i µ  x , µ  y làcác đại l ượ ng ng ẫ u nhiên phân phố i chuẩ n. Theo đề bài, chúng ta cần phải kiể m tra xem kích

thướ c của chi tiế t đượ c chế t ạo trên hai thiế t bị có như nhau hay không. B1. Giả thiế t và đố i thiế t:

H0: µx - µy = 0

H1: µx - µy  ≠ 0

 B2. Chọn mứ c ý nghĩ a α  

 B3. Xác định phươ ng pháp kiể m định: Phươ ng pháp kiể m định sự khác biệt tham số  trung bình giữ a hai mẫ u ( độc l ậ p), σ chư a biế t.

 B4. Tiêu chuẩ n kiể m định:

074,222025,0

22'2'

0 ==≥

+

−−= T T 

n

 s

n

 s

 D y xT  btd 

 y

 y

 x

 x

α 

 

Trong đ ó bậc t ự do đượ c xác định theo công thứ c :

144

Page 15: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 15/57

 

84,22

9

)10

9(

14

)15

25(

)10

9

15

25(

22

2

=

+

+=btd   

Minh họa bằ ng hình vẽ :

Miền bác bỏMiền bác bỏ 

-6,242 2,074-2,074

 K ế t luận: k qs ∈ W α  , ta bác bỏ giả thiế t H 0 và chấ  p nhận đố i thuyế t H 1 , nghĩ a là chiề u dài trung bình của chi tiế t đượ c chế t ạo ở hai thiế t bị trên là khác nhau.

 Hai bi ế n (mẫ u) phố i hợ  p t ừ ng cặ p

Điều kiện áp dụng: Khi tiến hình so sánh sự khác nhau giữa trung bình hai tổng thể, hai mẫu cầnthỏa mãn điều kiện là dữ liệu phải tuân theo quy luật phân phối chuẩn và phươ ng sai của hai mẫu

 phải bằng nhau.B1. Giả thuyết và đối thuyết:

Đối xứng Phải Trái

Giả thiết H0: µx - µy = D0 H1: µx - µy  ≤ D0 H0: µx - µy  ≥ D0

Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Lựa chọn mức ý ngh ĩ a α 

B3. Lựa chọn phươ ng pháp kiểm định: Phươ ng pháp kiểm định sự khác nhau trung bình của hai

tổng thể (mẫu phối hợ  p từng cặ p), chúng ta dùng bảng phân phối chuẩn (nếu mẫu lớ n hơ n hoặc bằng 30) hay phân phối T-student (nếu mẫu nhỏ hơ n 30)

B4. Tiêu chuẩn kiểm định

d  s

n D x D K 

'

)( 0−=≡ vớ i x và s’d là trung bình và độ lệch chuẩn của n khác biệt.

B5. Miền bác bỏ vớ i α cho tr ướ c:

 Nếu H0 : µx - µy > D0, khi đó Wα: Td  s

n D x

'

)( 0−= > U1-α (hoặc -T(n-1);α nếu n<30)

 Nếu H0 : µx - µy < D0, khi đó Wα: Td  s

n D x

'

)( 0−= < U1-α (hoặc -T(n-1);α nếu n<30)

 Nếu H0: µx - µy ≠ D0, khi đó Wα: ⏐T⏐ d  s

n D x

'

)( 0−=  ≥ U1-α/2 (hoặc T(n-1);α/2 nếu n<30)

Tính hệ số quan sát k qs để so sánh vớ i miền bác bỏ và k ết luận.

Mô hình của bài toán kiểm định sự khác biệt giữa hai tham số trung bình có thể tóm lượ c ở biểu

sau:

145

Page 16: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 16/57

 

 

  Ví d ụ: M ột công ty hóa m ỹ phẩ m đ ã tiế n hành một chiế n d ịch khuyế n mãi nhằ m mục đ ích t ă ng doanh số . Để  đ ánh giá xem việc khuyế n mãi có thự c sự làm t ă ng doanh số hay không, công ty đ ã chọn ng ẫ u nhiên 15 cử a hàng trong hệ thố ng phân phố i sản phẩ m của mình và khảo sát sự khácbiệt về doanh số bán trong tuần l ễ tr ướ c và sau chiế n d ịch khuyế n mãi. S ố liệu thu thậ p đượ c thể  hiện trong bảng sau:

 Doanh số trong tuần (triệu đồng)C ử a hàng 

Tr ướ c khuyế n mãi Sau khuyế n mãid i=(xi-yi ) (di- x )2

123456 7 

89101112131415

57 6112381269

5

69889

9226 147022

6054203521701

65791090321977 29

-37 

-83

-9-14

49-12

-6 -5-7 -7 

3,2467,2446,2417,6460,84

0,0427,04

27,04104,040,04

10,2423,0414,4433,6433,64

-18 468,40

x =-1.2  s’ d=5,78

KIỂM ĐỊNH THAM SỰ KHÁC NHAU HAI TRUNG BÌNH TỔNG THỂ (d ự a trên sự phân phố i t ừ ng cặ  p)

1. Giả thiết và đối thiết:Đối xứng Phải Trái

Giả thiết H0: µx - µy =D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0 Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0 

2. Xác định mức ý ngh ĩ a3. Phươ ng pháp kiểm nghiệm sự khác nhau của hai trung bình tổng thể - Bảng phân

 phối chuẩn hoặc T-student (nếu n<30)4. Tiểu chuẩn kiểm định T hoặc U:

x và s’d là trung bình và độ lệch chuẩn điều chỉnh của n khác biệt5. Điểm tớ i hạn và miền bác bỏ:

Đối xứng Phải TráiĐiểm tớ i hạn - T(n-1);1-α/2 và T(n-1);1-

α/2

T(n-1);1-α - T(n-1);1-α

Miền bác bỏ  D<- T(n-1);1-α/2 và D>T(n-1);1-α/2D>T(n-1);1-α D<-T(n-1);1-α

Mô hình

 

BB CN BB

-T(n-1);1-α/2 T(n-

BB

-T(n-1);1-α

BB

T(n-1);1-α

d qs  s

n D xT k 

'

)( 0−=≡

  146

Page 17: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 17/57

 

V ớ i mứ c ý nghĩ a α =0,05, có thể  k ế t luận chiế n d ịch khuyế n mãi đ ã làm t ă ng doanh số  haykhông?

Giải:

Gọi µ  x , µ  y l ần l ượ t là doanh số trung bình sau và tr ướ c khi thự c hiện chiế n d ịch khuyế n mãi, µ  x ,µ  y là đại l ượ ng ng ẫ u nhiên tuân theo quy luật phân phố i T-student (vì n=15<30)

 B1. Giả thiế t và đố i thiế t:

 H 0 : µ  x - µ  y ≤  0

 H 1: µ  x - µ  y > 0

 B2. M ứ c ý nghĩ a α =0,05.

 B3. Phươ ng pháp kiể m định: Kiể m định sự khác nhau giữ a hai trung bình của t ổ ng thể (hai mẫ u phố i hợ  p t ừ ng cặ  p).

 B4. Tính giá tr ị kiể m định:

qs s

n D x Dk '

)( 0−=≡ vớ i x và s’ d là trung bình và độ l ệch chuẩ n của n khác biệt.

T ừ số liệu trên, ta tính đượ c x =-1,2 và s’ d = 5,78. Khi đ ó K qs sẽ là:

803,078,5

152,1)('

0 −=−=−=d 

qs s

n D xk 

 B4. Miề n bác bỏ và k ế t luận:

V ớ i H 1: µ  x - µ  y > 0, khi đ ó W α  : T d

0

's

n)Dx( −= >T (n-1);α  = T (14),0,05 = 1,761

Minh họa bằ ng hình vẽ :

Miền bác bỏ 

1,761-0,803

 K ế t luận: vì k qs không thuộc W α  nên chư a có cơ  sở  để  bác bỏ giả thiế t H 0 và chấ  p nhận giả 

thuyế t đố i H 1 ở  mứ c ý nghĩ a α =0,05, hay chiế n d ịch khuyế n mãi của công ty vẫ n chư a làmt ă ng doanh số .

Kiểm định sự khác nhau giữ a trung bình từ hai mẫu trở lên – Phân tích ANOVA (Gồm mộtbiến định lượ ng và một biến phân loại (biến định tính))

Mục tiêu của phân tích phươ ng sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu, đây là hình thức mở r ộng của kiểm định T-student. Trong tr ườ ng hợ  p biến phân loại có

nhiều hơ n 2, chúng ta thườ ng sử dụng phân tích phươ ng sai (ANOVA – Analysis of variance).

Tại sao vây?, bở i vì khi sử dụng kiểm định t đối vớ i hai mẫu độc lậ p, trong tr ườ ng hợ  p biến phânloại có 3 hoặc nhiều hơ n 3 nhóm, chúng ta phải thực hiện r ất nhiều cặ p (k) so sánh lẫn nhau từng

đôi một, điều này dẫn đến một tình tr ạng là sai số của kiểm định sẽ lớ n hơ n r ất nhiều so vớ i mong

muốn ban đầu. Ví dụ, mỗi một kiểm định Z hay t (kiểm định sự khác nhau tham số trung bìnhgiữa hai mẫu độc lậ p) chứa đựng một sai số dạng I, tổng sai số của dạng I đối vớ i k đôi giá tr ị trung bình bằng I=1-(1 - α)

k . Trong một tr ườ ng hợ  p cụ thể, giả sử chúng ta có một biến phân loại

147

Page 18: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 18/57

 

vớ i 5 giá tr ị lựa chọn và α = 0,05, khi đó chúng ta sẽ có 10 so sánh nếu chúng ta dùng phươ ng pháp kiểm định t. Sai số dạng I của kiểm định t khi đó sẽ là:

I =1 – (1- α)k = 1- (1-0,05) = 1-(0,95)10 = 0.40

Trong tr ườ ng hợ  p này, sai số để chúng ta bác bỏ giả thuyết H0 về bằng nhau của các giá tr ị trung bình ngay cả khi H0 đúng là 40% chứ không phải là 5% như ban đầu.

Các đ iề u kiện sử d ụng: Các mẫu đượ c rút ra theo cách ngẫu nhiên và độc lậ p (điều kiện này phảiđượ c đảm bảo), các tổng thể có phân phối chuẩn (hoặc gần phân phối chuẩn) và các tổng thể cócùng phươ ng sai.

 Phân tích phươ ng sai một chiề u: (One-Way Analysis of Variance)

Phân tích phươ ng sai một chiều là phân tích dựa trên ảnh hưở ng của một nhân tố định lượ ng đếnmột nhân tố định tính (dạng phân loại).

Giả sử từ một biến phân loại, chúng ta có thể chia tổng thể thành k nhóm tuân theo quy luật phân phối chuẩn và có phươ ng sai bằng nhau dựa trên k mẫu ngẫu nhiên độc lậ p gồm n1, n2,..., nk quansát.

Gọi xij là giá tr ị của biến định lượ ng đang nghiên cứu tại quan sát thứ j của nhóm thứ I, khi đó,1x , 2x ,…, kx là giá tr ị trung bình của các nhóm, x là trung bình chung của tất cả các nhóm theo

 biến định lượ ng đang nghiên cứu.

Gọi giá tr ị trung bình của các nhóm trong tổng thể là µ1, µ2,…, µk  thì phươ ng pháp phân tích phươ ng sai sẽ cho phép chúng ta so sánh sự khác nhau giữa tham số trung bình của 2 hay nhiềunhóm có trong mẫu để suy r ộng lên tổng thể.

B1. Giả thiết và đối thiết trong phân tích phươ ng sai một chiều đượ c phát biểu như sau:

H0: µ1= µ2 =… = µk 

H1: Tồn tại ít nhất một giá tr ị trung bình của nhóm thứ I (µ

i) khác vớ i ít nhất một giá tr ị trung

 bình của nhóm còn lại.

B2. Lựa chọn mức ý ngh ĩ a α 

B3. Bài toán phân tích phươ ng sai một chiều (One-way ANOVA).

B4. Tính tiêu chuẩn kiểm định

Để tính tiêu chuẩn kiểm định trong phân tích phươ ng sai (ANOVA), chúng ta cần tiến hành tínhcác chỉ tiêu sau:

- Tổng độ lệch bình phươ ng giữa các nhóm (Sum of squares between groups): phản ánh biếnthiên của biến định lượ ng đánh nghiên cứu do tác động của biến phân loại đang xem xét

∑=

−=k 

i

i x xSSG1

2)(  

- Tổng độ lệch bình phươ ng trong nội bộ nhóm (Sum of squares within groups) phản ánh biếnthiên ngẫu nhiên do ảnh hưở ng của các yếu tố khác không xem xét ở mẫu.

∑ ∑= =

−=k 

i

n

 j

iij

i

 x xSSW 1 1

2)(  

- Tổng các độ lệch bình phươ ng toàn bộ (Total sum of squares): phản ánh toàn bộ biến thiên của biến định lượ ng đang nghiên cứu.

148

Page 19: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 19/57

 

∑∑= =

−=k 

i

n

 jij

i

 x xSST 1 1

2)( hay SST = SSW + SSG.

- Phươ ng sai giữa các nhóm (Mean squares between groups):

1−

=k 

SSGMSG  

- Phươ ng sai trong nội bộ các nhóm (Mean squares within groups):

k n

SSW MSW 

−=  

Lúc đó tiêu chuẩn kiểm định F (Fisher) đượ c tính bằng:

SW 

MSG F =  

Chúng ta có thể tóm gọn cách tính thông qua bảng sau:

ANOVASum of Squares df Mean Square F Sig.

BetweenGroups ∑

=

−=k 

i

i x xSSG1

2)(   k-11−

=k 

SSGMSG  

SW 

MSG F =   P(F)

WithinGroups ∑∑

= =

−=k 

i

n

 j

iij

i

 x xSSW 1 1

2)(   n-1k n

SSW MSW 

−=  

Total ∑∑= =

−=k 

i

n

 jij

i

 x xSST 1 1

2)(  

(SST=SSG+SSW)

B5. Miền bác bỏ:

Vớ i α cho tr ướ c, chúng ta bác bỏ H0 nếu F>Fk-1,n-k,α vớ i k-1 là bậc tự do của tử số và n-k là bậc tự do của mẫu số.

   Ví d ụ: Công ty A là công ty chuyên phân phố i bột giặ t cho thị tr ườ ng Thành phố   Đà N ẵ ng,hiện t ại công ty phân phố i đế n khách hàng thông qua 4 của hàng 1, 2, 3, 4.  Để  đư a ra nhữ ng quyế t định marketing phù hợ  p, công ty muố n xem xét có sự khác nhau trong doanh số bán củacác cử a hàng hay không, số liệu thu thậ p trong một nă m t ại các cử a hàng đượ c thể hiện ở bảng  sau:

 ĐVT: triệu đồng 

C ử a hàng số 1 C ử a hàng số 2 C ử a hàng số 3 C ử a hàng số 4

Tháng 1 120 123 112 119Tháng 2 123 143 127 134Tháng 3 134 132 156 245Tháng 4 123 153 176 256 Tháng 5 132 143 145 364Tháng 6 111 164 204 373Tháng 7 176 174 275 367 Tháng 8 192 184 284 283

149

Page 20: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 20/57

 

  150

Tháng 9 145 142 195 293Tháng 10 133 165 143 274Tháng 11 126 102 134 246 Tháng 12 138 123 127 234

 B1. Giả thuyế t và đố i thiế t:

 H 0: Doanh số bán trung bình hàng tháng của các cử a hàng là bằ ng nhau ( µ 1=µ 2=µ 3=µ k  )

 H 1 : T ồn t ại ít nhấ t một cử a hàng có doanh số bán khác vớ i ít nhấ t một cử a hàng còn l ại.

 B2. M ứ c ý nghĩ a α =0,05

 B3. Phươ ng pháp kiể m định : Thự c hiện phươ ng pháp phân tích phươ ng sai một chiề u.

 B4. Tính tiêu chuẩ n kiể m định :

-  Doanh số trung bình của cử a hàng số 1: 137,75 triệu

-  Doanh số trung bình của cử a hàng số 2: 145,67 triệu

-  Doanh số trung bình của cử a hàng số 3: 173,17 triệu-  Doanh số trung bình của cử a hàng số 4: 265,67 triệu

-  Doanh số trung bình của hàng tháng của công ty là 180,56 triệu

- Tham số SSG = 124176,56 

- Tham số SSW = 121275,25

-  Bậc t ự do k-1=3

-  Bậc t ự do n-k = 44

- Tham số MSG = 41392,18

- Tham số MSW= 2756,25-  H ệ số Fisher (F) = 15,01

 B5. Miề n bác bỏ và k ế t luận:

- Ta có F k-1;n-k;α = F 3;47;0,05 = 2,816 

- Vì F = 15,01 > 2,816 nên chúng ta bác bỏ H0, chấ p nhận H1 có ngh ĩ a là tồn tại ít nhất một củahàng có doanh số bán khác vớ i doanh số bán của ít nhất một của hàng còn lại. 

Hồi quy tươ ng quan (mối quan hệ giữ a hai hay nhiều biến định lượ ng)

Khi nghiên cứu mối quan hệ giữa hai hay nhiều biến định lượ ng, chúng ta có thể sử dụng phươ ng

 pháp hồi quy, trong đói có một biến nguyên nhân (biến độc lậ p) và một biến k ết quả (biến phụ thuộc). Trong phươ ng pháp này ngườ i ta có thể tìm ra đượ c mối quan hệ và mức độ tác động của biến nguyên nhân đến biến k ết quả như thế nào. Giả sử chúng ta kiểm tra mối quan hệ tuyến tínhgiữa số năm làm việc trong doanh nghiệ p vớ i thu nhậ p. Khi đó, ta có thể thấy r ằng biến phụ thuộclà biến thu nhậ p (biến Y) và biến độc lậ p là biến số năm làm việc (biến X)

 Đi ề u kiên ứ ng d ụng 

- Giá tr ị của biến X là hoàn toàn độc lậ p so vớ i biến Y

- Sai số trong mô hình phải tuân theo quy luật phân phối chuẩn

- Trung bình các sai số của mô hình phải bằng không

Page 21: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 21/57

 

- Phươ ng sai của sai số là một hằng số và độc lậ p vớ i giá tr ị X

 Đồ th ị  

Tr ướ c khi xem xét mối quan hệ tươ ng quan giữa hai biến này, chúng ta cần phải xây dựng đồ thị giữa hai biến số để chúng ta có thể dự đoán hàm số thích hợ  p để mô tả mối quan hệ.

Qua đồ thị, chúng ta có thể dự đoán đượ c, có thể dùng phươ ng trình đườ ng thẳng để mô tả mốiquan hệ giữa hai biến X, Y. Khi đó, mô hình hồi quy giản đơ n trên tổng thể có thể đượ c biểu hiệnnhư sau:

Yi = β0 + β1Xi + εi (1)

Trong đó: Xi là số năm làm việc của ngườ i thứ i

Yi là thu nhậ p hàng năm của ngườ i thứ i

β0 giá tr ị của mô hình (giá tr ị của biến Y) khi giá tr ị của biến độc lậ p X bằng 0

β1 đo lườ ng mức độ thay đổi của biến Y khi biến X thay đổi một đơ n vị 

Nam lam viec

20181614121086   T   h  u  n   h

  a  p  n  a  m    (   t  r

   i  e  u   )

100000

80000

60000

40000

20000

0

 

 Ki ể m tra sự phù hợ  p của mô hình

 Phân tích phươ ng - ANOVA (kiể m tra sự t ồn t ại mố i quan hệ trong mô hình)

Một mô hình tuyến tính đượ c xây dựng khi nó tồn tại mối quan hệ giữa biến độc lậ p và biến phụ thuộc, phân tích phươ ng sai sẽ cho phép kiểm định mối quan hệ tuyến tính giữa hai biến.

- Gọi SST là tổng bình phươ ng các biến động (giữa giá tr ị thực tế và giá tr ị trung bình của biếny). Khi đó ta có: ∑

=

−=n

ii  y ySST 

1

2)(  

- Gọi SSR là tổng bình phươ ng hồi quy, là đại lượ ng biến động của giá tr ị thực tế yi đượ c giải

thích bở i giá tr ị hồi quy, ∑=

−=n

ii  y ySSR

1

2)ˆ(  

151

Page 22: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 22/57

 

- Gọi SSE là tổng bình phươ ng biến động giữa giá tr ị thực tế và giá tr ị hồi quy, khi đó ta có thể 

tính đượ c ∑=

−=n

iii  y ySSE 

1

2)ˆ(

Khi đó trung bình bình phươ ng hồi quy sẽ làk 

SSR=MSR  vớ i k là số biến (trong tr ườ ng hợ  p này

k=1) và trung bình bình phươ ng phân dư k n

SSE −

=MSE  

Giá tr ị kiểm định F =MSE 

MSRcó phân phối F (Phân phối Fisherr) dùng để kiểm định ý ngh ĩ a của

mô hình hồi quy, do vậy, giá tr ị F càng lớ n (hay P(F) càng nhỏ hơ n α) thì mô hình càng có ýngh ĩ a.

 H ệ số R2 (s-square)

Hệ số R 2 dùng để đo lườ ng sự phù hợ  p của mô hình tuyến tính và nó thườ ng gọi là hệ số xác định(coefficient of determination). Hệ số này biểu hiện tỷ lệ phần tr ăm biến đội của biến y đượ c giải

thích bở i các biến x. Khi đóSST SSE 

SST SSR R −== 12 .

Tuy nhiên, R 2 của mẫu có khuynh hướ ng là ướ c lượ ng lạc quan của thướ c đo sự phù hợ  p của môhình đối vớ i tổng thể. Do vậy, R 2a (gọi là R 2 điều chỉnh) đượ c sử dụng để phản ánh chính xác hơ nsự phù hợ n của mô hình vớ i tổng thể và:

1

)1( 222

−−−

−=k n

 Rk  R Ra  

Tính các hệ số trong mô hình

Ở phươ ng trình (1) chúng ta quan tâm chú ý đến hai hệ số  β0

và β1, yêu cầu của mô hình hồi quy

là làm nhu thế nào để tìm đượ c các hệ số này, chúng ta có thể thể tính toán các giá tr ị tươ ng ứngcủa β0 và β1 là b0 và b1 trên mẫu để ứng lượ ng lên tổng thể. Đặt (x1, y1), (x2, y2),..., (xn,yn) là mẫugồm n cặ p quan sát trên đườ ng hồi qui tổng thể có dạng:

yi = b0 + b1xi + ei 

Theo phươ ng pháp bình phơ ng bé nhất, ta có thể ướ c lượ ng các hệ số β0 và β1 từ các hệ số b0 vàtham số b1 của mẫu sao cho tổng bình phươ ng sai số của phươ ng trình sau đây là bé nhất:

∑ ∑= =

−−==n

i

n

iiii  xbb yeSSE 

1 1

210

2 )(  

Khi đó các giá tr ị b0 và b1 đượ c tính như sau:

∑ ∑

∑ ∑∑

= =

= ==

−=

n

i

n

iii

n

i

n

ii

n

iiii

 x xn

 y x y xnb

1 1

22

1 111

)(

)()(và xbyb i0 −=  

Vớ in

 y y

n

ii∑

== 1 vàn

 x x

n

ii∑

== 1  

152

Page 23: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 23/57

 

 H ệ số hồi quy chuẩ n hóa (standardized regression coefficient)

Hệ số hồi quy chuẩn hóa, kí hiệu là Beta biểu hiện độ dốc của đườ ng thẳng (tìm đượ c theo phươ ng pháp bình phươ ng bé nhất) khi cả hai biến X và Y đượ c biểu diễn bằng thang đo chuẩnhóa, nó đượ c tính bằng:

 y

 x

 s

 s

 Beta 1 β = vớ i sx và sy là độ lệch chuẩn của biến X và biến Y.

Ướ c l ượ ng các tham số của t ổ ng thể  

Phân tích hồi quy không chỉ mô tả các dữ kiện quan sat đượ c mà công cho phép suy r ộng các k ếtluận về mối quan hệ trong mẫu lên tổng thể. Suy r ộng các k ết quả của mẫu cho các giá tr ị củatổng thể dựa vào các giả định sau:

- Vớ i bất kì một giá tr ị X nào thì phân phối chuẩn của biến Y phải là phân phối chuẩn

- Các giá tr ị Y độc lậ p đối vớ i nhau tức là quan sát này không bị ảnh hưở ng bở i các quan sátkhác.

- Tất cả các tr ị trung bình µy khi X xảy ra đều nằm trên một đườ ng thẳng – đó là đườ ng hồi quytổng thể.

Khi chúng ta biết các giá tr ị b0 và b1 trên mẫu, chúng ta sẽ suy r ộng giá tr ị này lên tổng thể chocác giá tr ị β0 và β1.

 Nếu đặt σ2e và s2

e là phươ ng sai của sai số của mẫu (e) và tổng thể (ε), ta có:

121

2

2

−=

−=

∑=

n

SSE 

n

e s

n

ii

e  

 Nếu đặt β1 là giá tr ị ướ c lượ ng của b1 trên tổng thể thì phươ ng sai của b1 sẽ là:

∑∑==

−=

−=

n

ii

en

ii

eb

 xn x

 s

 x x

 s s

1

22

2

1

2

22

)(1

 

Khi đó độ lệch chuẩn của sai số sẽ là:

∑=

−==

n

ii

ebb

 xn x

 s s s

1

22

22

11 

Suy ra ướ c lượ ng không chệch của σ2

 b1 sẽ đượ c xác định:

∑=

−=

n

ii

eb

 xn x

 s

1

22

22

1σ   

Giả sử t sai số hồi quy (ei) tuân theo quy luật phân phối chuẩn thì biến ngẫu nhiên (t) là giá tr ị dùng để kiểm định:

1

11

b s

bT 

β −=  

153

Page 24: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 24/57

 

Gọi α là mức ý ngh ĩ a thì ta luôn luôn tìm đượ c một khoảng tin cậy của β1, khi đó:2

2

112

2

1 11

−− +≤≤− nb

nb t  sbt  sb α α  β   

 Ki ể m đị nh các tham số của t ổ ng thể  

B1. Giả thiết và đối thiếtĐối xứng Phải Trái

Giả thiết H0: β1 = β1o H0: β1 ≤ β1o H0: β1 ≥ β1o

Đối thiết H1: β1 ≠ β1o H1: β1 > β10 H1: β1 < β1o

B2. Xác định mức ý ngh ĩ a α 

B3. Phươ ng pháp kiểm định: Kiểm định t-student đối vớ i mối quan hệ giữa hai biến.

B4. Tính tiêu chuẩn kiểm định:

1

011

bqs  s

bT k  β −=≡  

B5. Miền bác bỏ và k ết luận: Giả thiết H0 đượ c bác bỏ khi:1

2

−≥ nt T  α  (kiểm định đối xứng)

1−≥ nt T  α  (kiểm định phía phải)

1−−< nt T  α  (kiểm định phía trái)

 Dự  đ oán giá tr  ị  

Khi chúng ta có các hệ số b0 và b1, chúng ta có thể thành lậ p đượ c mô hình, thay các giá tr ị xn+1 vào thì ta có thể tính đượ c giá tr ị dự đoán của mô hình.

yi = b0 + b1xi + ei 

Vớ i mỗi giá tr ị của xi chúng ta sẽ tìm đượ c các giá tr ị dự đoán của y i tươ ng ứng luôn này trong

khoảng 2n

21

y tsY −α

−± , vớ i sai của dựa đoán sẽ là:

2

21

ˆ)1(

)(1

 x

ne y  sn

 x x

n s s

−−

+= +  

KIỂM ĐỊNH CHI BÌNH PHƯƠ NG VỀ TÍNH PHỤ THUỘC HAY ĐỘC LẬP CỦA CÁCBIẾNKiểm định giả thiết về quy luật phân phối của tổng thể 

Kiểm định giả thiết về sự phân phối của tổng thể hay có thể gọi là kiểm định sự phù hợ  p là kiểmđịnh nhằm xem xét dữ liệu thu thậ p đượ c phù hợ  p (thích hợ  p) đến mức nào vớ i giả định về phân phối của tổng thể.

154

Page 25: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 25/57

 

Giả sử có mẫu ngẫu nhiên n quan sát đượ c chia thành k nhóm khác nhau, mỗi quan sát phải vàchỉ thuộc về một nhóm thứ i nào đó (i=1,2,…,k).

Khi đó Oi là số lượ ng quan sát ở nhóm thứ i, vấn đề đặt ra là ta sẽ dùng mẫu quan sát này để kiểmđịnh giả thiết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i. Chúng tacần tính:

Tính số lượ ng quan sát thuộc về nhóm thứ i trong tr ườ ng hợ  p giả thiết H0 đúng, ngh ĩ a là tính cácgiá tr ị mong muốn Ei theo công thức: Ei =n*pi

  Nhóm 1 2 … k Σ 

GT thực tế (Oi)

XS theo H0

Giá tr ị mong muốn (Ei)

O1

 p1

E1

O2

 p2

E2

… Ok 

 pk 

Ek 

n

1

n

∑=

−=

i i

iidf   E 

 E O

1

22 )(

 χ 

Tiêu chuẩn kiểm định:

Trong đó: Oi : tần số quan sát đượ c trong thực tế 

Ei : tần số theo lí thuyết

df = k-1: mức độ tự do trong phép kiểm định.

k : số loại tính chất hay số khoảng đã dùng phân loại tính chất

 pi : thông số đượ c ướ c định từ số liệu thu thậ p đượ c.

KIỂM ĐỊNH CHI BÌNH PHƯƠ NG(kiể m định về sự phân phố i t ổ ng thể  )

1. Giả thiết và đối thiết:Giả thiết ……………….là bằng nhauĐối thiết ………………là khác nhau

2. Xác định mức ý ngh ĩ a3. Phươ ng pháp kiểm nghiệm Chi bình phươ ng.4. Tính tiêu chuẩn:

5. Điểm tớ i hạn và miền bác bỏ:Là kiểm định một đuôi (df=k-1) vớ i:

Điểm tớ i hạn λ2df;α

Miền bác bỏ  λ2 > λ2df;α

Mô hình BB

λ2df α

∑=

−=

i i

ii

 E 

 E O

1

22 )(

 χ   

155

Page 26: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 26/57

 

   Ví d ụ 1: Trong một đợ t ra đề  thi tr ắ c nghiệm môn Kinh t ế vi mô, ng ườ i ta tin t ưở ng r ằ ng 60% sinh viên tham gia thi sẽ   đạt đ iể m đậu trên bài thi tr ắ c nghiệm này vớ i độ tin cậ  y 95%.Chọn một cách ng ẫ u nhiên 200 sinh viên tham gia thi và tiế n hành đ iề u tra. K ế t quả thu đượ c có105 sinh viên đạt và 95 sinh viên không đạt. H ỏi k ế t quả này có trái vớ i k ế t quả mong đợ i haykhông ?

Giải: Gọi p là t ỉ l ệ sinh viên đạt đ iể m đậu, khi đ ó 1-p là t ỉ l ệ sinh viên không đạt  B1. Giả thiế t và đố i thiế t 

 H 0: p=0,6 

 H 1: H 0 không đ úng hay p≠0,6 

Chỉ tiêu Lí thuyế t Thự c t ế   Đạt 0,6*200 = 120 105

 Không đạt 0,4*200 = 80 95

 B3. Chọn phươ ng pháp kiể m định α =0,05.

 B3. Xác định phươ ng pháp kiể m định: Phươ ng pháp kiể m định sự phù hợ  p Chi bình phươ ng. Vì

df= k-1= 2-1= 1 nên vớ i độ tin cậ y 95% ta có

843,3205,0);1(

2);( == χ  χ  α df 

 B4. Tính tiêu chuẩ n kiể m định

Minh họa bằ ng hình vẽ  

69,481,288,180

)8095(

120

)120105( 222 =+=

−+

−=df  χ 

  156

 

 K ế t luận: Vì 4,69 > 3,843 nên bác bỏ H 0 ở mứ c ý nghĩ a 0,05 và k ế t quả thi trái vớ i tin t ưở ng của nhà soạn câu hỏi.

4,693,843

BB

   Ví d ụ 2: Để chọn một bí thư  đ oàn cho một tr ườ ng đại học ng ườ i ta đề cử 3 ứ ng viên và chúng ta phải kiể m tra xem t ỉ l ệ các đ oàn viên bỏ phiế u cho mỗ i ứ ng viên có khác nhau hay không. M ột mẫ u 150 cử tri hợ  p l ệ đượ c chọn ng ẫ u nhiên t ừ danh sách của tr ườ ng đại học ấ  y.

 K ế t quả kiể m phiế u thu đượ c như sau:

- Ứ ng viên 1: 61

- Ứ ng viên 2: 53

- Ứ ng viên 1: 36 

Giải:

Gọi p1 , p2 ,p3 l ần l ượ t là t  ỷ l ệ phiế u bầu của các đ oàn viên cho l ần l ượ t các ứ ng viên.

 B1. Phát biể u giả thiế t và đố i thiế t 

Giả thiế t H 0: p1= p2 =p3 =1/3

 Đố i thiế t H 1: Ít nhấ t một trong các t  ỷ l ệ nhỏ hơ n 1/3

Page 27: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 27/57

 

 B2. M ứ c ý nghĩ a α =0,05

 B3. Xác định phươ ng pháp kiể m định: Phươ ng pháp kiể m định sự phù hợ  p Chi bình phươ ng. Vì

df= k-1= 3-1= 2 nên vớ i độ tin cậ y 95% ta có

9914,5205,0,2

2,df  =χ=χ α

 B4. Tính tiêu chuẩ n kiể m định:

 N ế u giả thiế t H 0 đ úng thì số cử tri theo lí thuyế t bầu cho các ứ ng viên đề u là 50. Khi đ ó:

 B5. K ế t luận: Vì 6,52>5,9914 nên chúng ta có thể bác bỏ H 0 t ứ c là các đ aòn viên đ ã bỏ phiể u

cho một ứ ng viên nhiề u hơ n ít nhấ t một ứ ng viên còn l ại.

52,650

)5036(

50

)5053(

50

)5061( 2222 =

−+

−+

−= χ 

Kiểm định chi bình phươ ng về tính chất độc lập hay phụ thuộc (kiểm định hàng cột haykiểm định mối quan hệ giữ a hai biến biểu danh)

Ở trên ta xem xét tr ườ ng hợ  p dữ liệu thu thậ p đượ c xế p theo một tiêu chí hay một yếu tố. Bây giờ  chúng ta xem xét tr ườ ng hợ  p dữ liệu đượ c xế p theo hai tiêu chí, ngh ĩ a là đượ c phân theo hai yếutố có mối liên hệ hay không. Ví dụ, trong phân tích nghiên cứu tiế p thị, chúng ta thườ ng tìm cótồn tại hay không mối liên hệ giữa giớ i tính và hành vi tiêu dùng, giữa giớ i tính và mức độ hoànthành công việc, giữa tuổi tác và giớ i tính..

157

i và cột thứ j, khi đó ta có:

ố cột -1)*(số hàng-1)

Gọi Oij là số lượ ng quan sát ứng vớ i hàng thứ i và cột thứ j và Eij là số lý thuyết ứng vớ i hàng thứ 

Khi đó độ tự do sẽ là df= (sn

c*r E

máùucuíalåïnâäüTäøng

) jcäütTäøng(x)ihaìngTäøng(E

 jiij

ij

=

−−−−−−−−

=

 

 

KIỂM ĐỊNH CHI BÌNH PHƯƠ NG

. Giả thiết và đối thiết:g có mối liên hệ giữa hai biến .... trong tổng thể 

(Kiể m định mố i liên hệ )

1Giả thiết KhônĐối thiết Có mối liên hệ giữa hai biến ..... trong tổng thể 

2. X ức ý

)*(c-1)) vớ i:χ2

df;α

ác định m ngh ĩ a α m Chi bình phươ ng.3. Phươ ng pháp kiểm nghiệ

4. Tính tiêu chuẩn:

n và miền bác bỏ:5. Điểm tớ i hạLà kiểm định một đuôi (df=(r-1Điểm tớ i hạnMiền bác bỏ  χ2 χ2

α> df;

∑∑1 1

2

2 χ 

)(

i

c

 j ij

ijij

 E 

 E O

= =

=r 

Mô hìnhBB

  χ2df;α

Page 28: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 28/57

 

  158

í d ụ 1: M ột nhà nghiên cứ u thị tr ườ ng muố n xác định mố i t ươ ng quan có thể có giữ a kích cỡ xe

 Hãng chế t ạo

V ô tô và hãng sản xuấ t đố i vớ i các xe mớ i đượ c mua trong thờ i gian g ần đ ây. M ột mẫ u 1000 xemớ i mua trong nướ c đ ã chọn ng ẫ u nhiên và phân loại theo kích cỡ và hãng sản xuấ t. Dữ liệu thuđượ c:

 Loại xe

 A D

T ổ ng cột j

 B C  (cj) Nhỏ Trung bình

157 

 Lớ n126 58

658245

18114260

1046 28

413396 191

T ổ  i)ng i (r hàng 341 192 383 84 1000

 Nh hự c t ế  sát đượ   giá tr ị lý thuyế t như saư vậ y các giá tr ị t quan c và u:

 Hãng chế t ạo Loại xe A D

T ổ ng cột j B C  (cj)

 Nhỏ 

Trung bình

157 (14 (7 9

181(15

10(3 9

  Lớ n

0,833)

126 (135,036)

58(65,131)

659,2 6)

82(76,032)

45(36,672)

8,179)

142(151,668)

60(73,153)

4,6 2)

46 (33,264)

28(16,044)

413

396 

191

T ổ ng hàng i (ri) 1000341 192 383 84

 

húng ta dùng phép kiể m định chi bình phươ ng để so sánh giá tr ị qua sát đượ c và giá tr ị lí thuyế t 

hiế t và đố i thiế t 

hân loại độc l ậ p nhau trong t ổ ng thể  ể  

 B2.

ể m định Chi bình phươ ng về mố i quan hệ giữ a hai

 B4. Tính tiêu chuẩ n kiể m

 )=(3-1)*(4-1)=6 nên

V ậ ỡ xe và hãng sản xuấ t xe do khách hàng chọn l ự a là nhữ ng 

C vớ i các bướ c sau:

 B1. Phát biể u giả t 

Giả thiế t H 0: Hai yế u t ố dùng p Đố i thiế t H 1: Hai yế u t ố dùng phân loại phụ thuộc nhau trong t ổ ng th

 Xác định mứ c ý nghĩ a α =0,05.

 B3. Phươ ng pháp kiể m định: Phươ ng pháp kibiế n.

định

 B5. K ế t luận : Vì df= (r-1)*(c-1

5916,122

05,0);6( =χ  

81,45

)( 2

2 =−

=∑

ij

ijijij

 E 

 E O

 χ 

5916,1281,45 2

,0);6(

2 =χ>=χ 05

 y ta bác bỏ giả thiế t H 0 t ứ c là kích cnhữ ng biế n phụ thuộc l ẫ n nhau chứ không phải độc l ậ p.

Page 29: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 29/57

 

CÁC PHƯƠ NG PHÁP KIỂM ĐỊNH PHI THAM SỐ 

Kiểm định phim tham số là các loại kiểm định ít đòi hỏi các giả thiết về phân phối của dữ kiệnn.Thông thườ ng, kiểm định phí tham số phù hợ   p nhất trong các tr ườ ng hợ  p chúng ta không thể dùng các kiểm định tham số ví dụ dữ liệu mà chúng ta thu thậ p là loại dữ liệu định tính (biểudanh hay thứ tự) hoặc khi các dữ liệu thuộc thang đo lườ ng khoảng cách (interval) nhưng khi

kiểm định phân phối chuẩn không thỏa. Trong những tr ườ ng hợ  p như vậy, chúng ta thườ ng sử dụng phươ ng pháp kiểm định phi tham số. Trong phần này sẽ đề cậ p đến những kiểm định sau:

Kiểm định hai mẫu phụ thuộc (Dấu, Wilcoxon, Nemar)

Ở phần kiểm định tham số ta đã đề cậ p đến việc so sánh trung bình của hai tổng thể vớ i giải địnhtổng thể phân phối chuẩn và có phươ ng sai bằng nhau. Khi các điều kiện này không thỏa mãn tathực hiện kiểm định dấu.

Ứ ng d ụng: Dữ liệu mẫu từng cặ p phối hợ  p, tổng thể không phân phối chuẩn và có thể phươ ng saikhác nhau. Việc kiểm định dấu thườ ng đượ c dùng khi phân tích dự liệu từ mẫu phối hợ  p. Tuynhiên, ngườ i ta ít dùng kiểm định dấu do nói không làm sáng tỏ đượ c giá tr ị của khác biệt, k ếtquả không thuyết phục lắm nên ngườ i ta thườ ng thực hiện kiểm định Wilcoxon.

Tr ườ ng hợ  p mẫ u nhỏ (n<30)

Cách thức thực hiện kiểm định Wilcoxon trong tr ườ ng hợ  p mẫu nhỏ như sau:

B1. Tính các chênh lệch D=x1 - x2 

KIỂM ĐỊNH WILCOXON(mẫ u nhỏ )

1. Giả thiết và đối thiết:Đối xứng Phải Trái

Giả thiết H0: µ1 = µ2 H0: µ1  ≤ µ2 H0: µ1  ≥ µ2

Đối thiết H1: µ1 ≠ µ2 H1: µ1 > µ2 H1: µ1 < µ2 2. Xác định mức ý ngh ĩ a σ 

3. Phươ ng pháp kiểm nghiệm Wilcoxon - Phân phối Wilcoxon.4. Tính tiêu chuẩn:

D = x1 - x2 (xét dấu)Tiêu chuẩn W = min [Σ(+), Σ(-)]  W = min [Σ(-)]  W = min [Σ(+)] 

5. Điểm tớ i hạn và miền bác bỏ:Đối xứng Phải Trái

Điểm tớ i hạn W2α Wα Wα

Miền bác bỏ  W < W2α W < Wα W < Wα

Mô hình BB

W2α

BB

BB

B2. Chọn mức ý ngh ĩ a α 

B3. Phươ ng pháp kiểm định : Phươ ng pháp kiểm định Wilcoxon

B4. Tính tiêu chuẩn kiểm định :

- Xế p hạng giá tr ị tuyết đối các chênh lệch D theo thứ tự tăng dần, các giá tr ị bằng nhau sẽ nhậnhàng trung bình (bỏ qua các tr ườ ng hợ  p chênh lệch bằng 0).

159

Page 30: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 30/57

 

- Tính tổng cộng hạng. Giá tr ị W của kiểm định là: W= min [Σ(+), Σ(-)]

B5. Tham chiếu vớ i giá tr ị ở bảng Wilconxon trong bảng phân phối, so sánh vớ i giá tr ị kiểm địnhđể đưa ra k ết luận.

  

Ví d ụ: M ẫ u 9 khách hàng đượ c chọn ng ẫ u nhiên và yêu cầu họ cho biế t sở thích của họ về hailoại kem đ ánh r ă ng A, B khác nhau thông qua một thang đ iể m t ừ 1 (r ấ t không thích) đế n 5 (r ấ t thích). K ế t quả như sau:

  KH Kem A Kem B Ch. l ệ ch H ạng TQ H ạng (+) H ạng (-)

1 4 3 1 1,5 1,52 5 5 03 2 5 -3 5 54 3 2 1 1,5 1,55 3 5 -2 3 36 1 5 -4 7 7 7 3 3 08 2 5 -3 5 59 2 5 -3 5 5

3 25

 Đánh giá xem có hay không mứ c độ  ư a chuộng giữ a hai loại kem đ ánh r ă ng A, B vớ i mứ c ýnghĩ a 5%.

 B1. Giả thiế t và đố i thiế t:

 H0: Không có sự khác biệt trong mứ c độ ư a chuộng giữ a A, B trong t ổ ng thể  

 H1: Có sự khác biệt trong mứ c độ ư a chuộng giữ a A, B trong t ổ ng thể  

 B2. Lự a chọn mứ c ý nghĩ a α =0,05 B3. Xác định phươ ng pháp kiể m định : Phươ ng pháp kiể m định Wilcoxon

 B4. Tính tiêu chuẩ n kiể m định: Đây là loại kiể m định d ạng hai đ uôi ( đố i xứ ng). Theo bảng tính tacó: K qs = W = min [3,25]=3

Tra bảng phân phố i của kiể m định Wilcoxon vớ i mứ c ý nghĩ a 5% ta có

W 2α =W 2*0,05=W 0,1= 4Miền bác bỏ 

W2α=4W=3

Vì W<W 2α nên ta chư a có cơ sở  để bác bỏ H 0 t ứ c là chư a có cơ sở  để chứ ng minh có sự khácbiệt trong ư a chuộng của ng ườ i tiêu dùng giữ a sản phẩ m A, B trong t ổ ng thể  

Tr ườ ng hợ  p mẫ u l ớ n (n≥30)

Trong tr ườ ng hợ  p mẫu lớ n, dùng phân phối chuẩn thay thế cho phân phối của kiểm địnhWilcoxon. Giá tr ị trung bình và phươ ng sai của hai mẫu đượ c tính:

16024

)12)(1(4

)1(

2 ++=

+=

nnn

nn

σ 

µ  

Page 31: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 31/57

 

 

KIỂM ĐỊNH WILCOXON(mẫ u l ớ n)

1. Giả thiết và đối thiết:

Đối xứng Phải TráiGiả thiết H0: µ1 = µ2 H0: µ1  ≤ µ2 H0: µ1  ≥ µ2

Đối thiết H1: µ1 ≠ µ2 H1: µ1 > µ2 H1: µ1 < µ2 2. Xác định mức ý ngh ĩ a3. Phươ ng pháp kiểm nghiệm Wilcoxon – Tham chiếu phân phối chuẩn.4. Tính tiêu chuẩn:

T qs

T  Z k 

σ 

µ −=≡  

5. Điểm tớ i hạn và miền bác bỏ:Đối xứng Phải Trái

Điểm tớ i hạn U1-α/2

U1-α

U1-αMiền bác bỏ  Z <U1-α/2 Z < -U1-α Z <U1-α

Mô hình BB

U1-α/2

BB

-U1-α

BB

U1-α

   Ví d ụ: Công ty sản xuấ t d ầu g ội đầu nhãn hiệu P thự c hiện một chiế n d ịch quảng cáo r ầm r ộ trong mục tiêu xâm nhậ p thị tr ườ ng ở một thành phố . Để kiể m tra xem chiế n d ịch quảng cáo nàycó t ạo ra đượ c nhận biế t về  nhãn hiệu nớ i khách hàng hay không, tr ướ c và sau khi thự c hiệnchiế n d ịch quảng cáo, mẫ u 200 ng ườ i ở mỗ i địa bàn trong 50 địa bàn dân cư (phườ ng, xã) củathành phố  đượ c chọn và yêu cầu k ể tên 5 loại d ầu g ội đầu.

Ở t ừ ng địa bàn, tr ướ c và sau khi thự c hiện chiế n d ịch quảng cáo, số l ần d ầu g ội đầu nhãn hiệu P đượ c k ể tên đượ c ghi nhận l ại. Chênh l ệch về số  l ần d ầu g ội đầu nhãn hiệu P đượ c k ể tên giữ atr ướ c và sau khi quảng cáo đượ c tính toán, xế  p hạng theo giá tr ị tuyệt đố i của chúng (không cóchênh l ệch 0). T ổ ng cộng hạng của các chênh l ệch d ươ ng có giá tr ị nhỏ hơ n và bằ ng 625. Thự chiện kiể m định Wilcoxon, ta sẽ xem xét xem sau chiế n d ịch quảng cáo, d ầu g ội đầu nhãn hiệu P có đượ c khách hàng biế t đế n nhiề u hơ n tr ướ c hay không vớ i mứ c ý nghĩ a 5%?

Giải:

 B1. Giả thiế t và đố i thiế t 

 H 0: S ự nhận biế t nhãn hiệu d ầu g ội đầu P tr ướ c và sau chiế n d ịch quảng cáo là giố ng nhau

 H 1: Sau chiế n d ịch quảng cáo, d ầu g ội đầu nhãn hiệu P đượ c khách hàng biế t đế n nhiề u hơ n

 B2. Lự a chọn mứ c ý nghĩ a α =0,05

 B3. Lự a chọn phươ ng pháp kiể m định : Kiể m định Wilcoxon vớ i tham chiế u là tham chiế u phân phố i chuẩ n (Z) vì n=50>30

 B4. Tính tiêu chuẩ n kiể m định

V ớ i mẫ u n=50 ta có:

161

Page 32: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 32/57

 

  5,6734

)49(50

4

)1(==

+=

nnT µ   

25,1073124

101*51*50

24

)12)(1(2 ==++

=nnn

T σ   

 Áp dung công thứ c:

1206,05917,103

5,637625−=

−=

−=

T T  Z 

σ 

µ 

Ta có Z=-0,1206 < U 0,95= 1,65 nên chúng ta chư a có cơ sử  để bác bỏ giả thiế t H 0 t ứ c làchư a có cơ sở  để chấ  p nhận H 1

Kiểm định nhiều hơ n hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)

Thang đo lươ ng và phươ ng thức thực hiện tươ ng tự như Wilcoxon như mở r ộng cho nhiều hơ n 2sản phẩm, tình huống và k ết quả đượ c trình bày ở phần hướ ng dẫn SPSS

Kiểm định cho hai mẫu độc lập (Mann-Whitney U)

Kiểm định không yêu cầu các giả định về hình dạng của phân phối, nó đượ c dùng để các giả thiêtvề hai mẫu độc lậ p có xuất phát từ hai tổng thể có phân phối có thể không giống nhau. Kiểm định

này gần giống như kiểm định wilconxon vì các biến phải có thể xế p hạng (trong kiểm địnhwilcoxon ta phải xét cả dấu và hạng còn trong kiểm định Mann-Whitney U ta chỉ xét thứ hạng mà

không cần xét dấu. Tình huống và k ết quả đượ c mô tả ở phần SPSS.

Kiểm định nhiều hơ n hai mẫu độc lập (Kruskal-Wallis H)

Giả sử r ằng chúng ta có các mẫu ngẫu nhiên độc lậ p gồm k quan sát, nếu ta sắ p xế p các quan sát

này thành từng nhóm mà mỗi nhóm có phân phối tuân theo quy luật phân phối chuẩn và phươ ng

sai của chúng bằng nhau thì chúng ta có thể dùng phươ ng pháp kiểm định tham số (ANOVA) để  phân tích.

Tuy nhiên, có một số tr ườ ng hợ  p, mẫu không thoải mãn những điều kiện để sử dụng ANOVA thìchúng ta sử dụng phươ ng pháp kiểm định phi tham số vớ i phươ ng pháp Kruskal-Wallis.

Từ tổng thể n quan sát ta sắ p xế p các hạng một cách liên tục từ nhỏ đến lớ n, nếu giá tr ị quan sát

trùng nhau thì hạng xế p giống nhau bằng cách dùng số trung bình cộng các hạng của chúng.

Gọi R 1, R 2,..., R k  là tổng của các hạng đượ c xế p theo thứ tự, khi đó từ n quan sát ta có của k nhóm.

B1. Giả thiết và đối thiết

H0: µ1 = µ2 = ... = µk : Tham số trung bình của k nhóm đều bằng nhau

H1: Tồn tại ít nhất một tham số trung bình của nhóm i khác vớ i ít nhất một tham số trung bìnhcủa nhóm còn lại.

B2. Xác định mức ý ngh ĩ a α 

B3. Phươ ng pháp kiểm định Kruskal- Wallis

B4. Tiêu chuẩn kiểm định W đượ c tính bằng

∑=

+−+

=≡k 

i i

iqs n

n

 R

nnW k 

1

2

)1(3)1(

12 

B5. Miền bác bỏ và k ết luận :

162

Page 33: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 33/57

 

Trong tr ườ ng hợ  p này chúng ta dùng phân phối Chi bình phươ ng vớ i bậc tự do là k-1, khi đóchúng ta sẽ bác bỏ H0 nếu .2

,1kW α−χ>

XỬ LÍ DỮ LIỆU CÙNG SPSS

KIỂM ĐỊNH THAM SỐ Kiểm định t đối vớ i tham số trung bình mẫu

 Như chúng ta đã biết, thu nhậ p trung bình của các đối tượ ng phỏng vấn là 33,224 triệu/năm, cógiả thiết cho r ằng thu nhậ p của đối tượ ng mà chúng ta phỏng vấn trên tổng thể là 32 triệu/năm,chúng ta cần k ết luận nhận định đó có đúng không.

Khi đó, giả thiết của bài toán là:

H0 : µ = µ0= 32 (triệu) và H1: µ ≠ µ0 = 32 (triệu)

Nhấn Analyze – Compare Means – One sample T test.

Chọn biến cần phân tích vào ô Test Variable(s), đặt giá tr ị µ0 vào ô Test Value.

Nhấn Option để thiết đặt độ tin cậy

(giả sử đ tin cậy là 95%)

 

Bấm Continue và bấm OK ở hộ p hội thoại ban đầu, k ết quả thu đượ c như sau:

Descriptive Statistics

200 10750 82500 33224.00 12932.72

200

Thu nhap nam (trieu)

Valid N (listwise)

N Minimum Maximum Mean Std. Deviation

One-Sample Statistics

200 33224.00 12932.72 914.48Thu nhap nam (trieu)

N Mean Std. Deviation Std. Error Mean

163

Page 34: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 34/57

 

 

One-Sample Test

1.34 199 .182 1224.00 -579.32 3027.32Thu nhap nam (trieu)

t df 

Sig.

(2-tailed)

Mean

Difference Lower Upper  

95% Confidence Interval of theDifference

Test Value = 32000

Giá tr ị t-student= 1,34

Giá tr ị p-value=0,182>0,05

Tại các biểu trên, ta có thể biết giá tr ị trung bình, độ lệch chuẩn của mẫu. Ngoài ra t=1,34 nên p-value=0,182>0,05 nên chúng ta chưa có cơ sở  để bác bỏ H0 hay chưa có cơ sở  để chấ p nhận H1.

Kiểm định tham số trung bình hai mẫu (hai mẫu độc lập)

Giả sử ta muốn so sánh thu nhậ p trung bình giữa những ngườ i có giớ i tính nam và nữ trên tổngthể có khác nhau hay không, ta có giả thiết:

H0: Thu nhậ p trung bình của ngườ i nam và ngườ i nữ bằng nhau trên tổng thể 

H1: Thu nhậ p trung bình của ngườ i nam và ngườ i nữ không bằng nhau trên tổng thể 

Nhấn Analyze – Compare Means – Independent sample t-test.

Chọn biến thunhap vào ô Test Variables và biến gioitinh vào ô Grouping Variable 

Nhấn vào Define Groups để định ngh ĩ a các nhóm với

Nam=1 và Nữ = 0

 

Nhấn vào Define Groups để định ngh ĩ a các nhóm với

Nam=1 và Nữ = 0

K ết quả như sau164

Page 35: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 35/57

 

Group Statistics

124 37053.23 13962.42 1253.86

76 26976.32 7763.42 890.52

Gioi tinh

Nam

Nu

Thu nhap nam (trieu)

N Mean Std. Deviation Std. Error Mean

165

 Independent Samples Test

17 .000 5.77 198 .000 10076.91 1747.75 6630 13524

6.55 196.4 .000 10076.91 1537.92 7044 13110

Equal variances

assumed

Equal variances

not assumed

Thu

nhap

nam

(trieu)

F Sig.

Levene's

Test for 

Equality of 

Variances

t df 

Sig.

(2-ta

iled)

Mean

Difference

Std. Error 

Difference Lower Upper  

95% Confidence

Interval of the

Difference

t-test for Equality of Means

Trung bình người có

giớ

i tính là Nam

Trung bình người có

giới tính là Nữ 

Nếu sig. trong kiểm định phương sai<0,05 thìphương sai giữa hai mẫu không bằng nhau,ta sẽ dùng kết quả kiểm định t ở dòng thứ 2

Giá tr ị t củakiểm định

p-value củagiá tr ị t

Kiểm định Leneve’s (giả thiết H0: phươ ng sai của hai mẫu (biến) bằng nhau, H1: phươ ng saicủa hai mẫu (biến) không bằng nhau) sẽ cho phép kiểm định phươ ng sai hai mẫu có bằng nhauhay không, trong tr ườ ng hợ  p này nếu sig. của F (trong thống kê Leneve’s) < 0,05 ta bác bỏ H0,chấ p nhận H1 ngh ĩ a là phươ ng sai của hai mẫu không bằng nhau, do vậy giá tr ị t mà ta phải thamchiếu là giá tr ị t ở dòng thứ 2. Ngượ c lại nếu sig. >0,05 thì phươ ng sai của hai mẫu bằng nhau, ta

sẽ dùng k ết quả kiểm định t ở dòng thứ nhất. Đối vớ i kiểm định t, ta nhận thấy r ằng t=6,55 và p-value = 0,000<0,05 năm ta có thể bác bỏ H0 và chấ p nhận H1, có ngh ĩ a là thu nhậ p trung bình giữa ngườ i nam và nữ sẽ khác nhau.

Kiểm định tham số trung bình hai mẫu (hai mẫu phụ thuộc)

Nhấn Analyze – Compare Means – Paired sample t-test. Chọn biến cần phân tích vào ôPaired Variables.

Nhấn Option để thiết đặtđộ tin cậy

(giả sử độ tin cậy là 95%)

 

Page 36: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 36/57

 

K ết quả:

Paired Samples Statistics

42.9333 15 30.6419 7.9117

44.1333 15 28.1422 7.2663

TRUOCQC

SAUQC

Pair 

1

Mean N Std. Deviation Std. Error Mean

Paired Samples Test

-1.200 5.7842 1.4935 -4.4032 2.0032 -.803 14 .435TRUOCQC - SAUQCPair 1

Mean

Std.

Deviation

Std.

Error 

Mean Lower Upper  

95% Confidence

Interval of the

Difference

Paired Differences

t df 

Sig.

(2-tailed)

Giá tr ị t-student= -0,803

Giá tr ị ước lượng(giới hạn trên)

Giá tr ị ước lượng(giới hạn dưới) Giá tr ị p-value=0,435>0,05

Vì giá tr ị t=-0,803 và p-value = 0,435>0,05 nên chúng ta chưa có cơ sở  để bác bỏ H0 tức làchưa có cơ sở  để chấ p nhận H1.

Phân tích phươ ng sai (Analysis of variance – ANOVA)

Giả sử chúng ta muốn so sánh thu nhậ p trung bình của các đối tượ ng làm trong những l ĩ nh vựcdịch vụ - thươ ng mại, xây dựng và công nghiệ p có khác nhau hay không. Giả thiết và đối thiết sẽ là:

H0: Thu nhậ p trung bình của những ngườ i làm trong l ĩ nh vực dịch vụ - thươ ng mại, xây dựng

và công nghiệ p bằng nhauH1: Thu nhậ p trung bình của ngườ i làm trong l ĩ nh vực dịch vụ - thươ ng mại, xây dựng và côngnghiệ p không bằng nhau (có ngh ĩ a là tồn tại ít nhất một thu nhậ p trung bình của một ngànhkhác vớ i ít nhất một thu nhậ p trung bình của hai ngành còn lại)

Nhấn Analyze – Compare Means – One-way ANOVA.

Chọn biến cần phân tích (định lượ ng) vào ô Dependent List và biến phân loại vào ô Factor 

166

Page 37: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 37/57

 

Nhấn Post Hoc để chọn loại kiểm định nhằm xác định cụ thể sự khác biệt giữa các nhóm(nhóm nào khác vớ i nhóm nào). Chúng ta có thể chọn Bonferroni hoặc Tukey’s-b (hai thống kênày đều cho ra cùng một k ết quả).

Nếu phươ ng sai giữa các nhóm cần so sánh không bằng nhau, chúng ta chọn Tamhane’s T2(ứng dụng cho kiểm định t từng cặ p nếu phươ ng sai của chúng không bằng nhau).

Nhấn Continue, nhấn Option để thiết đặt các lựa chọn.

Trong đó Homogeneity-of-variance để kiểm định sự bằng nhau phươ ng sai các nhóm, Meansplot để làm cho hình minh họa.

Test of Homogeneity of Variances

Thu nhap nam (trieu)

.414 2 197 .661

Levene Statistic df1 df2 Sig.

Vì Sig. >0,05 nên ta có thể khẳng định là phươ ng sai của các nhóm là bằng nhau, thỏa mãnđiều kiện của phân tích ANOVA.

167

Page 38: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 38/57

 

ANOVA

Thu nhap nam (trieu)

87185676.623 2 43592838.312 .259 .772

33196619123.377 197 168510756.971

33283804800.000 199

Between Groups

Within Groups

Total

Sum of Squares df Mean Square F Sig.

Vớ i F=0,259 và p-value = 0,772>0,05 nên chưa có cơ sở  để bác bỏ H0 hay chưa có cơ sở  để chấ p nhậ p H1

Trong các tr ườ ng hợ  p khác, nếu ta bác bỏ H0 và chấ p nhận H1, vớ i thống kê Bonferonni ta cóthể biết đượ c sự khác nhau từng cặ p của các tham số trung bình.

Means plots

Loai hinh doanh nghiep

Cong nghiepXay dungDich vu thuong mai

   M  e  a  n  o

   f   T   h  u  n   h  a  p  n  a  m    (   t  r

   i  e  u   )

35000

34000

33000

32000

 

Hồi quy tuyến tính

Giả sử chúng ta mong muốn tìm mối tươ ng quan giữa hai biến năm làm việc (biến độc lậ p) và thunhậ p hàng năm (biến phụ thuộc) trên tổng thể, chúng ta sẽ thực hiện như thế nào.

Vẽ sơ  đồ, kiểm tra bằng thị giác mối quan hệ 

Vào Graphs, nhấn Scatter 

168

Page 39: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 39/57

 

Chọn Simple và bấm Define 

Chọn các biến vào ô Y Axis (biến phụ thuộc) và X Axis (biến độc lậ p), bấm OK 

Nam lam viec

20181614121086

   T   h  u  n   h  a  p  n  a  m    (   t  r

   i  e  u   )

100000

80000

60000

40000

20000

0

 

Chúng ta có thể xem đườ ng hồi quy lí thuyết của dãy dữ liệu bằng cách click hai lần vàochuôt.

Sau khi một màn hình mớ i hiện ra, vào Chart – Option, hội hội thoại tiế p theo sẽ hiện ra – Bấm OK – Hội hội thoại sẽ là:

169

Page 40: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 40/57

 

 

Bấm Fit Options chọn Linear regression 

Bấm Continue và OK  

Nam lam viec

20181614121086

   T   h  u  n   h  a  p  n  a  m    (   t  r

   i  e  u   )

100000

80000

60000

40000

20000

0

 

170

Page 41: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 41/57

 

Rõ ràng trên hình vẽ bên, ta có thể hình dung có mối quan hệ tuyến tính (theo đườ ng thẳng) giữasố năm làm việc và thu nhậ p/năm. Để kiểm tra một cách chính xác, ta thực hiện thao tác hồi quy.

Vào Analyze và Regression chọn các biến vào các ô tươ ng ứng

ANOVAb

449.294 1 449.294 71.115 .000a

1250.926 198 6.318

1700.220 199

Regression

Residual

Total

Model

1

Sum of Squares df Mean Square F Sig.

Predictors: (Constant), Thu nhap nam (trieu)a.

Dependent Variable: Nam lam viecb.

Vì F=71,115 và p-value=0,000 nên chúng ta có thể khẳng định tồn tạo mô hình hay tồn tại mốiquan hệ giữa hai biến năm làm việc và thu nhậ p trên tổng thể.

Model Summary

.514a

.264 .261 2.51

Model

1

R R Square Adjusted R Square Std. Error of the Estimate

Predictors: (Constant), Thu nhap nam (trieu)a.

Ta có R 2

= 0,264 có ngh ĩ a là biến số năm làm việc sẽ giải thích 26,4% thu nhậ p/ năm của nhânviên (còn lại là những biến số khác).

Ta có R 2

a =0,261, ta có thể k ết luận mối quah hệ giữa hai biến này r ất yếu vì R 2

a =0,261<0,3.

Chú ý: Nếu R 2

a <0,3 Mối quan hệ yếu

 Nếu 0,3 <= R 2

a <0,5 Mối quan hệ trung bình (chấ p nhận)

171

Page 42: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 42/57

 

Nếu 0,5 <= R 2a <0,7 Mối quan hệ khá chặt chẽ 

 Nếu 1 <= R 2a Mối quan hệ r ất chặt chẽ 

Coefficientsa

9.970 .491 20.304 .000

1.162E-04 .000 .514 8.433 .000

(Constant)

Thu nhap nam (trieu)

Model

1

B Std. Error  

Unstandardized Coefficients

Beta

Standardized

Coefficients

t Sig.

Dependent Variable: Nam lam vieca.

Bảng coefficient cho phép chúng ta kiểm định các hệ số góc trong mô hình, ta có t1 = 8,433 và p-value = 0,000<0,05 nên ta khẳng định tồn tại mối quan hệ giữa hai biến vớ i hệ số góc b1=0,00011có ngh ĩ a là khi tăng mỗi năm làm việc, thu nhậ p hàng năm tang 110 ngàn đồng.

Ta có thể thành lậ p đượ c phươ ng trình hồi quy như sau:

yi = 9.870 + 0,00011xi + e

KIỆM ĐỊNH CHI BÌNH PHƯƠ NG VỀ TÍNH ĐỘC LẬP HAY PHỤ THUỘC GIỮ A HAIBIẾN (CROSSTABS)Kiểm định phân phối (kiểm định sự phù hợ p)

Tình huống: Trong một nghiên cứu ướ c tính của bộ Y tế, ngườ i ta mong muốn kiểm tra giả thuyếtr ằng tần suất sử dụng dịch vụ bệnh viện của các ngày trong tuần là như nhau và giảm 25% vàocuối tuần. Một mẫu gồm 52 000 bệnh nhân có phân phối sau:

  Ngày Số bệnh nhân (quan sát) Số bệnh nhân (lí thuyết)

Thứ hai 8623 8000Thư ba 8308 8000Thứ tư 8420 8000

Thứ năm 9032 8000Thứ sáu 8754 8000Thứ bảy 4361 6000Chủ nhật 4502 6000

52000 52000

Khi đó, giả thiết và đối thiết:

H0: Nhu cầu khám chữa bệnh là như nhau ở tất cả các ngày trong tuần và giảm 25% vào cuối

tuầnH1: Nhu cầu này có một dạng phân phối khác

172

Page 43: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 43/57

 

 

Kiểm định chi bình phươ ng về tính chất độc lập hay phụ thuộc (kiểm định hàng cột haykiểm định mối quan hệ giữ a hai biến biểu danh)

 Ngườ i ta dùng kiểm định Chi bình phươ ng để kiểm định sự k ết hợ  p giữa bai biến (biểu danh hoặcthứ tự). Có một số chú ý như sau:

- χ2 đượ c thiết lậ p để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ ra đượ c cườ ng độ của mối liên hệ đó. Trong tr ườ ng hợ  p này, cần sử dụng các đo lườ ng k ếthợ  p.

- χ2 cho phép tìm ra những mối liên hệ phi tuyến tính giữa hai biến.

- Vớ i kiểm định Chi bình phươ ng, ta thành lậ p đượ c các bảng chéo. Hệ số V Cramer đượ c áp

dụng cho tất cả các loại bảng chéo vớ i k là chiều bé nhất của bảng chéo. Cườ ng độ của nó biếnđộng từ 0 đến 1.

)1(

2

−=

k nV 

χ 

Giả sử ta chọn phân tích tính độc lậ p giữa hai biến định tính quy mô doanh nghiệ p (quymo) vàloại hình kinh doanh (loaihinh). Các bướ c tiến hành như sau:

H0: Hai biến quy mô doanh nghiệ p và loại hình doanh kinh độc lậ p vớ i nhau trên tổng thể 

H1: Hai biến quy mô doanh nghiệ p và loại hình doanh kinh phụ thuộc vớ i nhau trên tổng thể 

Vào Descriptives statistics – Crosstab chọn các biến vào các ô tươ ng ứng

173

Page 44: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 44/57

 

 

Bấm Statistics để thiết lậ p các thống kê

174

Bấm Cells để thiết lậ p các tỷ lệ phần tr ăm theo dòng, cột hay tổng cộng

Chi-Square Tests

38.665a 2 .000

50.910 2 .000

36.280 1 .000

104

Pearson Chi-Square

Likelihood Ratio

Linear-by-Linear Association

N of Valid Cases

Value df Asymp. Sig. (2-sided)

0 cells (.0%) have expected count less than 5. The minimum expected count is 12.92.a.

 

Giá tr ị kiểm địnhChi bình phương

Giá tr ị kiểm địnhp-value

Page 45: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 45/57

 

Loai hinh doanh nghiep * Quy mo doanh nghiep Crosstabulation

11 26 37

22.1 14.9 37.0

10.6% 25.0% 35.6%16 16 32

19.1 12.9 32.0

15.4% 15.4% 30.8%

35 0 35

20.9 14.1 35.0

33.7% .0% 33.7%

62 42 104

62.0 42.0 104.0

59.6% 40.4% 100.0%

Count

Expected Count

% of TotalCount

Expected Count

% of Total

Count

Expected Count

% of Total

Count

Expected Count

% of Total

Dich vu thuong mai

Xay dung

Cong nghiep

Loai hinh

doanh nghiep

Total

vua va nho lon

Quy mo doanh nghiep

Total

Symmetric Measures

.610 .000

.610 .000

104

Phi

Cramer's V

Nominal by

Nominal

N of Valid Cases

Value Approx. Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Trong kiểm này, ta thấy giá tr ị Chi bình phươ ng = 38,665 và p-value=0,000<0,05 nên ta bác bỏ 

H0 và chấ p nhận H1 tức hai biến phụ thuộc lẫn nhau trên tổng thể.Hệ số Phi = 0,61 khẳng định mối quan hệ giữa hai biến này khá chặt chẽ.

KIỂM ĐỊNH PHI THAM SỐ Kiểm định hai mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar)Vớ i ví dụ về đánh giá hai loại kem ở trên, ta cógiả thiết:

Vớ i giả thiết và đối thiết là:

H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể 

H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể Các bướ c thực hiện như sau:

Vào Analyze – Nonparametric Tests - 2 Related Samples

175

Page 46: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 46/57

 

 

K ết quả thu đượ c:

Ranks

2a 1.50 3.00

5b 5.00 25.00

2c

9

Negative Ranks

Positive Ranks

Ties

Total

B - A

N Mean Rank Sum of Ranks

B < Aa.

B > Ab.

A = Bc.

Test Statistics b

-1.876a

.061

Z

Asymp. Sig. (2-tailed)

B - A

Based on negative ranks.a.

Wilcoxon Signed Ranks Testb.

Nhìn vào bảng trên ta có thể dễ dàng diễn giải dữ liệu, vớ i Z = -1,876 và p-value=0,61>0,05nên ta chưa có cơ sở  để bác bỏ H0 tức chưa có cơ sở  để chấ p nhận H1 hay chưa có cơ sở  để khẳngđịnh có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể.

Chú ý: Kiể m địn d ấ u và Nemar có thể thự c hiện t ươ ng t ự  Kiểm định nhiều hơ n hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)

Trong tr ườ ng hợ  p giống như ví dụ ở tr ườ ng hợ  p kiểm định wilcoxon, nhung bây giờ  ta có 3 sản phẩm A, B, C, khi đó

  KH Kem A Kem B Kem C 

1 4 3 52 5 5 53 2 5 54 3 2 5

176

Page 47: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 47/57

 

5 3 5 56 1 5 57 3 3 58 2 5 59 2 5 5

Vào Analyze – Nonparametric Test – K Related Samples chọn các biến vào phân tích

 

K ết quả:

Ranks

1.39

2.00

2.61

A

B

C

Mean Rank

Test Statistics a

9

9.308

2

.010

N

Chi-Square

df 

Asymp. Sig.

Friedman Testa.

Vớ i Chi bình phươ ng = 9,308 và p-value=0,01<0,05 nên ta bác bỏ H0 tức chấ p nhận H1 hay đã

có sự khác biệt trong mức độ ưa chuộng giữa A, B, C trong tổng thể.Kiểm định cho hai mẫu độc lập (Mann-Whitney U)

Tình huống: Có hai loại máy nổ Toshiba và Yamaha đang tiêu thụ tại Việt Nam, một nhà phân

 phối muốn kiểm tra mức độ tiêu hao nguyên vật liệu của hai loại sản phẩm này.

 Nhà phân phối gặ p các khách hàng sử dụng hai loại sản phẩm, tiến hành điều tra mức tiêu hao

nguyên vật liệu, tổng số khách hàng điều tra là 18 ngườ i trong đó 10 ngườ i sử dụng sản phẩm

Toshiba và 10 ngườ i sử dụng sản phẩm Yamaha, k ết quả thu đượ c như sau:

177

Page 48: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 48/57

 

  KH Toshiba Y

1 4000 42002 3800 43003 4600 34004 4300 3500

5 5000 38006  5300 42007  4900 43008 4700 34009 400010 5200

Vào Analyze – Nonparametric Test – 2 Independent Samples chọn các biến vào phân tích

Nhấn Grouping Define để định ngh ĩ a các biến

K ết quả như sau

Ranks

10 12.15 121.50

8 6.19 49.50

18

NHANHIEU

Toshiba

Yamaha

Total

TIEUHAO

N Mean Rank Sum of Ranks

178

Page 49: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 49/57

 

Test Statistics b

13.500

49.500

-2.364

.018

.016a

Mann-Whitney U

Wilcoxon W

Z

Asymp. Sig. (2-tailed)Exact Sig. [2*(1-tailed Sig.)]

TIEUHAO

Not corrected for ties.a.

Grouping Variable: NHANHIEUb.

Ta thấy giá tr ị Mann-Whitney U = 13,5, giá tr ị Z = -2,363 và p-value=0,18 nên ta bác bỏ H0, chấ pnhận H1 tức là có sự khác nhau về mức tiêu hao nhiên liệu trung bình của hai loại sản phẩm làkhác nhau.

Kiểm định nhiều hơ n hai mẫu độc lập (Kruskal-Wallis H)

Giả sử như chúng ta có 3 nhóm sản phẩm (thêm một sản phẩm của hãng Sonix), cách thức thực

hiện như sau: Vào Analyze – Nonparametric Test – K Independent Samples chọn các biến vào phân tích

Vào Grouping Variable để định ngh ĩ a biến, hiện tại chúng ta có 3 biến, chúng ta đặt giá tr ị ở  maximum là 3, nếu chúng ta so sánh 2 biến thì chúng ta định số 2 (giá tr ị 1, 2, hay 3 phụ thuộcvào các định ngh ĩ a value label của biến nhanhieu.

179

Page 50: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 50/57

 

Ranks

10 18.55

8 9.63

8 11.06

26

NHANHIEUToshiba

Yamaha

3

Total

TIEUHAON Mean Rank

Test Statistics a,b

7.318

2

.026

Chi-Square

df 

Asymp. Sig.

TIEUHAO

Kruskal Wallis Testa.

Grouping Variable: NHANHIEUb.

Ta thấy giá tr ị Chi bình phươ ng = 7,318 và p-value=0,026 nên ta bác bỏ H0, chấ p nhận H1 tức làcó sự khác nhau về mức tiêu hao nhiên liệu trung bình của ba loại sản phẩm là khác nhau.

TÓM TẮT

Trong nghiên cứu marketing, phân tích dữ liệu luôn bao hàm kiểm định giả thuyết. Để thực hiệnmột kiểm định ngườ i ta phải trình bày hai giả thuyết là giả thuyết không ( thườ ng ký hiệu H0) -

giả thuyết cần kiểm định; và giả thuyết đối ( thườ ng ký hiệu H1) - giả thuyết thay thế cho giả thuyết không để khi giả thuyết H0 bị bác bỏ thì chấ p nhận giả thuyết đối H1 này. Các k ỹ thuật

thống kê cho phép chúng ta đi đến quyết định là các giả thuyết đó có đượ c kiểm chứng bằng số 

liệu thực tế hay không.

Khi dựa vào mẫu để kiểm định giả thuyết có thể mắc hai loại sai lầm. sai lầm loại một là sai lầmkhi chúng ta bác bỏ một giả thuyết đúng. Sai lầm loại hai là sai lầm khi chúng ta thừa nhận một

giả thuyết sai.

Thực hiện một bài toán kiểm định bao gồm các bướ c: phát biểu giả thuyết không giả thuyết đối;

xác định mức ý ngh ĩ a; lựa chọn phươ ng pháp kiểm định; tính giá tr ị kiểm định; xác định miền

 bác bỏ; đưa ra k ết luận.

Thủ tục kiểm định giả thuyết có thể đượ c sắ p xế p theo hai loại chủ yếu: kiểm định tham số vàkiểm định phi tham số- tuỳ thuộc vào thang đo lườ ng của biến liên quan. Các kiểm định tham số 

đòi sử dụng các thang đo lườ ng là khoảng hoặc tỷ lệ, trong khi các kiểm định phi tham số phùhợ  p vớ i các thang đo lườ ng là định danh và thứ tự. Kiểm định tham số đượ c nghiên cứu bao gồm

kiểm định tham số trung bình của tổng thể, kiểm định tham số tỷ lệ, kiểm định sự khác nhau giữahai trung bình hai tổng thể, kiểm định sự khác nhau trung bình của nhiều tổng thể và hồi quy

tươ ng quan. Kiểm định phi tham số chúng ta sẽ nghiên cứu là kiểm định về quy luật phân phói

của tổng thể, kiểm định về tính độc lậ p hay phụ thuộc, kiểm định dấu, kiểm định Wilcoxon, kiểmđịnh Mann-Whitney...

Các thủ tục kiểm định đều dễ dàng và đơ n giản nhờ vào sự tr ợ giúp của phân mềm SPSS.

180

Page 51: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 51/57

 

  181

CÂU HỎI ÔN TẬP

1.  Thế nào là giả thuyết không? Giả thuyết đối? Cho ví dụ?2.  Trong kiểm định giả thuyết thống kê có thể vấ p những loại sai lầm nào?3.  Hãy cho biết các bướ c cơ bản thực hiện bài toán kiểm định?

4.  Sự khác nhau cơ bản phân biệt giữa kiểm định tham số và phi tham số.5.Thờ i gian hoàn thành một sản phẩm của nhà máy A qua quá trình quan sát 25 công nhân theo bảng sau:

Thờ i gian (phút) 40-42 42-44 44-46 46-48 48-50Số công nhân 2 6 10 4 3

Theo nhận định của nhà máy thờ i gian hoàn thành một sản phẩm là 44 phút, như vậy nhìn nhậncủa nhà máy có đúng không? Giả sử r ằng thờ i gian hoàn thành một sản phẩm của các công nhânlà biến chuẩn.

6. Theo thiết k ế k ỹ thuật chiều dài sản phẩm A là 20cm. Sau thờ i gian sản xuất, nghi ngờ chiều

dài sản phẩm không đạt yêu cầu. Tiến hành kiểm tra, ngườ i ta chọn ngẫu nhiên 64 sản phẩm để đo và thu đượ c k ết quả như sau chiều dài trung bình 20,5 cm và độ lệch tiêu chuẩn điều chỉnh là1cm. Biết r ằngchiều dài loại chi tiết trên là biến chuẩn N(a,σ). Hãy kiểm định điều nghi ngờ vớ imức ý ngh ĩ a α=0,05 ?

7.Trong lượ ng sản phẩm do nhà máy sản xuất ra (X) là một đại lượ ng ngẫu nhiên phân phốichuẩn vớ i độ lệch chuẩn là σ=2 kg và tr ọng lượ ng trung bình là 20 kg. Nghi ngờ máy hoạt độngkhông bình thườ ng làm thay đổi tr ọng lượ ng trung bình của sản phẩm, ngườ i ta cân thử 100 sản phẩm và thu đượ c k ết qủa sau:

Tr ọng lượ ng sản phẩm (kg) 19 20 21 22 23Số sản phẩm tươ ng ứng 10 60 20 5 5

Vớ i mức ý ngh ĩ a α=0,05 hãy k ết luận về nghi ngờ nói trên. Cho U0,95=1,645, U0,975=1,96 hãy ướ clượ ng tr ọng lượ ng sản phẩm do nhà máy sản xuất.

8. Tỉ lệ phế phẩm của một nhà máy theo dự toán là 0,1 và có ngườ i cho r ằng tỉ lệ đó là tỉ lệ thậtsự của phế phẩm. Chọn ngẫu nhiên 100 sản phẩm của nhà máy có thấy 11 phế phẩm. Hãy kiểmđịnh nhận xét trên vớ i α=0,05 ?

9. Giám đốc marketing của một công ty sẽ thực hiện chươ ng trình khuyến mãi sản phẩm A ở khuvực X nếu tỷ lệ những ngườ i thườ ng xuyên theo dõi chươ ng trình quảng cáo sản phẩm A củacông ty trên truyền hình là trên 15%. Thực hiện điều tra 2500 ngườ i có ti vi ở khu vực có 380ngườ i theo dõi chươ ng trình quảng cáo sản phẩm của công ty. Vớ i mức ý ngh ĩ a α = 0,05, hãy

giúp giám đốc marketing quyết định xem có nên thực hiện chươ ng trình khuyến mãi đó không?Ướ c lượ ng tỷ lệ những ngườ i thườ ng xuyên theo dõi chươ ng trình quảng cáo của công ty trêntruyền hình? Tỷ lệ những ngườ i có máy thu hình ở  khu vực đó là 20%. Cho biết U0,95=1,645,U0,975=1,96.

10. Định mức thờ i gian lắ p đặt một máy vi tính cá nhân là một đại lượ ng ngẫu nhiên tuân theoqui luật phân phối chuẩn có thờ i gian quy định là 30 phút. Do có thay đổi trong qui trình lắ p đặtloại máy vi tính này, ngườ i ta ngh ĩ r ằng điều này có thể dẫn đến việc phải thay đổi định mức thờ igian lắ p đặt máy. Tiến hành kiểm tra thử 5o máy vi tính và thu đượ c k ết quả sau:

Page 52: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 52/57

 

Thờ i gian lắ p đặt (phút) Số máy tính25-27 327-29 1429-31 1931-33 10

33-35 4Vớ i mức ý ngh ĩ a α=0,05, hãy k ết luận xem có cần thay đổi định mức thờ i gian lắ p đặt máy hay

không? Ướ c lượ ng thờ i gian lắ p đặt trung bình của loại máy vi tính đó? Cho biết =1,711,

=2,064.

)24(

95,0T)24(

975,0T

11. Một công ty sản xuất giấy dùng cho máy vi tính theo k ế hoạch cho ra những mẫu giấy cóchiều dài trung bình 11 cm và độ lệch chuẩn 0,02cm. Vào những khoảng thờ i gian nhất định,ngườ i ta lẫy ngẫu nhiên những mẫu giấy sản xuất, xác định chiều dài trung bình xem có bằng11cm không để biết máy làm việc bình thườ ng hay có tr ục tr ặc gì. Trong một lần kiểm nghiệm,một mẫu 1000 tờ giấy đã đượ c chọn và chiều daì trung bình đo đượ c 10,998 cm. Nếu độ tin cậy

cho việc

ướ c l

ượ ng chi

ều dài trung bình là 95% thì nhà s

ản xu

ất có th

ểk ết lu

ận gì v

ềgi

ấy

đã s

ảnxuất đượ c?

12. Hãng sản xuất xe hơ i Mercedes muốn nghiên cứu mức tiêu hao trung bình lượ ng xăng củamột loại xe tải do hãng này sản xuất. K ết quả đo đượ c như sau:

Tiêu hao (lít/100km) Số xe16-17 517-18 918-19 1419-20 1820-21 25

21-22 1622-23 723-24 6

a. Ướ c lượ ng tham số trung bình vớ i mức ý ngh ĩ a 5%

 b. Hãng khẳng định mức xăng tiêu hao trung bình là 19 lít /100km. Hãy kiểm tra lại lờ i khẳngđịnh này vớ i mức ý ngh ĩ a 5%?

13. Một doanh nghiệ p có số liệu thống kê về doanh thu bán hàng của mình qua ba năm theo cáctháng như sau:

T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12

  N1 250 240 260 270 280 230 290 180 210 250 270 300  N2 320 330 330 350 360 270 230 230 270 350 350 350  N3 360 380 380 400 410 350 300 300 350 430 430 450

a, Hãy dự đoán doanh thu bán hàng năm thứ 4.

 b. Doanh nghiệ p dự kiến năm thứ 4 sẽ sử dụng 2% doanh thu để thực hiện chươ ng trình khuyếnmãi. Hãy tính khoản dự kiến này.

c. Dự kiến song song vớ i việc thực hiện khuyến mãi, sản lượ ng mua của doanh nghiệ p tăng lên3%. Hãy lậ p bảng báo cáo k ết quả.

182

Page 53: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 53/57

 

  183

14. Một doanh nghiệ p sản xuất thức ăn để nuôi gà công nghiệ p muốn kiểm tra tr ọng lượ ng củacác bao thức ăn do mình sản xuất. Chọn cân thử ngẫu nhiên 50 bao thức ăn và k ết quả thu đượ cnhư sau:

20 25 29 32 3035 21 26 32 33

27 33 22 36 2927 36 28 23 3632 25 36 33 2427 31 30 29 2226 32 29 36 3029 31 29 32 3129 37 38 36 3928 32 40 30 28

a. Hãy phân k ết quả cân đượ c thành 5 lớ  p.

 b. Ướ c lượ ng tr ọng lượ ng trung bình của các bao thức ăn trên vớ i độ tin cậy 95%?

15. Công ty nướ c giả khát X có 3 loại sản phẩm là A, B, C vớ i mong muốn số lượ ng chai tiêu thụ lần lượ t chiếm 25%, 25%, 50%. Vớ i độ tin cậy 95% hãy kiểm nghiệm xem có trái vớ i mongmuốn không nếu k ết quả điều tra thu thậ p như sau:

Sản phẩm A B CSản lượ ng tiêu thụ 70 66 164

16. Trong một lần kiểm tra sơ bộ về tình hình học tậ p của sinh viên một tr ườ ng đại học vớ i mộtmẫu chọn ngẫu nhiên gồm 400 sinh viên để phân loại giỏi, khá, trung bình, yếu. Vớ i giả thiếtr ằng tỷ lệ sinh viên theo các tiêu thức trên lần lượ t là: 20%, 50%, 20%, 10%. K ết quả kiểm tracho thấy:

Giỏi Khá Trung bình YếuSố lượ ng SV 71 194 89 46

Vớ i mức ý ngh ĩ a 5%, hãy xác định xem giả thuyết trên có đúng không?

17. Hãy thử giả thiết Ho về tính chất độc lậ p của hai yếu tố phân loại A và B bằng cách dùng phép kiểm định chi (χ) cho trong bảng sau vớ i mức ý ngh ĩ a 5%?

BB1 B2 B3

A1 39 75 42A2 63 51 70A

A3 30 38 29

18. Để nghiên cứu về nhu cầu xem phim ở r ạ p chiếu bóng của nhân dân các vùng trong thành phố Đà Nẵng, một nhân viên marketing của công ty chiếu bóng thành phố đã chọn ngẫu nhiên mộtmẫu gồm 291 ngườ i để điều tra. Họ đượ c phân thành ba vùng: nội thành, ven đô và huyện. Mỗingườ i đượ c hỏi để biết có đi xem phim: (1): mỗi ngày một lần

(2): ít nhất một lần/tuần (3): ít nhất một lần/tháng

(4): ít hơ n một lần/tháng (5): không đi xem bao giờ  

Bảng phân bố trong mẫu theo vùng và mức độ xem phim như sau:

Page 54: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 54/57

 

  184

Mức độ xem phim (số lần)Vùng(1) (2) (3) (4) (5)

Tổng số 

 Nội thànhVen đôHuyện

20144

283412

232110

141420

121253

979599

Tổng số 38 74 54 48 77 291

Vớ i độ tin cậy 95% hãy xét xem mối quan hệ ngườ i dân giữa các vùng trong thành phố và mứcđộ xem phim

19. Ngườ i ta muốn điều tra xem giữa loại tai nạn lao động có liên quan đến độ tuổi của ngườ i láixe không, k ết quả thu đượ c:

Loại thươ ng tậtChân, tay Mình Sọ 

Dướ i 35 9 17 5Tuổi

Trên 35 61 13 12

Từ k ết quả trên, nhân viên điều tra k ết luận có mối tươ ng quan giữa độ tuổi và loại thươ ng tật củangườ i lao động. Bạn có đồng ý không vớ i độ tin cậy 95%.

20. Một viên thanh tra chi cục thuế muốn nghiên cứu xem có sự khác nhau nào trong việc kê khaihồ sơ thuế giữa ba nhóm doanh nghiệ p khác nhau hay không và đã thu thậ p đượ c số liệu sau:

Loại doanh nghiệ pA B C

Hồ sơ sai 6 5 9K ết quả 

Hồ sơ  đúng 19 20 41

21. Nhân viên marketing của một hãng nướ c ngọt CBA muốn nghiên cứu xem tỷ lệ ngườ i thíchchọn loại nướ c giải khát A có tăng thêm sau khi chiến dịch quảng cáo đượ c thực hiện hay không.Một mẫu 200 ngườ i uống nướ c ngọt đượ c chọn ngẫu nhiên và đượ c hỏi họ thích loại nướ c ngọt Ahay B tr ướ c và sau khi thực hiện quảng cáo hoàn tất. Ở mức ý ngh ĩ a 0,05, có bằng chứng nào chothấy khách hàng chuộng nướ c ngọt A hơ n sau khi thực hiện quảng cáo không? Cho biết:

Tr ướ c khi quảng cáoA B

Loại A 101 9Sau khiquảng cáo Loại B 22 68

22. Viên thanh tra chất lượ ng hàng của một công ty sản xuất ô tô muốn tìm hiểu xem tỉ lệ sản phẩm hư hỏng có khác nhau trong những ngày khác nhau trong tuần hay không. Mỗi ngày ngườ iấy chọn ngẫu nhiên một mẫu 100 sản phẩm làm đượ c trong ngày ấy. K ết quả như sau:

K ết quả Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáuSố bị hỏng

Số tốt1288

793

793

1090

1486

Tổng 100 100 100 100 100

Ở mức ý ngh ĩ a 0,05, có bằng chứng nào cho thấy tỷ lệ hàng hư hỏng khác nhau trong ngày khácnhau trong tuần không?

23. Trong mỗi tình huống sau, cho biết phân tích thống kê nào bạn sẽ thực hiện và các kiểm địnhhoặc các biến mà bạn sẽ sử dụng:

Page 55: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 55/57

 

  185

a.  Vớ i một thang đo Likert gồm 9 điểm, ngườ i ta đo lườ ng ý kiến của một nhóm khách hàngđối vớ i xà phòng Camay. Sau đó ngườ i ta chiếu một đoạn phim quảng cáo cho nhữngngườ i tham gia này r ồi đo lườ ng lại lần thứ hai ý kiến của họ. Quảng cáo có đạt tớ i khả năng làm thay đổi ý kiến của ngườ i mua?

 b.  Ý kiến khách hàng đối vớ i xà phòng Camay có tuân theo qui luật phân phối chuẩn không?c.  Một nghiên cứu dựa vào 1000 hộ gia đình, những ngườ i tr ả lờ i đượ c sắ p xế p theo mức

tiêu thụ của họ về kem (đáng k ể, trung bình, yếu hoặc không) và mức thu nhậ p của họ (cao, trung bình, thấ p). Mức tiêu thụ kem có quan hệ vớ i thu nhậ p không?

24. Chiến dịch quảng cáo hiện tại sẽ đượ c thay đổi nếu ít nhất 30% ngườ i tiêu dùng thích.a.  Xác lậ p giả thuyết không và giả thuyết đối b.  Kiểm định thống kê nào bạn sẽ sử dụng? tại sao?c.  Một điều tra dựa vào 300 ngườ i tiêu dùng chỉ ra r ằng 84 ngườ i trong số họ thích quảng

cáo. Quảng cáo có phải thay đổi không? tại sao?25. Trong khuôn khổ một thực nghiệm nhằm đo lườ ng ảnh hưở ng của giớ i tính và mức độ thườ ngxuyên đi du lịch đối vớ i sở  thích du lịch ra nướ c ngoài, ngườ i ta đã thu đượ c k ết quả của 30ngườ i tr ả lờ i như phần sau. Sở thích đượ c đo lườ ng ở i một thang đo 9 điểm (1= không hề thích,9= hoàn toàn r ất thích). Giớ i tính đượ c mã hoá 1 đối vớ i nam và 2 đối vớ i nữ. Mức độ thườ ng

xuyên đi du lịch dducmã hoá như sau: 1= yếu, 2= trung bình, 3= cao.Số thứ tự  Giớ i tính Mứ c độ thườ ng xuyên đi du lịch Sở thích

1234567891011121314151617181920

21222324252627282930

11111111111111122222

2222222222

11111222223333311111

2222233333

23442455338987767657

3454566678

Page 56: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 56/57

 

  186

Vớ i phần mềm SPSS, hãy thực hiện các phân tích sau:

a.   Nam và nữ có sở thích khác nhau đối vớ i đi du lịch ra nướ c ngoài hay không? b.   Những ngườ i ít đi du lịch, đi du lịch ở mức trung bình và hay đi du lịch có sở thích khác

nhau đối vớ i việc đi du lịch ra nướ c ngoài không?c.  Mức độ thườ ng xuyên đi du lịch có khác nhau giữa nam và nữ không?

26. Sau đây là một vài dữ liệu liên quan đến nhà hàng A đã đượ c thu thậ p từ 45 khách hàng. Cácdữ liệu này liên quan mức độ thườ ng xuyên đến nhà hàng, giớ i tính của khách hàng, đánh giá củakhách hàng về không gian, thái độ của nhân viên phục vụ, chất lượ ng các món ăn và giá cả cácmón ăn của nhà hàng. Mức độ thườ ng xuyên đến nhà hàng đượ c mã hoá 1,2 và 3 theo ít thườ ngxuyên, thườ ng xuyên và r ất thườ ng xuyên. Giớ i tính đượ c mã hoá 1 đói vớ i nam và 2 đối vớ i nữ.Đánh giá về không gian thoáng đẹ p nhà hàng, thái độ lịch sự vui vẻ của nhân viên phục vụ, chấtlượ ng cao của các món ăn và giá cả các món ăn hợ  p lý của nhà hàng đượ c đánh giá bở i một thangLikert gồm 7 điểm( 1=R ất không tán thành, 7= r ất tán thành). Có 5 ngườ i tr ả lờ i đã không tr ả lờ ivà đượ c mã hoá bằng giá tr ị khuyết là 9.

TT

Mứ c độ 

thườ ngxuyên đến Giớ i tính

không gian

thoáng đẹp

nhân viên

phục vụ lịch sự  

món ăn

ngon

giá cả 

hợ p lý123456789

1011121314151617181920

21222324252627282930

311332212

13313113213

3213123212

211222112

12212221111

2211222112

723654524

36646437615

6216357695

623543414

17534346517

6317236429

546575433

26635424434

7136246234

567342346

44413545341

7427145516

Page 57: Chuong Viii

5/8/2018 Chuong Viii - slidepdf.com

http://slidepdf.com/reader/full/chuong-viii-559abe77a041b 57/57

 

  187

313233343536373839404142434445

112233333111111

221111222111111

143456657421231

264675767333431

953577546442344

392733333653665

a.  Thiết lậ p phân phối tần suất cho mỗi biến. b.  Lậ p một bảng chéo giữa hai biến: mức độ thườ ng xuyên đến nhà hàng và giớ i tính ? mức độ thườ ng

xuyên đến nhà hàng có khác nhau giữa nam và nữ không ?c.  Dữ liệu về đánh giá chất lượ ng các món ăn có tuân theo qui luật chuẩn hay không ?d.  Hãy mã hoá lại dữ liệu đánh giá sự hợ  p lý về giá cả theo một thang đo lườ ng thứ tự. Biến số này có

thay đổi theo mức độ thườ ng xuyên đến nhà hàng?26. Để biết đượ c chất lượ ng, giá cả các mặt hàng đã ảnh hưở ng như thế nào đến mức độ ưa thích củakhách hàng đối vớ i các cửa hàng, ngườ i ta đã tiến hành nghiên cứu trên 14 cửa hàng. Các cửa hàng này đãdducđánh giá theo các đặc tính sau : mức độ ưa thích đối vớ i cửa hàng, chất lượ ng hàng hoá, mức giá. Tấtcả các đánh giá đượ c đo lườ ng bở i một thang điểm 11 trong đó điểm số càng cao biểu thị mức đánh giácàng tốt.

Số TT cử a hàng Mứ c độ ư a thích Chất lượ ng HH Giá1

23456789

10111213

14

6

983

10452

119

1029

5

5

662634195818

3

3

114111174810855

2a.  Phân tích thống kê nào là thích hợ  p để xem xét mối quan hệ giữa biến mức độ ưa thích và chất lượ nghàng hoá? Tại sao ? Sử dụng phần mềm SPSS thực hiện phân tích đó và giải thích k ết quả?

 b.  Phân tích thống kê nào là thích hợ  p để xem xét mối quan hệ giữa biến mức độ ưa thích vớ i biến chấtlượ ng hàng hoá và giá cả? Tại sao ? Sử dụng phần mềm SPSS thực hiện phân tích đó và giải thích k ếtquả?

TÀI LIỆU THAM KHẢODick R. Wittink, The Application of Regression Analysis (Boston: Allyn & Bacon, 1988), 30–31. William E. Becker, Statistics for Business and Economics (Cincinnati: South-Western College Publishing,

1995), 502.