142
Bài 1: Cuộc điều tra nghiên cứu mối quan hệ giữa giới tính, tuổi và thói quen hút thuốc. Được cho như sau: (phần sau là những tập tin của những câu trả lời có tính chất lý thuyết. Mỗi hàng dữ kiện tham khảo là một người trả lời cá thể. Giớ i tính Tuổ i Thói quen hút thuốc 1 1 1 2 2 2 2 2 1 1 2 2 1 1 35 24 18 26 45 27 17 36 53 64 56 -1 37 49 0 1 1 1 1 0 0 0 0 0 1 1 0 9 Bộ mã Thói quen hút thuốc 0 = không hút, 1 = hút , 9 = thiếu. Giới tính 1 = nữ, 2 = nam , 9 = thiếu. Tuổi -1 = thiếu. Tuổi trung bình của người hút thuốc và không hút thuốc, cùng với kiệm định –t cho sự khác biệt về tuổi. Bài làm

Hướng dẫn SPSS

Embed Size (px)

DESCRIPTION

Hướng dẫn SPSS truong dai hoc cong nghiep

Citation preview

Page 1: Hướng dẫn SPSS

Bài 1:

Cuộc điều tra nghiên cứu mối quan hệ giữa giới tính, tuổi và thói quen hút thuốc. Được cho như sau:(phần sau là những tập tin của những câu trả lời có tính chất lý thuyết. Mỗi hàng dữ kiện tham khảo làmột người trả lời cá thể.

Giớ i tính Tuổ i Thói quenhút thuốc

11122222112211

3524182645271736536456-13749

01111000001109

Bộ mã

Thói quen hút thuốc0 = không hút, 1 = hút , 9 = thiếu. Giới tính1 = nữ, 2 = nam , 9 = thiếu. Tuổi-1 = thiếu.

Tuổi trung bình của người hút thuốc và không hút thuốc, cùng với kiệm định –t cho sựkhác biệt về tuổi.

Bài làm

Page 2: Hướng dẫn SPSS
Page 3: Hướng dẫn SPSS

Click vào Define Groups…

Đặt giả thiết H0 là tuổi trung bình của những người hút thuốc và không hút thuốc làkhông có sự khác nhau.

Page 4: Hướng dẫn SPSS

Levene's Test for

Equality of

Variances

t-test for Equality of Means

F Sig. t df Sig. (2-

tailed)

Mean

Difference

Std. Error

Difference

95% Confidence Interval

of the Difference

Lower Upper

Equal variances

assumedtuổi

Equal variances

not assumed

.152 .705 .500

.498

10

8.654

.628

.631

4.629

4.629

9.259

9.294

-16.002

-16.525

25.259

25.782

Independent Samples Test

Kiểm đinh Levene's Test có sig = 0.705 > 0.05 nên chấp nhận giả thiết phương saicủa các nhóm bằng nhau.Do đó, sử dụng kết quả kiểm định T ờ dòng phương sai bằng nhau. Kết quả kiểm địnht-test cho thấy sig = 0.628 > 0.05 nên chấp nhận giả thiết H0 kết luận rằng tuổi trungbình của người hút thuốc và không hút thuốc là không có sự khác nhau.Bài 2Mức tiêu thụ xăng của 3 loại xe – km/l

Xe A

22.219.920.321.421.221.020.3

Xe B

24.623.122.023.523.622.123.5

Xe C

22.721.923.324.122.123.4

-

Yêu c ầu:a. Vẽ biểu đồ hộp phản ánh mức tiêu thụ xăng của 3 loại xe (bằng

SPSS)b. Tính các giá trị trung bình của mẫu về mức tiêu thụ xăngc. Dùng phương pháp phân tích phương sai một yếu tố (one – way –

anova) để thấy được mức tiêu thụ xăng của 3 loại xe có khác nhauhay không ?

Page 5: Hướng dẫn SPSS

Bài làm

Page 6: Hướng dẫn SPSS

Click vào Options…

Page 7: Hướng dẫn SPSS

Click Continue và OKchạy Anova lần 2

Click vào nút Post Hoc…

Page 8: Hướng dẫn SPSS

Sum of Squares df Mean Square F Sig.

Between Groups

Within Groups

Total

21.670

12.248

33.918

2

17

19

10.835

.720

15.038 .000

Levene Statistic df1 df2 Sig.

.036 2 17 .965

Continue và OK

Đặt giả thiêt H0 mức tiêu thụ xăng trung bình của 3 loại xe là như nhau.Test of Homogeneity of Variances

Mức tiêu thụ xăng

Kiểm định Levene Statistic có sig = 0.965 > 0.05 nên chấp nhận giả thiết phương sai bằngnhau giũa các nhóm. Do đó bảng phân ANOVA sử dụng tốt.

ANOVA

Mức tiêu thụ xăng

Kiểm định ANOVA có mức ý nghĩa sig = 0.000 < 0.05 nên bác bỏ giả thiết H0 và kết luậnmức tiêu thụ xăng trung bình của 3 loại xe có sự khác nhau và có ý nghĩa thống kê.

Multiple Comparisons

Page 9: Hướng dẫn SPSS

(I) Loại xe (J) Loại xe Mean

Difference (I-J)

Std. Error Sig. 95% Confidence Interval

Lower Bound Upper Bound

Xe BXe A

Xe C

Xe AXe B

Xe C

Xe AXe C

Xe B

*-2.3000

*-2.0167

*2.3000

.2833*

2.0167

-.2833

.4537

.4722

.4537

.4722

.4722

.4722

.000

.002

.000

1.000

.002

1.000

-3.505

-3.270

1.095

-.970

.763

-1.537

-1.095

-.763

3.505

1.537

3.270

.970

Dependent Variable: Mức tiêu thụ xăng

Bonferroni

*. The mean difference is significant at the 0.05 level.

Bảng kết quả so sánh giá trị trung bình từng cặp Bonferroni cho thấy 2 cặp có giá trị sig <0.05 nên mức tiêu thụ xăng trung bình của ba loại xe trên có sự khác nhau và có ý nghĩathống kê.

Đồ thị trên cho thấy:

Mức tiêu thụ xăng trung bình của xe B cao nhất: 23.2 km/l

Tiếp đến mức tiêu thụ xăng của xe C trung bình 22.917 km/l

Thấp nhất là mức tiêu thục xăng của xe A trung bình 20.9 km/l

Page 10: Hướng dẫn SPSS

Stt Thái độ đốivới du lịch

Thu nhập GĐ(1000đ/tháng)

1 5 1845

2 6 2134

3 7 2516

4 7 1940

5 6 2108

6 9 3000

7 5 1848

8 8 2564

9 4 1972

10 3 1844

11 8 2855

12 7 2700

13 6 2256

14 2 1845

15 8 2900

Câu 3Giả sử chúng ta muốn xác định thái độ đối với du lịch của các gia đình phân theo thu nhập trong vòng hainăm qua. Các dữ liệu được thu thập từ một mẫu gồm 15 hộ gia đình. Thu nhập trung bình tháng của giađình tính bằng 1000đ/tháng, thái độ đối với du lịch được đo trên thang đo chín điểm.

Yêu c ầu :Hãy trình bày kết quả phân tích ANOVA để thấy

được rằng thu nhập gia đình có liên quan thái độ đối với du

lịch hay không? (Cho biết thêm chỉ xét 4 mức thu nhập gia

đình sau khi recode)

Bài làm

Page 11: Hướng dẫn SPSS
Page 12: Hướng dẫn SPSS

Click vào Continue

Click vào

1. Gõ tên mới vào ô Binned Variable

Page 13: Hướng dẫn SPSS

2. Click vào nút Make Cutpoints…

Page 14: Hướng dẫn SPSS

Click vào

Click vào Make Labels rồi OK.

Nhấp OK

Page 15: Hướng dẫn SPSS

Sum of Squares df Mean Square F Sig.

Between Groups

Within Groups

Total

38.267

16.667

54.933

3

11

14

12.756

1.515

8.419 .003

Levene Statistic df1 df2 Sig.

3.249 3 11 .064

Tạo ra một biếnđịnh tính mới

Từ đây chạy ANOVA bình thường như câu trên kết quả như sau:

Đặt giả thiết H0 thái độ đối với du lịch không có sự khác nhau giữa các nhóm thu nhập.

Test of Homogeneity of Variances

Thái độ

Bảng kết quả kiểm định Levene Statistic cho thấy: sig = 0.064 > 0.05 nên chấp

nhận giả thiết về phương sai bằng nhau giửa các nhóm. Do đó bảng phân tích

ANOVA sử dụng tốt.ANOVA

Thái độ

Page 16: Hướng dẫn SPSS

(I) Nhóm thu nhập (J) Nhóm thu nhập Mean Difference

(I-J)

Std. Error Sig. 95% Confidence Interval

Lower Bound Upper Bound

2101 - 2400

<= 2100 2401 - 2700

2701+

<= 2100

2101 - 2400 2401 - 2700

2701+

<= 2100

2401 - 2700 2101 - 2400

2701+

<= 2100

2701+ 2101 - 2400

2401 - 2700

-1.667

*-3.000

*-4.000

1.667

-1.333

-2.333*

3.000

1.333

-1.000*

4.000

2.333

1.000

.870

.870

.870

.870

1.005

1.005

.870

1.005

1.005

.870

1.005

1.005

.491

.033

.005

.491

1.000

.243

.033

1.000

1.000

.005

.243

1.000

-4.46

-5.79

-6.79

-1.13

-4.56

-5.56

.21

-1.89

-4.22

1.21

-.89

-2.22

1.13

-.21

-1.21

4.46

1.89

.89

5.79

4.56

2.22

6.79

5.56

4.22

Từ bảng phân tích ANOVA ta thấy: giá trị sig = 0.003 < 0.05 nên bác bỏ giả thiết

H0 và kết luận thái độ đối với du lịch có sự khác nhau giữa các nhóm thu nhập.

Multiple Comparisons

Dependent Variable: Thái độ

Bonferroni

*. The mean difference is significant at the 0.05 level.

Kết kiểm định từng cặp của các nhóm thu nhập: ta thấy cặp dưới 2100 và thu nhập

từ 2401 -> 2700 thái độ du lịch có sự khác nhau và có ý nghĩa thống kê vì sig =

0.033 < 0.05. Cặp dưới 2100 và thu nhập trên 2701 thái độ du lịch có sự khác nhau

và có ý nghĩa thống kê vì sig = 0.005 < 0.05. Nên kết luận thái độ du lịch so với

các nhóm thu nhập có sự khác nhau.

Page 17: Hướng dẫn SPSS

Doanh số bán (Tr.đ) 300 450 250 400 330 220 445 125 360 220 350 350

Chi phí quảng cáo

(Tr.đ) 20 25 21 30 16 14 35 10 27 16 30 32

Đồ thị trên cho thấy thu nhập càng cao thì thái độ đối với du lịch càng tăng.

Câu 4

Có số liệu của 12 doanh nghiệp về doanh số bán và chi phí quảng cáo như sau:

Yêu cầu:

Nhập dữ liệu vào SPSS, Tìm phương trình hồi quy tuyến tính thể hiện sự tương quan của Chiphí quảng cáo đến Doanh số bán?

(Ghi chú: Doanh số bán (tr.đ) là Y, Chi phí quảng cáo (tr.đ) là: X)

Bài làm

Page 18: Hướng dẫn SPSS
Page 19: Hướng dẫn SPSS

Click vào nút Statistics…

Page 20: Hướng dẫn SPSS

doanh số bán chi phí quảng cáo

Pearson Correlationdoanh số bán 1.000 .838

chi phí quảng cáo .838 1.000

Sig. (1-tailed)doanh số bán . .000

chi phí quảng cáo .000 .

Ndoanh số bán 12 12

chi phí quảng cáo 12 12

Click ContinueOK

Giả thiết được kiểm định: Chi phí quảng cáo tác động đến doanh số bán hàng (đơn vị:triệu đồng)

Mô hình hồi quy tổng thể như sau:Doanh số bán (triệu đồng) =0 +1*chi phí quảng cáo

Correlations

Bảng ma trận tương quan Correlations cho thấy hệ số tương quan của biến chi phi quảng cáo và doanhsố bán là R = 0.838. Chứng tỏ rằng mối tương quan của biến chi phí quảng cáo và doanh số bán là mốitương quan thuận (vì R > 0), hệ số tương quan R = 0.838 gần tiến tới 1 cho nên mối tương quan giữa 2biến này khá mạnh.

Coefficients a

Page 21: Hướng dẫn SPSS

Model Unstandardized Coefficients Standardiz

ed

Coefficien

ts

t Sig. Collinearity Statistics

B Std. Error Beta Tolerance VIF

1(Constant) 80.623 51.252 1.573 .147

chi phí

quảng cáo10.263 2.114 .838 4.854 .001 1.000 1.000

Mức độ quan tâm Độ tuổi3 13 13 12 13 23 21 22 2

Model R R Square Adjusted R

Square

Std. Error of the

Estimate

Durbin-Watson

1 a.838 .702 .672 56.096 1.935

a. Dependent Variable: doanh số bán

Bảng kiểm định mức ý nghĩa của các biến trong phương trình hồi quy Coefficientsa ta thấy sig của biến

chi phí quảng cáo = 0.001 < 0.05 nên bác bỏ giả thiết không tương quan giữa các biến và kết luận rằng

chi phí quảng cáo có mối tương quan với doanh số bán.

Phương trình tương quan là:

Doanh số bán = 80.623 + 10.263*chi phí quảng cáo.

Model Summary b

a. Predictors: (Constant), chi phí quảng cáo

b. Dependent Variable: doanh số bán

Bảng kết quả kiểm định sự phù hợp của mô hình hồi quy Model Summaryb cho thấy hệ số tương quangR điều chỉnh = 0.672 chứng tỏ rằng phương trình hồi quy trên giải thích được 67.2% sự biến thiên củadữ liệu.

Câu 5Nghiên cứu mối quan hệ giữa mức độ quan tâm đối với chủ đề gia đình trên tờ báo Sài Gòn Tiếp Thị vàtuổi tác. Cả hai yếu tố này là thang đo thứ bậc, dữ liệu được thu thập trong b ảng s ố liệu sau:

Bộ mãMức độ quan tâm chủ đề gia đình

1: Quan tâm nhất2: Quan tâm nhì3: Quan tâm ba

Độ tuổi1: Từ 18 -> 252: Từ 26 -> 353: Từ 36 -> 45

Page 22: Hướng dẫn SPSS

2 32 31 31 31 41 41 42 4

4: Từ 46 -> 60

Nhập dữ liệu trên vào SPSS.Dùng kiểm định mối liên hệ giữa hai thang đo thứ bậc (Tau – b của Kendall, d của Somer, gamma củaGoodman và Kruskal) để kiểm định mối quan hệ giữa tuổi tác và mức độ quan tâm đến chủ đề gia đìnhtrên báo SGTT?

Bài làm

Page 23: Hướng dẫn SPSS
Page 24: Hướng dẫn SPSS

Click vào Statistics…

Click continue.Click nút Cells

Page 25: Hướng dẫn SPSS

Continue ,

Page 26: Hướng dẫn SPSS

Value df Asymp. Sig. (2-

sided)

Pearson Chi-Square a9.333 6 .156

Likelihood Ratio 12.173 6 .058

Linear-by-Linear Association 7.560 1 .006

N of Valid Cases 16

OK

Đặt giả thiết H0 độ tuổi không liên quan đến mức độ quan tâm về chủ đề gia đình trên tờ báo sài gòntiếp thị.

Chi-Square Tests

a. 12 cells (100.0%) have expected count less than 5. The minimum

expected count is 1.25.

Từ kết quả kiểm đinh chi –square ta thấy giá trị kiểm điịnh sig = 0.156 >0.05 nên đại lượng kiểm định nàychưa phát hiện được mối quan hệ giữa 2 thang đo thứ bậc đó là độ tuổi và mức độ quan tâm về chủ đềgia đình trên báo sài gòn tiếp thị. Do đó trong trường hợp này không dùng đại lượng kiểm định chi –square mà dùng các đại lượng kiểm định trong trường hợp thang đo thứ bậc.

Page 27: Hướng dẫn SPSS

độ tuổi Total

từ 18 -> 25 từ 26 -> 35 từ 36 -> 45 từ 46 -> 60

mức độ

quan tâm

quan tâm

nhât

Count 0 1 2 3 6

% within độ tuổi 0.0% 25.0% 50.0% 75.0% 37.5%

quan tâm

nhì

Count 1 1 2 1 5

% within độ tuổi 25.0% 25.0% 50.0% 25.0% 31.2%

quan tâm

ba

Count 3 2 0 0 5

% within độ tuổi 75.0% 50.0% 0.0% 0.0% 31.2%

TotalCount 4 4 4 4 16

% within độ tuổi 100.0% 100.0% 100.0% 100.0% 100.0%

Value Asymp. Std.a

Error

bApprox. T Approx. Sig.

Ordinal by

OrdinalSomers' d

Symmetric -.619 .116 -5.292 .000

mức độ quan tâm Dependent -.583 .110 -5.292 .000

độ tuổi Dependent -.659 .124 -5.292 .000

Value Asymp. Std.a

Error

bApprox. T Approx. Sig.

Ordinal by Ordinal

Kendall's tau-b -.620 .117 -5.292 .000

Kendall's tau-c -.656 .124 -5.292 .000

Gamma -.800 .120 -5.292 .000

N of Valid Cases 16

Directional Measures

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null hypothesis.

Symmetric Measures

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null hypothesis.

Từ kết quả các đại lượng kiểm định trong trường hợp thang đo thứ bậc: Somers' d, Kendall's tau-b,Kendall's tau-c, Gamma ta thấy sig của các đại lượng này rất nhỏ và nhỏ hơn 0.05 nên bác bỏ giả thiết H0 và kết luậnrằng độ tuổi có liên hệ đối với mức độ quan tâm về chủ đề gia đình trên tờ báo sài gòn tiếp thị, và có ý nghĩa thốngkê.

mức độ quan tâm * độ tuổi Crosstabulation

Page 28: Hướng dẫn SPSS

Từ kết quả của bảng thống kê mô tả và đồ thị cho thấy tuổi càng cao thì bạn đọc quan tâm càng nhiều vềchủ đề gia đình trên báo sài gòn tiếp thị.

Page 29: Hướng dẫn SPSS

Điểmtrung bình

Yêu thíchngành học

Thời giantự học

5 1 17 2 15 1 15 1 1

5.2 1 18 1 2

5.4 1 17 2 28 2 25 1 19 3 3

10 3 38 2 38 2 2

7.5 2 29 3 3

10 3 39.4 3 3

7 2 29 3 2

9.5 3 3

Câu 6Có dữ liệu thu thập được điểm trung bình của các sinh viên, mức độ yêu thích ngành đang học của sinhviên và thời gian tự học được cho như sau:

Điểm trung bình là thang đo định lượng

Yêu thích ngành đang học được mã hóa:

1: Không thích lắm

2: Thích

3: Rất thích

Thời gian tự học được mã hóa:

1: Tự học ít

2: Tự học trung bình

3: Tự học nhiều

Hãy nhập liệu dữ liệu vào SPSSSữ dụng phân tích phương sai nhiều yếu tố (Univariate) để kiểm định mối quan hệ giữa điểm trung bìnhcủa sinh viên liên quan đến mức độ yêu thích ngành học và thời gian tự học có sự khác nhau không?

Bài làm

Page 30: Hướng dẫn SPSS
Page 31: Hướng dẫn SPSS

Click nút Plots…

Page 32: Hướng dẫn SPSS

Click ContinueClick Nút Options

Page 33: Hướng dẫn SPSS

Yêu thích ngành học Thời gian tự học Mean Std. Deviation N

Không thích lắm

Tự học ít 5.100 .1673 6

Tự học trung bình 8.000 . 1

Total 5.514 1.1067 7

Thích

Tự học ít 7.000 . 1

Tự học trung bình 7.500 .5000 5

Tự học nhiều 8.000 . 1

Total 7.500 .5000 7

Rất thíchTự học trung bình 9.000 . 1

Tự học nhiều 9.483 .4491 6

Click Continue và OK

Đặt giả thiết H0 điểm trung bình không liên quan đến ngành học và thời gian tự học.

Descriptive Statistics

Dependent Variable: Điểm trung bình

Page 34: Hướng dẫn SPSS

Source Type III Sum of

Squares

df Mean Square F Sig.

Corrected Model a61.150 6 10.192 66.416 .000

Intercept 680.549 1 680.549 4434.917 .000

yeuthichnganhhoc 3.039 2 1.520 9.903 .002

thoigiantuhoc 4.437 2 2.218 14.457 .000

yeuthichnganhhoc *

thoigiantuhoc2.449 2 1.224 7.978 .005

Error 2.148 14 .153

Total 1237.060 21

Corrected Total 63.298 20

Total 9.414 .4488 7

Total

Tự học ít 5.371 .7342 7

Tự học trung bình 7.786 .6986 7

Tự học nhiều 9.271 .6945 7

Total 7.476 1.7790 21

Từ số liệu của bảng thống kê mô tả ta thấy: Những người có yêu thích về ngànhhọc của mình thì thời gian tự học của họ có vẻ như nhiều hơn, và điểm trung bìnhcó vẻ cao. Cụ thể giá trị trung bình tang theo thời gian tự học và theo mức độ yêuthích về ngành học.

Tests of Between-Subjects Effects

Dependent Variable: Điểm trung bình

a. R Squared = .966 (Adjusted R Squared = .952)

Nhìn vào bảng kiểm định mức độ tương tác nhau giữa các biến trong mô hình, tathấy: Những sinh viên yêu thích ngành học khác nhau thì sẽ ảnh hưởng khác nhauđến điểm trung bình, vì giá trị sig. của yêu thích ngành học và điểm trung bình =0.002 < 0.05.

Thời gian tự học và điểm trung bình có mối liên quan nhau, vì giá trị sig.=0.000 <

0.05.

Mức độ yêu thích về ngành học và thời gian tự học có sự liên quan nhau, vì giá trị

sig. = 0.005 < 0.05.

Page 35: Hướng dẫn SPSS

Như vậy, có đủ cơ sở để bác bỏ giả thiết H0 và kết luận rằng điểm trung bình củasinh viên có ảnh hưởng đến mức độ yêu thích về ngành học và thời gian tự học.

Từ đồ thị trên, ta thấy: Mức độ yêu thích về ngành học càng tăng thì điểm trungbình càng cao, và thời gian tự học càng nhiều.

Page 36: Hướng dẫn SPSS

Nhìn đồ thị trên ta thấy, thời gian tự học và mức độ yêu thích về ngành học cómối liên hệ nhau, mức độ yêu thích về ngành học càng nhiều thì thời gian tự họccàng tăng.

Câu 7Coù döõ lieäu trong hai maãu ñieàu tra nhoû veà tuoåi cuûa caùc sinh vieân taïi chöùc ñang hoïc naêm thöù 1 cuûa haingaønh nhö sau :

Tuoåi cuûa 30 sinh vieân ngaønh keá toaùn kieåm toaùn (KTKT)2821

2326

3027

2425

1929

2127

3921

2225

2228

3126

3729

3329

2022

3032

3527

Tuoåi cuûa 30 sinh vieân ngaønh quaûn trò kinh doanh (QTKD)31 23 36 24 20 21 42 33 30 31 37 33 19 40 4535 26

Yeâu caàu :34 29 38 27 39 25 28 26 33 31 22 32 37

Page 37: Hướng dẫn SPSS

Haõy veõ bieåu ñoà nhaùnh vaø laù (Stem – and – Leaf Plot), vaø bieåu ñoà hoäp (Boxplot) ñeå thaáy ñöôïc tuoåi cuûasinh vieân taäp trung nhieàu vaøo khoaûng naøo, cho nhaän xeùt yù kieán cuûa anh chò veà tuoåi cuûa sinh vieân thuoächai ngaønh naøy.Bài làm

Page 38: Hướng dẫn SPSS
Page 39: Hướng dẫn SPSS

Click vào Plots …

Page 40: Hướng dẫn SPSS

aKolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Tuổi SV KTKT .101 30 *.200 .963 30 .360

Tuổi SV QTKD .073 30 *.200 .984 30 .916

Statistic Std. Error

Tuổi SV KTKT

Mean 26.93 .927

95% Confidence Interval for

Mean

Lower Bound 25.04

Upper Bound 28.83

Click continueOk

Đặt giả thuyết H0 Tuổi trung bình của sinh viên kế toán kiểm toán và tuổi trung bình của sinhviên quản trị kinh doanh là không có sự khác nhau.

Tests of Normality

*. This is a lower bound of the true significance.

a. Lilliefors Significance Correction

Bảng kết quả kiểm định Shapiro-Wilk trong trường hợp mẫu < 50 cho thấy:

Giá trị kiểm định mức ý nghĩa của tuổi sinh viên KTKT có Sig = 0.360 > 0.05Giá trị kiểm định mức ý nghĩa của tuổi sinh viên QTKD có Sig = 0.916 > 0.05

Do đó, bác bỏ giả thuyết H0 và kết luận rằng tuổi trung bình của sinh viên KTKT và tuổi trungbình của sinh viên QTKD có sự khác nhau và có ý nghĩa thống kê.

Descriptives

Page 41: Hướng dẫn SPSS

5% Trimmed Mean 26.72

Median 27.00

Variance 25.789

Std. Deviation 5.078

Minimum 19

Maximum 39

Range 20

Interquartile Range 8

Skewness .533 .427

Kurtosis -.127 .833

Tuổi SV QTKD

Mean 30.90 1.232

95% Confidence Interval for

Mean

Lower Bound 28.38

Upper Bound 33.42

5% Trimmed Mean 30.81

Median 31.00

Variance 45.541

Std. Deviation 6.748

Minimum 19

Maximum 45

Range 26

Interquartile Range 11

Skewness .062 .427

Kurtosis -.654 .833

Tuổi SV KTKT Stem-and-Leaf Plot

Frequency Stem & Leaf

1.009.00

12.005.003.00

12233

.

.

.

.

.

901112223455667778899900123579

Stem width:Each leaf:

101 case(s)

Page 42: Hướng dẫn SPSS

Đ thồ ị Stem-and-Leaf Plot cho th y tu i trung bình c a sinh viên k toán ki m toánấ ổ ủ ế ểt p trung t 25 -> 29 tu i là nhi u nh t vì thân có t n s cao nh t: 12 tu trung bìnhậ ừ ổ ề ấ ầ ố ấ ổlà 27 tu i.ổ

Tuổi SV QTKD Stem-and-Leaf Plot

Frequency Stem & Leaf

1.005.006.009.006.002.001.00

1223344

.

.

.

.

.

.

.

901234566789011123334567789025

Stem width:Each leaf:

101 case(s)

Page 43: Hướng dẫn SPSS

Cặp Mức lương cao nhất nhận được (đôla/tháng)Nam Nữ

1 262 2262 247 236

Đồ thị Stem-and-Leaf Plot cho thấy tuổi trung bình của sinh viên quản trị kinhdoanh tập trung từ 30 -> 34 tuổi là nhiều nhất. vì tần suất của cao nhất: 9 tuổi trung bình31 tuổi.

Kết luận, vậy tuổi sinh viên kế toán kiểm toán trẻ hơn sinh viên quản trị kinh doanh. Haynói cách khác tuổi trung bình của sinh viên quản trị kinh doanh cao hơn tuổi trung bìnhcủa sinh viên kế toán kiểm toán 4 tuổi.

Câu 8So sánh thu nhập trung bình của sinh viên nam và nữ sau khi tốt nghiệp. Có 14 cặp sinh viên được chọnmột cách nhẫu nhiên và mỗi cặp bao gồm 1 nam 1 nữ. Giả thiết cần kiểm định là mức lương đề nghị chotrung bình của sinh viên nam và nữ bằng nhau.Mức lương đề nghị cho sinh viên nam và nữ (thu nhập trọn gói) như sau:

Page 44: Hướng dẫn SPSS

3 284 2934 217 2235 286 2626 293 2597 283 2858 243 2139 300 20010 350 25011 320 30012 420 40013 420 30014 350 300

Các bạn hãy dùng kiểm định Paired Samples T - Test và rút ra nhận xét về mức lương của nam và nữsinh viên khi tốt nghiệp ra trường.

Bài làm

Page 45: Hướng dẫn SPSS
Page 46: Hướng dẫn SPSS

Click OK

Page 47: Hướng dẫn SPSS

Paired Differences t df Sig. (2-

tailed)Mean Std.

Deviation

Std.

Error

Mean

95% Confidence

Interval of the

Difference

Lower Upper

Pair 1

Mức lương

nam - Mức

lương nữ

37.714 41.097 10.984 13.985 61.443 3.434 13 .004

Mean N Std. Deviation Std. Error Mean

Pair 1Mức lương nam 305.36 14 61.381 16.405

Mức lương nữ 267.64 14 51.374 13.730

N Correlation Sig.

Pair 1Mức lương nam & Mức

lương nữ14 .748 .002

Đặt giả thuyết H0 Mức lương trung bình của sinh viên nam và sinh viên nữ là bằng nhau.

Paired Samples Correlations

Bảng kết quả kiểm định mối tương quan của hai biến mức lương nam và mức lương nữcó giá trị Sig = 0.002 (<0.05) nên hai biến này có mối tương quan nhau, hệ số tương quancủa hai biến này khá lớn gần tiến tới 1 (R = 0.748) chứng tỏ mối quan hệ của hai biến nàyrất mạnh và có ý nghĩa thống kê.

Paired Samples Test

Kết quả kiểm định Paired Samples Test về sự khác biệt nhau về giá trị trung bình của hainhóm cho thấy:

Giá trị kiểm định mức ý nghĩa Sig = 0.004 (<0.05) nên bác bỏ giả thuyết H0 và kết luận

rằng Mức lương trung bình của sinh viên nam và sinh viên nữ khi tốt nghiệp ra trường là

khác nhau và có ý nghĩa thống kê. Hay nói cách khác có sự chênh lệch có ý nghĩa thống

kê về mức lương nam và nữ sau khi tốt nghiệp ra trường.

Paired Samples Statistics

Page 48: Hướng dẫn SPSS

Từ bảng kết quả thống kê mô tả trên cho thấy Mức lương trung bình của sinh viên nam

(305.36usd) cao hơn mức lương trung bình của sinh viên nữ (267.64usd). chênh lệch trung bình

là khoảng 37.714 usd.

Bài 9Cuộc điều tra nghiên cứu mối quan hệ giữa giới tính, tuổi và thói quen hút thuốc. Được cho như sau:(phần sau là những tập tin của những câu trả lời có tính chất lý thuyết. Mỗi hàng dữ kiện tham khảo làmột người trả lời cá thể.

Stt Giới tính Thói quenhút thuốc

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21111222122111122111

01111000001111101111

Bộ mã Giới tính1 = nữ, 2 = nam Thói quen hút thuốc0 = không hút, 1 = hút

Yêu cầu:Nhập dữ liệu vào chương trình SPSS.Dùng điểm định Chi –Square để kiểm định mối quan hệ giữa thói quen hút thuốc và giới tính cósự khác nhau hay không?

Bài làm

Page 49: Hướng dẫn SPSS
Page 50: Hướng dẫn SPSS
Page 51: Hướng dẫn SPSS
Page 52: Hướng dẫn SPSS

Click vào nút Statistics…

Click nút ContinueClick nút Cells…

Page 53: Hướng dẫn SPSS

Value df Asymp. Sig. (2-

sided)

Exact Sig. (2-

sided)

Exact Sig. (1-

sided)

Pearson Chi-Square a9.377 1 .002

bContinuity Correction 6.676 1 .010

Likelihood Ratio 10.016 1 .002

Fisher's Exact Test .004 .004

Linear-by-Linear Association 8.908 1 .003

N of Valid Cases 20

Click nút ContinueOk.Đặt giả thuyết H0 thói quen hút thuốc và giới tính là không sự khác nhau.

Chi-Square Tests

a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.80.

b. Computed only for a 2x2 table

Kết quả kiểm định bảng Chi – Square Test cho thấy: giá trị kiểm định Chi – Square ở độ tin cậy95% có mức ý nghĩa Sig. = 0.002 (< 0.05) nên bác bỏ giả thuyết H0 và kết luận rằng thói quenhút thuốc và giới tính có sự khác nhau và có ý nghĩa thống kê.

Page 54: Hướng dẫn SPSS

Giới tính Total

Nam Nữ

Thói quen hút thuốc

Không hút thuốcCount 1 6 7

% within Giới tính 8.3% 75.0% 35.0%

Có hút thuốcCount 11 2 13

% within Giới tính 91.7% 25.0% 65.0%

TotalCount 12 8 20

% within Giới tính 100.0% 100.0% 100.0%

Thói quen hút thuốc * Giới tính Crosstabulation

Từ kết quả bảng Crosstabulation và đồ thị cho thấy tỷ lệ % của người hút thuốc vàkhông hút thuốc phân theo giới tính nam, nữ có sự khác nhau nhiều. có hút thuốc thìnam hút thuốc chiếm tỷ lệ % nhiều hơn nữ (nam: 91.7%; nữ 25%). Không hút thuốc thì

Page 55: Hướng dẫn SPSS

Doanh số (Tr.đ) Chi phí (Tr.đ) Khu vực(1: Thành thị; 0 Nông thôn)

100 30 0300 20 0500 40 1350 25 0400 50 0600 40 1700 40 1800 95 1550 35 0800 90 1900 80 1500 45 1120 10 0680 25 1

Value Approx. Sig.

Nominal by NominalPhi -.685 .002

Cramer's V .685 .002

N of Valid Cases 20

tỷ lệ % nữ chiếm nhiều hơn nam (Nữ: 75%; Nam 8.3%). Điều này chứng tỏ rằng Namchiếm tỷ lệ % hút thuốc nhiều hơn nữ.

Symmetric Measures

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null

hypothesis.

Bảng kết quả (Symmetric Measures) đo lường mối quan hệ của hai biến mạnh hay yếu.giá trị kiểm định Phi = -0.685 < 0 với mức ý nghĩa Sig = 0.002 (< 0.05) cho thấy mốiquan hệ giữa hai biến này là nghịch biến. có nghĩa là tỷ lệ % những người không hútthuốc thì nữ nhiều hơn nam, tỷ lệ % của những người có hút thuốc thì nam nhiều hơn nữ.Nếu xét về độ lớn thì giá trị Phi = 0.685 -> 1 nên mối tương tác nhau của hai biến này rấtlớn. có nghĩa là có sự khác nhau rất lớn giữa những người hút thuốc và không hút thuốctheo giới tính nam và nữ.

Bài 10Có số liệu về doanh số, chi phí quảng cáo và khu vực bán hàng như sau:

Dùng phân tích hồi quy tuyến tính biến giả để phân tích mối quan hệ giữa chi phí và khu vực bán hàngtác động đến doanh số bán của doanh nghiệp?

Bài gi ải

Page 56: Hướng dẫn SPSS
Page 57: Hướng dẫn SPSS
Page 58: Hướng dẫn SPSS
Page 59: Hướng dẫn SPSS

Click chọn statistics

Sau đó nhấn continueClick chon plots

Page 60: Hướng dẫn SPSS

Doanh số Chi phí quảng

cáo

khu vực

Pearson Correlation

Doanh số 1.000 .762 .792

Chi phí quảng cáo .762 1.000 .563

khu vực .792 .563 1.000

Sig. (1-tailed)

Doanh số . .001 .000

Chi phí quảng cáo .001 . .018

khu vực .000 .018 .

N

Doanh số 14 14 14

Chi phí quảng cáo 14 14 14

khu vực 14 14 14

Continue -> OK

Các giả thuyết: Những nhân tố tác động đến doanh số bán hàng (đơn vị: triệu đồng )

H1 chi phí quảng cáo tác động đến đến doanh số bán hàng

H2 khu vực tiêu thụ tác động đến đến doanh số bán hàng

Mô hình hồi quy tổng thể như sau:Doanh số bán (triệu đồng) =0 +1*chi phí quảng cáo +2*khu vực tiêu thụ

Correlations

Bảng kết quả tính hệ số tương quan của các biến độc lập tác động đến doanh số bán

(Correlations) cho thấy, giá trị kiểm định mức ý nghĩa của biến chi phí quảng cáo tác động

Page 61: Hướng dẫn SPSS

Model Unstandardized Coefficients Standardized

Coefficients

t Sig. Collinearity Statistics

B Std. Error Beta Tolerance VIF

1

(Constant) 179.017 70.010 2.557 .027

Chi phí quảng cáo 4.388 1.647 .462 2.665 .022 .683 1.463

khu vực 256.436 83.530 .532 3.070 .011 .683 1.463

Model Sum of Squares df Mean Square F Sig.

1

Regression 615527.518 2 307763.759 18.824 b.000

Residual 179843.911 11 16349.446

Total 795371.429 13

ANOV

đến doanh thu là sigα = 0.001, giá trị kiểm định mức ý nghĩa của biến khu vực tác động

đến doanh thu là sigα = 0.000. Mức ý nghĩa của hai biến đều nhỏ hơn 0.05 nên kết luận

rằng chi phí quảng cáo có mối tương quan với doanh số bán hàng, khu vực bán hàng cũng

có mối tương quan đến doanh số bán hàng.

Hệ số tương quan của biến chi phí quảng cáo với doanh số bán là R1 = 0.762, hệ số tương

quan của biến khu vực với doanh số bán là R2 = 0.792. Cho thấy, các biến chi phí quảng

cáo và khu vực có mối tương quan rất mạnh đối với doanh số bán (R -> 1) và mối tương

quan của các biến trên với doanh số bán là mối tương quan thuận (R > 0).

a

a. Dependent Variable: Doanh số (tr.đ)

b. Predictors: (Constant), Khu vực, Chi phí (Tr.đ)

Kiểm định F sử dụng trong phân tích phương sai (ANOVAa ) là một phép kiểm định giảthuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể để xem xét biến phụthuộc có liên hệ tuyến tính với toàn bộ tập hợp của các biến độc lập. Trong trường hợpnày, ta thấy rằng trị thống kê F được tính từ giá trị R2 đầy đủ khác 0, giá trị sig.= 0.000rất nhỏ (<0.05) cho thấy mô hình sử dụng là phù hợp và các biến đều đạt được tiêuchuẩn chấp nhận (Tolerance > 0,0001).

a. Dependent Variable: Doanh số

Coefficients a

Kết quả kiểm định mức ý nghĩa của mô hình hồi quy (Coefficientsa) cho thấy, giá trị kiểm địnhmức ý nghĩa của biến chi phí quảng cáo với doanh số bán là 0.022 < 0.05, giá trị kiểm định mức

Page 62: Hướng dẫn SPSS

Model R R Square Adjusted R

Square

Std. Error of the

Estimate

Durbin-Watson

1 a.880 .774 .733 127.865 2.316

Model Summary

ý nghĩa của biến khu vực với doanh số bán là 0.011 < 0.05,nên bác bỏ giả thiết không tươngquan và kết luận rằng chi phí quảng cáo và khu vực bán hàng có liên quan đến doanh số bán củadoanh nghiệp. mô hình hồi quy tương quan có dạng như sau:

Doanh số bán = 179.017 + 4.388*Chi phí quảng cáo + 256.436*Khu vực

Đối với khu vực thành thị thì mô hình là: Doanh số bán = 435.453 + 4.388*Chi phíquảng cáo

Đối với khu vực nông thôn thì mô hình là: Doanh số bán = 179.017 + 4.388*Chi phíquảng cáo

Từ hai mô hình trên ta thấy khu vực bán hàng ở thành thị tác động đến doanh số bán nhiều hơnnông thôn (vì hằng số của phương trình hồi quy thành thị cao hơn hằng số của phương trình hồiquy nông thôn)

Mô hình hồi quy tương quan trên không vi phạm giả thuyết về hiện tượng tự tương quan (vì hệsố kiểm định hiện tương tự tương quan của các biến trong mô hình có VIF = 1.463 < 10)

b

a. Predictors: (Constant), khu vực, Chi phí quảng cáo

b. Dependent Variable: Doanh số

Bảng kết quả đánh giá sự phù hợp của mô hình hồi quy (Model Summaryb) cho thấy, hệ sốtương quan R điều chỉnh (Adjusted R Square)= 0.733 chứng tỏ rằng mô hình hồi quy ảnh hưởngsự tác động của hai nhân tố trên giải thích được hiện tượng tác động 73.3% sự biến thiên củadữ liệu, còn lại là do sự tác động của các nhân tố khác.

Mô hình hồi quy trên không vi phạm giả thuyết về hiện tượng tương quan chuỗi bậc nhất trongmô hình vì hệ số kiểm định Durbin-Watson = 2.316 thuộc trong khoảng từ 1->3 .

Page 63: Hướng dẫn SPSS

Stt Ttxang Maluc Nang May Lit Stt Ttxang Maluc Nang May Lit

1 18.96 48 893 4 1.475 26 10.52 90 1539 8 4.261

2 8.76 110 1514 8 4.261 27 13.16 65 1071 4 1.606

3 8.45 105 1591 6 3.786 28 13.38 67 1463 4 2.393

4 7.79 165 1550 6 3.786 29 15.84 74 891 4 1.721

5 7.96 139 1442 8 4.95 30 9.94 110 1260 4 1.983

6 8.93 103 1274 5 2.147 31 16.02 67 1328 5 1.983

7 9.46 115 1460 6 3.786 32 12.1 95 1152 4 2.196

8 7.44 155 1962 8 5.737 33 14.83 75 995 4 1.754

9 6.82 142 1824 8 5.753 34 19.62 67 833 4 1.491

10 8.14 150 1773 8 5.9 35 14.48 100 1177 4 1.95

11 11.97 71 1436 4 2.311 36 16.72 67 884 4 1.491

12 18.26 76 965 4 1.606 37 10.65 120 1319 6 2.393

13 20.5 65 950 4 1.41 38 16.76 60 886 4 1.459

14 10.43 100 1089 3 1.147 39 17.34 70 932 4 1.393

15 11.97 84 1121 4 2.213 40 11.18 116 1305 6 2.754

16 17.2 58 790 4 1.295 41 13.77 75 1144 4 1.967

17 12.32 88 1172 4 1.836 42 15 68 893 4 1.491

18 10.56 92 1289 4 2.295 43 14.96 88 1078 4 1.836

19 8.89 139 1607 8 4.95 44 13.64 82 1224 4 1.95

20 9.02 95 1420 6 3.278 45 12.06 80 1202 4 1.983

21 12.32 90 1205 4 2.475 46 9.81 88 1301 4 2.295

22 15.27 63 997 4 1.721 47 12.32 79 1181 4 1.967

23 15.88 66 810 4 1.606 48 7.74 85 1559 6 3.688

24 15.71 80 862 4 1.606 49 15.14 65 920 4 1.606

25 8.89 85 1334 6 3.278 50 9.06 105 1521 6 3.786

Câu 11:Có dữ kiện về 50 quan sát trong nghiên cứu mức tiêu thụ xăng của xe Ôtô.

Trong đó:Ttxang

Maluc

Nang

May

Lit

:

:

:

:

:

Mức tiêu thụ xăng (km/lit)

Công suất động cơ (HP)

Trọng lượng xe (kg)

Số máy (Cylinder)

Dung tích động cơ (lít)

Yêu c ầ u: a) Xây dựng mô hình hồi quy bội thể hiện tương quan

của các biến?b) Dự báo mức tiêu thụ xăng khi các biến yếu tố bằng 1.

Bài làm:

Page 64: Hướng dẫn SPSS
Page 65: Hướng dẫn SPSS
Page 66: Hướng dẫn SPSS
Page 67: Hướng dẫn SPSS

Click chọn statistics

Sau đó nhấn continueClick chon plots

Page 68: Hướng dẫn SPSS

Continue -> OK

Các giả thuyết: Những nhân tố tác động đến mức tiêu thụ xăng

H1 công suất động cơ tác động đến mức tiêu thụ xăng

H2 trọng lượng tác động đến mức tiêu thụ xăng H3 số máy tác động đến mức tiêu thụ xăng H4 dung tích động cơ tác động đến mức tiêu thụ xăng

Mô hình hồi quy tổng thể như sau:Mứ c tiêu th ụ xăng =0 +1*công su ất động cơ +2*trọng lượ ng xe +3*số máy +4*dung tích động cơ

correlations

Mức tiêu thụ

xăng (km/lit)

Công suất

động cơ (HP)

Trọng lượng

xe (kg)

Số máy

(Cylinder)

Dung tích

động cơ (lít)

Mức tiêu thụ xăng (km/lit)

Công suất động cơ (HP)

1.000

-.788

-.788

1.000

-.858

.786

-.681

.752

-.777

.818Pearson

Correlation

Sig. (1-

tailed)

Trọng lượng xe (kg)

Số máy (Cylinder)

Dung tích động cơ (lít)

Mức tiêu thụ xăng (km/lit)

Công suất động cơ (HP)

Trọng lượng xe (kg)

Số máy (Cylinder)

-.858

-.681

-.777

.

.000

.000

.000

.786

.752

.818

.000

.

.000

.000

1.000

.802

.901

.000

.000

.

.000

.802

1.000

.941

.000

.000

.000

.

.901

.941

1.000

.000

.000

.000

.000

Page 69: Hướng dẫn SPSS

Model Sum of Squares df Mean Square F Sig.

1

Regression 466.219 1 466.219 133.984 b.000

Residual 167.023 48 3.480

Total 633.243 49

2

Regression 487.713 2 243.856 78.755 c.000

Residual 145.530 47 3.096

Total 633.243 49

ANOVA

Dung tích động cơ (lít)

Mức tiêu thụ xăng (km/lit)

Công suất động cơ (HP)

.000

50

50

.000

50

50

.000

50

50

.000

50

50

.

50

50

N Trọng lượng xe (kg)

Số máy (Cylinder)

Dung tích động cơ (lít)

50

50

50

50

50

50

50

50

50

50

50

50

50

50

50

Bảng ma trận tương quan cho thấy mức tiêu thụ xăng có tương quan với các biến:

Công suất động cơ (HP)

Trọng lượng xe (kg)

Số máy (Cylinder)

Dung tích động cơ (lít)Vì mức ý nghĩa của hệ số tương quan các biến độc lập có giá trị sig = 0.000 < 0.05Mối tương quan của các biến này với biến mức tiêu thụ xăng là tương quannghịch biến, vì hệ số tương quan R của các biến độc lập với biến phụ thuộc có giátrị âm.

Biến trọng lượng xe tương quan mạnh nhất đối với mức tiêu thụ xăng vì hệ sốtương quan của 2 biến này cao nhất (R=0.858). biến số máy động cơ tương quanthấp nhất đối với mức tiêu thụ xăng vì hệ số tương quan của biến này nhỏ nhất(R=0.681).

a

a. Dependent Variable: Mức tiêu thụ xăng (km/lit)

b. Predictors: (Constant), Trọng lượng xe (kg)

c. Predictors: (Constant), Trọng lượng xe (kg), Công suất động cơ (HP)

Kiểm định F sử dụng trong phân tích phương sai (ANOVA) là một phép kiểm địnhgiả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể để xem xétbiến phụ thuộc có liên hệ tuyến tính với toàn bộ tập hợp của các biến độc lập.

Page 70: Hướng dẫn SPSS

Trong trường hợp này, ta thấy rằng trị thống kê F được tính từ giá trị R2 đầy đủkhác 0 (F=78.755), giá trị sig. rất nhỏ =0.000 (<0.05) cho thấy mô hình sử dụng làphù hợp và các biến đều đạt được tiêu chuẩn chấp nhận (Tolerance > 0,0001).

Page 71: Hướng dẫn SPSS

Model Unstandardized

Coefficients

Standardize

d

Coefficients

t Sig. Collinearity Statistics

B Std. Error Beta Tolerance VIF

(Constant)1

Trọng lượng xe (kg)

(Constant)

Trọng lượng xe (kg)2

Công suất động cơ

(HP)

25.825

-.011

25.775

-.008

-.039

1.176

.001

1.110

.001

.015

-.858

-.624

-.298

21.959

-11.575

23.229

-5.520

-2.635

.000

.000

.000

.000

.011

1.000

.383

.383

1.000

2.614

2.614

Model R R Square Adjusted R

Square

Std. Error of the

Estimate

Durbin-Watson

1

2

a.858

b.878

.736

.770

.731

.760

1.86538

1.75965 1.759

Model Summary

Coefficients a

a. Dependent Variable: Mức tiêu thụ xăng (km/lit)

Bảng kết quả kiểm định mức ý nghĩa ta thấy sig của biến trọng lượng xe bằng 0.000 <0.05. sig của biến công suất động cơ bằng 0.011 < 0.05. Nên Trọng lượng xe (kg) và Côngsuất động cơ (HP) có tương quan với mức tiêu thụ xăng.Phương trình tương quan là:

Mức tiêu thụ xăng (km/lit) = 25.775 – 0.008* Trọng lượng xe (kg) – 0.039* Công suất động cơ (HP)

Trong phương trình này biến tương quan mạnh nhất với mức tiêu thụ xăng là Trọng

lượng xe (kg) vì hệ số Beta = -0.624, Biến tương quan thấp hơn là Công suất động cơ (HP) vì hệ

số beta = -0.298.

Chuẩn đoán hiện tượng đa cộng tuyến Collinearity diagnostics với hệ số phóngđại phương sai VIF (Variance inflation factor) của các biến độc lập trong mô hìnhđều rất nhỏ, có giái trị 2.614, thể hiện tính đa cộng tuyến của các biến độc lập làkhông đáng kể và các biến độc lập trong mô hình chấp nhận được (khi giá trị VIFvượt quá 10 là dấu hiệu của hiện tượng đa cộng tuyến).

c

a. Predictors: (Constant), Trọng lượng xe (kg)

b. Predictors: (Constant), Trọng lượng xe (kg), Công suất động cơ (HP)

c. Dependent Variable: Mức tiêu thụ xăng (km/lit)

Page 72: Hướng dẫn SPSS

Mức độ phù hợp của phương trình hồi quy Model Summaryc. Phương trình hồiquy trên giải thích được 76% sự biến thiên của các biến trong phương trình.

Mô hình hồi quy trên không vi phạm giả thuyết về hiện tượng tương quan chuỗibậc nhất trong mô hình vì hệ số kiểm định Durbin-Watson = 1.759 thuộc trongkhoảng từ 1->3 .

Dự báo:

Dự báo thống kê khi các biến độc lập trong phương trình hồi quy bằng 1Nhập giá trị cần dự báo ở các dòng cuối cùng của dữ liệu phân tích.

Page 73: Hướng dẫn SPSS

Click Save chọn như hình sau:

Page 74: Hướng dẫn SPSS

Kết quả

Page 75: Hướng dẫn SPSS

Stt Sinh viên Điểm1 A 82 B 93 C 84 D 75 E 56 F 97 G 108 H 59 I 7

10 J 611 K 5

Khi các biến độc lập có giá trị bằng 1 thì giá trị dự báo về mức tiêu thụ xăng là: Dự báo điểm: 25.728 (km/l)

Dự báo khoảng: (23.497 -> 27.959) (km/l)

Câu 12:Giảng viên dự đoán điểm bình quân một sinh viên trong lớp là 8 điểm. thực tế kiểm tra điểm của 15 sinhviên được thu thập như sau:

Page 76: Hướng dẫn SPSS

12 L 413 M 514 N 615 O 7

Hãy đánh giá chất lượng học tập của sinh viên có khác nhau với kết quả điểm dự đoán của giảng viênhay không? Nêu nhận xét đánh giá kết quả tính được, dùng kiểm định One Sample t – test.

Bài làm

Page 77: Hướng dẫn SPSS
Page 78: Hướng dẫn SPSS

Click ok

Page 79: Hướng dẫn SPSS

Stt Khu vực Tuổi (tháng) Chiều cao (cm)1 1 109 1362 1 113 137.63 1 115 138.54 1 116 130.55 1 119 1506 1 120 1457 1 121 1608 1 124 1509 1 126 165.3

10 1 129 15511 2 130 13012 2 133 131

Test Value = 8

t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the

Difference

Lower Upper

Điểm -2.738 14 .016 -1.267 -2.26 -.27

N Mean Std. Deviation Std. Error Mean

Điểm 15 6.73 1.792 .463

Đặt giả thiết H0 điểm dự đoán của giảng viên (8 điểm) và điểm trung bình của sinh viên là không có sựkhác nhau.

One-Sample Test

Bảng kết quả kiểm định (One-Sample Test) cho thấy, giá trị kiểm định Sigα = 0.016 <0.05 nên, bác bỏ giả thiết H0 và kết luận điểm dự đoán của giảng viên và điểm trungbình của sinh viên có sự khác nhau và có ý nghĩa thống kê.

One-Sample Statistics

Bảng kết quả thống kê mô tả (One-Sample Statistics ) cho thấy, điểm kiểm tra trungbình của sinh viên (6.73 điểm) thấp hơn điểm dự đoán của giảng viên (8 điểm), điều đónói lên chất lượng học tập của các sinh viên thấp hơn mong đợi của giảng viên.

Câu 13Nghiên cứu về chiều cao và tuổi của các học sinh thuộc vùng thành thị (1), và học sinh thuộcvùng nông thôn (2) như sau: Câu hỏi đặt ra là có sự khác biệt nào về chiều cao và tuổi giữa cáchọc sinh ở 2 khu vực khác nhau?Chiều cao (định lượng), Tuổi (định lượng), khu vực (định tính, 1: Thành thị; 2: Nông thôn).Dùng phép kiểm định ANOVA nhiều chiều Multivariate để kiểm định mối quan hệ trên.

Page 80: Hướng dẫn SPSS

13 2 134 130.514 2 135 138.215 2 137 135.516 2 139 14017 2 141 14018 2 142 145.519 2 139 135.220 2 140 140

Bài gi ải

Page 81: Hướng dẫn SPSS
Page 82: Hướng dẫn SPSS
Page 83: Hướng dẫn SPSS

Click vô Plots

Page 84: Hướng dẫn SPSS

Đưa biến khu _vực qua, click Add, click continueNhấn vô nút Options

Click Continue, click OK

Page 85: Hướng dẫn SPSS

Source Dependent Variable Type III Sum of

Squares

df Mean Square F Sig.

Corrected ModelTuổi (tháng) a

1584.200 1 1584.200 59.957 .000

Chiều cao b520.200 1 520.200 6.810 .018

InterceptTuổi (tháng) 328192.200 1 328192.200 12421.067 .000

Chiều cao 401521.122 1 401521.122 5256.055 .000

khuvucTuổi (tháng) 1584.200 1 1584.200 59.957 .000

Chiều cao 520.200 1 520.200 6.810 .018

ErrorTuổi (tháng) 475.600 18 26.422

Chiều cao 1375.058 18 76.392

TotalTuổi (tháng) 330252.000 20

Chiều cao 403416.380 20

Corrected TotalTuổi (tháng) 2059.800 19

Chiều cao 1895.258 19

Đặt giả thiết H0 không có sự khác nhau về chiều cao và tuổi của những học sinh sống ở các khác vực khácnhau (thành thị, nông thôn)

Tests of Between-Subjects Effects

a. R Squared = .769 (Adjusted R Squared = .756)

b. R Squared = .274 (Adjusted R Squared = .234)

·

·

·

Bảng kết qủa kiểm định mối quan hệ giữa các biến cho thấy, tuổi, chiều cao có

sự tương tác đến khu vực sinh viên cư trú. Được thể hiện trong kết quả ở dòng

Corrected Model có giá trị kiểm định mức ý nghĩa sig < 0.05.

Kết quả kiểm định mối quan hệ giữa các biến được trình bày qua bảng (Tests of

Between-Subjects Effects) cho thấy, tuổi và chiều cao có mối quan hệ rất chặt

và có ý nghĩa thống kê được thể hiện ở dòng Intercept có giá trị kiểm định mức ý

nghĩa rất nhỏ sig = 0.000 < 0.05.

Những học sinh cư trú ở các khu vực khác nhau có tương quan với tuổi và chiều

cao được thể hiện ở dòng thứ 3 có giá trị kiểm định mức ý nghĩa giữa khu vưc

tương tác với tuổi và chiều cao. Gía trị kiểm định mức ý nghĩa sig1 = 0.000 (<

0.05); sig2 = 0.018 (< 0.05). nên bác bỏ giả thiết H0 và kết luận có sự khác

nhau về chiều cao và tuổi của những học sinh, cư trú ở các khu vực khác nhau

và có ý nghĩa thống kê.

Page 86: Hướng dẫn SPSS

khu vực Mean Std. Deviation N

Tuổi (tháng)

Thành thị 119.20 6.143 10

Nông thôn 137.00 3.887 10

Total 128.10 10.412 20

Chiều cao

Thành thị 146.790 11.2710 10

Nông thôn 136.590 5.0744 10

Total 141.690 9.9875 20

Descriptive Statistics

· Bảng kết quả thống kê mô tả (Descriptive Statistics) và đồ thị cho thấy, tuổi

trung bình của các học sinh ở nông thôn cao hơn thành thị (Nông thôn: 137

tháng; Thành thị: 119 tháng).

Page 87: Hướng dẫn SPSS

·

·

Tuy nhiên, Chiều cao của các học sinh sống ở nông thôn lại có chiều cao trung

bình thấp hơn chiều cao trung bình của học sinh sống ở thành thị (Nông thôn:

136.59 cm; Thành thị: 146.79 cm).

Đồ thị Scatter minh họa mối liên hệ tuổi, chiều cao và khu vực cư trú sau:

Page 88: Hướng dẫn SPSS

· Từ kết quả đồ thị phân tán (Scatter) trên cho thấy, tuổi của học sinh ở các khu

vực trên càng cao thì chiều cao càng tăng.

Page 89: Hướng dẫn SPSS

STT A. Hình ãnh doanh nghiệp B. Cạnh tranh về giá C. Mức độ hài lòngGiữ chữ

tínHoạt

động xãhội

Marketing hiệu

quả

Chiếnlượcpháttriển

Lãi suấtcạnhtranh

Chi phíhợp lý

Giá linhhoạt

Hài lòngvới chấtlượng

Đáp ứngnhu cầu

1 4 4 4 4 4 4 4 4 42 3 3 3 4 4 3 3 4 43 4 4 4 4 4 4 4 5 44 4 4 4 4 5 4 4 5 55 4 4 4 4 4 4 4 4 46 2 5 3 2 4 4 4 4 37 4 4 4 4 4 3 4 5 48 5 5 5 5 5 4 4 5 49 5 4 4 5 5 5 4 5 5

10 4 4 3 4 5 4 5 5 511 4 4 4 4 4 4 4 4 412 2 3 4 4 4 3 3 4 413 4 4 4 4 5 4 4 5 514 3 4 4 4 4 3 3 4 415 4 2 5 5 4 4 4 5 5

Câu 14Có dữ liệu thống kê thu thập được về Đo lường mức độ hài lòng của khách hàng sử dụng sản phẩm, dịchvụ tại Ngân hàng TMCP Ngoại Thương Việt Nam. (1: Hoàn toàn không đồng ý; 5: Hoàn toàn đồng ý)

Yêu c ầu:

Hãy tạo khuôn, nhập liệu dữ liệu trên vào SPSS. Dùng Cronbach’s Alpha để kiểm định độ tincậy của ba thang đo trên, viết nhận xét của mình về kết quả kiểm định được?

Hướng dẫn

Page 90: Hướng dẫn SPSS
Page 91: Hướng dẫn SPSS
Page 92: Hướng dẫn SPSS

A. Hình ãnh doanh nghiệp

Click chọn Statistics…

Page 93: Hướng dẫn SPSS

Chọn Scale if item deleted, Continue.OK.Chạy Cronbach's Alpha lần 2 (Loại biến A2)

Page 94: Hướng dẫn SPSS

B. Cạnh tranh về giá

C. Mức độ hài lòng

Bài làmHệ số Cronbach’s Alpha là một phép kiểm định thống kê dùng để kiểm tra sự chặt chẽ và tương quangiữa các biến quan sát. Phương pháp này cho phép loại bỏ những biến không phù hợp và hạn chế cácbiến rác trong mô hình nghiên cứu. Theo đó, chỉ những hệ số tương quan tổng biến phù hợp (CorrectedItem – Total Correlation) lớn hơn 0.3 và có hệ số Alpha lớn hơn 0.7 mới được xem là chấp nhận được vàthích hợp đưa vào phân tích những bước tiếp theo.

A. Hình ãnh doanh nghiệp

Page 95: Hướng dẫn SPSS

Scale Mean if

Item Deleted

Scale Variance

if Item Deleted

Corrected Item-

Total

Correlation

Cronbach's

Alpha if Item

Deleted

Giữ chữ tín 11.87 1.410 .781 .010

Hoạt động xã hội 11.73 3.638 -.128 .829

Marketing hiệu quả 11.67 2.524 .505 .413

Chiến lược phát triển 11.53 2.267 .503 .384

Scale Mean if

Item Deleted

Scale Variance

if Item Deleted

Corrected Item-

Total

Correlation

Cronbach's

Alpha if Item

Deleted

Giữ chữ tín 8.00 1.429 .676 .813

Marketing hiệu quả 7.80 2.171 .637 .825

Cronbach's

Alpha

N of Items

.574 4

Cronbach's

Alpha

N of Items

.829 3

Reliability Statistics

Item-Total Statistics

Bảng kết quả kiểm định Cronbach's Alpha cho thấy: hệ số Cronbach's Alpha cho 4 biến quan sát

trong thang đo “Hình Ảnh Doanh Nghiệp” có Cronbach's Alpha = 0.574 < 0.7 và hệ số tương

quan biến tổng Corrected item- total correlation của các 1 biến quan sát: hoạt động xã hội (A2) <

0.3. Do đó không thỏa các thông số khi phân tích độ tin cậy của thang đo, nên loại biến có hệ số

tương quan biến tổng (Corrected item- total correlation) < 0.3 ra khỏi quá trình phân tích và chạy

lại kiểm định Cronbach's Alpha lần 2.

Kết quả kiểm định Cronbach's Alpha lần 2 khi loại biến (A2)

Reliability Statistics

Item-Total Statistics

Page 96: Hướng dẫn SPSS

Scale Mean if

Item Deleted

Scale Variance

if Item Deleted

Corrected Item-

Total

Correlation

Cronbach's

Alpha if Item

Deleted

Lãi suất cạnh tranh 7.67 .952 .550 .780

Chi phí hợp lý 8.20 .743 .680 .641

Giá linh hoạt 8.13 .838 .645 .682

Cronbach's

Alpha

N of Items

.783 3

Cronbach's

Alpha

N of Items

.796 2

Chiến lược phát triển 7.67 1.667 .812 .640

Kết quả chạy Cronbach's Alpha lần 2 cho thấy, hệ số Cronbach's Alpha của 3 biến quan sát của

thang đo có giá trị Cronbach's Alpha = 0.829 > 0.7 và hệ số tương quan biến tổng của 3 biến

quan sát có giá trị Corrected item- total correlation > 0.3. Nên thang đo này đạt tiêu chuẩn độ tin

cậy khi kiểm định Cronbach's Alpha.

B. Cạnh tranh về giá

Reliability Statistics

Item-Total Statistics

Kết quả chạy Cronbach's Alpha thang đo “Cạnh tranh về giá” cho thấy, hệ số Cronbach's Alpha

của 3 biến quan sát của thang đo có giá trị Cronbach's Alpha = 0.783 > 0.7 và hệ số tương quan

biến tổng của 3 biến quan sát có giá trị Corrected item- total correlation > 0.3. Nên thang đo này

đạt tiêu chuẩn độ tin cậy khi kiểm định Cronbach's Alpha.

C. Mức độ hài lòng

Reliability Statistics

Page 97: Hướng dẫn SPSS

Mã hóa Công việc 1 2 3 4 5Cv1 Sử dụng tốt các năng lực cá nhân Cv2 Công việc rất thú vị Cv3 Công việc có nhiều thách thức Cv4 Có thể thấy rõ kết quả hoàn thành công việc

Lương 1 2 3 4 5L1 Được trả lương cao L2 Sống hoàn toàn dựa vào thu nhập của công ty L3 Tiền lương tương xứng với kết quả làm việc L4 Thu nhập được trả công bằng

Đồng nghiệp 1 2 3 4 5

Scale Mean if

Item Deleted

Scale Variance

if Item Deleted

Corrected Item-

Total

Correlation

Cronbach's

Alpha if Item

Deleted

Hài lòng với chất lượng 4.27 .352 .668 .

Đáp ứng nhu cầu 4.53 .267 .668 .

Item-Total Statistics

Kết quả chạy Cronbach's Alpha thang đo “Mức độ hài lòng” cho thấy, hệ số Cronbach's Alpha

của 2 biến quan sát của thang đo có giá trị Cronbach's Alpha = 0.796 > 0.7 và hệ số tương quan

biến tổng của 3 biến quan sát có giá trị Corrected item- total correlation > 0.3. Nên thang đo này

đạt tiêu chuẩn độ tin cậy khi kiểm định Cronbach's Alpha.

Như vậy, khi kiểm định độ tin cậy của 3 thang đo có 1 biến (A2: hoạt động xã hội) có hệ số

tương quan biến tổng < 0.3 nên biến này bị loại ra khỏi quá trình phân tích. 8 biến quan sát còn

lại của 3 thang đo trên đều thỏa mãn điều kiện hệ số cronbach’s alpha > 0.7 và hệ số tương quan

biến tổng > 0.3. Do đó, thang đo trên đạt tiêu chuẩn kiểm định độ tin cậy và tiếp tục các bước

phân tích tiếp theo.

Câu 15

Có dữ liệu khảo sát “Đo lường sự thỏa mãn trong công việc của nhân viên làm việc trong các

tổ chức tại thành phố Hồ Chí Minh”. Bảng câu hỏi này dựa trên thang đo Likert, vì đây có tính

chất lý thuyết nên tác giả chỉ lấy ra nột phần của kết quả khảo sát thu thập được từ 15 nhân viên

như sau:

Bảng câu hỏi: anh/ chị vui lòng đánh giá mức độ đồng ý đối với mỗi phát biểu dưới đây. Điểm

của các thang đo 1: rất không đồng ý, đến 5: rất đồng ý.

Page 98: Hướng dẫn SPSS

Stt Cv1 Cv2 Cv3 Cv4 L1 L2 L3 L4 Dn1 Dn2 Dn3 Dn41 5 5 5 5 3 3 2 3 4 4 4 32 4 4 4 4 4 4 4 4 4 4 4 53 4 4 4 4 3 3 3 3 3 3 3 34 5 4 5 5 5 5 5 5 4 4 4 45 5 5 5 5 4 4 5 3 3 3 3 56 4 4 4 4 4 4 4 4 3 3 3 27 4 4 4 4 3 4 3 4 3 3 3 38 4 5 5 4 5 5 5 4 4 4 4 59 4 5 5 4 4 3 5 4 4 4 4 4

10 5 5 5 4 4 5 5 4 4 4 4 411 5 5 5 5 4 5 5 4 4 4 4 412 4 4 4 3 4 3 3 4 3 4 4 413 4 4 4 3 3 3 3 3 4 4 3 314 5 5 5 5 5 4 4 5 4 4 4 515 3 4 4 3 5 4 4 4 4 4 4 3

Dn1 Thoải mái và dễ chịu Dn2 Phối hợp làm việc tốt Dn3 Mọi người làm việc rất thân thiện Dn4 Mọi người làm việc thường giúp đỡ lẫn nhau

Yêu cầu:

Hãy tạo khuôn, nhập liệu dữ liệu trên vào SPSS. Dùng kỹ thuật Phân tích nhân tố khám phá

(EFA- Exploratory Factor Analysis) để gom dữ liệu thành các nhóm nhân tố. Giải thích ý

nghĩa của các số liệu trong bảng kết quả và đặt tên nhóm cho các nhân tố tạo thành.

Hướng d ẫn

Page 99: Hướng dẫn SPSS
Page 100: Hướng dẫn SPSS

Chạy phân tích nhân tố lần 1:

Page 101: Hướng dẫn SPSS

Click chọn Descriptives…

Page 102: Hướng dẫn SPSS

Click chọn Rotation…

Click chọn Options…

Page 103: Hướng dẫn SPSS

Click OK

Phân tích nhân tố lần 2 (lần cuối):

Ok

Bài làm

Phân tích nhân tố là một kỹ thuật phân tích nhằm thu nhỏ và tóm tắt các dữ liệu, rất có ích choviệc xác định các tập hợp nhóm biến. Quan hệ của các nhóm biến có liên hệ qua lại lẫn nhauđược xem xét dưới dạng một số các nhân tố cơ bản.

Kết quả phân tích nhân tố lần 1:Rotated Component Matrix

Component

a

Page 104: Hướng dẫn SPSS

1 2 3

Cv1 .894

Cv3 .869

Cv4 .869

Cv2 .831

Dn4

L1 .855

L2 .804

L3 .792

L4 .788

Dn2 .972

Dn1 .856

Dn3 .854

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .563

Bartlett's Test of Sphericity

Approx. Chi-Square 116.965

df 55

Sig. .000

Extraction Method: Principal Component

Analysis.

Rotation Method: Varimax with Kaiser

Normalization.

a. Rotation converged in 5 iterations.

Bảng kết quả ma trận xoay nhân tố cho thấy, 12 biến quan sát được gom thành 3 nhân tố, trong

đó có 1 biến quan sát là Dn4 có hệ số tải nhân tố Factor Loading < 0.5 nên biến quan sát này bị

loại ra khỏi phân tích EFA. Tiến hành phân tích nhân tố lần 2 khi loại biến Dn4.

Kết quả phân tích nhân tố lần 2 (lần cuối):

KMO and Bartlett's Test

Kết quả tính hệ số đo lường mức độ phù hợp của mô hình phân tích nhân tố (KMO) và kiểm

định mức ý nghĩa của mô hình phân tích nhân tố (Bartlett's Test) cho thấy:

Hệ số KMO = 0.563 (KMO >= 0.5) nên phân tích nhân tố là phù hợp và đáng tin cậy.

Sig. (Bartlett’s Test) = 0.000 (sig. < 0.05) chứng tỏ các biến quan sát có tương quan với

nhau trong tổng thể.

Page 105: Hướng dẫn SPSS
Page 106: Hướng dẫn SPSS

Com

pone

nt

Initial Eigenvalues Extraction Sums of Squared

Loadings

Rotation Sums of Squared Loadings

Total % of

Variance

Cumulati

ve %

Total % of

Variance

Cumulativ

e%

Total % of

Variance

Cumulative

%

1 4.974 45.218 45.218 4.974 45.218 45.218 3.266 29.691 29.691

2 2.386 21.693 66.911 2.386 21.693 66.911 2.893 26.297 55.987

3 1.638 14.895 81.806 1.638 14.895 81.806 2.840 25.819 81.806

4 .738 6.712 88.519

5 .468 4.250 92.769

6 .239 2.173 94.942

7 .208 1.890 96.832

8 .156 1.415 98.247

9 .132 1.200 99.447

10 .047 .425 99.873

11 .014 .127 100.000

Component

1 2 3

Cv1 .898

Cv4 .876

Cv3 .872

Cv2 .825

L1 .848

L2 .815

L4 .796

L3 .785

Dn2 .972

Total Variance Explained

Extraction Method: Principal Component Analysis.

Bảng kiểm định mức ý nghĩa của các nhân tố rút trích ra (Total Variance Explained)

Eigenvalues = 1.638 > 1 đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố, thì

nhân tố rút ra có ý nghĩa tóm tắt thông tin tốt nhất.

Tổng phương sai trích: Rotation Sums of Squared Loadings (Cumulative %) = 81.806%

> 50 %. Điều này chứng tỏ 81.806% biến thiên của dữ liệu được giải thích bởi 3 nhân tố.

Rotated Component Matrix a

Page 107: Hướng dẫn SPSS

Stt Nhân tố Biến Chỉ tiêu Tên nhóm

1 1

Cv1 Sử dụng tốt các năng lực cá nhân

Công việcCv4 Công việc rất thú vị

Cv3 Công việc có nhiều thách thức

Cv2Có thể thấy rõ kết quả hoàn thànhcông việc

2 2

L1 Được trả lương cao

LươngL2Sống hoàn toàn dựa vào thu nhập củacông ty

L4 Thu nhập được trả công bằng

L3Tiền lương tương xứng với kết quảlàm việc

3 3Dn2 Phối hợp làm việc tốt

Đồng nghiệpDn1 Thoải mái và dễ chịu

Dn3 Mọi người làm việc rất thân thiện

Dn1 .862

Dn3 .856

Extraction Method: Principal Component

Analysis.

Rotation Method: Varimax with Kaiser

Normalization.

a. Rotation converged in 5 iterations.

Bảng ma trận xoay nhân tố (Rotated Component Matrixa) cho thấy:

11 biến quan sát được gom thành 3 nhân tố, tất cả các biến số có hệ số Factor Loading >

0.5 cho nên không có biến nào bị loại.

Số nhân tố tạo ra 3 nhân tố.

Bảng phân nhóm và đặt tên cho các nhân tố

Page 108: Hướng dẫn SPSS

STT Sự thỏa mãn chungHài lòng vềcông việchiện tại

Công việchiện tại đápứng đượcnhu cầu

Tiếp tụclàm việc ở

tổ chức

TM1 TM2 TM31 4 3 32 4 4 43 4 4 44 5 5 55 5 5 56 4 4 47 4 4 48 5 5 59 5 5 5

10 5 5 411 5 5 512 4 3 413 4 4 414 5 5 515 4 3 3

Câu 16

Có dữ liệu khảo sát “Đo lường sự thỏa mãn trong công việc của nhân viên làm việc trong các

tổ chức tại thành phố Hồ Chí Minh”. Bảng câu hỏi này dựa trên thang đo Likert, vì đây có tính

chất lý thuyết nên tác giả chỉ lấy ra nột phần của kết quả khảo sát thu thập được từ 15 nhân viên

đánh giá về sự thỏa mãn của nhân viên khi làm việc trong các tổ chức, dữ liệu được cho như

sau:

Anh/ chị vui lòng đánh giá mức độ đồng ý đối với mỗi phát biểu dưới đây. Điểm của các thang

đo 1: rất không đồng ý, đến 5: rất đồng ý.

Yêu c ầu:

Hãy lập mô hình hồi qui bội (hồi quiđa biến) thể hiện sự tương quan giữa mức

độ thỏa mãn chung về công việc hiện tại

trong các tổ chức với các nhân tố tác động

đã gom được trong phân tích nhân tố khám

phá (EFA- Exploratory Factor Analysis) ở câu

trên. Nêu nhận xét báo cáo kết quả phân

tích được.

Hướng dẫn

1. Phân tích nhân tố cho biến phụ thuộc

Page 109: Hướng dẫn SPSS
Page 110: Hướng dẫn SPSS
Page 111: Hướng dẫn SPSS

Click chọn Descriptives…

Page 112: Hướng dẫn SPSS

Click chọn Rotation…

Click chọn Options…

Page 113: Hướng dẫn SPSS

Click OK

2. Kiểm định Cronbach’s Alpha

Page 114: Hướng dẫn SPSS

Click Statistics

Click Continue, OK

3. Tích giá trị của các biến phụ thuộc

Page 115: Hướng dẫn SPSS
Page 116: Hướng dẫn SPSS

Nhập tên biến mới

Nhập hàm tínhtrung bình (Mean)

Nhập Label của biếnmới

Kết quả

Page 117: Hướng dẫn SPSS

4. Tích giá trị của các biến độc lậpCông việc (là trung bình của các biến CV1, CV4, CV3, CV2)

Page 118: Hướng dẫn SPSS

Lương (là trung bình của các biến L1, L2, L4, L3)

Page 119: Hướng dẫn SPSS

Đồng nghiệp (là trung bình của các biến DN2, DN1, DN3)

Page 120: Hướng dẫn SPSS

5. Chạy hồi qui cho biến phụ thuộc và độc lập

Page 121: Hướng dẫn SPSS
Page 122: Hướng dẫn SPSS

Click Statistics

Click Continue, Plots…

Page 123: Hướng dẫn SPSS

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .744

Bartlett's Test of Sphericity

Approx. Chi-Square 37.428

df 3

Sig. .000

Click Continue, OK

Bài làm

1. Phân tích nhân tố cho biến phụ thuộc

Phân tích nhân tố cho các biến phụ thuộc để xác định các tập hợp nhóm biến được tạo ra

cho biến phụ thuộc. đồng thời cũng xác định mức độ tương quan của các biến quan sát trong biến

phụ thuộc, loại đi những biến quan sát có mức độ tương quan yếu làm nhiễu, ảnh hưởngđén dữ

liệu phân tích.

KMO and Bartlett's Test

Kết quả tính hệ số đo lường mức độ phù hợp của mô hình phân tích nhân tố (KMO) và kiểm

định mức ý nghĩa của mô hình phân tích nhân tố (Bartlett's Test) cho thấy:

Hệ số KMO = 0.744 (KMO >= 0.5) nên phân tích nhân tố là phù hợp và đáng tin cậy.

Sig. (Bartlett’s Test) = 0.000 (sig. < 0.05) chứng tỏ các biến quan sát có tương quan với

nhau trong tổng thể.

Page 124: Hướng dẫn SPSS

Component Initial Eigenvalues Extraction Sums of Squared Loadings

Total % of Variance Cumulative % Total % of Variance Cumulative %

1 2.722 90.732 90.732 2.722 90.732 90.732

2 .188 6.260 96.992

3 .090 3.008 100.000

Total Variance Explained

Extraction Method: Principal Component Analysis.

Page 125: Hướng dẫn SPSS

Cronbach's

Alpha

N of Items

.935 3

Component

1

TM2 .970

TM1 .945

TM3 .942

Bảng kiểm định mức ý nghĩa của các nhân tố rút trích ra (Total Variance Explained)

Eigenvalues = 2.722 > 1 đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố, thì

nhân tố rút ra có ý nghĩa tóm tắt thông tin tốt nhất.

Tổng phương sai trích: Rotation Sums of Squared Loadings (Cumulative %) = 90.732%

> 50 %. Điều này chứng tỏ 90.732% biến thiên của dữ liệu được giải thích bởi 1 nhân tố.

Component Matrix a

Extraction Method:

Principal Component

Analysis.

a. 1 components

extracted.

Bảng ma trận các nhân tố (Component Matrixa) cho thấy:

3 biến quan sát được gom thành 1 nhân tố, tất cả các biến số có hệ số Factor Loading >

0.5 cho nên không có biến nào bị loại.

Số nhân tố tạo ra 1 nhân tố cho biến phụ thuộc.

2. Kiểm định Cronbach’s Alpha cho biến phụ thuộc

Kiểm định cronbach’s Alpha cho các biến quan sát trong biến phụ thuộc để kiểm tra sự

chặt chẽ và tương quan giữa các biến quan sát, cho phép loại bỏ những biến không phù hợp và

hạn chế các biến rác trong biến phụ thuộc. Hệ số tương quan tổng biến phù hợp (Corrected Item

– Total Correlation) lớn hơn 0.3 và có hệ số Alpha lớn hơn 0.7 được xem là chấp nhận và thích

hợp đưa vào phân tích những bước tiếp theo.

Reliability Statistics

Page 126: Hướng dẫn SPSS

Sự thỏa mãn Công việc Lương Đồng nghiệp

Pearson Correlation

Sự thỏa mãn 1.000 .660 .685 .167

Công việc .660 1.000 .352 .264

Lương .685 .352 1.000 .420

Đồng nghiệp .167 .264 .420 1.000

Sig. (1-tailed) Sự thỏa mãn . .004 .002 .276

Scale Mean if

Item Deleted

Scale Variance

if Item Deleted

Corrected Item-

Total

Correlation

Cronbach's

Alpha if Item

Deleted

TM1 8.53 2.124 .880 .933

TM2 8.73 1.352 .928 .873

TM3 8.73 1.638 .878 .895

Item-Total Statistics

Kết quả chạy Cronbach's Alpha thang đo “Đánh giá mức độ thỏa mãn của nhân viên”

cho thấy, hệ số Cronbach's Alpha của 3 biến quan sát của thang đo có giá trị Cronbach's Alpha =

0.935 > 0.7 và hệ số tương quan biến tổng của 3 biến quan sát có giá trị Corrected item- total

correlation > 0.3. Nên thang đo này đạt tiêu chuẩn độ tin cậy khi kiểm định Cronbach's Alpha.

Như vậy, sau khi phân tích nhân tố và kiểm định độ tin cậy cronbach’s Alpha, số biến

phụ thuộc tạo ra 1 biến bao gồm TM2,TM1,TM3 và thang đo đạt tiêu chuẩn độ tin cậy

cronbach’s Alpha. Do đó, giá trị của biến phụ thuộc đo lường sự thỏa mãn của nhân viên làm

việc trong các tổ chức là trung bình của 3 biến TM2,TM1,TM3 được sử dụng để phân tích hồi

qui.

3. Phân tích hồi qui đa biến

Các giả thiết của mô hình: Những nhân tố tác động đến sự thỏa mãn của nhân viên làm việc

trong các tổ chức.

H1 công việc tác động đến sự thỏa mãn của nhân viên làm việc trong các tổ chức

H2 lương tác động đến sự thỏa mãn của nhân viên làm việc trong các tổ chức

H3 đồng nghiệp tác động đến sự thỏa mãn của nhân viên làm việc trong các tổ chức

Mô hình hồi qui tổng thể như sau:

Correlations

Page 127: Hướng dẫn SPSS

Công việc .004 . .099 .171

Lương .002 .099 . .060

Đồng nghiệp .276 .171 .060 .

N

Sự thỏa mãn 15 15 15 15

Công việc 15 15 15 15

Lương 15 15 15 15

Đồng nghiệp 15 15 15 15

Model Sum of Squares df Mean Square F Sig.

1

Regression 2.713 1 2.713 11.505 b.005

Residual 3.065 13 .236

Total 5.778 14

2

Regression 3.871 2 1.936 12.182 c.001

Residual 1.907 12 .159

Total 5.778 14

ANOVA

Bảng ma trận tương quan cho thấy sự thỏa mãn của công việc có tương quan với 2

nhân tố:

Công việc

Lương

Vì mức ý nghĩa của hệ số tương quan các biến độc lập có giá trị sig = 0.000 < 0.05

Nhân tố đồng nghiệp không tương quan với phụ thuộc sự thỏa mãn công việc vì hệ

số sig =0.276 (>0.05)

Mối tương quan của 2 biến này với sự thỏa mãn của công việc là tương quan

thuận, vì hệ số tương quan R của 2 biến độc lập với biến phụ thuộc có giá trị

dương.

Nhân tố lương tương quan mạnh nhất đối với sự thỏa mãn công việc vì hệ số

tương quan của nhân tố này cao nhất (R=0.685). nhân tố công việc tương quan

thấp hơn đối với sự thỏa mãn công việc vì hệ số tương quan của nhân tố này nhỏ

(R=0.660).

a

a. Dependent Variable: Sự thỏa mãn

b. Predictors: (Constant), Lương

c. Predictors: (Constant), Lương, Công việc

Page 128: Hướng dẫn SPSS

Kiểm định F sử dụng trong phân tích phương sai (ANOVA) là một phép kiểm địnhgiả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể để xem xétbiến phụ thuộc có liên hệ tuyến tính với toàn bộ tập hợp của các biến độc lập.Trong trường hợp này, ta thấy rằng trị thống kê F được tính từ giá trị R2 đầy đủkhác 0 (F=12.182), giá trị sig. rất nhỏ =0.000 (<0.05) cho thấy mô hình sử dụng làphù hợp và các biến đều đạt được tiêu chuẩn chấp nhận (Tolerance > 0,0001).

Page 129: Hướng dẫn SPSS

Model Unstandardized Coefficients Standardized

Coefficients

t Sig. Collinearity Statistics

B Std. Error Beta Tolerance VIF

1(Constant) 1.762 .768 2.293 .039

Lương .651 .192 .685 3.392 .005 1.000 1.000

2

(Constant) -.123 .941 -.130 .898

Lương .491 .168 .517 2.919 .013 .876 1.141

Công việc .576 .213 .478 2.700 .019 .876 1.141

Model R R Square Adjusted R

Square

Std. Error of the

Estimate

Durbin-Watson

1 a.685 .470 .429 .48557

Model Summary

Coefficients a

a. Dependent Variable: Sự thỏa mãn

Bảng kết quả kiểm định mức ý nghĩa ta thấy sig của nhân tố lương bằng 0.013 < 0.05. sigcủa nhân tố công việc bằng 0.019 < 0.05 nên 2 nhân tố này có mối tương quan với sựthỏa mãn công việc và chấp nhận trong mô hình hồi qui tương quan đa biến thể hiệnmối tương quan của nhân tố lương và công việc tác động đến sự thỏa mãn công việcMô hình hồi qui tương quan là:

Sự thỏa mãn công việc = 0.517*Lương + 0.478*Công việc

Phương trình hồi qui tương quan trên cho thấy nhân tố lương tác động mạnh nhất đói với

sự thỏa mãn công việc của nhân viên vì hệ số beta của nhân tố này cao nhất (beta=

0.517). Nhân tố tác động mạnh thứ 2 đến thoả mãn công việc là công việc vì hệ số beta

của nhân tố này nhỏ hơn (beta= 0.478)

Mối tương quan của 2 nhân tố lương và công việc tác động đế sự thỏa mãn công việc của

nhân viên là mối tương quan thuận chiều vì giá trị hệ số beta của 2 nhân tố đều có giá trị

dương( beta>0).

Chuẩn đoán hiện tượng đa cộng tuyến Collinearity diagnostics với hệ số phóng đại

phương sai VIF (Variance inflation factor) của các biến độc lập trong mô hình đều rất

nhỏ, có giái trị 1.141, thể hiện tính đa cộng tuyến của các biến độc lập là không đáng kể

và các biến độc lập trong mô hình chấp nhận được (khi giá trị VIF vượt quá 10 là dấu

hiệu của hiện tượng đa cộng tuyến).

c

Page 130: Hướng dẫn SPSS

2 .819 b .670 .615 .39860 1.518

a. Predictors: (Constant), Lương

b. Predictors: (Constant), Lương, Công việc

c. Dependent Variable: Sự thỏa mãn

Mức độ phù hợp của phương trình hồi quy Model Summaryc. mô hình hồi quitương quan thể hiện sự tác động cảu 2 nhân tố lương và công việc tác động đếnsự thỏa mãn công việc của nhân viên có hệ số R điều chỉnh (Adjusted R Square =0.615) thể hiện 2 nhân tố lương và công việc tác động đến sự thỏa mãn công việccủa nhân viên ở mức độ 61.5% còn lại là do các nhân tố khác tác động sự thỏamãn công việc.

Mô hình hồi quy trên không vi phạm giả thuyết về hiện tượng tương quan chuỗibậc nhất trong mô hình vì hệ số kiểm định Durbin-Watson = 1.518 thuộc trongkhoảng từ 1->3 .