15
III. Thiết lập mô hình hồi quy 3.1 Xây dựng mô hình tổng quát Y = C1 + C2*X2 + C3*X3 + C4*X4 + C5*X5 + C6*D6 + C7*D7 + C8*D8 + C9*D9 + C10*D10+ C11*D11 + C12*D12 + C13*D13 + C14*D14 + C15*D15+ C16*D16 + C17*D17 + C18*D18 + C19*D19 3.2 Giải thích các biến trong mô hình: 3.2.1 Biến phụ thuộc Y : Số lần đi du lịch của sinh viên ngoại thương (lần/năm) 3.2.2 Biến độc lập Biến định lượng: TÊN Ý NGHĨA ĐƠN VỊ TÍNH DẤU KỲ VỌNG DIỄN GIẢI X2 Thu nhập do gia đình chu cấp Ngàn đồng/tháng + Gia đình chu cấp càng nhiều thì nhu cầu đi du lịch càng cao X3 Thu nhập do sinh viên làm thêm Ngàn đồng/tháng + Sinh viên kiếm được càng nhiều tiền càng có nhiều nhu cầu du lịch X4 Độ tuổi của sinh viên Tuổi - Sinh viên càng nhỏ tuổi thì càng

sinh viên và nhu cầu du lịch

  • Upload
    anh-thu

  • View
    13

  • Download
    1

Embed Size (px)

Citation preview

Page 1: sinh viên và nhu cầu du lịch

III. Thiết lập mô hình hồi quy

3.1 Xây dựng mô hình tổng quát

Y = C1 + C2*X2 + C3*X3 + C4*X4 + C5*X5 + C6*D6 + C7*D7 + C8*D8 + C9*D9 + C10*D10+ C11*D11 + C12*D12 + C13*D13 + C14*D14 + C15*D15+ C16*D16 + C17*D17 + C18*D18 + C19*D19

3.2 Giải thích các biến trong mô hình:

3.2.1 Biến phụ thuộc

Y : Số lần đi du lịch của sinh viên ngoại thương (lần/năm)

3.2.2 Biến độc lập

Biến định lượng:

TÊN Ý NGHĨA ĐƠN VỊ

TÍNH

DẤU KỲ

VỌNG

DIỄN GIẢI

X2 Thu nhập do gia đình chu cấp Ngàn đồng/tháng + Gia đình chu cấp càng nhiều thì nhu cầu đi du lịch càng cao

X3 Thu nhập do sinh viên làm thêm Ngàn đồng/tháng + Sinh viên kiếm được càng nhiều tiền càng có nhiều nhu cầu du lịch

X4 Độ tuổi của sinh viên Tuổi - Sinh viên càng nhỏ tuổi thì càng có nhiều thời gian rãnh hơn để đi du lịch

X5 Số ngày rãnh trong tuần Ngày/tuần + Sinh viên càng rãnh nhiều càng có nhu cầu đi du lịch cao

Biến định tính

Page 2: sinh viên và nhu cầu du lịch

TÊN Ý NGHĨA LỰA CHỌN DẤU KỲ

VỌNG

DIỄN GIẢI

1 0

D6 GIỚI TÍNH NAM NNỮ +/- Giới tính có hoặc không có ảnh hưởng đến số lần du lịch

D7 Sinh viên Năm 1 Khác +/- Sinh viên năm thứ mấy có thể làm tăng hoặc giảm số lần du lịchD8 Năm 2 Khác +/-

D9 Năm 3 Khác +/-

D10 Có chấp nhận vay mượn để đi du lịch hay không và nếu vay thì dễ dàng hay khó khăn

Có vay dễ dàng

Khác +/- Khả năng vay mượn dễ dàng, khó khăn hay không muốn vay mượn chắc chắn sẽ ảnh hưởng đến số lần du lịch.

Nếu D10 = D11 = 0 thì sinh viên này không chấp nhận vay mượn để đi du lịch

D11 Có vay khó khăn

Khác +/-

D12 Có hi sinh thời gian học, làm để đi du lịch không

Có Không +/- Sinh viên chấp nhận hi sinh thời gian học, làm việc thì khả năng đi du lịch nhiều hơn

D13 Có say tàu xe hay không Có Không +/- Sinh viên say tàu xe có thể hoặc không ảnh hưởng đến quyết định đi du lịch

D14 Sức khỏe xấu có ảnh hưởng đến quyết định đi du lịch hay không

Có Không +/- Khi sinh viên có sức khỏe không tốt mà vẫn quyết định đi du lịch thì số lần đi du lịch trong năm của họ sẽ tăng lên

D15 Tính cách sinh viên Hướng ngoạiHướng nội +/- Sinh viên hướng ngoại

Page 3: sinh viên và nhu cầu du lịch

có thể có nhiều mối quan hệ bạn bè hơn nên có thể sẽ đi du lịch nhiều hơn.

D16 Sở thích đi du lịch Xa Gần +/- Sinh viên mà thích đi du lịch gần thì số lần thực hiện chuyến du lịch có thể sẽ cao hơn

D17 Có ngại đi du lịch khi thời tiết xấu không

Có Không +/- Nếu sinh viên ngại đi du lịch khi thời tiết xấu thì số lần đi du lịch của sinh viên đó sẽ giảm.

3.3 Tiến hành xây dựng mô hình:

3.3.1 Mô hình hồi quy mẫu:

Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 14:29Sample: 1 109Included observations: 109

Variable Coefficient Std. Error t-Statistic Prob.  

C -13.33282 5.867269 -2.272406 0.0254X2 0.000823 0.000181 4.557992 0.0000X3 -9.96E-05 0.000217 -0.458364 0.6478X4 0.645173 0.261821 2.464179 0.0156X5 0.088530 0.177893 0.497657 0.6199D6 0.256586 0.355654 0.721448 0.4725D7 4.733829 1.120609 4.224335 0.0001D8 1.526034 0.874633 1.744770 0.0844D9 -0.013904 0.565514 -0.024587 0.9804

D10 0.429462 0.399242 1.075694 0.2849D11 -0.479545 0.571631 -0.838906 0.4037D12 0.421561 0.383576 1.099029 0.2746D13 0.396565 0.420923 0.942132 0.3486D14 0.014917 0.349183 0.042721 0.9660D15 0.217091 0.385487 0.563159 0.5747D16 -0.476790 0.590328 -0.807671 0.4214D17 -0.106171 0.357444 -0.297028 0.7671

R-squared 0.503962    Mean dependent var 3.091743Adjusted R-squared 0.417694    S.D. dependent var 2.183869S.E. of regression 1.666488    Akaike info criterion 4.001681Sum squared resid 255.5008    Schwarz criterion 4.421433Log likelihood -201.0916    Hannan-Quinn criter. 4.171906F-statistic 5.841843    Durbin-Watson stat 1.654635Prob(F-statistic) 0.000000

Page 4: sinh viên và nhu cầu du lịch

Mô hình có mức độ phù hợp R2 = 0.503962

Dựa vào kết quả hồi quy nhóm phát hiện ra mô hình có 3 biến độc lập có ý nghĩa: X2, X4 và D7 do P-value < α =0.05 tuy nhiên lại có rất nhiều biến độc lập không có ý nghĩa: p-value> α =0.05. Để đánh giá một cách chính xác bản chất của hiện tượng này nhóm sẽ thực hiện xét ma trận tương quan giữa các biến độc lập như sau:

  X2 X3 X4 X5 D6 D7 D8 D9 D10 D11 D12 D13 D14 D15 D16 D17X2 1 -0.17 0.006 0.063 -0 -0.03 0.049 0.008 0.018 -0.11 0.205 -0.09 0.153 0.184 0.014 -0.18X3 -0.17 1 0.15 -0.21 0.116 -0.19 0.199 -0.05 0.018 0.049 0.08 0.274 0.034 0.147 -0.08 -0.03X4 0.006 0.15 1 -0.14 -0.19 -0.73 -0.2 0.267 -0 -0.2 -0.1 0.074 0.184 0.093 0.221 0.16X5 0.063 -0.21 -0.14 1 0.1 0.25 -0.07 -0.32 -0 0.156 0.29 -0.17 0.135 -0.18 -0.06 -0.05D6 -0 0.116 -0.19 0.1 1 0.163 0.067 -0.11 0.162 -0.1 0.126 -0.14 -0.04 -0.1 -0.1 -0.03D7 -0.03 -0.19 -0.73 0.25 0.163 1 -0.34 -0.32 -0.13 0.126 0.023 -0.36 -0.08 -0.08 0.028 -0.18D8 0.049 0.199 -0.2 -0.07 0.067 -0.34 1 -0.36 0.301 0.245 0.134 0.51 -0.14 -0.04 -0.47 -0.02D9 0.008 -0.05 0.267 -0.32 -0.11 -0.32 -0.36 1 -0.17 -0.19 -0.12 -0.11 0.026 0.099 0.235 0.016D10 0.018 0.018 -0 -0 0.162 -0.13 0.301 -0.17 1 -0.35 0.236 0.154 -0.04 -0.05 -0.06 -0.07D11 -0.11 0.049 -0.2 0.156 -0.1 0.126 0.245 -0.19 -0.35 1 -0.19 0.138 0.064 -0.09 -0.27 -0.01D12 0.205 0.08 -0.1 0.29 0.126 0.023 0.134 -0.12 0.236 -0.19 1 -0.05 0.085 0.166 -0.01 -0.2D13 -0.09 0.274 0.074 -0.17 -0.14 -0.36 0.51 -0.11 0.154 0.138 -0.05 1 0.065 -0.17 -0.3 0.119D14 0.153 0.034 0.184 0.135 -0.04 -0.08 -0.14 0.026 -0.04 0.064 0.085 0.065 1 -0.02 -0.02 -0.05D15 0.184 0.147 0.093 -0.18 -0.1 -0.08 -0.04 0.099 -0.05 -0.09 0.166 -0.17 -0.02 1 0.304 -0.14D16 0.014 -0.08 0.221 -0.06 -0.1 0.028 -0.47 0.235 -0.06 -0.27 -0.01 -0.3 -0.02 0.304 1 -0.2D17 -0.18 -0.03 0.16 -0.05 -0.03 -0.18 -0.02 0.016 -0.07 -0.01 -0.2 0.119 -0.05 -0.14 -0.2 1

Dựa vào ma trận trên nhóm nhận xét hệ số tương quan giữa các biến đều nhỏ hơn 0.8 nên nhóm khẳng định không có hiện tượng đa cộng tuyến trong mô hình

3.3.2 Kiểm định lại mô hình với các biến có ý nghĩa:

Y = -13.33289 – 0.0008*X2 + 0.6451*X4 + 4.7338*D7

Kết quả hồi quy:

Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 15:00Sample: 1 109Included observations: 109

Variable Coefficient Std. Error t-Statistic Prob.  

C -0.541929 3.468795 -0.156230 0.8762X2 0.000928 0.000172 5.402731 0.0000X4 0.071565 0.164304 0.435561 0.6640D7 2.578564 0.583897 4.416132 0.0000

R-squared 0.375497    Mean dependent var 3.091743Adjusted R-squared 0.357654    S.D. dependent var 2.183869

Page 5: sinh viên và nhu cầu du lịch

S.E. of regression 1.750294    Akaike info criterion 3.993451Sum squared resid 321.6705    Schwarz criterion 4.092216Log likelihood -213.6431    Hannan-Quinn criter. 4.033504F-statistic 21.04459    Durbin-Watson stat 1.293429Prob(F-statistic) 0.000000

Sau khi hồi quy lại với các biến có ý nghĩa, nhóm thấy xuất hiện thêm 1 biến không có ý nghĩa là

X4 (do P-value > 0.05). Lúc này mức độ phù hợp của mô hình chỉ còn R2 = 0.375497

Vì vậy, để xem xét biến này có phải là biến thừa trong mô hình hay không, ta tiến hành kiểm định

Wald:

Wald Test:Equation: HOIQUY1

Test Statistic Value   df     Probability

F-statistic 0.189713 (1, 105)   0.6640Chi-square 0.189713 1   0.6632

Null Hypothesis Summary:

Normalized Restriction (= 0) Value   Std. Err.

C(3) 0.071565 0.164304

Restrictions are linear in coefficients.

Theo kết quả kiểm định, ta thấy biến X4 là biến thừa do P_value = 0.6632> 0.05

3.3.3 Mô hình hồi quy mới là:

Y = C1 + C2*X2 + C3*D7

Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 15:51Sample: 1 109Included observations: 109

Variable Coefficient Std. Error t-Statistic Prob.  

C 0.961118 0.351247 2.736299 0.0073X2 0.000926 0.000171 5.413418 0.0000D7 2.392878 0.397461 6.020414 0.0000

R-squared 0.374369    Mean dependent var 3.091743Adjusted R-squared 0.362565    S.D. dependent var 2.183869S.E. of regression 1.743591    Akaike info criterion 3.976908

Page 6: sinh viên và nhu cầu du lịch

Sum squared resid 322.2517    Schwarz criterion 4.050982Log likelihood -213.7415    Hannan-Quinn criter. 4.006948F-statistic 31.71446    Durbin-Watson stat 1.284498Prob(F-statistic) 0.000000

Y= 0.9611 + 0.0009*X2 + 2.3928*D7

Mức độ phù hợp của mô hình (R2 = 0.3743) thấp hơn mô hình hồi quy gốc. Tuy nhiên, nhóm

khẳng định các biến trong mô hình đều có ý nghĩa(P_value <0.05)

IV. Tiến hành kiểm định bệnh của mô hình:

4.1 Đa cộng tuyến:

  X2 D7X2 1 -0.03D7 -0.03 1

Nhận xét:

Các hệ số tương quan giữa các biến đều nhỏ hơn 0.8, nên giữa các biến không có sự tương quan.

Vậy mô hình không bị đa cộng tuyến.

4.2 Tự tương quan

Thực hiện kiểm định BG Test trong Eviews

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 15.41334    Prob. F(1,105) 0.0002Obs*R-squared 13.95239    Prob. Chi-Square(1) 0.0002

Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 02/20/11 Time: 16:17Sample: 1 109Included observations: 109Presample missing value lagged residuals set to zero.

Variable Coefficient Std. Error t-Statistic Prob.  

C 0.240515 0.335201 0.717523 0.4746X2 -0.000134 0.000164 -0.819231 0.4145D7 -0.072955 0.373378 -0.195392 0.8455

RESID(-1) 0.367894 0.093707 3.925983 0.0002

R-squared 0.128004    Mean dependent var -8.15E-18Adjusted R-squared 0.103089    S.D. dependent var 1.727371

Page 7: sinh viên và nhu cầu du lịch

S.E. of regression 1.635913    Akaike info criterion 3.858287Sum squared resid 281.0023    Schwarz criterion 3.957052Log likelihood -206.2766    Hannan-Quinn criter. 3.898339F-statistic 5.137780    Durbin-Watson stat 2.193278Prob(F-statistic) 0.002353

Nhận xét:

Chỉ số Prob. Chi-Square(1)=0.0002<0.05 nên có hiện tượng tự tương quan trong mô hình.

4.3 Phương sai thay đổi:

Heteroskedasticity Test: White

F-statistic 6.374665    Prob. F(2,106) 0.0024Obs*R-squared 11.70261    Prob. Chi-Square(2) 0.0029Scaled explained SS 21.35106    Prob. Chi-Square(2) 0.0000

Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 02/20/11 Time: 16:20Sample: 1 109Included observations: 109

Variable Coefficient Std. Error t-Statistic Prob.  

C 0.792300 0.838972 0.944370 0.3471X2^2 5.29E-07 1.49E-07 3.551416 0.0006D7^2 0.496044 1.267599 0.391326 0.6963

R-squared 0.107363    Mean dependent var 2.956437Adjusted R-squared 0.090521    S.D. dependent var 5.834102S.E. of regression 5.563785    Akaike info criterion 6.297571Sum squared resid 3281.305    Schwarz criterion 6.371645Log likelihood -340.2176    Hannan-Quinn criter. 6.327611F-statistic 6.374665    Durbin-Watson stat 1.601668Prob(F-statistic) 0.002431

Page 8: sinh viên và nhu cầu du lịch

-2

-1

0

1

2

3

4

5

25 50 75 100

ABS_RESIDF ± 2 S.E.

Forecast: ABS_RESIDFActual: ABS_RESIDForecast sample: 1 109Included observations: 109

Root Mean Squared Error 0.881024Mean Absolute Error 0.672970Mean Abs. Percent Error 234.2073Theil Inequality Coefficient 0.316555 Bias Proportion 0.000000 Variance Proportion 0.437836 Covariance Proportion 0.562164

Nhận xét:

Bằng phương pháp kiểm định White cho ta kết quả chỉ số P-value=0.0029 <0.05 nên mô hình có

hiện tượng phương sai thay đổi

Cách khắc phục bệnh phương sai thay đổi:

Bước 1: Tạo biến abs_resid = abs(resid) – Trị tuyệt đối phần dư

Bước 2: Hồi quy hàm abs_resid với dạng

Abs_resid = C1 + C2*X2 + C3*X2^2 + C4*D7 + ei

Dependent Variable: ABS_RESIDMethod: Least SquaresDate: 02/21/11 Time: 09:00Sample: 1 109Included observations: 109

Variable Coefficient Std. Error t-Statistic Prob.  

C 1.297817 0.262961 4.935400 0.0000X2 -0.000701 0.000319 -2.197122 0.0302

X2^2 2.63E-07 8.72E-08 3.015908 0.0032

Page 9: sinh viên và nhu cầu du lịch

D7 0.334951 0.205551 1.629532 0.1062

R-squared 0.152865    Mean dependent var 1.194895Adjusted R-squared 0.128661    S.D. dependent var 0.961641S.E. of regression 0.897649    Akaike info criterion 2.657931Sum squared resid 84.60621    Schwarz criterion 2.756696Log likelihood -140.8573    Hannan-Quinn criter. 2.697984F-statistic 6.315715    Durbin-Watson stat 2.105294Prob(F-statistic) 0.000558

Bước 3 : Hồi quy với trọng số 1/abs_residf

Dependent Variable: YMethod: Least SquaresDate: 02/21/11 Time: 09:05Sample: 1 109Included observations: 109Weighting series: 1/ABS_RESIDFWhite Heteroskedasticity-Consistent Standard Errors & Covariance

Variable Coefficient Std. Error t-Statistic Prob.  

C 1.043980 0.294781 3.541538 0.0006X2 0.000787 0.000182 4.328110 0.0000D7 2.554324 0.377091 6.773757 0.0000

Weighted Statistics

R-squared 0.337080    Mean dependent var 2.790827Adjusted R-squared 0.324572    S.D. dependent var 1.634588S.E. of regression 1.536600    Akaike info criterion 3.724158Sum squared resid 250.2807    Schwarz criterion 3.798232Log likelihood -199.9666    Hannan-Quinn criter. 3.754198F-statistic 26.94933    Durbin-Watson stat 1.296903Prob(F-statistic) 0.000000

Unweighted Statistics

R-squared 0.366380    Mean dependent var 3.091743Adjusted R-squared 0.354425    S.D. dependent var 2.183869S.E. of regression 1.754688    Sum squared resid 326.3665Durbin-Watson stat 1.201574

Nhận xét:

Mức độ phù hợp của mô hình giảm còn R2 = 0.3370

Bước 4: Kiểm định phương sai thay đổi của mô hình đã khắc phục

Heteroskedasticity Test: White

F-statistic 0.220562    Prob. F(3,105) 0.8819

Page 10: sinh viên và nhu cầu du lịch

Obs*R-squared 0.682592    Prob. Chi-Square(3) 0.8773Scaled explained SS 1.594429    Prob. Chi-Square(3) 0.6607

Test Equation:Dependent Variable: WGT_RESID^2Method: Least SquaresDate: 02/21/11 Time: 09:07Sample: 1 109Included observations: 109White Heteroskedasticity-Consistent Standard Errors & Covariance

Variable Coefficient Std. Error t-Statistic Prob.  

C 2.392512 1.382966 1.729986 0.0866WGT^2 -0.327669 1.479883 -0.221415 0.8252

X2^2*WGT^2 1.26E-07 1.28E-07 0.989021 0.3249D7^2*WGT^2 -0.960647 1.256720 -0.764408 0.4463

R-squared 0.006262    Mean dependent var 2.296153Adjusted R-squared -0.022130    S.D. dependent var 5.126959S.E. of regression 5.183379    Akaike info criterion 6.164798Sum squared resid 2821.078    Schwarz criterion 6.263563Log likelihood -331.9815    Hannan-Quinn criter. 6.204851F-statistic 0.220562    Durbin-Watson stat 1.847135Prob(F-statistic) 0.881932

Nhận xét:

Mô hình không còn bị HET nữa do P-value>0.05

V. Kết quả hồi quy:

Y= 0.9611 + 0.0009*X2 + 2.3928*D7

BIẾN TÁC ĐỘNG ĐẾN SỐ LẦN ĐI DU LỊCH CỦA SINH VIÊN

DIỄN GIẢI

X2 Cùng chiều Sinh viên nào được gia đình chu cấp thêm càng nhiều thì số lần đi du lịch càng tăng

D7

VI. Kết luận chung:

6.1. Khó khăn:

Page 11: sinh viên và nhu cầu du lịch

Do chưa nắm rõ về việc xây dựng một bản khảo sát hoàn chỉnh nên nhóm đã gặp một

số khó khăn như thứ tự câu hỏi đảo lộn làm mất thời gian khi tổng hợp số liệu eviews.

Quá trình lựa chọn biến còn khá nhiều sai sót khiến kết quả R2 không cao lắm. Nhiều

biến độc lập được chọn ban đầu bị loại khỏi mô hình.

Kết quả khảo sát không mang tính thực tế cao vì có một bộ phận sinh viên được khảo

sát trả lời không nghiêm túc và chân thực.

Vì chưa có kinh nghiệm nên nhóm gặp một số khó khăn trong kỹ thuật sử dụng eviews

khi chọn biến mà cho ra R2 thấp hay khi kết quả cho ra là không có biến nào có ý

nghĩa.

6.2. Hạn chế:

Đề tài chọn lựa ít áp dụng được vào thực tế. Nội dung hỏi về biến phụ thuộc gây khó khăn

cho sinh viên khi trả lời. Một số biến độc lập còn mang tính chủ quan, có ý nghĩa thực tiễn

không cao. Số lượng mẫu khảo sát ít và mức độ chính xác còn hạn chế. Điều này cũng ảnh

hưởng lớn đến việc xây dựng mô hình hồi quy và quyết định việc các biến có ý nghĩa.

6.3. Kết luận:

Từ kết quả hồi quy cuối cùng, nhóm thực hiện có thể rút ra kết luận rằng các yếu tố ảnh

hưởng trực tiếp đến số lần đi du lịch trong năm của sinh viên là: số tiền mà gia đình chu

cấp cho sinh viên đó là cao hay thấp và sinh viên năm 1 ảnh hưởng đến số lần đi du lịch

nhiều nhất.

Thông qua bài nghiên cứu này, nhóm chúng tôi hi vọng rằng sẽ có cái nhìn rõ ràng hơn về

nhu cầu đi du lịch của sinh viên trường đại học Ngoại thương.

Bài nghiên cứu chắc chắn không thể tránh khỏi một số thiếu sót và hạn chế không mong

muốn, do đó nhóm chúng tôi rất mong nhận được sự nhận xét khách quan cũng như đóng

góp từ giảng viên và các bạn.

Xin chân thành cảm ơn sự giúp đỡ tận tình và những tài liệu quý giá mà giảng viên đã

cung cấp để chúng tôi hoàn thành bài nghiên cứu này. Xin gửi lời cám ơn chân thành đến

những cá nhân và tập thể đã tham gia vào quá trình khảo sát nhằm đưa ra những số liệu

giúp chúng tôi hoàn thành bài nghiên cứu.

Page 12: sinh viên và nhu cầu du lịch