Upload
anh-thu
View
13
Download
1
Embed Size (px)
Citation preview
III. Thiết lập mô hình hồi quy
3.1 Xây dựng mô hình tổng quát
Y = C1 + C2*X2 + C3*X3 + C4*X4 + C5*X5 + C6*D6 + C7*D7 + C8*D8 + C9*D9 + C10*D10+ C11*D11 + C12*D12 + C13*D13 + C14*D14 + C15*D15+ C16*D16 + C17*D17 + C18*D18 + C19*D19
3.2 Giải thích các biến trong mô hình:
3.2.1 Biến phụ thuộc
Y : Số lần đi du lịch của sinh viên ngoại thương (lần/năm)
3.2.2 Biến độc lập
Biến định lượng:
TÊN Ý NGHĨA ĐƠN VỊ
TÍNH
DẤU KỲ
VỌNG
DIỄN GIẢI
X2 Thu nhập do gia đình chu cấp Ngàn đồng/tháng + Gia đình chu cấp càng nhiều thì nhu cầu đi du lịch càng cao
X3 Thu nhập do sinh viên làm thêm Ngàn đồng/tháng + Sinh viên kiếm được càng nhiều tiền càng có nhiều nhu cầu du lịch
X4 Độ tuổi của sinh viên Tuổi - Sinh viên càng nhỏ tuổi thì càng có nhiều thời gian rãnh hơn để đi du lịch
X5 Số ngày rãnh trong tuần Ngày/tuần + Sinh viên càng rãnh nhiều càng có nhu cầu đi du lịch cao
Biến định tính
TÊN Ý NGHĨA LỰA CHỌN DẤU KỲ
VỌNG
DIỄN GIẢI
1 0
D6 GIỚI TÍNH NAM NNỮ +/- Giới tính có hoặc không có ảnh hưởng đến số lần du lịch
D7 Sinh viên Năm 1 Khác +/- Sinh viên năm thứ mấy có thể làm tăng hoặc giảm số lần du lịchD8 Năm 2 Khác +/-
D9 Năm 3 Khác +/-
D10 Có chấp nhận vay mượn để đi du lịch hay không và nếu vay thì dễ dàng hay khó khăn
Có vay dễ dàng
Khác +/- Khả năng vay mượn dễ dàng, khó khăn hay không muốn vay mượn chắc chắn sẽ ảnh hưởng đến số lần du lịch.
Nếu D10 = D11 = 0 thì sinh viên này không chấp nhận vay mượn để đi du lịch
D11 Có vay khó khăn
Khác +/-
D12 Có hi sinh thời gian học, làm để đi du lịch không
Có Không +/- Sinh viên chấp nhận hi sinh thời gian học, làm việc thì khả năng đi du lịch nhiều hơn
D13 Có say tàu xe hay không Có Không +/- Sinh viên say tàu xe có thể hoặc không ảnh hưởng đến quyết định đi du lịch
D14 Sức khỏe xấu có ảnh hưởng đến quyết định đi du lịch hay không
Có Không +/- Khi sinh viên có sức khỏe không tốt mà vẫn quyết định đi du lịch thì số lần đi du lịch trong năm của họ sẽ tăng lên
D15 Tính cách sinh viên Hướng ngoạiHướng nội +/- Sinh viên hướng ngoại
có thể có nhiều mối quan hệ bạn bè hơn nên có thể sẽ đi du lịch nhiều hơn.
D16 Sở thích đi du lịch Xa Gần +/- Sinh viên mà thích đi du lịch gần thì số lần thực hiện chuyến du lịch có thể sẽ cao hơn
D17 Có ngại đi du lịch khi thời tiết xấu không
Có Không +/- Nếu sinh viên ngại đi du lịch khi thời tiết xấu thì số lần đi du lịch của sinh viên đó sẽ giảm.
3.3 Tiến hành xây dựng mô hình:
3.3.1 Mô hình hồi quy mẫu:
Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 14:29Sample: 1 109Included observations: 109
Variable Coefficient Std. Error t-Statistic Prob.
C -13.33282 5.867269 -2.272406 0.0254X2 0.000823 0.000181 4.557992 0.0000X3 -9.96E-05 0.000217 -0.458364 0.6478X4 0.645173 0.261821 2.464179 0.0156X5 0.088530 0.177893 0.497657 0.6199D6 0.256586 0.355654 0.721448 0.4725D7 4.733829 1.120609 4.224335 0.0001D8 1.526034 0.874633 1.744770 0.0844D9 -0.013904 0.565514 -0.024587 0.9804
D10 0.429462 0.399242 1.075694 0.2849D11 -0.479545 0.571631 -0.838906 0.4037D12 0.421561 0.383576 1.099029 0.2746D13 0.396565 0.420923 0.942132 0.3486D14 0.014917 0.349183 0.042721 0.9660D15 0.217091 0.385487 0.563159 0.5747D16 -0.476790 0.590328 -0.807671 0.4214D17 -0.106171 0.357444 -0.297028 0.7671
R-squared 0.503962 Mean dependent var 3.091743Adjusted R-squared 0.417694 S.D. dependent var 2.183869S.E. of regression 1.666488 Akaike info criterion 4.001681Sum squared resid 255.5008 Schwarz criterion 4.421433Log likelihood -201.0916 Hannan-Quinn criter. 4.171906F-statistic 5.841843 Durbin-Watson stat 1.654635Prob(F-statistic) 0.000000
Mô hình có mức độ phù hợp R2 = 0.503962
Dựa vào kết quả hồi quy nhóm phát hiện ra mô hình có 3 biến độc lập có ý nghĩa: X2, X4 và D7 do P-value < α =0.05 tuy nhiên lại có rất nhiều biến độc lập không có ý nghĩa: p-value> α =0.05. Để đánh giá một cách chính xác bản chất của hiện tượng này nhóm sẽ thực hiện xét ma trận tương quan giữa các biến độc lập như sau:
X2 X3 X4 X5 D6 D7 D8 D9 D10 D11 D12 D13 D14 D15 D16 D17X2 1 -0.17 0.006 0.063 -0 -0.03 0.049 0.008 0.018 -0.11 0.205 -0.09 0.153 0.184 0.014 -0.18X3 -0.17 1 0.15 -0.21 0.116 -0.19 0.199 -0.05 0.018 0.049 0.08 0.274 0.034 0.147 -0.08 -0.03X4 0.006 0.15 1 -0.14 -0.19 -0.73 -0.2 0.267 -0 -0.2 -0.1 0.074 0.184 0.093 0.221 0.16X5 0.063 -0.21 -0.14 1 0.1 0.25 -0.07 -0.32 -0 0.156 0.29 -0.17 0.135 -0.18 -0.06 -0.05D6 -0 0.116 -0.19 0.1 1 0.163 0.067 -0.11 0.162 -0.1 0.126 -0.14 -0.04 -0.1 -0.1 -0.03D7 -0.03 -0.19 -0.73 0.25 0.163 1 -0.34 -0.32 -0.13 0.126 0.023 -0.36 -0.08 -0.08 0.028 -0.18D8 0.049 0.199 -0.2 -0.07 0.067 -0.34 1 -0.36 0.301 0.245 0.134 0.51 -0.14 -0.04 -0.47 -0.02D9 0.008 -0.05 0.267 -0.32 -0.11 -0.32 -0.36 1 -0.17 -0.19 -0.12 -0.11 0.026 0.099 0.235 0.016D10 0.018 0.018 -0 -0 0.162 -0.13 0.301 -0.17 1 -0.35 0.236 0.154 -0.04 -0.05 -0.06 -0.07D11 -0.11 0.049 -0.2 0.156 -0.1 0.126 0.245 -0.19 -0.35 1 -0.19 0.138 0.064 -0.09 -0.27 -0.01D12 0.205 0.08 -0.1 0.29 0.126 0.023 0.134 -0.12 0.236 -0.19 1 -0.05 0.085 0.166 -0.01 -0.2D13 -0.09 0.274 0.074 -0.17 -0.14 -0.36 0.51 -0.11 0.154 0.138 -0.05 1 0.065 -0.17 -0.3 0.119D14 0.153 0.034 0.184 0.135 -0.04 -0.08 -0.14 0.026 -0.04 0.064 0.085 0.065 1 -0.02 -0.02 -0.05D15 0.184 0.147 0.093 -0.18 -0.1 -0.08 -0.04 0.099 -0.05 -0.09 0.166 -0.17 -0.02 1 0.304 -0.14D16 0.014 -0.08 0.221 -0.06 -0.1 0.028 -0.47 0.235 -0.06 -0.27 -0.01 -0.3 -0.02 0.304 1 -0.2D17 -0.18 -0.03 0.16 -0.05 -0.03 -0.18 -0.02 0.016 -0.07 -0.01 -0.2 0.119 -0.05 -0.14 -0.2 1
Dựa vào ma trận trên nhóm nhận xét hệ số tương quan giữa các biến đều nhỏ hơn 0.8 nên nhóm khẳng định không có hiện tượng đa cộng tuyến trong mô hình
3.3.2 Kiểm định lại mô hình với các biến có ý nghĩa:
Y = -13.33289 – 0.0008*X2 + 0.6451*X4 + 4.7338*D7
Kết quả hồi quy:
Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 15:00Sample: 1 109Included observations: 109
Variable Coefficient Std. Error t-Statistic Prob.
C -0.541929 3.468795 -0.156230 0.8762X2 0.000928 0.000172 5.402731 0.0000X4 0.071565 0.164304 0.435561 0.6640D7 2.578564 0.583897 4.416132 0.0000
R-squared 0.375497 Mean dependent var 3.091743Adjusted R-squared 0.357654 S.D. dependent var 2.183869
S.E. of regression 1.750294 Akaike info criterion 3.993451Sum squared resid 321.6705 Schwarz criterion 4.092216Log likelihood -213.6431 Hannan-Quinn criter. 4.033504F-statistic 21.04459 Durbin-Watson stat 1.293429Prob(F-statistic) 0.000000
Sau khi hồi quy lại với các biến có ý nghĩa, nhóm thấy xuất hiện thêm 1 biến không có ý nghĩa là
X4 (do P-value > 0.05). Lúc này mức độ phù hợp của mô hình chỉ còn R2 = 0.375497
Vì vậy, để xem xét biến này có phải là biến thừa trong mô hình hay không, ta tiến hành kiểm định
Wald:
Wald Test:Equation: HOIQUY1
Test Statistic Value df Probability
F-statistic 0.189713 (1, 105) 0.6640Chi-square 0.189713 1 0.6632
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(3) 0.071565 0.164304
Restrictions are linear in coefficients.
Theo kết quả kiểm định, ta thấy biến X4 là biến thừa do P_value = 0.6632> 0.05
3.3.3 Mô hình hồi quy mới là:
Y = C1 + C2*X2 + C3*D7
Dependent Variable: YMethod: Least SquaresDate: 02/20/11 Time: 15:51Sample: 1 109Included observations: 109
Variable Coefficient Std. Error t-Statistic Prob.
C 0.961118 0.351247 2.736299 0.0073X2 0.000926 0.000171 5.413418 0.0000D7 2.392878 0.397461 6.020414 0.0000
R-squared 0.374369 Mean dependent var 3.091743Adjusted R-squared 0.362565 S.D. dependent var 2.183869S.E. of regression 1.743591 Akaike info criterion 3.976908
Sum squared resid 322.2517 Schwarz criterion 4.050982Log likelihood -213.7415 Hannan-Quinn criter. 4.006948F-statistic 31.71446 Durbin-Watson stat 1.284498Prob(F-statistic) 0.000000
Y= 0.9611 + 0.0009*X2 + 2.3928*D7
Mức độ phù hợp của mô hình (R2 = 0.3743) thấp hơn mô hình hồi quy gốc. Tuy nhiên, nhóm
khẳng định các biến trong mô hình đều có ý nghĩa(P_value <0.05)
IV. Tiến hành kiểm định bệnh của mô hình:
4.1 Đa cộng tuyến:
X2 D7X2 1 -0.03D7 -0.03 1
Nhận xét:
Các hệ số tương quan giữa các biến đều nhỏ hơn 0.8, nên giữa các biến không có sự tương quan.
Vậy mô hình không bị đa cộng tuyến.
4.2 Tự tương quan
Thực hiện kiểm định BG Test trong Eviews
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 15.41334 Prob. F(1,105) 0.0002Obs*R-squared 13.95239 Prob. Chi-Square(1) 0.0002
Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 02/20/11 Time: 16:17Sample: 1 109Included observations: 109Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C 0.240515 0.335201 0.717523 0.4746X2 -0.000134 0.000164 -0.819231 0.4145D7 -0.072955 0.373378 -0.195392 0.8455
RESID(-1) 0.367894 0.093707 3.925983 0.0002
R-squared 0.128004 Mean dependent var -8.15E-18Adjusted R-squared 0.103089 S.D. dependent var 1.727371
S.E. of regression 1.635913 Akaike info criterion 3.858287Sum squared resid 281.0023 Schwarz criterion 3.957052Log likelihood -206.2766 Hannan-Quinn criter. 3.898339F-statistic 5.137780 Durbin-Watson stat 2.193278Prob(F-statistic) 0.002353
Nhận xét:
Chỉ số Prob. Chi-Square(1)=0.0002<0.05 nên có hiện tượng tự tương quan trong mô hình.
4.3 Phương sai thay đổi:
Heteroskedasticity Test: White
F-statistic 6.374665 Prob. F(2,106) 0.0024Obs*R-squared 11.70261 Prob. Chi-Square(2) 0.0029Scaled explained SS 21.35106 Prob. Chi-Square(2) 0.0000
Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 02/20/11 Time: 16:20Sample: 1 109Included observations: 109
Variable Coefficient Std. Error t-Statistic Prob.
C 0.792300 0.838972 0.944370 0.3471X2^2 5.29E-07 1.49E-07 3.551416 0.0006D7^2 0.496044 1.267599 0.391326 0.6963
R-squared 0.107363 Mean dependent var 2.956437Adjusted R-squared 0.090521 S.D. dependent var 5.834102S.E. of regression 5.563785 Akaike info criterion 6.297571Sum squared resid 3281.305 Schwarz criterion 6.371645Log likelihood -340.2176 Hannan-Quinn criter. 6.327611F-statistic 6.374665 Durbin-Watson stat 1.601668Prob(F-statistic) 0.002431
-2
-1
0
1
2
3
4
5
25 50 75 100
ABS_RESIDF ± 2 S.E.
Forecast: ABS_RESIDFActual: ABS_RESIDForecast sample: 1 109Included observations: 109
Root Mean Squared Error 0.881024Mean Absolute Error 0.672970Mean Abs. Percent Error 234.2073Theil Inequality Coefficient 0.316555 Bias Proportion 0.000000 Variance Proportion 0.437836 Covariance Proportion 0.562164
Nhận xét:
Bằng phương pháp kiểm định White cho ta kết quả chỉ số P-value=0.0029 <0.05 nên mô hình có
hiện tượng phương sai thay đổi
Cách khắc phục bệnh phương sai thay đổi:
Bước 1: Tạo biến abs_resid = abs(resid) – Trị tuyệt đối phần dư
Bước 2: Hồi quy hàm abs_resid với dạng
Abs_resid = C1 + C2*X2 + C3*X2^2 + C4*D7 + ei
Dependent Variable: ABS_RESIDMethod: Least SquaresDate: 02/21/11 Time: 09:00Sample: 1 109Included observations: 109
Variable Coefficient Std. Error t-Statistic Prob.
C 1.297817 0.262961 4.935400 0.0000X2 -0.000701 0.000319 -2.197122 0.0302
X2^2 2.63E-07 8.72E-08 3.015908 0.0032
D7 0.334951 0.205551 1.629532 0.1062
R-squared 0.152865 Mean dependent var 1.194895Adjusted R-squared 0.128661 S.D. dependent var 0.961641S.E. of regression 0.897649 Akaike info criterion 2.657931Sum squared resid 84.60621 Schwarz criterion 2.756696Log likelihood -140.8573 Hannan-Quinn criter. 2.697984F-statistic 6.315715 Durbin-Watson stat 2.105294Prob(F-statistic) 0.000558
Bước 3 : Hồi quy với trọng số 1/abs_residf
Dependent Variable: YMethod: Least SquaresDate: 02/21/11 Time: 09:05Sample: 1 109Included observations: 109Weighting series: 1/ABS_RESIDFWhite Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 1.043980 0.294781 3.541538 0.0006X2 0.000787 0.000182 4.328110 0.0000D7 2.554324 0.377091 6.773757 0.0000
Weighted Statistics
R-squared 0.337080 Mean dependent var 2.790827Adjusted R-squared 0.324572 S.D. dependent var 1.634588S.E. of regression 1.536600 Akaike info criterion 3.724158Sum squared resid 250.2807 Schwarz criterion 3.798232Log likelihood -199.9666 Hannan-Quinn criter. 3.754198F-statistic 26.94933 Durbin-Watson stat 1.296903Prob(F-statistic) 0.000000
Unweighted Statistics
R-squared 0.366380 Mean dependent var 3.091743Adjusted R-squared 0.354425 S.D. dependent var 2.183869S.E. of regression 1.754688 Sum squared resid 326.3665Durbin-Watson stat 1.201574
Nhận xét:
Mức độ phù hợp của mô hình giảm còn R2 = 0.3370
Bước 4: Kiểm định phương sai thay đổi của mô hình đã khắc phục
Heteroskedasticity Test: White
F-statistic 0.220562 Prob. F(3,105) 0.8819
Obs*R-squared 0.682592 Prob. Chi-Square(3) 0.8773Scaled explained SS 1.594429 Prob. Chi-Square(3) 0.6607
Test Equation:Dependent Variable: WGT_RESID^2Method: Least SquaresDate: 02/21/11 Time: 09:07Sample: 1 109Included observations: 109White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 2.392512 1.382966 1.729986 0.0866WGT^2 -0.327669 1.479883 -0.221415 0.8252
X2^2*WGT^2 1.26E-07 1.28E-07 0.989021 0.3249D7^2*WGT^2 -0.960647 1.256720 -0.764408 0.4463
R-squared 0.006262 Mean dependent var 2.296153Adjusted R-squared -0.022130 S.D. dependent var 5.126959S.E. of regression 5.183379 Akaike info criterion 6.164798Sum squared resid 2821.078 Schwarz criterion 6.263563Log likelihood -331.9815 Hannan-Quinn criter. 6.204851F-statistic 0.220562 Durbin-Watson stat 1.847135Prob(F-statistic) 0.881932
Nhận xét:
Mô hình không còn bị HET nữa do P-value>0.05
V. Kết quả hồi quy:
Y= 0.9611 + 0.0009*X2 + 2.3928*D7
BIẾN TÁC ĐỘNG ĐẾN SỐ LẦN ĐI DU LỊCH CỦA SINH VIÊN
DIỄN GIẢI
X2 Cùng chiều Sinh viên nào được gia đình chu cấp thêm càng nhiều thì số lần đi du lịch càng tăng
D7
VI. Kết luận chung:
6.1. Khó khăn:
Do chưa nắm rõ về việc xây dựng một bản khảo sát hoàn chỉnh nên nhóm đã gặp một
số khó khăn như thứ tự câu hỏi đảo lộn làm mất thời gian khi tổng hợp số liệu eviews.
Quá trình lựa chọn biến còn khá nhiều sai sót khiến kết quả R2 không cao lắm. Nhiều
biến độc lập được chọn ban đầu bị loại khỏi mô hình.
Kết quả khảo sát không mang tính thực tế cao vì có một bộ phận sinh viên được khảo
sát trả lời không nghiêm túc và chân thực.
Vì chưa có kinh nghiệm nên nhóm gặp một số khó khăn trong kỹ thuật sử dụng eviews
khi chọn biến mà cho ra R2 thấp hay khi kết quả cho ra là không có biến nào có ý
nghĩa.
6.2. Hạn chế:
Đề tài chọn lựa ít áp dụng được vào thực tế. Nội dung hỏi về biến phụ thuộc gây khó khăn
cho sinh viên khi trả lời. Một số biến độc lập còn mang tính chủ quan, có ý nghĩa thực tiễn
không cao. Số lượng mẫu khảo sát ít và mức độ chính xác còn hạn chế. Điều này cũng ảnh
hưởng lớn đến việc xây dựng mô hình hồi quy và quyết định việc các biến có ý nghĩa.
6.3. Kết luận:
Từ kết quả hồi quy cuối cùng, nhóm thực hiện có thể rút ra kết luận rằng các yếu tố ảnh
hưởng trực tiếp đến số lần đi du lịch trong năm của sinh viên là: số tiền mà gia đình chu
cấp cho sinh viên đó là cao hay thấp và sinh viên năm 1 ảnh hưởng đến số lần đi du lịch
nhiều nhất.
Thông qua bài nghiên cứu này, nhóm chúng tôi hi vọng rằng sẽ có cái nhìn rõ ràng hơn về
nhu cầu đi du lịch của sinh viên trường đại học Ngoại thương.
Bài nghiên cứu chắc chắn không thể tránh khỏi một số thiếu sót và hạn chế không mong
muốn, do đó nhóm chúng tôi rất mong nhận được sự nhận xét khách quan cũng như đóng
góp từ giảng viên và các bạn.
Xin chân thành cảm ơn sự giúp đỡ tận tình và những tài liệu quý giá mà giảng viên đã
cung cấp để chúng tôi hoàn thành bài nghiên cứu này. Xin gửi lời cám ơn chân thành đến
những cá nhân và tập thể đã tham gia vào quá trình khảo sát nhằm đưa ra những số liệu
giúp chúng tôi hoàn thành bài nghiên cứu.