Upload
alyson
View
134
Download
1
Embed Size (px)
DESCRIPTION
CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN. 1. HỒI QUY ĐƠN BIẾN Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp:. 1. 9/15/2014. 1. HỒI QUY ĐƠN BIẾN. 2. 9/15/2014. 1. HỒI QUY ĐƠN BIẾN. - PowerPoint PPT Presentation
Citation preview
04/21/23
1
04/21/23
1
CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
1. HỒI QUY ĐƠN BIẾN
Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp:
Xi 8.0 8.5 9.0 9.5 10.0 10.5 11.0 12.0 13.0 14.0
Yi 45.0 38.0 40.0 39.0 32.0 29.0 28.0 27.0 25.0 23.0
04/21/23
2
04/21/23
2
1. HỒI QUY ĐƠN BIẾN
04/21/23
3
04/21/23
3
1. HỒI QUY ĐƠN BIẾN
Phương trình: Yi = β1 + β2Xi + ui
Trong đó :
X, Y: Được gọi là biến. X được gọi là biến giải thích (độc lập); Y: Biến được giải thích (phụ thuộc).
β1: Hệ số chặn, tham số chặn
β2: Hệ số góc, tham số biến
ui: Là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên
04/21/23
4
04/21/23
4
2. MÔ HÌNH HỒI QUY TUYẾN TÍNH MẪU
Phương trình hồi quy mẫu: nên ta có:
Yi = + ei ii XY
21
iY
MinXYYYe iiiii
221
22 )()(
222
21
)(XnX
YXnYX
XY
i
ii
04/21/23
5
04/21/23
5
Hãy ước lượng phương trình hồi quy mẫu?
Xi Yi XY X2
8 45 360 64
8.5 38 323 72.25
9 40 360 81
9.5 39 370.5 90.25
10 32 320 100
10.5 29 304.5 110.25
11 28 308 121
12 27 324 144
13 25 325 169
14 23 322 196
Σ105.5 Σ326 Σ3317 Σ1147.75
55,1010
5,105X 6,32
10
326YTa có n =10,
5220,3)55,10(1075,1147
6,3255,10103317
)( 2222
XnX
YXnYX
i
ii
XY
21 = 32,6 + 3,5220 x 10,55 = 69,7571
Phương trình hồi quy mẫu:
iY = 69,7571 – 3,5220Xi
04/21/23
6
04/21/23
6
3. HỆ SỐ XÁC ĐỊNH VÀ HỆ SỐ TƯƠNG QUAN
222 )()()(
iiii YYYYYY
TSS = ESS + RSS
Xi Yi XY X2
8 45 360 64 153.76 80.6602
8.5 38 323 72.25 29.16 52.1298
9 40 360 81 54.76 29.8018
9.5 39 370.5 90.25 40.96 13.6759
10 32 320 100 0.36 3.7524
10.5 29 304.5 110.25 12.96 0.0310
11 28 308 121 21.16 2.5119
12 27 324 144 31.36 26.0804
13 25 325 169 57.76 74.4579
14 23 322 196 92.16 147.6444
Σ105.5 Σ326 Σ3317 Σ1147.75 Σ 494.4 Σ 430.7457
8712,04,494
7457,4302 TSS
ESSR
Hệ số tương quan: r = ± 2R
9334,08712,0 r
2)( YYi 2)( YYi
04/21/23
7
04/21/23
7
4. PHƯƠNG SAI VÀ SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG
2
22
2
1))((
)var( XnXn
X
i
i
)var()( 11
se
22
2
2)(
)var(XnX i
)var()( 22
se
22
22
n
RSS
n
ei
04/21/23
8
04/21/23
8
5. KHOẢNG TIN CẬY CỦA β1, β2
Khoảng tin cậy của β1: ± tα/2se( )
Khoảng tin cậy của β2: ± tα/2se( )
Ví dụ: Tiếp tục ví dụ 1, Hãy xác định khoảng tin cậy của β1, β2.
1
1
2
2
04/21/23
9
04/21/23
9
6. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA HÀM HỒI QUY
Chúng ta kiểm định giả thuyết: H0: 2 = 0
FR
nRF
1118,54
8712,01
)210(8712,0
1
)2(2
2
04/21/23
10
04/21/23
10
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo điểm: Cho X0, tìm thông qua phương trình hồi quy
Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư là bao nhiêu?
04/21/23
11
04/21/23
11
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo giá trị trung bình:
Dự báo giá trị trung bình: ± t/2se( )
Ví dụ: Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư trung bình là khoảng bao nhiêu ?
22
202
0)(
)(1)var(
XnX
XX
nY
i
)var()( 00
YYse
0Y
0Y
04/21/23
12
04/21/23
12
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo giá trị riêng biệt: ± t/2se
Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% hãy dự báo giá trị riêng biệt của tổng vốn đầu tư.
)( 00
YY
0Y
22
202
00)(
)(11)var(
XnX
XX
nYY
i
)var()( 0000
YYYYse
04/21/23
13
04/21/23
13
CHƯƠNG 12. HỒI QUY ĐA BIẾN
1. TỔNG QUAN VỀ MÔ HÌNH HỒI QUY ĐA BIẾN
Mô hình: Yi = β1 + β2X1t + β3X2t +…+ βkXkt + ut
Trong đó :
Y là biến phụ thuộc
X là các biến độc lập
β1: Hệ số từ do
βj: Hệ số hồi quy riêng
04/21/23
14
04/21/23
14
Các giả định (điều kiện) phân tích mô hình hồi quy đa biến
1. Tuyến tính các tham số hồi quy
2. Các giá trị mẫu của xtj được ước lượng đúng, không có sai số
3. Kỳ vọng hoặc trung bình số học của các sai số là bằng 0
4. Các sai số u độc lập với biến giải thích
5. Các sai số u có phương sai bằng nhau
6. Các sai số u từng cặp độc lập với nhau
7. Vector sai số u theo phân phối chuẩn nhiều chiều
8. Không có biến độc lập nào là hằng số, và không tồn tại các mối liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập
04/21/23
15
04/21/23
15
2. PHÂN TÍCH HỒI QUY ĐA BIẾN BẰNG PHẦN MỀM SPSS
Để phân tích hồi quy ta cần một số bước như sau:
Bước 1: Xác định vấn đề cần nghiên cứu
Bước 2: Xác định được đâu là biến Y, đâu là các biến X.
Bước 3: Lập bảng câu hỏi hoặc phiếu khảo sát để thu thập số liệu.
Bước 4: Xử lý số liệu và nhập liệu
Bước 5: Phân tích tương quan hồi quy.
Bước 6: Báo cáo kết quả
04/21/23
16
04/21/23
16
Ví dụ
Yi = β1 + β2X1 + β3X2 + β4X3 + β5X4 + β6X5 + β7X6 + ei
Với:
Yi: Lợi nhuận bình quân (triệu đồng)
X1: Vốn kinh doanh hiện tại (triệu đồng)
X2: Tài sản cố định (triệu đồng)
X3: Tuổi chủ nhiêm HTX (tuổi)
X4: Chuyên môn của chủ nhiệm HTX
X5: Lương của chủ nhiệm HTX (triệu đồng)
X6: Quan tâm của chính quyền địa phương đối với hoạt động của HTX
04/21/23
17
04/21/23
17
Kết quả chạy phần mềm SPSS
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .898a .807 .662 102.83959
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
ANOVAb
Model Sum of Squares df Mean Square F Sig.
Regression 352891.599 6 58815.267 5.561 .015a
Residual 84607.847 8 10575.981
1
Total 437499.446 14
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
04/21/23
18
04/21/23
18
Kết quả chạy phần mềm SPSS
Coefficientsa
Unstandardized Coefficients
Standardized
Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
(Constant) 172.028 262.471 .655 .531 -433.231 777.287
X1 -.224 .094 -.906 -2.389 .044 -.439 -.008
X2 .335 .113 1.120 2.956 .018 .074 .597
X3 -10.728 5.579 -.398 -1.923 .091 -23.594 2.138
X4 49.052 42.833 .290 1.145 .285 -49.721 147.824
X5 185.751 60.536 .615 3.068 .015 46.154 325.348
1
X6 25.364 27.582 .173 .920 .385 -38.241 88.968
a. Dependent Variable: Y
04/21/23
19
04/21/23
19
Kết quả dự báo bằng phần mềm SPSS
04/21/23
20
04/21/23
20
ĐA CỘNG TUYẾN
1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Đa cộng tuyến là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy.
04/21/23
21
04/21/23
21
2. HẬU QUẢ CỦA ĐA CỘNG TUYẾN
Không xác định được hệ số quan hệ Độ lệch chuẩn của hệ số hồi quy ước lượng sẽ rất lớn. Điều này có nghĩa là ước lượng của chúng ta kém chính xác và khoảng tin cậy sẽ rộng hơn
Khi độ lệch chuẩn của hệ số hồi quy ước lượng lớn, giá trị t-test thường nhỏ nhưng mô hình lại thường có R2 cao nên ta dễ đưa ra các quyết định sai lầm về độ tốt của mô hình hồi quy
Ước lượng hệ số hồi quy sẽ dễ bị thay đổi khi ta bỏ một vài quan sát hay bỏ một biến độc lập được cho là không có giá trị.
04/21/23
22
04/21/23
22
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
Cách 1: Một cách đơn giản để xác định đa cộng tuyến là ta tính hệ số tương quan giữa các cặp biến độc lập. Nếu ta thấy hệ số tương quan trên 0,8, ta có thể coi đó là quan hệ gần như hoàn hảo. Nếu ta thấy hệ số tương quan trên 0,5, ta có thể coi đó là quan hệ chặt chẽ
04/21/23
23
04/21/23
23
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
Cách 2: Sử dụng yếu tố phóng đại phương sai (VIF): Nếu VIF > 10 thì xảy ra hiện tượng đa cộng tuyến.
Coefficientsa
Model
Unstandardized Coefficients Standardized Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 3.348 .466 7.186 .000
I -.073 .037 -.086 -1.989 .070 .252 3.962
W .208 .008 1.071 24.796 .000 .252 3.962
a. Dependent Variable: C
04/21/23
24
04/21/23
24
4. CÁCH KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
Thu thập thêm dữ liệu hoặc thu thập dữ liệu chính xác hơn
Tái cấu trúc mô hình bằng cách đưa thêm thông tin bổ trợ vào
Xác định cặp biến độc lập nào có quan hệ gần hoàn hảo, ta có thể bỏ bớt một biến độc lập. Tính R2 đối với các hàm hồi quy: có mặt cả hai biến; không có mặt một trong hai biến. Ta loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn
04/21/23
25
04/21/23
25
PHƯƠNG SAI SAI SỐ THAY ĐỔI VÀ HẬU QUẢ
1. TỔNG QUAN VỀ PHƯƠNG SAI SAI SỐ THAY ĐỔI
04/21/23
26
04/21/23
26
2. HẬU QUẢ CỦA PHƯƠNG SAI SAI SỐ THAY ĐỔI
Ước lượng OLS vẫn tuyến tính, chúng vẫn là ước lượng không chệch. Tuy nhiên, chúng sẽ không còn có phương sai nhỏ nhất nữa
Công thức thông thường để ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ chệch
Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa
04/21/23
27
04/21/23
27
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. CÁCH PHÁT HIỆN PHƯƠNG SAI SAI SỐ THAY ĐỔI
1.1. Xem xét đồ thị của phần sai số
04/21/23
28
04/21/23
28
1.2. Kiểm định Park
Park cho rằng i2 là một hàm số nào đó của biến giải thích
X. Trong trường hợp mô hình hai biến, Park đã đưa ra dạng hàm số giữa i
2 và X như sau:
lni2 = 1 + 2lnXi + vi (1)
Park đã đề nghị chúng ta có thể sử dụng ei thay cho i và chạy mô hình hồi quy sau:
lnei2 = 1 + 2lnXi + vi (2)
ei2 có thể được thu thập từ mô hình hồi quy gốc. Theo đó,
kiểm định Park được tiến hành theo các bước sau đây:
04/21/23
29
1.2. Kiểm định Park
Bước 1: Chạy hàm hồi quy gốc bất chấp vấn đề phương sai của sai số thay đổi.
Bước 2: Từ hàm hồi quy này, tính phần dư ei, sau đó, bình phương và lấy log chúng:
lnei2.
Bước 3: Ước lượng hồi quy (2) sử dụng biến giải thích của hàm hồi quy ban đầu. Nếu có
nhiều biến giải thích, chúng ta sẽ chạy hồi quy cho từng biến giải thích đó. Hay cách
khác, chúng ta có thể chạy hồi quy mô hình với biến giải thích là
iY , ước lượng của Y.
Bước 4: Kiểm định giả thuyết H0: 2 = 0, nghĩa là, không có phương sai của sai số thay
đổi. Nếu mối quan hệ giữa lne2 và lnX có ý nghĩa thống kê, giả thuyết H0 bị bác bỏ. Lúc
này, chúng ta có thể sử dụng các phương pháp khắc phục sẽ được trình bày trong phần
sau.
Bước 5: Nếu giả thuyết H0 được chấp nhận, 2 trong mô hình (2) có thể được xem là giá
trị chung của phương sai của sai số không đổi, σ2.
04/21/23
30
1.3. Kiểm định Glejser
Glejser đề nghị chạy hồi quy giá trị tuyệt đối của ei, leil, theo biến X nào mà có quan
hệ chặt chẽ với . Ông ta đề xuất một số dạng hàm hồi quy sau:
(3)
(4)
(5)
(6)
(7)
(8)
Giả thuyết H0 trong mỗi hàm số trên là phương sai của sai số không đổi, nghĩa là,
H0: 2 = 0.
iii
iii
i
i
i
ii
i
iii
iii
vXe
vXe
vX
e
vX
e
vXe
vXe
221
21
21
21
21
21
1
1
04/21/23
31
1.4. Kiểm định tương quan hạng của Spearman
Hệ số tương quan hạng của Spearman, rS, được xác định như sau:
)1(61
2
2
nn
dr i
s (9)
Trong đó di là hiệu của các hạng được gán cho 2 đặc trưng khác nhau của cùng
một phần tử thứ i và n là số các phần tử được xếp hạng.
Hệ số tương quan hạng có thể được dùng để phát hiện ra phương sai sai số thay
đổi. Xét mô hình hồi quy sau:
Yi = β1 + β2Xi + ui (10)
Các bước thực hiện kiểm định tương quan hạng như sau:
04/21/23
32
1.4. Kiểm định tương quan hạng của Spearman
Bước 1: Ước lượng mô hình hồi quy trên dựa trên bộ mẫu cho trước, thu thập
phần dư ei.
Bước 2: Xếp hạng leil và Xi theo thứ tự tăng dần hay giảm dần, tính d = hạng
leil - hạng Xi, sau đó tính hệ số tương quan hạng Spearman.
Bước 3: Giả sử hệ số tương quan hạng của tổng thể là ρ bằng 0 và n > 8 thì ý
nghĩa của hệ số tương quan hạng mẫu rS có thể được kiểm định bằng tiêu chuẩn
t sau:
21
2
s
s
r
nrt
(11)
04/21/23
33
Kết quả phát hiện PSSSTĐ bằng SPSS
H0: Hệ số tương quan hạng của tổng thể bằng 0Nhìn vào giá trị sig. của kiểm định là 0,489 > mức ý nghĩa = 5% Chấp nhận giả thuyết H0, tức là mô hình không xảy ra hiện tượng phương sai sai số thay đổi.
Correlations
Lai suat ABSres
Correlation Coefficient 1.000 -.248
Sig. (2-tailed) . .489
Lai suat
N 10 10
Correlation Coefficient -.248 1.000
Sig. (2-tailed) .489 .
Spearman's rho
ABSres
N 10 10
04/21/23
34
1.5. Kiểm định Goldfeld – Quandt
Xét mô hình hồi quy 2 biến: Yi = β1 + β2Xi + ui
Giả sử i2 có quan hệ dương với biến X theo cách sau: i
2 = 2Xi2 (12)
Trong đó i2 là hằng số. Giả thuyết này có nghĩa là i
2 tỷ lệ với bình phương của biến X.
Nếu giả thuyết (12) là thích hợp thì điều này có nghĩa là khi X tăng thì i2 cũng tăng. Các bước
thực hiện kiểm định Goldfeld - Quandt như sau:
Bước 1: Sắp xếp các quan sát theo thứ tự tăng dần về giá trị của biến X.
Bước 2: Bỏ qua quan sát ở giữa theo cách sau:
Đối với mô hình 2 biến:
c = 4 nếu cỡ mẫu khoảng n = 30;
c = 10 nếu cỡ mẫu khoảng n = 60.
và chia số quan sát còn lại thành 2 nhóm, trong đó mỗi nhóm có 2
cn quan sát.
04/21/23
35
1.5. Kiểm định Goldfeld – Quandt
Bước 3: Sử dụng phương pháp bình phương bé nhất để ước lượng tham số của các
hàm hồi quy đối với 2
cn quan sát đầu và cuối; thu thập tổng bình phương của các
phần dư RSS1 và RSS2 tương ứng. Trong đó RSS1 đại diện cho RSS từ hồi quy ứng
với các giá trị của Xi nhỏ hơn và RSS2 ứng với các giá trị Xi lớn hơn. Bậc tự do
tương ứng là 2
cn - k hoặc
2
2kcn . Trong đó, k là các tham số được ước lượng
kể cả hệ số chặn.
04/21/23
36
1.5. Kiểm định Goldfeld – Quandt
Bước 4: Tính tỷ số dfRSS
dfRSS
/
/
1
2
Nếu ui theo phân phối chuẩn và nếu giả định về phương sai có điều kiện không đổi
được thỏa mãn thì λ tuân theo phân phối F với bậc tự do ở tử số và mẫu số là
2
2kcn .
Khi thực hành, nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa mong
muốn, thì chúng ta có thể bác bỏ giả thuyết H0: phương sai có điều kiện không
đổi, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi.
04/21/23
37
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
2.1. Trường hợp đã biết i2
Chúng ta hãy xem xét trường hợp mô hình hồi quy tổng thể 2 biến:
Yi = β1 + β2Xi + ui (13) Chúng ta giả sử rằng phương sai sai số i2 đã biết; nghĩa là
phương sai sai số của mỗi quan sát đã biết. Bây giờ, chúng ta xem xét “sự chuyển
đổi” của mô hình (13) như sau:
ii
2i
1
i
i Y
ii uX
(14) Đặt vi = iiu
Chúng ta có thể gọi vi là phần sai số “được chuyển đổi”. Chúng ta sẽ chứng minh
vi đồng đều. Chúng ta có: vi2 =
2
2
i
iu
. Do đó:
04/21/23
38
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
2.2. Trường hợp chưa biết i2
Trường hợp 1: Phương sai sai số tỷ lệ với bình phương biến giải thích:
E(ui2) = 2 Xi
2
Trong đó, hằng số i2 là nhân tố tỷ lệ.
Chia 2 vế mô hỉnh (13) cho Xi:
ii v
XX
u
XX 2i
1i
2i
1
i
i 1
Y
(15). Tương tự như trường hợp đã
biết i2 trên, chúng ta có thể dễ dàng chứng minh phần dư vi này là đồng
đều và chúng ta có thể áp dụng phương pháp WLS để ước lượng
(15) như phần trước.
04/21/23
39
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
Trường hợp 2: Phương sai sai số tỷ lệ với biến giải thích: E(ui2) = 2 Xi.
Chia 2 vế mô hỉnh (13) cho iX :
ii vX
XX
uX
XXi2
i
1
i
i2
i
1
i
i 1
Y
(16)
Trong đó vi = iX
ui và có thể thấy ngay rằng E(vi2) = 2
04/21/23
40
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
Trường hợp 3: Phương sai của sai số tỷ lệ với bình phương của giá trị kỳ vọng
của Y. Điều này nghĩa là: E(ui2) = 2[E(Yi)]
2 . Trong trường hợp này, chúng ta
thực hiện việc biến đổi như sau:
iiiii
ii
iii
vXYEYEYE
uX
YEYEYE )(
1
)(
1
)()()(
)(
Y21
21i
(17)
Trong đó vi =)( i
i
YE
u, var(vi) = 2
04/21/23
41
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
Bước 1: Ước lượng mô hình hồi quy Yi = β1 + β2Xi + ui bằng phương pháp OLS
thông thường, từ đó ta thu được
iY . Sau đó, sử dụng
iY để biến đổi mô hình gốc
về dạng như sau: i
i
i
ii
vY
X
YY21
i 1
Y (18) Trong đó, vi =
i
i
Y
u
Bước 2: Ước lượng hồi quy (18), dù
iY không chính xác là E(Yi), nhưng chúng là
ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi). Do
vậy, phép biến đổi (18) có thể dùng được khi cỡ mẫu tương đối lớn.
04/21/23
42
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI
Trường hợp 4: Phép biến đổi loga
Đôi khi thay vì dự đoán về i2, chúng ta có thể định lại dạng của mô hình để làm
giảm ảnh hưởng của phương sai sai số không đồng nhất. Chẳng hạn, thay vì ước
lượng mô hình hồi quy gốc (13), ta có thể ước lượng mô hình hồi quy:
lnYi = β1 + β2lnXi + ui (19)
04/21/23
43
HIỆN TƯỢNG TỰ TƯƠNG QUAN
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
Thuật ngữ tự tương quan có thể được định nghĩa như là “quan hệ tương quan giữa các thành viên của chuỗi của các quan sát được sắp xếp theo thời gian [như trong dữ liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu chéo].”
04/21/23
44
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
Hình 1: Các dạng phân phối của sai số ui hoặc (ei)
04/21/23
45
*Nguyên nhân của sự tự tương quan
Tính ì
Hiện tượng mạng nhện
Các độ trễ
Xử lí số liệu
Một cách xử lý khác là phép nội suy và ngoại suy số liệu
Sai lệch do lập mô hình
04/21/23
46
2. HẬU QUẢ CỦA TỰ TƯƠNG QUAN
Ước lượng hệ số hồi quy vẫn là ước lượng không thiên lệch, nhưng không còn là ước lượng hiệu quả nhất
Công thức ta dùng để tính phương sai ở các chương trước không thể áp dụng trong trừơng hợp này. Do đó, kiểm định giả thuyết, tính khoảng tin cậy, khoảng dự báo sẽ sai.
04/21/23
47
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC TỰ TƯƠNG QUAN
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
Phương pháp kiểm định có ý nghĩa nhất để phát hiện ra tự tương quan là kiểm
định d Durbin – Watson.
Thống kê d. Durbin – Watson được định nghĩa như sau:
là tỷ số giữa tổng bình phương sai lệch của các phần dư kế tiếp nhau với RSS.
04/21/23
48
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
Người ta đã chứng minh khi n đủ lớn thì: Giá trị d ≈ 2(1-
) với
04/21/23
49
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
04/21/23
50
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 .927a .859 .855 11.17237 .234
Tra bảng Durbin-Watson, ở mức ý nghĩa α = 5%, dL= 1,393 và dU = 1,514. Theo kết
quả chạy mô hình 0 < d = 0,234 < dL nên mô hình xảy ra hiện tượng tự tương quan
dương.
04/21/23
51
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
2.1. Trường hợp đã biết cấu trúc của tự tương quan
Giả sử yếu tố nhiễu ui có tự tương quan bậc 1, nghĩa là:
ut = ρut-1 + et (1)
Trong đó < 1 và et thoả mãn các giả định của phương pháp OLS. Giả sử (1) là
đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tương
quan ρ đã biết. Để làm sáng tỏ vấn đề này, ta xét mô hình hai biến:
Yt = β1 + β2Xt + ut (2)
Nếu (2) đúng với t thì cũng đúng với t – 1 nên: Yt-1 = β1 + β2Xt-1 + ut-1 (3)
Nhân 2 vế phương trình (3) cho ρ, ta được: ρYt-1 = ρβ1 + ρβ2Xt-1 + ρut-1 (4)
04/21/23
52
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
Lấy phương trình (2) – (4), ta được:
Yt - ρYt-1 = β1(1- ρ) + β2(Xt - ρXt-1) + (ut - ρut-1). Đây là phương trình sai phân cấp
1 tổng quát.
Đặt Yt* = Yt - ρYt-1 , β1
* = β1(1- ρ) , Xt
* = Xt - ρXt-1, β2* = β2, et = ut - ρut-1
Ta có phương trình: Yt* = β1
* + β2
*Xt* + et
Vì et thoả mãn các giả thuyết của phương pháp bình phương nhỏ nhất thông
thường đối với các biến Y* và X*, và các ước lượng tìm được có tất cả các tính
chất tối ưu, nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Để tránh mất một quan sát, quan sát thứ nhất của X và Y có thể được biến đổi như
sau:
04/21/23
53
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
2.2. Trường hợp chưa biết cấu trúc của tự tương quan
Trường hợp ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã biết công thức:
d ≈ 2(1 -
) Hoặc
≈ 1 -2
d
Đối với các mẫu nhỏ có thể sử dụng thống kê d cải biên của Theil – Nagar. Theil
và Nagar đã đề xuất rằng trong các mẫu nhỏ:
trong đó n là tổng số các quan sát; d là Durbin – Watson d và k là số các hệ số
(bao gồm cả tung độ gốc) cần phải ước lượng.
04/21/23
54
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
Phương pháp Durbin-Watson hai bước để ước lượng ρ
Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng quát dưới dạng
sau: Yt = β1(1- ρ) + β2Xt - ρ β2Xt-1 + ρYt-1 + et (5)
Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ:
Bước 1: Coi (5) như một mô hình hồi quy đa biến, hồi quy Yt theo Xt, Xt-1, Yt-1 và
giá trị ước lượng được của các hệ số hồi quy của Yt-1 là giá trị ước lượng của ρ. Mặc
dầu là ước lượng chệch nhưng ta có ước lượng vững của ρ.
Bước 2: Sau khi ước lượng được
, hãy đổi biến Yt* = Yt -
Yt-1 , Xt* = Xt -
Xt-1
Và ước lượng hồi quy Yt* = β1
* + β2
*Xt* + et bằng phương pháp bình phương nhỏ
nhất thông thường.
04/21/23
55
BIẾN GIẢ VÀ CÁCH XÁC ĐỊNH MÔ HÌNH HỒI QUY CÓ SỰ XUẤT HIỆN CỦA BIẾN GIẢ
1. TỔNG QUAN VỀ BIẾN GIẢ
Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính. Ví dụ khi nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của chính phủ là các biến không định lượng được.
04/21/23
56
2. KỸ THUẬT BIẾN GIẢ
2.1. Hồi quy với biến giải thích là biến định tính
2.1.1. Biến định tính có hai phạm trù
VD: Thu nhập có phụ thuộc giới tính ?
Yi : thu nhập
Di = 0
1
Nếu quan sát là Nam
Nếu quan sát là Nữ
Mô hình : Yi = 1 + 2Di + ui
Thu nhập trung bình của nam E(Y/Di = 1) = 1 + 2
Thu nhập trung bình của nữ E(Y/Di = 0) = 1
Nếu 2 0 thì thu nhập trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả.
04/21/23
57
2. KỸ THUẬT BIẾN GIẢ
Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm.
STT Lương
(Y: nghìn $) Giới D
1 22 Nam 1
2 19 Nữ 0
3 18 Nữ 0
4 21,7 Nam 1
5 18,5 Nữ 0
6 21 Nam 1
7 20,5 Nam 1
8 17 Nữ 0
9 17,5 Nữ 0
10 21,2 Nam 1
Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei
04/21/23
58
Quy tắc đặt biến giả
Biến giả chỉ nhận giá trị 0 và 1
Cá thể nào cũng phải có giá trị
Biến giả chia tổng thể thành những thành phần riêng biệt
04/21/23
59
2.1. Hồi quy với biến giải thích là biến định tính
1.1.2. Biến định tính có k phạm trù
Lúc đó dùng k-1 biến giả để thay thế cho chúng.
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Yi: Chi phí cho văn hoá phẩm.
D2i = 1: Trình độ tiểu học
0: Trình độ khác
D3i = 1: Trình độ trung học
0: Trình độ khác
D4i = 1: Trình độ đại học
0: Trình độ khác
Mô hình có dạng:
Yi = 1 + 2D2i + 3D3i + 4D4i + ui
04/21/23
60
2.1. Hồi quy với biến giải thích là biến định tính
2.1.3. Mô hình có hai biến định tính
Ví dụ: Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, giữa nam và
nữ?
D2 = 0
1
Nếu là nam
Nếu là nữ
D3 =
0
1
Nếu làm việc ở thành thị
Nếu làm việc ở nông thôn
E(Y/D2i, D3i) = 1 + 2D2i + 3D3i + ui
Các chú ý:
Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1,
n2, . . . nk thì phải dùng k – 1 biến giả.
Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùng để so sánh với các
phạm trù khác.
Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.
Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như
thông lệ.
04/21/23
61
2.1. Hồi quy với biến giải thích là biến định tính
2.1.4. Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng.
Để tính đến điều đó ta thêm vào mô hình biến tương tác.
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình 1:
Yi = 1 + 2D2i + 3D3i + 5Xi + ui
Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác.
Mô hình 2:
Yi = 1 + 2D2i + 3D3i + 4D2i*D3i + 5Xi + ui
Kiểm định H0: 4 = 0 (không có tương tác)
H1: 4 0 (có tương tác)
Lúc đó mức độ tương tác bằng 4.
04/21/23
62
2.2. Dùng biến giả để phân tích biến động mùa vụ
Xét mô hình: Yi = 1 + 2Xi + ui
Nếu có sự biến động mùa vụ, chẳng hạn theo quý thì dùng 3 biến giả để đặc
trưng cho chúng:
D2 = 1: Quý II
0: Quý khác
D3 = 1: Quý III
0: Quý khác
D4 = 1: Quý II
0: Quý khác
Ta có mô hình: Yi = 1 + 2D2i + 3D3i + 4D4i + 5Xi + ui
Như vậy phạm trù cơ sở là quý I, nếu có ảnh hưởng theo mùa của từng quý khác
nhau thì các hệ số 2, 3, 4 khác nhau có ý nghĩa thống kê.