Upload
price-bates
View
44
Download
0
Embed Size (px)
DESCRIPTION
Ekonometrika. Program Studi Statistika, semester Ganjil 2012/2013. Pengujian Asumsi-asumsi di dalam Regresi Linier. Galat menyebar normal Multikolinearity Heteroskedasticity Autocorrelation Misspecification: Peubah bebas yang kurang tepat Measurement errors - PowerPoint PPT Presentation
Citation preview
Dr. Rahma Fitriani, S.Si., M.Sc
Ekonometrika
Program Studi Statistika, semester Ganjil 2012/2013
Pengujian Asumsi-asumsi di dalam Regresi Linier Galat menyebar normal Multikolinearity Heteroskedasticity Autocorrelation Misspecification:
Peubah bebas yang kurang tepat Measurement errors Bentuk fungsional yang salah
Asumsi kenormalan Pelanggaran, dengan kemungkinan
penyebab:1. Sebaran peubah eksogen atau endogennya tidak
normal2. Pelanggaran asumsi linieritas3. Sebaran galat menjulur karena adanya pencilan4. Ukuran sampel yang terlalu kecil
Efek pelanggaran: Pencilan berpengaruh besar terhadap penduga
parameter (bias) Hasil pengujian tidak sah Selang kepercayaan terlalu lebar atau terlalu sempit
Asumsi Kenormalan Bagaimana mendeteksinya?
Normal probability plot Histogram dari sisaan Chi square goodness test of fit Anderson Darling normality test Jarque Berra normality test
Jika dilanggar, bagaimana memperbaikinya? Transformasi non linier pada penyebab 1 atau 2 Pada penyebab 3, pencilan harus dievaluasi penyebabnya
Murni kesalahan: pencilan dapat dibuang Apa adanya: pencilan memberikan informasi tambahan pada hasil analisis
Perbesar ukuran sampel untuk penyebab 4
Transformasi: sesuaikan dengan permasalahan teori ekonomi yang ingin dianalisis Ukuran sampel yang diperbesar dapat memperbaikinya
Multikolinieritas Terdapat hubungan linier di antara peubah eksogen Multikolinieritas sempurna:
Satu peubah eksogen adalah fungsi linier dari peubah eksogen yang lain
uXXY 33221
2213 XX
Multikolinieritas Efek dari multikolinieritas:
uXXY 33221 2213 XX
uXXY 2213221
uXY 2232131
uXvvY 221
Sampel dipakai untuk menduga koefisien v1 dan v2
Multikolinieritas Untuk memperoleh penduga β1 dan β2 : solusi dari persamaan
berikut:
2322
1311
ˆˆˆ
ˆˆˆ
v
v
2 persamaan untuk 3 peubah Tidak ada solusi unik bagi penduga parameter populasi
Efek dari struktur matriks akibat satu kolom yang merupakan fungsi linier dari kolom yang lain:
XX' Matriks singular
Karena determinan matriks singular = 0
0' XX
Tidak dapat diperoleh inverse dari X’X pada:
YXXX ''ˆ 12
XXXX
XX ''1' 1 adjKarena:
Koefisien regresi menjadi ‘indeterminate’
Multikolinieritas tak sempurna Terjadi jika terdapat hubungan linier yang tidak
sempurna antar peubah eksogen
vXX 23
Dengan v sebagai galat acak yang tidak sama dengan nol
Kasus ini sering terjadi pada kasus terapan Bagaimana mengidentifikasi seberapa
serius derajat multikolinieritas yang terjadi.
Efek dari Multikolinieritas tak sempurna Penduga OLS tetap dapat diduga Penduga OLS tetap bersifat BLUE Penduga OLS tetap efisien (ragam dari penduga paling
kecil dari semua penduga yang mungkin) Akan tetapi pada nilai yang cukup besar Relatif lebih besar jika tidak ada multikolinieritas
1'ˆvar XX
XXXX
XX ''1' 1 adj0' XX
Efek dari Multikolinieritas tak sempurna Ragam dan peragam dari penduga OLS relatif besar
Selang kepercayaan menjadi lebih besar Lebih banyak menerima hipotesis nol (koefisien tidak
nyata)
Statistik uji t dari satu atau beberapa koefisien menjadi tidak nyata Walaupun R2 secara keseluruhan besar
Tanda bagi penduga koefisien berkebalikan dengan teori a priorinya
Struktur Ragam Peragam dengan adanya Multikolinieritas Pada multiple regression:
12 XX'ˆ βvar
Dengan 2 peubah eksogen:
33231
32221
312112
ˆvarˆ,ˆcovˆ,ˆcov
ˆ,ˆcovˆvarˆ,ˆcov
ˆ,ˆcovˆ,ˆcovˆvarˆ
βvar
kkiki XXx 23223
22
232
2ˆvar
iiii
i
xxxx
x
2
322
2322
23ii
ii
xxxx
r 2
2322
2
1 rx i
23223
22
222
3ˆvar
iiii
i
xxxx
x
223
23
2
1 rx i
Struktur Korelasi dinamakan dengan Variance Inflation Factor (VIF)
23
22
223
223
321
ˆ,ˆcovii xxr
r
2231
1r
VIF
VIFx i 2
2
2
2ˆvar VIFx i
23
2
3ˆvar
Semakin besar multikolinieritas maka semakin besar VIF Semakin besar VIF semakin besar ragam penduga OLS
Untuk regresi lebih dari 2 peubah definisi dari VIF:
211
jRVIF
:2jR
Koefisien determinasi dari auxiliary regression
Auxiliary regression: regresi dengan Xj sebagai peubah endogen, dan X selainnya sebagai peubah eksogen
Nilai VIF berdasarkan Koefisien Determinasi dari Auxiliary Regression
0 10.5 20.8 50.9 100.95 200.975 400.99 1000.995 2000.999 1000
2jR VIF VIF yang naik seiring dengan
kenaikan koefisien determinasi VIF yang lebih dari 10: bukti
cukup untuk multikolinieritas
Pendeteksian Multikolinieritas Dari koefisien korelasi sederhana
Efektif untuk regresi dengan 2 peubah eksogen Dari VIF, multikolinieritas serius jika r ≥ 0.9
Dari koefisien determinasi auxiliary regression Efektif untuk regresi dengan 3 peubah eksogen
atau lebih Peubah eksogen pada auxiliary regression :
peubah yang mempunyai masalah multikolinieritas
Hasil dari auxiliary regression: Standar error yang kecil Statistik uji t yang nyata bagi masing-masing koefisien
Contoh: Model regresi dengan 2 peubah eksogen, Dua peubah eksogen tsb mempunyai korelasi tinggi:
Dari matrix korelasi berikut:
X2 X3 YX2 1
X3 0.999995 1
Y 0.857369 0.857438 1
Kedua X berkorelasi positif dengan Y Antar X berkorelasi positif
Output dari pendugaan Model Regresi dengan Kedua PeubahModel 1: OLS, using observations 1-25Dependent variable: Y
coefficient std. error t-ratio p-value ------------------------------------------------------- const 35.8677 19.3872 1.850 0.0778 * X2 -6.32650 33.7510 -0.1874 0.8530 X3 1.78976 8.43832 0.2121 0.8340
Mean dependent var 169.3680 S.D. dependent var 79.05857Sum squared resid 39658.40 S.E. of regression 42.45768R-squared 0.735622 Adjusted R-squared 0.711587F(2, 22) 30.60702 P-value(F) 4.41e-07Log-likelihood -127.5882 Akaike criterion 261.1765Schwarz criterion 264.8331 Hannan-Quinn 262.1907
Output model regresi dengan memakai X2 saja
Model 2: OLS, using observations 1-25Dependent variable: Y
coefficient std. error t-ratio p-value -------------------------------------------------------- const 36.7186 18.5695 1.977 0.0601 * X2 0.832012 0.104149 7.989 4.39e-08 ***
Mean dependent var 169.3680 S.D. dependent var 79.05857Sum squared resid 39739.49 S.E. of regression 41.56686R-squared 0.735081 Adjusted R-squared 0.723563F(1, 23) 63.81897 P-value(F) 4.39e-08Log-likelihood -127.6138 Akaike criterion 259.2276Schwarz criterion 261.6653 Hannan-Quinn 259.9037
Output model regresi dengan peubah X3 saja
Model 3: OLS, using observations 1-25Dependent variable: Y
coefficient std. error t-ratio p-value -------------------------------------------------------- const 36.6097 18.5764 1.971 0.0609 * X3 0.208034 0.0260332 7.991 4.37e-08 ***
Mean dependent var 169.3680 S.D. dependent var 79.05857Sum squared resid 39721.74 S.E. of regression 41.55758R-squared 0.735199 Adjusted R-squared 0.723686F(1, 23) 63.85778 P-value(F) 4.37e-08Log-likelihood -127.6082 Akaike criterion 259.2164Schwarz criterion 261.6541 Hannan-Quinn 259.8925
Output dari auxiliary regression Regresi X2 terhadap X3
Model 4: OLS, using observations 1-25Dependent variable: X2
coefficient std. error t-ratio p-value ----------------------------------------------------------- const -0.117288 0.117251 -1.000 0.3276 X3 0.250016 0.000164318 1522 4.83e-059 ***
Mean dependent var 159.4320 S.D. dependent var 81.46795Sum squared resid 1.582488 S.E. of regression 0.262305R-squared 0.999990 Adjusted R-squared 0.999990F(1, 23) 2315090 P-value(F) 4.83e-59Log-likelihood -0.974992 Akaike criterion 5.949985Schwarz criterion 8.387736 Hannan-Quinn 6.626113
Bagaimana mengatasinya? Do nothing
Rule of Thumb Procedure A priori information Combining cross sectional and time series data Dropping a variable(s) and specification bias Transformation of variables Additional or new data
Do Nothing Multikolinieritas adalah masalah akibat
ketidaksempurnaan data Untuk data ekonomi: tidak dapat dikontrol dan
tidak ada pilihan Penduga secara keseluruhan tetap dapat
dipakai walaupun penduga secara individu relatif kurang efisien dan tidak signifikan
A priori information Informasi dari penelitian sebelumnya mengenai hubungan
fungsional antar parameter peubah yang berkorelasi
uXXY 33221
Dengan X2 yang berkorelasi tinggi dengan X3 Misal: X2: pendapatan, X3: Kekayaan, Y: konsumsi Diketahui dari penelitian sebelumnya bahwa perubahan
kekayaan terhadap perubahan konsumsi adalah 1/10 perubahan pendapatan terhadap perubahan konsumsi
23 1.0
Lakukan transformasi terhadap kedua peubah eksogen dengan hubungan sesuai (*)
Lakukan pendugaan menggunakan peubah yang sudah ditransformasi
uXXY 33221 23 1.0
uXXY 32221 1.0
uXY 21 *1.0 32 XXX
Menggabungkan data cross section dan time series Misalkan: Y : jumlah penjualan mobil P : rata-rata harga mobil I : pendapatan Pada data time series, P dan I cenderung berkorelasi
tttt uIPY lnlnln 321
β2: adalah elastisitas harga terhadap jumlah penjualan mobil
β3: adalah elastisitas pendapatan terhadap jumlah penjualan mobil
Jika terdapat data cross section (pada satu waktu) yang dapat dipakai untuk menduga koefisien elastisitas pedapatan β3 Dengan asumsi bahwa pada satu waktu harga tidak terlalu
bervariasi Gunakan penduga bagi β3 untuk melakukan
transformasi terhadap Y
tttt uIPY lnˆlnln 321
tttt uPIY lnlnˆln 213
ttt uPY ln21*
Dropping a variable(s) and specification bias Membuang salah satu dari peubah yang berkorelasi Masalah:
Jika semua peubah secara ekonomi harus ada di dalam model: specification bias
Jika pendapatan dan kekayaan memang harus ada di dalam model konsumsi
Tujuan perbaikan multikolinieritas dapat memunculkan masalah baru: specification bias
Tetap gunakan dua-duanya
Transformation of variables Contoh pada data time series pada X2: pendapatan, X3: Kekayaan, Y: konsumsi Dengan X2 yang berkorelasi tinggi dengan X3 seiring dengan
waktu Pada waktu t berlaku:
tttt uXXY 33221
Model yang sama dapat berlaku pada waktu t-1
11,331,2211 tttt uXXY
Untuk meminimumkan multikolinieritas, dilakukan pembedaan dari model di waktu t dan waktu t-1 First difference form
1133312221 tttttttt uuXXXXYY
tttt vXXY 3322
Regresi dilakukan pada masing-masing peubah yang sudah dibedakan Korelasi di antara peubah beda (∆X2 dan ∆ X3) tidak sebesar
korelasi dari peubah aslinya
Additional or new data Jika multikolinieritas terjadi akibat
pengambilan sampel Penambahan ukuran sampel dapat
mengurangi efek dari multikolinieritas
223
22
2
2 1ˆvar
rx i
Sampel bertambah akan memperbesar nilai komponen ini
Komponen ini diasumsikan tetap
Ragam lebih kecil/lebih efisien