22
Modul Ordinary Least Square dan Simultan Wisnu Harto Adi W June 12, 2012 Abstract Dalam modul ini, akan disampaikan secara sederhana penggunaan software Stata (versi 11 maupun 12) untuk pengolahan statistik secara sederhana. Model yang dipilih adalah OLS dan Simultan, dikarenakan penggunaan OLS maupun Simultan lebih luas jika dibandingkan metode pengolahan statistik yang lain (seperti GMM, Panel, ARIMA, dsb). Modul ini boleh dibagikan secara bebas sesuai dengan lisensi bebas GNU/Linux. Software yang dipergunakan untuk penulisan modul dan presentasi (slide ) juga mempergunakan software bebas berlisensi GNU/Linux. Terimakasih untuk SloveniaX TPB untuk Stata 12 SE, Linux, serta Acer 4530 gue SchachNoir. 1 Pengenalan Data Dalam setiap penelitian, bagian pertama yang harus kita lakukan pasti adalah manajemen data. Secara sederhana, Stata dapat mempergunakan fungsi copy - paste yang ada secara langsung. Perintah yang dipergunakan adalah “edit ”, selanjutnya dipergunakan “bro” atau browse (read-only ). Beberapa perintah dalam Stata untuk data manajemen: edit —— Mengubah / Input Data bro —— Melakukan Pembacaan data sysuse —— Untuk mengambil *.dta dari sistem internal webuse —— Import *.dta dari internet Untuk mempermudah input data, dalam modul akan dipergunakan data au- tomobile di USA (auto.dta) 1 dengan menggunakan perintah: clear sysuse auto 1 *.dta adalah format file dalam Stata, sama seperti *.db dalam Database Query, ataupun *.wf1 (Eviews), *.sav (SPSS / PSPP), dan *.xlsx (Excel 2007 / 2010) 1

[Wisnu,2012]Modul Ols Ivreg

Embed Size (px)

DESCRIPTION

Modul Lab stata

Citation preview

Page 1: [Wisnu,2012]Modul Ols Ivreg

Modul Ordinary Least Square dan

Simultan

Wisnu Harto Adi W

June 12, 2012

Abstract

Dalam modul ini, akan disampaikan secara sederhana penggunaansoftware Stata (versi 11 maupun 12) untuk pengolahan statistik secarasederhana. Model yang dipilih adalah OLS dan Simultan, dikarenakanpenggunaan OLS maupun Simultan lebih luas jika dibandingkan metodepengolahan statistik yang lain (seperti GMM, Panel, ARIMA, dsb).

Modul ini boleh dibagikan secara bebas sesuai dengan lisensi bebasGNU/Linux. Software yang dipergunakan untuk penulisan modul danpresentasi (slide) juga mempergunakan software bebas berlisensi GNU/Linux.

Terimakasih untuk SloveniaX TPB untuk Stata 12 SE, Linux, sertaAcer 4530 gue SchachNoir.

1 Pengenalan Data

Dalam setiap penelitian, bagian pertama yang harus kita lakukan pasti adalahmanajemen data. Secara sederhana, Stata dapat mempergunakan fungsi copy- paste yang ada secara langsung. Perintah yang dipergunakan adalah “edit”,selanjutnya dipergunakan “bro” atau browse (read-only).

Beberapa perintah dalam Stata untuk data manajemen:

• edit —— Mengubah / Input Data

• bro —— Melakukan Pembacaan data

• sysuse —— Untuk mengambil *.dta dari sistem internal

• webuse —— Import *.dta dari internet

Untuk mempermudah input data, dalam modul akan dipergunakan data au-tomobile di USA (auto.dta)1 dengan menggunakan perintah:

clear

sysuse auto

1*.dta adalah format file dalam Stata, sama seperti *.db dalam Database Query, ataupun*.wf1 (Eviews), *.sav (SPSS / PSPP), dan *.xlsx (Excel 2007 / 2010)

1

Page 2: [Wisnu,2012]Modul Ols Ivreg

Figure 1: Browse dan Edit

Maka kita akan mendapatkan dataset secara otomatis dari sistem untukbisa kita pakai. Jika tidak, kita bisa melakukan impor data secara langsungdari file spreadsheet seperti Lotus123, Excel, maupun LibreSpreadsheet dengancara melakukan copy - paste ke spreadsheet Stata (ketik edit).

2 Data Deskriptif Sederhana

Stata bisa dipergunakan untuk berbagai pengolahan data deskriptif, dari pen-golahan berbasis statistik sederhana (tabulasi, cross-tab, ranking, statistik se-baran data, deviasi, dsb.) maupun pengolahan data dengan statistik parametrikmaupun non-parametrik (Spearman, ANOVA, MANOVA, dsb.). Beberapa per-intah yang bisa dilakukan adalah:

No Syntax Efek Pre-installed1 sum Statistik Deskriptif Sederhana

(mean,max,min,s.dev)Ya

2 sum, detail Statistik Deskriptif Lanjutan (skew,kurtosis, obs, dsb.)

Ya

3 tabstat Tabel sederhana s.deskriptif lanjutan Ya4 Describe Deskripsi Label Ya5 Tab Tabulasi Data Sederhana Ya6 Tab, row chi Tabel Interaksi Lengkap Ya7 Swilk melihat error model / data Ya8 Graph Box Cek nilai Outliers Ya9 Winsorize Penghapusan nilai outliers dan diganti

dengan data baruTidak

Dari beberapa perintah yang penulis sebutkan, akan dipraktekan beberapa

2

Page 3: [Wisnu,2012]Modul Ols Ivreg

Figure 2: Perintah Summary dan Sysuse

yang relevan dengan sesi pelatihan hari ini. Perintah yang akan penulis bahasadalah: a. Sum, b. Describe, c. Boxplot, d. Matrix-Plot

2.1 Summary

Perintah summary, atau biasa disingkat menjadi sum di Stata dipergunakanketika kita ingin melakukan ekstraksi sederhana terhadap dataset dari tiap -tiap variabel yang kita punya. Data yang bisa diekstraksi dari perintah sumcukup sederhana, yaitu: obs (jumlah observasi), mean (nilai rata - rata vari-abel), max dan min (nilai maksimum dan minimum masing - masing variabel),serta s.dev (standar deviasi, atau simpangan). Perintahnya dapat berupa:

sum <untuk seluruh variabel observasi>, ataupun;

sum X1 <Spesifik ke variabel X1>

Hasil dapat dilihat pada figur 2 (Perintah Summary dan Sysuse). Dari hasil-nya, didapatkan keseluruhan ekstraksi dari dataset auto yang di impor dari sis-tem internal.

2.2 Describe

Describe secara sederhana merupakan perintah Stata untuk melihat hasil darilabelisasi variabel - variabel yang ada. Untuk lebih ringkasnya dapat dilihatpada figur 3.

3

Page 4: [Wisnu,2012]Modul Ols Ivreg

Figure 3: Describe Command

Figure 4: Kernel Densitas Error

Perintah describe sangat berguna bila dipergunakan untuk pengolahan datatingkat tinggi (dengan berbagai label rumit dari sumber data) seperti Sakernas,Susenas, IFLS, dsb.

2.3 Boxplot

Boxplot sangat berguna bila kita ingin membuat data yang timpang menjadilebih mendekati normal. Data dibilang terdistribusi mendekati normal ketikadistribusi datanya menyerupai lonceng terbalik (kecuali jika distribusinya lo-gistik). Semakin normal suatu distribusi data, mengindikasikan nilai pencilan(outliers) yang semakin kecil. Boxplot dipergunakan untuk mengecek setiapvariabel dalam dataset apakah terdistribusi normal / tidak.

Dari gambar diatas, titik - titik diluar garis deviasi tertinggi (garis terluardari box) disebut sebagai sebaran data outliers. Solusi terbaiknya adalah se-

4

Page 5: [Wisnu,2012]Modul Ols Ivreg

Figure 5: Boxplot Dataset Auto

cara manual membuang data yang membuat bias, ataupun penggunaan teknikwinsorized2.

2Teknik Winsorized tidak dijelaskan dalam materi ini

5

Page 6: [Wisnu,2012]Modul Ols Ivreg

Figure 6: Matriks-Plot

2.4 Matrix-Plot

Matriks Plot (atau di Stata dipergunakan perintah graph matrix), adalah ma-triksasi dari scatter plot hubungan dua arah (baik Y dan X, maupun X denganX lain). Penggunaan matriks plot mempermudah kita untuk melihat data scat-terplot lebih lengkap daripada melakukannya satu per satu. Perintah yang biasadipakai adalah graph matrix y x1 x2, sehingga didapatkan hasil seperti padagambar matriks di atas.

3 Pengolahan OLS (Ordinary Least Square)

Regresi linear adalah teknik statistika yang memberikan pendugaan dari kemiringansuatu garis lurus (linear) dan posisi dimana garis tersebut memotong sumbuy, berdasarkan sejumlah informasi mengenai hubungan antar variabel. Mem-berikan pendugaan nilai a dan b, berdasarkan sejumlah informasi mengenai xdan y, pada persamaan berikut: y = α+ βX

• x disebut variabel independent, karena nilainya tidak tergantung variabellain.

• y disebut variabel dependent, karena nilainya tergantung nilai x.

• α dan β disebut parameter, α adalah intercept dan β adalah slope.

Regresi linear sederhana, apabila variabel dependent hanya ditentukan olehsatu variabel independent. Contohnya: y = α + βX + ε. Sedangkan JikaRegresi Linear berganda, apabila variabel dependent ditentukan oleh lebih darisatu variabel independent. Contohnya: y = α+β1X1+β2X2+ ....+βnXn+ ε.Dimana, ε = error term = perbedaan antara y aktual dengan y hasil estimasigaris regresi.

6

Page 7: [Wisnu,2012]Modul Ols Ivreg

Metode yang digunakan untuk mengestimasi parameter garis regresi disebutmetode Ordinary Least Square (OLS). Metode ini meminimisasi jumlah darierror yang dikuadratkan (ε2) dari setiap observasi. Pada dasarnya, model regresidengan OLS dibangun atas asumsi CLRM (Classical Linear Regression Model).Asumsi tersebut memiliki properti sesuai dengan Gauss-Markov Theorem yangmenuntut adanya karakteristik Best Linier Unbiassed Estimator / BLUE daripenduga / estimatornya (Gujarati,2003), yakni:

• Linier: Estimator OLS merupakan fungsi linier dari variabel acak (ran-dom). Contoh: variabel terikat Y dalam model regresi

• Tidak Bias. Nilai rata-rata atau nilai ekspektasi dari estimator samadengan nilai aktual/sesungguhnya,

• Varians Minimum. Estimator OLS memiliki nilai varians minimum.Kriteria ini penting untuk memastikan bahwa estimator efisien. Den-gan kata lain, estimator yang tidak bias dengan varians terkecil dapatdikatakan sebagai estimator yang efisien.

3.1 Memulai Regresi OLS

Dari teori diatas, kita dapat melakukan modeling untuk di regresi dengan OLS.Data yang kita pergunakan adalah dataset auto.dta yang didapatkan dari per-intah:

sysuse auto , atau

webuse auto

Setelah kita dapatkan data auto.dta diimpor ke Stata, maka kita dapatmelanjutkan dengan perintah deskriptif sederhana:

sum

describe

sum, detail

graph matrix price - foreign, half

Setelah itu, dengan model sederhana yang akan dibuat jadi OLS:

lnPrice = α+ β1Mpg + β2Turn+ β3GearRatio+ β4Foreign+ ε

lnPrice didapatkan dari generalisasi logaritma natural dengan cara:

gen lnprice=ln(price)

reg y x1 x2 x3 x4

reg price mpg turn gear_ratio foreign

Maka dari regresi tersebut didapatkan hasil:

7

Page 8: [Wisnu,2012]Modul Ols Ivreg

Figure 7: OLS Regression

3.1.1 Membaca Hasil OLS

Setelah melakukan regresi, tahapan selanjutnya adalah intepretasi hasil regresitersebut. Seperti yang kita ketahui, penyertaan variabel ε atau error dalammodel regresi secara langsung menyatakan regresi sebagai model stokastik (tidakpasti), berbeda dengan hasil deterministik yang sudah pasti dapat diukur. Be-saran error dapat dilihat dari simpangan baku (standar deviasi) maupun per-masalah dalam hipotesis BLUE. Semakin besar error model, maka semakin biashasil regresi tersebut (jauh dari kenyataan). Beberapa indikator yang patutdibaca dan diintepretasikan dalam rankingnya (OLS) adalah:

• Pertama dilihat adalah nilai Prob - F. Prob F mengindikasikan sig-nifikansi dari model, secara sederhana ketika model tidak signifikan, makabisa dianggap sia - sia penelitian terhadap model tersebut.

• Kedua adalah nilai besaran R2 maupun R2 − Adjusted. Kedu-anya menggambarkan setiap variabel dalam persamaan mampu menggam-barkan model dengan baik. Semakin tinggi nilainya, semakin bagus.3

• Arah koefisien (β dan α). Arah dari koefisien (positif ataupun negatif)mengindikasikan hubungan antara variabel independen (X) dengan depen-den (Y), serta kaitannya dengan penyusunan hipotesis awal dari model.Perbandingan dengan hipotesis harus bisa dijelaskan dengan baik, tidakharus bernilai signifikan.

• Signifikansi variabel. Bukan berarti signifikansi dari variabel menjadiyang utama dalam penelitian, namun hasil yang signifikan mengindikasikan

3nilai R2 − adjusted bisa negatif bila nilai MSE(Mean Square Error) dari tabel ANOVAsangat besar

8

Page 9: [Wisnu,2012]Modul Ols Ivreg

marjin perubahan nilai yang bersar ketika implementasi kebijakan / shockterjadi. Semakin kecil errornya (ditunjukkan dengan nilai prob-t atauprob-Z lebih kecil dari nilai α)

Dari figur 7 (OLS Regression), kita dapati nilai Prob-F (Model) adalah 0.000.Nilai prob-F sebesar 0.000 < nilai α = 5%, sehingga dapat kita nyatakan modelregresi lnprice signfikan. Berlanjut pada nilai R2 dan R2 − Adjusted masing -masing sebesar 0.3931 (39%) dan 0.3579 (35.8%) yang dapat diinterpetasikansebagai “Model mampu digambarkan dengan baik oleh variabel - variabel inde-penden sebesar 35.8% setelah dibagi nilai MSEnya. Untuk tiap variabel hampirsemuanya signifikan (nilai prob-t < α) kecuali untuk variabel turn yang ni-lainya lebih dari α. Koefisien regresi dibandingkan dengan hipotesis yang telahdiberikan pada bab 2 / 3 penelitian masing - masing. Secara ringkas dapatditulis:

No Prob-Stat Intepretasi Syarat Signifikansi1 F Model < α2 Chi Model < α3 t Variabel (> 30) < α4 Z Variabel (< 30) < α

3.2 Uji BLUE - Gauss Markov dalam OLS

Pada bab OLS di Gujarati (2003), terdapat 10 asumsi klasik dalam regresi lin-ear yang harus dipenuhi, yaitu:

1. Model linear dalam parameter.

2. Nilai x tetap dalam pengambilan sampel yang diulang.

3. Nilai rata-rata dari error sama dengan nol.

4. Homoskedastis yaitu nilai varians dari setiap error sama.

5. Tidak ada korelasi antar error.

6. Covarians antara ui dan xi adalah nol.

7. Banyaknya observasi n harus lebih besar daripada banyaknya parameteryang diestimasi.

8. Nilai dari xi harus bervariasi (tidak boleh sama).

9. Model regresi dispesifikasikan dengan benar.

10. Tidak ada multikolinearitas sempurna.

Namun terkadang dalam penelitian nyata, cukup susah untuk melakukanpemenuhan 10 asumsi klasik dari OLS. Hal itu menyebabkan bias dalam re-gresi jika beberapa asumsinya tidak terpenuhi, ambil saja asumsi nomor 6(heterokedastisitas) dan asumsi nomor 10 (multikolinearitas). Oleh sebab itu,dalam Stata setelah melakukan regresi OLS, kita disarankan untuk melakukan

9

Page 10: [Wisnu,2012]Modul Ols Ivreg

Figure 8: Heterokedastisitas OLS

pengujian BLUE yang bisa memenuhi 10 asumsi dalam OLS, yaitu: a. Het-erokedastisitas (White), b. Uji Multikol (VIF dan Indeks Korelasi), serta c.Autokorelasi (Bgodfrey ataupun Durbin-Watson).

3.2.1 Heterokedastisitas

Dalam estimasi menggunakan data cross section, masalah yang umum timbuladalah heteroskedastisitas atau varians residual yang tidak seragam. Salah satumetode untuk menguji adanya heteroskedastisitas dalam ekonometrik adalahCook and Weisberg’s test. Stata dapat melakukan pengujian ini dengan perin-tah hettest [varlist] [,rhs] atau szroeter [varlist] [,rhs] setelah melakukanregresi.

Hipotesis: ρH0 : Constant VarianceH1 : NO Constant Variance

Intepretasi : Berdasarkan hasil uji Breusch-Pagan / Cook-Weisberg, di-mana nilai Prob > chi2 = 0.043, lebih besar dari alfa (0.05) maka dapat disim-pulkan bahwa estimasi kita terbelenggu masalah heteroskedastisitas4.

3.2.2 Mutikoleniaritas

Didalam asumsi BLUE, antar variabel tidak ada hubungan exact collinearityantar variabel independen. Jika ada maka OLS meskipun BLUE namun es-

4heterokedastisitas adalah nilai varians yang tidak konstan, kalau diibaratkan jamansekarang seperti mahasiswa labil

10

Page 11: [Wisnu,2012]Modul Ols Ivreg

Figure 9: Corr dan VIF

timator akan mempunyai nilai varians dan covarians yang besar, maka cukupsulit untuk menentukan estimasi yang benar. Deteksi :

1. Nilai R tapi sangan sedikit variabel yang signifikan.

2. High pair-wise (zero-order) correlations among regressors

3.2.3 Pengujian Multikol dalam Stata

Dengan menggunakan indeks korelasi (perintah corr) maupun perintah vif (vari-ance inflating factor).

Gudjarati (2003) menyatakan dua hal, yaitu: 1. nilai VIF diatas 10 mengindikasikanadanya multikolinearitas yang kuat antara variabel independen, sedangkan un-tuk indeks korelasi (corr), hasil korelasi diatas 0.8 (80%) menyatakan adanyahubungan multikolinearitas yang kuat antar variabel independennya. Keduahasil di figur ”Corr dan VIF“ mengindikasikan tidak adanya multikolinearitasdalam model lnprice.

Mengatasi Multikol :

• Do nothing If the main purpose of modeling is predicting Y only,then don’t worry . (since ESS is left the same) “Don’t worry aboutmulticollinearity if the R-squared from the regression exceeds the R-squaredof any independent variable regressed on the other independent variables.”

• First difference , dibuat First difference pada salah satu variabel yangbermasalah multicol, pada stata dapat dilakukan dengan perintah: gen

11

Page 12: [Wisnu,2012]Modul Ols Ivreg

[namaa variabel first difference] = D.[variabel awal] contoh : gen fdx1=D.x1

• Diubah rumus dalam mendapatkan variabel tersebut, dapat di-ubah menjadi ln atau dibuat selisih antar waktu.

• Menambah jumlah data. Hilangkan salah satu variabel yang berkaitanerat, dapat dilihat pada perinta corr, yaitu Pearson correlation coefficientyang lebih dari 0.8 atau 0.75

3.2.4 Autokorelasi

Autokorelasi suatu keadan dimana terjadi korelasi eror antar periode waktu.Adanya autokolareasi akan membuat OLS linear unbiased, consistent dan asymp-totically normally distributed dan tidak lagi efisien. Autokorelasi umumnyaterjadi pada data time series, sebelum melakukan regresi kita harus mendefin-isikan terlebih dahulu time variable kita dengan perintah tsset [timevar]. Atauseperti yang penulis lakukan, penulis melakukan generalisasi waktu pada datasetauto secara otomatis dengan stata. Perintah yang bisa dipakai adalah:

gen time = (2000) + _n-1 --> tahun awal 2000

tsset time, yearly

Tes Autokorelasi dengan Dwstat dan Bgodfrey

Durbin Watson statistic

Hipotesis: ρ =H0 : Tidak ada AutokorelasiH1 : Ada Autokorelasi

Keputusan : Jika nilai DWstat disekitar 2 atau 1,54¡Dwstat¡2,5 maka tidakada cukup bukti untuk menolak H0.

Breusch–Godfrey (BG) Test / LM test

Hipotesis: ρH0: ρ1 = ρ2 = ρ3 = Tidak Ada AutokorelasiH1 : Ada Autokorelasi

Keputusan: Jika p-value < 5%, maka tolak hipotesis nol (ada autokorelasi).

3.3 Robustness dan Praiβ

Perintah robust secara otomatis menghilangkan heteroskedastisitas dengan jalanmembobotkan dengan robust standard error. Hasil regresi yang didapat telahdapat dipastikan telah terbebas dari heteroskedastisitas. Perintahnya secarasederhana adalah menambahkan opsi di belakang regresi berupa *, robust ataupun*, vce(robust). Sebagai contoh:

12

Page 13: [Wisnu,2012]Modul Ols Ivreg

Figure 10: Tes Autokorelasi

Figure 11: Robustness Heterokedastisitas

13

Page 14: [Wisnu,2012]Modul Ols Ivreg

Figure 12: Prais - Robust, Autokol - Hetero

Dan penambahan fungsi Prais dipergunakan jika terdapat autokorelasi dalamregresi OLS Time-series.

Setelah dilakukan treatment tersebut, diharapkan hasil dari OLS sudah tidakbias dan memenuhi asumsi BLUE Gauss-Markov.

4 Regresi Simultan

4.0.1 Inkonsistensi Metode Kuadrat Terkecil (Ordinary Least Squares)dan Permasalahan Identifikasi

Metode OLS tidak dapat digunakan untuk mengestimasi sebuah persamaantunggal yang merupakan bagian pembentuk sistem jika satu atau lebih variabelpenjelasnya berkorelasi dengan error. Oleh sebab itu persamaan simultan diper-gunakan untuk menjelaskan model seperti ini. Dalam persamaan simultan, akanditemui dua istilah yang sering dipakai, yaitu: Variabel Endogen dan Eksogen,serta model struktural.

Variabel endogen (endogeneous variabel) adalah variabel tak bebas dalampersamaan simultan yang nilainya ditentukan di dalam sistem persaman, walaupunvariabel-variabel tersebut mungkin juga muncul sebagai variabel bebas di dalamsistem persamaan. Cari variabel endogen dari contoh (a, b, dan c) di atas. Vari-abel eksogen (disebut juga predetermine) adalah variabel yang nilainya tidakditentukan secara langsung di dalam sistem. Variabel ini menyebabkan perg-erakan variabel endogen di dalam sistem. Contohnya adalah konstanta danvariabel lag (lagged endogeneous variable). Variabel lag dikategorikan sebagaipredetermine dengan asumsi tidak ada korelasi serial dengan error di dalam

14

Page 15: [Wisnu,2012]Modul Ols Ivreg

persamaan yang mengandung variabel lag tersebut. Variabel eksogen adalahvariabel yang bebas dan benar - benar independen dari error variabel lainnya.

Model struktural (structural model) adalah model yang mengandungvariabel endogen di bagian kiri dan kanan persamaan, dimana pada sisi kanan-nya juga terdapat variabel eksogen. Contoh (a, b, dan c) di atas merupakancontoh model struktural, karena diambil dari landasan teori dan kemudian di-turunkan dalam bentuk model ( yaitu : suatu simplifikasi) dan diberi asumsi(yaitu : alat untuk menjaga agar model dapat berjalan). Secara umum, ada2 cara untuk menyatakan suatu model, yaitu implisit (tidak langsung) dan ek-splisit (langsung). Model implisit menggambarkan suatu keadaan secara umum,dan tidak menyatakan hubungan secara langsung antara suatu variabel denganvariabel yang lain. Model implisit sering dinyatakan dalam Y = f (X1, X2,....).Sedangkan model eksplisit menunjukkan hubungan secara langsung antara su-atu variabel dengan variabel yang lain, seperti misalnya linier, kuadratik, danlain-lain. Contoh (a, b, dan c) di atas merupakan bentuk model yang eksplisit.

Bentuk persamaan sederhana/reduksi (reduced form) adalah sebuah penye-lesaian sistem persamaan simultan dimana variabel endogen dinyatakan dalamvariabel predetermine dan error. Diperoleh dengan memecahkan sistem per-samaaan struktural sedemikian rupa sehingga bisa dinyatakan setiap variabelendogen dalam modell sebagai fungsi hanya dari variabel eksogen atau prede-tremined variables dan error dalam model. Secara umum, juga bisa dinyatakandalam bentuk implisit maupun eksplisit. Cara implisit lebih mudah dilakukan,sedangkan cara eksplisit cukup susah karena harus mencari besarnya nilai-nilaikoefisien.

Persamaan simultan yang bias ialah suatu keadaan di mana terjadi ‘overestimation or under estimation’ daripada parameter struktural yang diperolehsebagai hasil dari pengetrapan OLS pada persamaan struktural dari suatu modelpersamaan simultan. Bias tersebut disebabkan karena variabel endogen dalammodel yang juga merupakan variabel bebas berkorelasi dengan kesalahan peng-ganggu, jadi terjadi pelanggaran asumsi OLS (variabel bebas tak berkorelasidengan kesalahan pengganggu)

Secara umum, sistem persamaan simultan mencakup :Persamaan struktural atau tingkah laku (structural or behavioralequations). Persamaan ini menggambarkan respon agen-agen (tingkah lakudari para pelaku) ekonomi dan mencakup hubungan-hubungan ekonomi seperti:fungsi permintaan dan fungsi konsumsi yang menggambarkan perilaku kon-sumen, atau fungsi penawaran yang menggambarkan perilaku produsen.

Ada satu persamaan struktural untuk setiap variabel endogen di dalammodel/sistem persamaan simultan. Koefisien setiap persamaan struktural dise-but parameter struktural (structural parameters) dan menunjukkan pengaruhlangsung (direct effect) dari setiap variabel bebas terhadap variabel tak bebas.Persamaan teknis. Persamaan ini mengekspresikan hubungan teknis, seperti :fungsi produksi yang menggambarkan hubungan antara faktor-faktor input danoutput produksi. Persamaan kelembagaan dan persamaan identitas akuntansiatau definisi. Contoh : Keuntungan = TR – TC ; Y = C + I + G + (X – M).Persamaan tersebut tidak mengandung error (bukan persamaan ekonometrika),karena menunjukkan hubungan yang sudah pasti, bukan perkiraan (estimasi).

15

Page 16: [Wisnu,2012]Modul Ols Ivreg

Namun akan berbeda jika menjadi model stokastik dengan error ditambahkan.Lebih jauh lagi, secara sederhana model dari persamaan simultan adalah

sebagai berikut:

Y = α+ β1X1 + β2X2 + β3X3 + ε, dimana (1)

X2 = α+ β1X1 + β4X4 + υ (2)

Jadi diantara kedua model tersebutm nilai variabel β2X2 tidak benar - be-nar independen terhadap Y . Hal itu dikarenakan adanya hubungannya terhadaperror model kedua (υ). Dari persamaan tersebut, kita dapat melanjutkan padaidentifikasi model simultan yang paling baik untuk dipakai.

4.0.2 Identifikasi Persamaan Simultan

Identifikasi masalah berarti menentukan apakah nilai estimasi parameter per-samaan struktural dapat diperoleh dari estimasi persamaan reduksi. Masalahidentifikasi muncul karena kumpulan koefisien struktural yang berbeda mungkincocok dengan sekumpulan data yang sama.

Sebuah sistem persaman dikatakan:

1. Exactly identified / Just Identified jika nilai parameter yang unik dapatdiperoleh, artinya hanya ada satu nilai untuk setiap koefisien parameterstruktural.(ILS atau IV)

2. Over identified jika nilai parameter persamaan struktural yang diperolehlebih dari satu.(2SLS atau IV)

3. Under identified jika nilai parameter persamaan struktural tidak dapatdiperoleh.(Tidak Simultan)

4. Identified jika mungkin untuk mendapatkan nilai parameter dari estimasipersamaan reduksi.

Penyelesaian sebuah persamaan simultan diawali dengan mengidentifikasivariabel dalam persamaan. Order and Rank Condition merupakan aturan yangmenjadi acuan apakah suatu sistem persamaan dapat diselesaikan sehingga nilaikoefisien persamaan struktural dapat diperoleh. Menurut Order and Rank Con-dition, agar sebuah sistem persamaan simultan dengan M persamaan strukturaldapat diidentifikasi maka setidaknya harus memiliki M − 1 variabel endogen.Jika jumlah variabel endogen tepat M − 1 maka persamaan tersebut dikatakanexactly identified dan jika jumlah variabel endogen lebih dari M − 1 maka per-samaan tersebut dikatakan over identified atau agar sebuah sistem persamaansimultan dengan M persamaan struktural dapat diselesaikan, jumlah variabelpredetermine yang ada dalam persamaan tersebut harus tidak kurang dari jum-lah variabel endogen yang ada dalam persamaan dikurangi satu.

16

Page 17: [Wisnu,2012]Modul Ols Ivreg

Berdasarkan keterangan diatas, jika5

M = Endogen−Model

m = Endogen− Persamaan− Struktural

K = Predetermine(eksogen) −Model

k = Predetermine(eksogen) − Persamaan− Struktural,

maka :

• Jika K − k = m − 1 maka persamaan tersebut dikatakan exactly (just)identified

• Jika K − k > m− 1 maka persamaan tersebut over identified

• Jika K–k < m− 1 maka persamaan tersebut under identified Yang hanyabisa diolah adalah apabila model tersebut adalah over identified dan atauexactly (just) identified

4.1 Penggunaan Stata Dalam Regresi Simultan

Seandainya dimodelkan dari data auto.dta (sama seperti di modul OLS danData Manajemen), dihasilkan model:

lnPrice = α+ β1Mpg + β2Turn+ β3dForeign+ β4GearRatio+ ε(3)

GearRatio = α+ β1Trunk + β2Turn+ υ (4)

Dapat kita ketahui beberapa hal, yaitu:

• Persamaan pertama adalah just-identified (5-4 = 2-1) K=α+Mpg,Turn,Trunk,dForeign

• Persamaan kedua adalah over-identified (5-3 ¿ 1-1)

• Karena hasil tidak konsisten, IV dapat dipergunakan

Regresi Instrumental Variable, memiliki perintah dasar dalam Stata denganbentuk:

ivreg Y X1 X2 X3 (X4 = X3 X5) --> X4 = Endogenous; X1 X2 X3 X5 = Instruments

ivreg lnprice mpg turn foreign (gear_ratio = trunk turn)

Bisa juga dilakukan 2SLS IV jika nilai diasumsikan keduanya Over-identification.

ivregress 2sls lnprice mpg turn foreign (gear_ratio = trunk turn)

Ataupun cara manual 2SLS dengan metode:

5nilai α dihitung sebagai 1 predetermine / eksogen, dan tidak ada pengulangan untuksetiap predetermine yang sudah dihitung

17

Page 18: [Wisnu,2012]Modul Ols Ivreg

Figure 13: IVregress

reg gear_ratio trunk turn

predict gearhat --> memprediksi nilai Y-hat model kedua

reg lnprice mpg turn foreign gearhat --> memasukkan yang sudah mencakup error u ke dalam model 1

Dan hasilnya dapat dilihat dalam figur berikut:

18

Page 19: [Wisnu,2012]Modul Ols Ivreg

Figure 14: 2SLS

Figure 15: Step1-Manual 2SLS

19

Page 20: [Wisnu,2012]Modul Ols Ivreg

Figure 16: Step2-Manual 2SLS

4.2 Uji Hausman

Terakhir, modul ini akan membahas mengenai model terbaik jika memperband-ingkan OLS ataupun Simultan. Pada dasarnya prinsip OLS dan Simultan tidakjauh berbeda, hanya saja beberapa cakupan yang belum bisa dibahas dalamOLS bisa dijelaskan dengan baik dalam model simultan. Namun tidak semuamodel sesuai dengan simultan, terkadang metode OLS saja sudah cukup men-jelaskan dengan baik. Agar bisa diidentifikasi, Stata dapat melakukan uji haus-man untuk memperbandingkan hasil estimasi dengan OLS ataupun dengan IV- 2SLS, manakah yang lebih sesuai untuk model lnprice dari data auto.dta.

Tahapan yang dilakukan oleh penulis:

ivreg lnprice mpg turn foreign (gear_ratio = trunk turn)

estimates store ivreg

reg price mpg turn gear_ratio foreign

estimates store ols

hausman ivreg ols

Sehingga didapatkan hasil uji Hausman sebesar 0.9 (lebih dari α, terimah0=model OLS, tolak h1=model simultan). Dengan begitu disimpulkan bahwadari dataset auto.dta dengan model lnprice, didapatkan model OLS sudahmampu menjelaskan dengan baik tanpa harus memasukan persamaan simul-tan.

20

Page 21: [Wisnu,2012]Modul Ols Ivreg

Figure 17: Uji Hausman Endogenitas

5 Ringkasan

Regresi OLS dan Simultan dalam Stata memberikan gambaran yang lebih mu-dah dibandingkan pekerjaan regresi secara manual. Beberapa catatan pentingdalam materi kali ini adalah fundamental perbedaan antara OLS dan Simultan,terutama dalam spesifikasi model regresi. Pengujian hausman dipergunakanuntuk melihat ada atau tidaknya endogenitas dalam persamaan.[]

21

Page 22: [Wisnu,2012]Modul Ols Ivreg

6 Daftar Pustaka

References

[] Gudjarati, Damodar N. (2003). Essential Econometrics. New York, USA:McGraw-Hill.

[] Nachrowi, D.N., dan Usman, H. (2006). Pendekatan Populer dan PraktisEkonometrikan Untuk Analisis Ekonomi dan Keuangan. Jakarta, Indoen-sia: Lembaga Penerbit Fakultas Ekonomi Universitas Indonesia.

[] Suwardi, A. (2011). STATA: Dasar Pengolahan Data (edisi Juni). Depok,Indonesia: Laboratorium Komputasi Departemen Ilmu Ekonomi FEUI.

[] Wijoyo, W.H.A. (2011). Tutorial Penulisan JEPI (Jurnal Ekonomi Pem-bangunan Indonesia) dengan LATEX. Depok, Indonesia: LaboratoriumKomputasi Departemen Ilmu Ekonomi FEUI.

22