Upload
runny-run
View
218
Download
3
Embed Size (px)
DESCRIPTION
about logistic regression
Citation preview
PENDAHULUAN
A. Latar Belakang
Salah satu masalah di negara
Indonesia adalah masih banyak lulusan
pendidikan jenjang menengah yang
terdiri dari lulusan SMA dan SMK yang
berprestasi tetapi tidak dapat
melanjutkan ke jenjang pendidikan yang
lebih tinggi disebabkan faktor ekonomi.
Jumlah anak berusia 19 – 23 tahun yang
melanjutkan ke perguruan tinggi hanya
23 persen. Sisanya 77 persen belum
punya kesempatan untuk masuk ke
perguruan tinggi (1). Upaya pemerintah
dalam menyelesaikan masalah tersebut
adalah dengan membuat program yang
disebut dengan “Beasiswa Bidik Misi”
(Beasiswa Pendidikan Bagi Calon
Mahasiswa Berprestasi dari Keluarga
Kurang Mampu). Beasiswa Bidik Misi
adalah salah satu program terbaru
pemerintah yang dicanangkan untuk
lulusan pendidikan jenjang menengah
yang berprestasi baik dalam bidang -
bidang akademik atau kurikuler, ko-
kurikuler, maupun ekstrakurikuler yang
tidak mampu untuk melanjutkan ke
jenjang pendidikan tinggi karena
disebabkan tidak ada biaya atau berasal
dari keluarga yang kurang mampu.
Beasiswa Bidik Misi ini baru dijalankan
pada tahun 2010. Tujuan dari
pelaksanaan program Beasiswa Bidik
Misi adalah untuk memutuskan mata
rantai kemiskinan dengan cara
memberikan beasiswa kepada lulusan
berprestasi dan kurang mampu untuk
menjadi seseorang yang hebat kelak dan
membawa keluarga mereka untuk keluar
dari garis kemiskinan (2).
Model logistik biner merupakan
model regresi dengan variabel respon Y
terdiri dari dua kategorik, yaitu Y={0,1}
dan probabilitas suskses hasil percobaan
didasarkan pada distribusi logistik.
Berdasarkan uraian diatas, penelitian ini
bertujuan untuk mengetahui faktor-
faktor yang berpengaruh terhadap
permasalahan pilihan siswa melanjutkan
pendidikan ke perguruan tinggi siswa
SMA kelas 3 Surabaya dengan
menggunakan metode regresi logistik
biner.
B. Rumusan Masalah
Berdasarkan latar belakang yang
telah diuraikan, diperoleh rumusan
masalahnya sebagai berikut.
1. Bagaimana estimasi model logistik
biner pada permasalahan pilihan
siswa melanjutkan pendidikan ke
perguruan tinggi?
2. Bagaimana deskriptif faktor-faktor
yang mempengaruhi pilihan siswa
dalam melanjutkan pendidikan ke
perguruan tinggi?
C. Tujuan
Tujuan yang ingin dicapai dalam
penelitian ini adalah sebagai berikut.
1. Memperoleh estimasi model
logistik biner pada permasalahan
pilihan siswa melanjutkan
pendidikan ke perguruan tinggi.
2. Mengetahui faktor-faktor yang
mempengaruhi pilihan siswa
melanjutkan pendidikan ke
perguruan tinggi.
D. Manfaat
Manfaat yang ingin diperoleh
dalam penelitian ini sebagai berikut.
1. Bagi Mahasiswa
Dalam bidang keilmuan,
khususnya statistika diharapkan
dapat menambah wawasan
mengenai model logistik biner
sehingga mampu mengasah dalam
pengembangan keilmuan.
2. Bagi Pemerintah
Diharapkan hasil dari tulisan ini
mampu dijadikan sebagai masukan
dan evaluasi pemerintah untuk
meningkatkan kualitas pendidikan
di Kota Surabaya.
TINJAUAN PUSTAKA
A. Model Logistik Biner
Model logistik biner merupakan
model regresi dengan variabel respon
Y terdiri dari dua kategorik, yaitu
Y={0,1} dan probabilitas suskses
hasil percobaan didasarkan pada
distribusi logistik. Model logistik
biner merupakan pemodelan regresi
yang didasarkan pada konsep
probabilitas. Model logistik biner
dinyatakan dalam bentuk :
g ( π i )=X i β ; i=1,2 ,…, N
dengan
g ( π i )=ln( π i
1−π i) adalah fungsi link
X i=(1 , X i 1 , X i2 , …, X i , K−1) adalah
vektor dari variabel prediktor ke i.
β=(β0 , β1 ,…, βK −1) ' adalah bektor
parameter yang bersesuaian dengan
variabel prediktor g ( π i ) sehingga
diperoleh probabilitas sukses pada
percobaan ke i yang bersesuaian
dengan variabel prediktor X i adalah:
π i=exp (X i β)1+(X i β)
dengan π i=Pr (Y=1|X i ).
B. Inferensi pada Model Logistik
Biner
Uji Serempak digunakan untuk
memeriksa pengaruh variabel
prediktor terhadap variabel respon
secara serempak. Menurut Hosmer
dan Lameshow (2000) untuk menguji
pengaruh variabel prediktor terhadap
variabel respon secara serentak
digunakan hipotesis:
H 0 : β1=β2=…=βK−1=0
H 1:paling sedikit ada satu β j
tidak sama
dengan menggunakan
statistik uji LRT sebagai
berikut
G=−2 ln Λ
secara asimtotik statistik uji G
berdistribusi χ ( K ; α )2 . Daerah
kritis untuk menguji hipotesis
parameter secara serentak
dengan tingkat signifikansi α
adalah H0 ditolak jika G> χ ( K ;α )2 .
Uji individu dilakukan untuk
menguji signifikansi paramter
secara individu pada model
logistik biner dengan
menggunakan hipotesis :
H 0 : β j=0; j=1 , 2,…, K−1
H 1: β j≠ 0
dengan menggunakan
statistik uji
Z j=β̂ j
S ( β̂ j); j=1 ,2 ,…, K−1
dengan S( β̂ j) adalah
simpangan baku dari
estimator β̂ j. Daerah kritis
untuk menguji hipotesis
tersebut dengan tingkat
signifikansi α adalah H 0
ditolak jika |Z j|>Zα /2.
Uji kesesuaian model
logistik biner digunakan untuk
membandingkan model
sebenarnya dengan model
dugaan. Untuk menguji
kesesuaian model logistik
biner digunakan statistik uji
deviance dengan hipotesis
H 0 : model logistik biner sesuai
H 1: model logistik biner tidak
sesuai
Misalkan probabilitas
sukses dari hasil pengamatan
pada percobaan ke i adalah
π i=y i
mi
dan penduga
probabilitas sukses pada
percobaan ke i adalah π̂ i=¿
exp ( X i β̂ )1+exp (X i β̂ )
maka diperoleh
statistik uji deviance adalah:
D=2[l ( π i )−l ( π̂ i )]
Statistik uji deviance
berdistribusi asimtotik χ J−K ,α2 ,
dengan J adalah banyaknya
level dari variabel prediktor X
yang berbeda. Derah kritis
untuk uji kesesuaian model
logit biner adalah H 0 ditolak
jika D> χ J−K ,α2 .
C.Odds Ratio
Odds Ratio merupakan
ukuran isiko atau
kecenderungan untuk
mengalami kejadian tertentu
antara satu kategori dengan
kategori lainnya. Didefinisikan
odds adalah perbandingan
antara probabilitas sukses
dan probabilitas gagal,
sehingga diperoleh nilai Odd
adalah:
Odd=π (X )
1−π (X )=exp ( X β̂)
D. Ketepatan Klasifikasi
Apparent Error Rate (APPER)
merupakan suatu nilai yang
digunakan untuk melihat peluang
kesalahan dalam mengklasifikasi
objek. Nilai APPER adalah :
APPER=n12+n21
n11+n12+n21+n22
X 100 %
dengan
n11 banyaknya kejadian gagal hasil
pengamatan yang
diklasifikasikan gagal dari
hasil prediksi.
n12 banyaknya kejadian gagal hasil
pengamatan yang
diklasifikasikan sukses dari
hasil prediksi.
n21 banyaknya kejadian sukses
hasil pengamatan yang
diklasifikasikan gagal dari
hasil prediksi.
n22 banyaknya kejadian sukses
hasil pengamatan yang
diklasifikasikan sukses dari
hasil prediksi.
METODE PENELITIAN
A. Data dan Sumber Data
Data yang digunakan dalam
penelitian ini adalah data primer. Data
diperoleh dari survey terhadap siswa
kelas 3 di SMA dan SMK berstatus
Negeri di Surabaya tahun 2015
mengenai pilihan siswa melanjutkan
pendidikan ke perguruan tinggi. Populasi
dalam penelitian ini adalah siswa kelas 3
SMA Negeri berjumlah 6249 siswa dan
SMK Negeri berjumlah 7018 siswa
(PPDB Surabaya 2012).
Sebanyak 150 siswa dipilih
sebagai sampel yang tersebar di
beberapa sekolah antara lain, SMAN 16,
SMAN 21, SMAN 20, SMAN 3, SMAN
12, SMAN 9, SMAN 8, SMKN 6,
SMKN 1, SMKN 10 dan SMKN 11.
Sekolah-sekolah tersebut diperoleh
secara acak menggunakan bantuan
Minitab. Pelaksanaan survey lapangan
dilaksanakan selama 2 minggu di awal
desember tahun 2014.
B. Variabel Penelitian
Variabel penelitian yang
digunakan dalam penelitian ini meliputi
variabe respon (Y) dengan skala
nominal, 1 (melanjutkan kuliah) dan 0
(bekerja). Variabel prediktor terdiri atas:
1. Jenis kelamin(X 1), dengan
pengkodean:
0 untuk perempuan, 1 untuk laki-laki.
2. Pendapatan orang tua (X 2), dengan
pengkodean:
1 untuk pendapatan rendah (kurang
dari 1.500.000)
2 untuk pendapatan sedang
(1.500.000 – 2.500.000)
3 untuk pendapatan tinggi (diatas
2.500.000)
3. Tingkat pengetahuan mengenai
program BM(X 3), dengan
pengkodean:
1 untuk tingkat tinggi (sangat tahu,
Responden dikatakan sangat tahu
apabila mereka mengerti
persyaratan dan alur pendaftaran
peserta Bidik Misi).
2 untuk tingkat sedang ( tahu,
responden dikatakan tahu apabila
mereka hanya mengerti (pernah
mendengar) namun tidak tahu alur
pendaftarannya.)
3 untuk tingkat rendah (tidak tahu,
responden dikatakan tidak tahu
apabila mereka tidak mengeti
sedikitpun mengenai beasiswa
Bidik Misi)
C. Proses Analisis Data
Langkah-langkah analisis data
pada penelitian ini sebagai berikut:
1. Buka program SPSS, copy data
penelitian pada lembar data view.
2. Berikan keterangan variabel pada
lembar variabel view.
3. Klik analyze pilih regression,
lalu pilih binary logistic.
4. Masukkan variabel tak bebas
pada kolom dependent, lalu
variabel bebas masukkan pada
kolom covariates.
5. Pilih submenu categorical, lalu
masukkan variabel bebas bersifat
kategori pada kolom categorical
covariates. Lalu klik continue.
6. Pilih sub menu options, centang
pilihan Hosmer Lemeshow. Lalu
klik continue. Lalu klik ok.
HASIL DAN PEMBAHASAN
A. Identifikasi Responden
Data reponden hasil survey terhadap
siswa kelas 3 di SMA dan SMK
berstatus Negeri di Surabaya tahun 2015
sebanyak 150 respon mengenai keputusn
melanjutkan pendidikan atau tidakke
universitas diidentifikasi berdasarkan
jenis kelamin, pendapatan orang tua, dan
tingkat pengetahuan terhadap program
BM di jelaskan sebagai berikut:
Tabel 1. Deskripsi Responden
Berdasarkan Jenis kelamin
No Jenis
Kelamin
Jumlah Persentase
1. Laki- Laki 55 37 %
2. Perempuan 95 63 %
Total 150 100 %
Berdasarkan tabel dapat diketahui bahwa
mayoritas responden yang ikut
berpartisipasi dalam observasi ini adalah
perempuan. Dari 150 responden,
responden perempuan berjumlah 95
responden (63%) lebih besar dari jumlah
responden laki- laki dengan jumlah 55
responden atau 37%.
Tabel 2. Deskripsi Responden
Berdasarkan Tingkat Pendapatan Orang
Tua.
No Pendapatan
Orang TuaJumlah (%)
1. Rendah 38 25 %
2. Sedang 37 25 %
3. Tinggi 75 50 %Total 150 100 %
Berdasarkan tabel 2 diketahui bahwa
mayoritas responden yang ikut
berpartisipasi dalam observasi ini adalah
siswa yang memiliki orang tua dengan
pendapatan tinggi sebanyak 75 siswa
(50%) , disusul dengan siswa yang
memiliki orang tua dengan pendapatan
rendah dan sedang secara berturut- turut
sebesar 38 dan 37 siswa.
Tabel 3. Deskripsi Responden
Bedasarkan Tingkat Pengetahuan
No
Pengetahuan
mengenai
BM
Jumlah (%)
1. Tidak tahu 15 10 %
2. Tahu 88 59 %
3. Sangat tahu 47 31 %Total 150 100 %
Berdasarkan tabel dapat diketahui bahwa
mayoritas responden yang ikut
berpartisipasi dalam observasi ini adalah
siswa yang memiliki tingkat
pengetahuan program BM adalah sedang
(hanya sekedar tahu) sebanyak 88 siswa
(59%) , sedangkan siswa yang tingkat
pengetahuan program BM tinggi (sangat
tahu) dan rendah (tidak tahu) sebanyak
47 dan 15 siswa.
B. Analisis Regresi Logistik Biner
Analisis regresi logistik biner
dilakukan dengan melakukan estimasi
model logistik biner, uji kesesuaian
model, uji signifikasi secara simultan, uji
signifikasi secara parsial, koefisien
determinasi, penentuan nilai odds ratio ,
dan nilai APPER.
Estimasi Model Logistik Biner
Hasil regresi dengan menggunakan
program SPSS, didapatkan koefisien
regresi yang dapat dilihat pada tabel
berikut ini:
Tabel 4. Nilai Parameter Variabel
Prediktor
Variabel B
Jenis Kelamin(1) 2,701
Pendapatan(1) -1,568
Pendapatan(2) 1,225
Pengetahuan(1) -2,190
Pengetahuan(2) -0,423
Constant 0,748
Berdasarkan tabel 4 maka diperoleh
fungsi logit yaitu:g ( x )=0,748+2,701 X1−1,568 X2(1)
+1,225 X2 (2)−2,190 X3 (1 )
−0,423 X3 (2)
Sehingga diperoleh π1sebesar
¿e0,748+2,701 X1−1,568 X 2( 1)+1,225 X 2(2)−2,190 X3 (1)−0,423 X 3(2)
1+e0,748 +2,701 X 1−1,568 X 2(1)+1,225 X2 (2)−2,190 X 3(1)−0,423 X3 (2)
Uji Kesesuaian Model
Uji kesesuaian medel logistik biner
menggunakan uji Hosmer Lameshow
dengan hipotesis:
H 0 : model logistik biner sesuai
H 1: model logistik biner tidak sesuai
hasil uji kesesuaian dapat dilihat pada
tabel
Tabel 5. Hosmer and Lemeshow Test
Step Chi- Df Sig.
Square1 2,652 8 0,954
Berdasarkan tabel 5 diketahui nilai
Sig.sebesar 0,954 ¿α=5% , diperoleh
keputusan terima H 0 dan dapat ditarik
kesimpulan bahwa model logistik biner
sudah sesuai sehinga dapat dilakukan
pengujian lanjut mengenai model
lohistik biner yang diperoleh.
Uji Signifikasi secara Simultan
Uji signifikasi secara simultan pada
model logistik biner memiliki hipotesis :
H 0 : β1=β2=β3=0
H 1 : paling sedikit ada satu βk ≠ 0,
secara simultan, variabel
prediktor mempengaruhi
variabel respon.
Tabel 6. Omnibus Tests of
Model Coefficients
Chi-Square
Df Sig.
Step 62,542 5 0,000Block 62,542 5 0,000Model 62,542 5 0,000
Tabel 6 menunjukkan nilai Sig. sebesar
0,000 < α=5% , diperoleh keputusan
tolak H 0 dan dapat ditarik kesimpulan
bahwa secara simultan, nilai variabel
prediktor mempengaruhi nilai dari
variabel respon.
Uji Signifikasi secara Parsial
Uji signifikasi secara simultan pada
model logistik biner memiliki hipotesis :
H 0 : β j=0; j=1 , 2,3
H 1: β j≠ 0 , nilai variabel prediktor
ke j mempengarhi nilai variabel
respon.
j=1 untuk variabel prediktor jenis
kelamin.
j=2 untuk variabel prediktor tingkat
pendapatan orang tua siswa.
j=3 untuk variabel prediktor tingkat
pengetahuan siswa terkait
program BM.
Tabel 7. Nilai p value Setiap Variabel
Variabel Sig.Jenis Kelamin 0,000Pendapatan Orang Tua 0,002Pengetahuan Program BM 0,026
Tabel 7 menunjukkan nilai Sig. sebesar
0,000 (jenis kelamin), 0,002 (pendapatan
orang tua), dan 0,026 (pengetahuan
program BM) ¿α=5% , diperoleh
keputusan tolak H 0 untuk ketiga variabel
prediktor dan dapat ditarik kesimpulan
bahwa nilai dari masing-masing ketiga
variabel prediktor mempengaruhi nilai
variabel respon.
Koefisien Determinasi
Tabel 8. Koefisien Determinasi
(Nagelkerke R Square)
Step
-2 log likelihood
Cox & Snell
R Square
Nagelkerke R Square
1 105,051a 0,341 0,507Tabel 8 menjelaskan bahwa variabel
prediktor dalam penelitian ini yaitu
berupa jenis kelamin, tingkat pendapatan
oran tua, dan tingkat pengetahuan
mengenai program BM mampu
menjelaskan variabel respon sebesar
50,7 %, sedangkan sisanya sebesar
40,3% dijelaskan oleh variabel lain yang
tidak disebutkan dalam penelitian ini.
Odds Ratio
Nilai odds ratio pada masing-masing
variabel prediktor dapat dilihat pada
tabel berikut.
Tabel 9. Nilai Odds Ratio
Variabel Exp(β)
Jenis Kelamin(1) 14,899
Pendapatan(1) 0,208
Pendapatan(2) 3,404
Pengetahuan(1) 0,112
Pengetahuan(2) 0,655 Berdasarkan tabel diperoleh nilai odds
ratio dari masing – masing variabel
prediktor adalah sebagai berikut:
1. Murid SMA kelas 3 dengan jenis
kelamin laki-laki memiliki
kecenderungan memilih melanjutkan
pendidikan ke jenjang universitas
sebesar 14,899 kali daripada siswa
dengan jenis kelamin perempuan.
2. Siswa/siswi SMA kelas 3 yang
memiliki orang tua dengan
pendapatan menengah memiliki
kecenderungan untuk melanjutkan
pendidikan ke jenjang universitas
sebesar 0,208 kali daripada
siswa/siswi yang memiliki orang tua
dengan pendapatan rendah, atau
siswa/siswi yang memiliki orang tua
dengan pendapatan rendah memiliki
kecenderungan sebesar 40,7 kali
untuk melanjutkan pendidikan ke
jenjang universitas daripada yang
berasal dari keluarga dengan
pendapatan sedang. Hal tersebut
terjadi karena kemauan yang keras
dari siswa/siswi dari kalangan kurang
mampu untuk menjadikan pendidikan
sebagai pijakan memperoleh
kehidupan yang lebih baik di masa
yang akan datang.
3. Siswa/siswi SMA kelas 3 yang
memiliki orang tua dengan
pendapatan tinggi memiliki
kecenderungan untuk melanjutkan
pendidikan ke jenjang universitas
sebesar 3,404 kali daripada
siswa/siswi yang memiliki orang tua
dengan pendapatan rendah. Hal
tersebut terjadi karena mayoritas
orang tua dengan pendapatan tinggi
berada pada top manajemen
(mayoritas adalah orang dengan
pendidikan tinggi) dalam perusahaan,
dimana siswa/siswi tersebut akan
menjadikan pendidikan orang tuanya
sebagai tolak ukur keberhasilan
mereka di masa yang akan datang.
Odds ratio yang lebih tinggi juga
disebabkan dalam memilih keputusan
untuk melanjutkan pendidikan ke
jenjang universitas tidak terbebani
kendala biaya seperti pada
siswa/siswi dari keluarga dengan
pendapatan rendah.
4. Siswa/siswi SMA kelas 3 yang
memiliki pengetahuan sedang
mengenai program BM memiliki
kecenderungan untuk melanjutkan
pendidikan ke jenjang universitas
sebesar 0,112 kali daripada
siswa/siswi yang memiliki
pengetahuan tinggi mengenai
program BM atau siswa/siswi yang
memiliki pengetahuan tinggi
mengenai program BM memiliki
kecenderungan sebesar 8,92 kali
untuk melanjutkan pendidikan ke
jenjang universitas daripada yang
yang memiliki pengetahuan sedang.
Hal tersebut terjadi karena
siswa/siswi yang memiliki
pengetahuan tinggi mengenai
program BM sangat mengerti tata
cara pendaftaran sehingga mereka
dimudahkan dalam hal registrasi
peserta sedangkan siswa/siswi yang
memiliki pengetahuan sedang belum
mengerti secara menyeluruh
mengenai tata cara pendaftaran
sehingga mereka perlu bantuan dalam
hal registrasi.
5. Siswa/siswi SMA kelas 3 yang
memiliki pengetahuan rendah
mengenai program BM memiliki
kecenderungan untuk melanjutkan
pendidikan ke jenjang universitas
sebesar 0,665 kali daripada
siswa/siswi yang memiliki
pengetahuan tinggi mengenai
program BM atau siswa/siswi yang
memiliki pengetahuan tinggi
mengenai program BM memiliki
kecenderungan sebesar 1,5 kali untuk
melanjutkan pendidikan ke jenjang
universitas daripada yang yang
memiliki pengetahuan rendah. Hal
tersebut terjadi karena siswa/siswi
yang memiliki pengetahuan rendah
mengenai program BM mungkin
mendapatkan bantuan dari sekolah
dalam hal pendaftaran sehingga
mereka yang tidak mengerti apapun
mengenai BM sangat diuntungkan
dengan bantuan ini.
Error Rate (APPER)
Nilai APPER dalam pengklasifikasian
objek adalah sebagai berikut.
APPER = 15+7
22+15+7+106x100 %
= 14,7%
Atau berarti ketepatan pengklasifikasian
objek sebesar 85,3%.
Tabel 10. Tabel Ketepatan Klasifikasi
pilihan siswa
(%)
Kerja Kuliah
Pil
ihan
sis
wa
Kerja 22 15 59,5
Kuliah 7 106 93,8
total persentase
85,3
SIMPULAN
Berdasarkan hasil dan
pembahasan diatas, maka diperoleh
kesimpulan sebagai berikut.
1. Estimasi model logistik diperoleh
fungsi logit sebagai berikut:
g ( x )=0,748+2,701 X1−1,568 X2(1)+1,225 X2 (2)−2,190 X3(1)−0,423 X3(2)
2. Faktor-faktor yang berpengaruh
terhadap pilihan siswa
melanjutkan pendidikan setelah
lulus sekolah adalah jenis
kelamin, pendapatan orang tua
dan pengetahuan siswa tentang
program Bidik Misi.
SARAN
Pemerintah
Disarankan untuk Pemerintah Kota
Surabaya terutama Dinas Pendidikan
Kota Surabaya (Dispendik) untuk dapat
meningkatkan kualitas pendidikan ke
arah yang lebih baik dengan cara
sosialisasi kepada siswa mengenai
pentingnya pendidikan tinggi di era
globalisasi ini.
Civitas Akademik
Perlu menambah varibel- variabel
prediktor terkait keputusan seorang
siswa untuk memilih melanjutkan ke
jenjang pendidikan universitas atau
bekerja untuk memberbesar nilai
koefisien determinasi pada penelitian
yang akan datang.