Upload
others
View
21
Download
5
Embed Size (px)
Citation preview
REGRESI LOGISTIK ORDINAL
BAB I
PENDAHULUAN
Seiring dengan perkembangan zaman, era reformasi terus bergulir
beriringan dengan waktu yang terus berlalu. Perkembangan ilmu pengetahuan dan
teknologi semakin maju. Salah satu ilmu pengetahuan yang berkembang adalah
statistika yang tanpa disadari dalam kehidupan sehari-hari sesungguhnya telah
banyak digunakan walaupun dalam bentuk yang sangat sederhana baik di rumah, di
kantor, maupun di tempat lain. Statistika adalah pengetahuan yang berkaitan
dengan metode, teknik, atau cara untuk mengumpulkan data, mengolah data,
menganalisis data, dan menarik kesimpulan atau menginterpretasikan data.
Statistika memegang peranan yang penting pada aspek perencanaan dalam
mengambil suatu keputusan dan membantu peneliti dari berbagai disiplin ilmu
untuk merancang studi, mengumpulkan dan mengolah data serta menarik
kesimpulan berdasarkan hasil studinya. Statistika berkembang dengan pesat, salah
satunya adalah analisis regresi yaitu analisis yang berkaitan dengan hubungan antar
variabel.
Analisis regresi merupakan salah satu analisis yang digunakan untuk
mengetahui hubungan antara variabel respon atau biasa disebut dengan variabel
dependen terhadap satu atau lebih variabel prediktor atau variabel independen
(bebas). Atau dengan kata lain, metode regresi merupakan analisis data yang
mendeskripsikan antara sebuah variabel respon dan satu atau lebih variabel penjelas
(Homes dan Lemeshow, 2000).
Untuk beberapa kasus yang biasanya terjadi dalam kehidupan ini, tidak serta
merta dapat dimodelkan atau dapat langsung dianalisis dengan analisis regresi
linear sederhana. Berbagai cara pemodelan yang dapat digunakan dalam analisis
regresi namun penggunaan terhadap suatu data haruslah sesuai dengan kasus yang
diperoleh sehingga dalam penginterpretasian model dapat mewakili data yang
diperoleh tersebut.
Umumnya, banyak penelitian yang menggunakan analisis regresi dalam
penelitiannya. Biasanya dengan variabel dependen yang merupakan skala kontinyu
ataupun rasio. Dalam penyusunan instrument penelitian, harus mengetahui dan
paham tentang jenis skala pengukuran agar instrumen bisa diukur sesuai apa yang
hendak diukur dan bisa dipercaya.
Maksud dari skala pengukuran ini untuk mengklasifikasikan variabel yang
akan diukur supaya tidak terjadi kesalahan dalam menentukan analisis data dan
langkah penelitian selanjutnya. Jenis-jenis skala pengukuran ada empat yaitu skala
nominal, skala interval, skala ordinal, dan skala rasio (Riduwan dan Akdon, 2010).
Dalam regresi, apabila pada variabel respon tersebut menggunakan skala
nominal atau ordinal maka analisis regresi tersebut yang dikenal sebagai analisis
regresi logistik. Tergantung bagaimana dan berapa jenis kategorik yang digunakan.
Berdasarkan jenis skala data variabel respon yang digunakan dibagi menjadi 3
macam yaitu regresi logistik biner, regresi logistik multinomial, dan regresi logistik
ordinal (Wulandari, dkk. 2009).
Regresi logistik adalah regresi dimana variabel terikatnya adalah dummy
yaitu 1 dan 0. Analisis regresi ordinal merupakan suatu analisis atau metode
statistika untuk menganalisis variabel respon yang mempunyai skala data ordinal
yang terdiri dari tiga kategorik atau lebih. Variable prediktor yang digunakan dalam
model berupa data kategorik atau data kontinyu.
Menurut Hosmer dan Lemeshow (2000), salah satu metode regresi yang
tepat digunakan untuk variabel respon berskala ordinal yaitu regresi logistik
ordinal. Banyak penelitian yang menggunakan metode regresi logistik ordinal yang
menghubungkan antara variabel respon berskala ordinal dengan variabel prediktor
yang berupa data kategorik atau kuantitatif.
Berdasarkan penjabaran yang telah dijelaskan, terdapat berbagai contoh
data yang telah diteliti sebelumnya. Penelitian semacam ini dimaksudkan guna
memperoleh kisaran kesuksesan dan kegagalan suatu terapan data dengan
menggunakan regresi logistik ordinal tersebut. Penerapan yang biasa kita temui
dalam lingkungan keseharian meliputi pengkategorian suatu data terhadap apa yang
akan diteliti. Salah satu penerapannya yaitu pada bidang pendidikan.
Dalam rangka mewujudkan tujuan nasional di bidang pendidikan maka
pemerintah berupaya meningkatkan kualitas pendidikan dengan mengeluarkan PP
No.19 Tahun 2005, tentang Standar Nasional Pendidikan (SNP) diantaranya yaitu
sistem evaluasi. yaitu mencakup pencapaian Standar Kompetensi Lulusan (SKL).
Pencapaian Standar Kompetensi Lulusan (SKL) dapat diukur dengan nilai
ujian nasional. Hal ini sesuai dengan Peraturan Menteri Pendidikan nomor 34
tahun 2007, bahwa ujian nasional adalah kegiatan pengukuran dan penilaian
kompetensi peserta didik secara nasional untuk jenjang pendidikan dasar dan
menengah yang bertujuan untuk menilai pencapaian kompetensi lulusan secara
nasional pada mata pelajaran yang ditentukan dari kelompok mata pelajaran ilmu
pengetahuan dan teknologi, dalam rangka pencapaian standar nasional. Hasil ujian
nasional digunakan sebagai salah satu pertimbangan untuk penentuan kelulusan
peserta didik dari suatu satuan pendidikan, seleksi masuk jenjang pendidikan
berikutnya, pemetaan mutu satuan atau program pendidikan, akreditasi satuan
pendidikan serta pembi-naan dan pemberian bantuan kepada satuan pendidikan
dalam upaya pening-katan mutu pendidikan.
BAB II
TINJAUAN PUSTAKA
2.1 Regresi Logistik Ordinal
Regresi logistik digunakan jika variabel terikatnya Y berupa variabel
kategori klasifikasi. Perbedaan antara regresi linear dengan regresi logistik adalah
jika regresi linear merupakan suatu metode statistik yang menganalisis hubungan
antara variabel respon dengan variabel prediktor. Selain itu, variabel responnya
berskala interval atau rasio. Persamaan umumnya adalah sebagai berikut:
xY (2.1)
Di mana errornya berdistribusi normal dengan meannya nol dan variansinya
konstan. Sedangkan regresi logistik merupakan suatu metode statistik yang
bertujuan menganalisis variabel respon untuk memperoleh hubungan antara
variabel prediktor dengan probabilitas dari suatu kejadian yang diakibatkan oleh
variabel prediktor. Variabel responnya biasanya berskala ordinal atau nominal,
sedangkan variabel prediktornya bisa diskrit atau kontinyu.
Regresi logistik untuk respon berskala nominal dapat dibedakan menjadi
dua, yaitu regresi logistik biner (binary logistic regression) dan regresi logistik
multinomial (multinomial logistic regression). Regresi logistik biner digunakan
ketika hanya ada dua kemungkinan variabel respon Y , misal membeli dan tidak
membeli. Sedangkan regresi logistik multinomial digunakan ketika pada variabel
respon Y terdapat lebih dari dua kategori.
Model logit kumulatif pertama kali diperkenalkan oleh Walker dan Duncan
(1967) dan kemudian disebut model odds proporsional (proportional odds model)
oleh McCullagh (1980). Jika variabel prediktor 𝒙 = (𝑥1 𝑥2 ⋯ 𝑥𝑝)𝑇, maka peluang
kumulatif logit didefinisikan (Agresti, 2002) sebagai
𝑃(𝑌 ≤ �⃓�𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥), 𝑗 = 1, 2, ⋯ , 𝐽
Kumulatif logit didefinisikan sebagai
𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ �⃓�𝑥) = ln [𝑃(𝑌 ≤ �⃓�𝑥)
1 − 𝑃(𝑌 ≤ �⃓�𝑥)] = ln [
𝑃(𝑌 ≤ �⃓�𝑥)
𝑃(𝑌 > �⃓�𝑥)]
= ln [𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥)
𝜋𝑗=1(𝑥) + 𝜋𝑗=2(𝑥) + ⋯ + 𝜋𝑗(𝑥)] , 𝑗 = 1, 2, ⋯ , 𝐽
Anggap suatu variabel respon multinomial Y dengan keluaran kategori yang
dinyatakan oleh 1,2,...,J dan misalkan x menyatakan suatu vektor kovariat
berdimensi p. Dependensi peluang kumulatif Y terhadap x untuk model
proportional odds sering dinyatakan dalam bentuk
ln [𝑃(𝑌 ≤ �⃓�𝑥)
𝑃(𝑌 > �⃓�𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1
Persamaan di atas dapat diubah dalam bentuk
ln [𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥)
𝜋𝑗=1(𝑥) + 𝜋𝑗=2(𝑥) + ⋯ + 𝜋𝑗(𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1
Model yang secara simultan menggunakan semua kumulatif logit (Agresti, 2002)
adalah
𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ �⃓�𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1
𝛾𝑗(𝑥) = 𝑃(𝑌 ≤ �⃓�𝑥) merupakan peluang kumulatif dari kejadian (𝑌 ≤ 𝑗).
{𝛽01 , 𝛽02, ⋯ , 𝛽0𝐽−1 } meruapakan parameter intersep yang tidak diketahui yang
memenuhi kondisi 𝛽01 ≤ 𝛽02 ≤ ⋯ ≤ 𝛽0𝐽−1 dan 𝜷 = (𝛽1, 𝛽2, ⋯ , 𝛽𝑝)𝑇merupakan
vektor koefisien regresi yang tidak diketahui yang bersesuaian dengan x.
Jika 𝛾𝑗(𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥) maka 𝛾1(𝑥) = 𝜋1(𝑥), 𝛾2(𝑥) =
𝜋1(𝑥) + 𝜋2(𝑥) dan 𝛾𝐽(𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝐽(𝑥) = 1. Model regresi
logistik ordinal yang terbentuk jika terdapat J kategori respon adalah
𝑙𝑜𝑔𝑖𝑡 𝛾1(𝑥) = ln [ 𝛾1(𝑥)
1 − 𝛾1(𝑥)] = 𝛽01 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝
𝑙𝑜𝑔𝑖𝑡 𝛾2(𝑥) = ln [ 𝛾2(𝑥)
1 − 𝛾2(𝑥)] = 𝛽02 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝
⋮
𝑙𝑜𝑔𝑖𝑡 𝛾𝐽−1(𝑥) = ln [ 𝛾𝐽−1(𝑥)
1 − 𝛾𝐽−1(𝑥)] = 𝛽0,𝐽−1 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝
dimana 𝛾𝑗(𝑥) = 𝑃(𝑌 ≤ �⃓�𝑥) =exp(𝛽0𝑗+ 𝛽𝑇𝑥)
1− exp(𝛽0𝑗+ 𝛽𝑇𝑥), 𝑗 = 1, 2, ⋯ , 𝐽 − 1 𝑑𝑎𝑛 𝛾𝑗(𝑥) = 1
Model ini disebut model logistik kumulatif karena rasio odds dari suatu kejadian
(𝑌 ≤ 𝑗) adalah independen pada setiap indikator kategori.
Selanjutnya untuk mendapatkan pendugaan parameter regresi logistik
ordinal dapat diperoleh dengan menggunakan metode pendugaan maximum
likelihood estimation ( MLE). Metode MLE dipilih karena mempunyai beberapa
kelebihan dibandingkan dengan metode lain, diantaranya dapat digunakan untuk
model tidak linier seperti regresi logistik, serta hasil penaksirannya unbiased
(Hosmer dan Lemeshow, 2000).
Pendugaan parameter regresi logistik ordinal didapatkan dengan
menurunkan fungsi log likelihood terhadap parameter yang akan diestimasi dan
disamakan dengan nol. Persamaan 𝜕 𝐿(𝛽)
𝜕 𝛽𝑘= 0 digunakan untuk menaksir intersep
parameter 𝛽𝑘 dimana 𝑘 = 1, 2, ⋯ , 𝑝 dan 𝜕 𝐿(𝛽)
𝜕 𝛽0𝑗= 0 dipergunakan untuk menaksir
intersep 𝜃𝑗 𝑑𝑖𝑚𝑎𝑛𝑎 𝑗 = 1, 2, ⋯ , 𝐽 − 1.
Hasil dari persamaan 𝜕 𝐿(𝛽)
𝜕 𝛽𝑘= 0 dan
𝜕 𝐿(𝛽)
𝜕 𝛽0𝑗= 0 merupakan fungsi nonlinear
sehingga diperlukan metode iterasi untuk memperoleh estimasi parameternya.
Metode iterasi yang dipergunakan adalah metode iterative Weighted Least Square
(WLS) yaitu algoritma Newton-Raphson. Iterasi akan berhenti jika terpenuhi
kondisi konvergen, yaitu selisih ‖𝛽(𝑡+1) − 𝛽𝑡‖ ≤ 𝜀, dimana 𝜀 adalah bilangan
yang sangat kecil.
2.2. Odds Ratio
Odds ratio ( ) adalah ukuran asosiasi yang menggambarkan seberapa
besar kemungkinan untuk income itu terjadi. Odds ratio digunakan untuk
interpetasi parameter, bertujuan untuk menentukan hubungan fungsional antara
variabel prediktor dangan variabel respon dan menentukan unit perubahan dalam
variabel prediktor, interpertasi model logit tergantung pada jenis variabel
prediktornya. Interpertasi dari model diskrit adalah sebagai berikut (Hosmer and
Lemeshow, 1989).
a. Variabel Prediktor Dikatomus
Variabel prediktor dengan dua kategori yang dinotasikan dengan kategori X2 dan
X1 disebut variabel prediktor dikatomus, pada variabel prediktor kategori X2
dibandingkan dengan kategori X1 dirumuskan sebagai berikut.
1
1
2
2
)(
/(
/(
/(
/(
12
xXjYP
xXjYP
xXjYP
xXjYP
XX
= exp 121( xx
Log dari odds ratio adalah sebagai berikut.
ln )( expln; 12112 xxxx = 121 xx
Interpertasi persamaan adalah jika suatu respon yang jatuh pada kategori lebih kecil
atau sama dengan j dibandingkan dengan respon yang jatuh pada kategori j+1 untuk
X=x2 adalah sebesar 121 xx kali dari X=x1.
b. Variabel Prediktor Polikatomus
Variabel prediktor dengan kategori lebih dari dua disebut variabel prediktor
polikatomus, seperti halnya pada variabel prediktor dikatomus nilai odds ratio salah
satu kategori dijadadikan pembanding. Perhitungan dan interpertasinya sama
dengan variabel dikatomus.
c. Variabel Prediktor Kontinyu
Interpertasi dari variabel kontinyu secara matematis dapat dituliskan sebagai
berikut.
xxg 10)(
dimana
)()1(1 xgxg dan )()(1 xgsxgs .
Berdasarkan bentuk matematis maka perubahan satu unit pada variabel
prediktor akan memberikan perubahan pada g(x) sebesar 𝛽1, apabila pada variabel
prediktor terjadi perubahan sebesar s unit akan memberikan perubahan pada g(x)
sebesar s1 .
Model logistik ordinal yang telah diperoleh perlu diuji kesesuaiannya.
Pengujian yang dilakukan adalah sebagai berikut.
Uji Univariabel (Parsial)
Hipotesis pengujian ini adalah
𝐻𝑜 ∶ 𝛽𝑘 = 0
𝐻1 ∶ 𝛽𝑘 ≠ 0 , 𝑘 = 1, 2, ⋯ , 𝑝
Statistik uji yang digunakan adalah statistik Wald : 𝑊𝑘2 = (
𝛽�̂�
𝑆𝐸(𝛽�̂�)
2
Daerah penolakan;
𝐻𝑜 ditolak bila 𝑊𝑘2 > 𝜒(𝛼,1)
2 atau p-value kurang dari α
Uji Multivariabel (Serentak)
Hipotesis pengujian ini adalah
𝐻𝑜 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝 = 0
𝐻1 ∶ 𝑃𝑎𝑙𝑖𝑛𝑔 𝑠𝑒𝑑𝑖𝑘𝑖𝑡 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑘 ≠ 0, 𝑘 = 1, 2, ⋯ , 𝑝
Statistik uji yang digunakan statistik uji 𝐺2 atau Likelihood Ratio Test;
𝐺 = −2 ln (ℓ0
ℓ1) = −2 (𝐿0 − 𝐿1)
Dimana ℓ0 = nilai yang dimaksimalkan dari fungsi likelihood di bawah 𝐻0
ℓ1 = nilai yang dimaksimalkan secara keseluruhan (𝐻0 ∪ 𝐻1)
Daerah penolakan;
𝐻0 ditolak bila 𝐺 > 𝜒(𝛼,𝑝)2 dimana p menunjukkan nilai variabel random pada tabel
distribusi chi-square pada derajat bebas p.
Uji Kesesuaian Model
Setelah dilakukan pengujian parameter secara serentak dan parsial, selanjutnya
dilakukan pengujian terhadap kebaikan model yang telah dibentuk. Hipotesis yang
digunakan sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)
α = 5%
Statistik uji Deviance:
𝐷 = −2 ∑ [𝑦𝑖𝑗 ln (�̂�𝑖𝑗
𝑦𝑖𝑗) + (1 − 𝑦𝑖𝑗) ln (
1 − �̂�𝑖𝑗
1 − 𝑦𝑖𝑗)]
𝑛
𝑖=1
Tolak H0 jika p-value kurang dari α.
Uji Parallel Lines
Pada saat membuat model regresi logistik ordinal, diasumsikan bahwa
hubungan antara variabel independen dengan logit adalah sama untuk semua logit.
Ini berarti bahwa hasil model berupa sebuah garis paralel untuk setiap kategori
variabel respon. Untuk membuktikannya dapat menggunakan Test of parallel lines,
dimana uji tersebut digunakan untuk membuktikan terpenuhinya asumsi bahwa
setiap kategori memiliki hubungan antara variabel independen dengan logit yang
sama untuk semua persamaan logit. Jika nilai signifikansi > α, maka hasil
menyatakan bahwa model yang dihasilkan memiliki parameter yang sama sehingga
pemilihan model link function logit adalah sesuai. Namun jika nilai signifikansi
kurang dari α maka pemilihan link function logit tidak tepat dan analisis pada data
cukup menggunakan regresi logistik multinomial.
Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,
pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.
H0 : hubungan antara variabel independen dengan logit sama untuk semua
persamaan logit
H1 : hubungan antara variabel independen dengan logit tidak sama untuk semua
persamaan logit
α = 5%
Kekuatan Asosiasi
Ada beberapa R2 yang dapat digunakan untuk mengukur kekuatan asosiasi
antara variabel dependen dengan variabel prediktor. R2 yang dimaksud disini tidak
sepenting pada regresi biasa, karena interpretasi R2 pada regresi logistik tidak kaku
seperti pada regresi biasa. Pengukuran kekuatan asosiasi pada pembahasan ini
menggunakan 3 metode, yaitu sebagai berikut.
1. Cox danSnell R2
𝑅𝐶𝑆2 = 1 − (
𝐿(𝑩(0))
𝐿(�̂�))
2𝑛
2. Nagelkerke’s R2
𝑅𝑁2 =
𝑅𝐶𝑆2
1 − 𝐿(𝐵(0))2𝑛
3. McFadden’s R2
𝑅𝐶𝑆2 = 1 − (
𝐿(�̂�)
𝐿(𝑩(0)))
Dimana
𝐿(�̂� ) : fungsi log-likelihood model dengan estimasi parameter.
𝐿(𝑩(0)) : fungsi log-likelihood dengan hanya memuat thresholds.
n : banyaknya kasus
Pengujian Signifikansi Hasil Pendugaan Parameter
Pengujian terhadap parameter model dilakukan untuk memeriksa pengaruh dari
variabel prediktor terhadap respon. Pengujian dilakukan dengan menggunakan
statistik uji Wald (Hosmer dan Lemeshow, 1989:20).
Hipotesis dari pengujian ini adalah :
0:0 cH
:1H paling sedikit ada satu pcc ,...,2,1,0
Statistik ujinya : c
c
SEW
ˆ
ˆ
Statistik uji Wald untuk jumlah sampel besar mengikuti distribusi normal
standart dengan mean 0 dan varians 1. Jika uji Wald ini dikuadratkan, maka akan
didapatkan uji 2W yang mengikuti distribusi Chi-Square dengan derajat bebas 1
untuk sampel besar juga (Hosmer dan Lemeshow, 1989:21).
Daerah penolakannya adalah jika 2
aZW atau jika dapat pula dilihat dari nilai p,
bila nilai P yang ditetapkan maka tolak 0H .
BAB III
STUDI KASUS
Data yang digunakan dalam tugas ini adalah data dari tesis Jumaidin yang
berjudul “FAKTOR-FAKTOR YANG MEMPENGARUHI NILAI UNAS
DENGAN ANALISIS REGRESI LOGISTIK ORDINAL DAN REGRESI
PROBIT ORDINAL (Studi Kasus: Nilai UNAS SMA Negeri 2 Amahai
Kabupaten Maluku Tengah)” yang merupakan data sekunder pada tahun
pembelajaran 2007/2008 yang terdiri:
1. Jurusan Ilmu Pengetahuan Alam (IPA) sebanyak 19 orang
2. Jurusan ilmu Pengetahuan Sosial (IPS) sebanyak 42 orang
Variabel Respon (Y) adalah nilai UNAS SMA dengan tiga kategori yaitu
UNAS 65 Cukup (0), 65 <UNAS < 75 Baik (1) dan UNAS 75 amat baik
(2), hal ini sesuai dengan pengkategorian rata-rata nilai UNAS tiap mata pelajaran
oleh Dinas Pendidikan Propinsi Maluku. Adapun variabel-variabel yang diduga
mempengaruhi probabilitas seorang siswa bernilai kategori cukup, baik dan amat
baik adalah rata-rata nilai UNAS SMP (X1), rata-rata nilai UAS (X2), rata-rata nilai
tryout (X3), rata-rata nilai raport SMA (X4), pendapatan orang tua (X5), jumlah
saudara (X6) dan jurusan yang diambil siswa (X7).
Metode yang digunakan dalam penelitian ini untuk mencapai tujuan
penelitian adalah mengkategorikan variabel respon dengan tiga kategori yaitu Y =
0, Y = 1 dan Y = 2, membuat model regresi logistik ordinal untuk mengetahui ada
tidaknya pengaruh dari setiap variabel bebas terhadap variabel respon.
BAB IV
PEMBAHASAN
Statistika Deskriptif dan Estimasi Parameter
Nilai UNAS SMA Negeri 2 Amahai dibedakan menjadi tiga predikat
(kategori) diantaranya cukup baik (y = 0), baik (y = 1) dan sangat baik (y = 2). Dari
61 siswa, 9,8 persen memiliki nilai UNAS yang sangat baik dan 47,6 persen
terbilang baik, sedangkan sisanya yaitu sebesar 42,6 persen menyandang predikat
cukup baik. Secara ringkas, informasi responden tersebut ditunjukkan pada Gambar
1.
Gambar 1. Informasi Responden Berdasarkan Nilai UNAS
Dalam setiap analisis regresi, penentuan variabel prediktor yang memiliki
pengaruh signifikan terhadap variabel respon sangat perlu untuk diketahui, yaitu
dengan cara meregresikannya kemudian dilakukan pengujian. Adapun model
regresi logistik ordinal yang terbentuk adalah sebagai berikut.
)0(1,347X-X22,1
X803,00,877X-1,695X -13,169XX909,02304.0611
log)(
)0(1,347-X22,1
X803,00,877X-1,695X -13,169XX909,02274.621
log)(
76
54321
2
22
76
54321
1
11
Logit
Logit
Ketujuh variabel dalam model logit tersebut kemudian dilakukan pengujian
kebermaknaan atau uji signifikansi untuk diketahui apakah variabel-variabel
Cukup Baik43%
Baik47%
Amat Baik10%
tersebut memiliki pengaruh signifikan terhadap nilai UNAS di SMAN 2 Amahai.
Pengujian dilakukan secara serentak dan kemudian secara parsial. Hipotesis dalam
pengujian serentak pada kasus ini diantaranya sebagai berikut.
H0 : β1 = β2 =... = β7 = 0
H1 : paling sedikit ada satu 0k , dimana k=1,2,…,7
Tabel 1 Pengujian Signifikansi Variabel Prediktor Terhadap Respon Secara Serentak
Model -2 Log
Likelihood Chi-Square df Sig.
Intercept Only 115,301
Final 0 115,301 7 0,000
Berdasarkan Tabel 1, diperoleh penurunan nilai chi-square sebesar 115,301
dan signifikan pada taraf nyata 5%. Hal ini berarti bahwa terjadi tolak H0 atau
terdapat paling sedikit satu variabel yang berpengaruh signifikan terhadap nilai
UNAS. Untuk mengetahui variabel mana saja yang memiliki pengaruh bila
dimodelkan secara bersama, maka perlu dilakukan uji signifikansi secara parsial.
Statistik uji yang digunakan adalah uji Wald dan hipotesis yang diberikan adalah
sebagai berikut.
H0 : βk = 0, dimana k = 1,2,…,7
H1 : βk ≠ 0
Hasil pengujian signifikansi secara parsial yang ditampilkan pada Tabel 2
menunjukkan bahwa pada taraf kepercayaan 95%, terdapat beberapa variabel yang
tidak berpengaruh parsial terhadap nilai UNAS di SMA Negeri 2 Amahai. Hal ini
ditunjukkan dari nilai p-valuenya yang lebih besar dari taraf nyata 5% atau nilai uji
Wald lebih kecil dari 𝑋1,0.052
= 3,841. Sedangkan variabel yang memiliki pengaruh
parsial terhadap nilai UNAS SMA 2 Amahai diantaranya adalah nilai UNAS SMP
(X1), nilai UAS SMA (X2) dan nilai raport (X4) , karena nilai p-value lebih kecil
dari 5%.
Tabel 2 Pengujian Signifikansi Variabel Prediktor terhadap Variabel Respon Secara Parsial
Variabel Estimasi
Parameter
Std.
Eror
Nilai Uji
Wald P-Value Keputusan
Nilai UNAS SMP (X1) 20,909 8,601 5,910 0,015 Signifikan
Nilai UAS SMA (X2) 13,169 5,847 5,072 0,024 Signifikan
Nilai tryout (X3) -1,695 1,620 1,095 0,295 Tidak Signifikan
Nilai raport (X4) 0,877 0,371 5,598 0,018 Signifikan
Pendapatan ortu (X5) -3,803 2,830 1,806 0,179 Tidak Signifikan
Jumlah keluarga (X6) 0,122 0,303 0,164 0,686 Tidak Signifikan
Jurusan (X7=0) -1,347 1,906 0,500 0,480 Tidak Signifikan 0
Uji Kesesuaian Model
Setelah dilakukan pengujian parameter secara serentak maupun parsial,
selanjutnya dilakukan pengujian terhadap kebaikan model yang telah dibentuk.
Konsep pengujian ini didasarkan pada perbandingan antara hasil prediksi dengan
kenyataannya. Pengujian dilakukan dengan menggunakan statistik uji deviance
dengan α = 5%, dimana hipotesis yang digunakan sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)
Tolak H0 jika p-value kurang dari α.
Tabel 3 Uji Kesesuaian Model dengan Metode Deviance
𝜒2 Derajat bebas p-value
Deviance 19,404 113 1.000
Berdasarkan Tabel 3, maka keputusan yang diambil adalah terima H0, dan
menunjukkan bahwa model yang terbentuk sesuai. Hal ini berarti bahwa tidak ada
perbedaan antara hasil observasi dengan hasil prediksi.
Uji Parallel Lines
Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,
pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.
H0 : hubungan antara variabel independen dengan logit sama untuk semua
persamaan logit
H1 : hubungan antara variabel independen dengan logit ada yang tidak sama pada
persamaan logit
α = 5%
Hasil pengujian ditampilkan pada Tabel 4 berikut ini.
Tabel 4 Uji Kesesuaian Model dengan Metode Deviance
𝜒2 Derajat bebas p-value
0 7 1.000
Berdasarkan Tabel 4, maka keputusan yang diambil adalah terima H0. Ini
berarti bahwa pemilihan model link function logit sudah sesuai karena memenuhi
asumsi setiap kategori memiliki hubungan antara variabel independen dengan logit
sama untuk semua persamaan logit.
Kekuatan Asosiasi
Adapun pengukuran kekuatan asosiasi dari model yang sudah terbentuk
adalah seperti pada Tabel 5 berikut ini.
Tabel 5 Kekuatan Asosiasi
R2
Cox and Snell 0,849
Nagelkerke 1,000
McFadden 1,000
Berdasarkan Tabel 5, nilai R2 (kekuatan asosiasi) dari berbagai metode
bernilai cukup besar, dengan nilai sebesar 0,849 untuk metode Cox dan Snell, dan
sebesar 1 untuk metode Nagelkerke dan McFadden. Ini menunjukkan bahwa
hubungan variabel dependen dan variabel prediktor cukup erat.
Ketepatan Klasifikasi
Berdasarkan model regresi logistik ordinal yang telah terbentuk, diperoleh
ketepatan klasifikasi yang ditampilkan pada Tabel 6 berikut ini.
Tabel 6 Ketepatan Klasifikasi
Observasi
Prediksi
Total
Ketepatan
Klasifikasi Relatif (%)
Cukup
baik
(Y=0)
Baik
(Y=1)
Sangat
baik
(Y=2)
Kategori Nilai
UNAS
Cukup baik
(Y=0) 24 2 0 26 92.31%
Baik
(Y=1) 2 26 1 29 89.66%
Sangat
baik
(Y=2) 0 0 6 6 100.00%
Total 27 26 28 7
Ketepatan Klasifikasi Keseluruhan 90.80%
Tabel 6 menunjukkan bahwa ketepatan klasifikasi dari model adalah sebesar
90,80%. Ketepatan klasifikasi tersebut cukup tinggi, yang menunjukkan bahwa
model regresi ordinal yang terbentuk tepat dalam memprediksi observasi.
BAB V
KESIMPULAN
Berdasarkan uraian pembahasan sebelumnya, didapatkan model regresi
logistik ordinal sebagai berikut.
)0(1,347X-X22,1X803,0
0,877X-1,695X -13,169XX909,02304.0611
log)(
)0(1,347-X22,1X803,0
0,877X-1,695X -13,169XX909,02274.621
log)(
765
4321
2
22
765
4321
1
11
Logit
Logit
Secara serentak, kesimpulan yang didapatkan adalah sedikitnya terdapat
satu variabel yang signifikan terhadap model. Adapun secara parsial, variabel yang
signifikan pengaruhnya terhadap model regresi logistik ordinal adalah variabel X1,
X2, dan X4.
LAMPIRAN