REGRESI LOGISTIK ORDINAL - himasta.unimus.ac.id

REGRESI LOGISTIK ORDINAL

BAB I

PENDAHULUAN

Seiring dengan perkembangan zaman, era reformasi terus bergulir

beriringan dengan waktu yang terus berlalu. Perkembangan ilmu pengetahuan dan

teknologi semakin maju. Salah satu ilmu pengetahuan yang berkembang adalah

statistika yang tanpa disadari dalam kehidupan sehari-hari sesungguhnya telah

banyak digunakan walaupun dalam bentuk yang sangat sederhana baik di rumah, di

kantor, maupun di tempat lain. Statistika adalah pengetahuan yang berkaitan

dengan metode, teknik, atau cara untuk mengumpulkan data, mengolah data,

menganalisis data, dan menarik kesimpulan atau menginterpretasikan data.

Statistika memegang peranan yang penting pada aspek perencanaan dalam

mengambil suatu keputusan dan membantu peneliti dari berbagai disiplin ilmu

untuk merancang studi, mengumpulkan dan mengolah data serta menarik

kesimpulan berdasarkan hasil studinya. Statistika berkembang dengan pesat, salah

satunya adalah analisis regresi yaitu analisis yang berkaitan dengan hubungan antar

variabel.

Analisis regresi merupakan salah satu analisis yang digunakan untuk

mengetahui hubungan antara variabel respon atau biasa disebut dengan variabel

dependen terhadap satu atau lebih variabel prediktor atau variabel independen

(bebas). Atau dengan kata lain, metode regresi merupakan analisis data yang

mendeskripsikan antara sebuah variabel respon dan satu atau lebih variabel penjelas

(Homes dan Lemeshow, 2000).

Untuk beberapa kasus yang biasanya terjadi dalam kehidupan ini, tidak serta

merta dapat dimodelkan atau dapat langsung dianalisis dengan analisis regresi

linear sederhana. Berbagai cara pemodelan yang dapat digunakan dalam analisis

regresi namun penggunaan terhadap suatu data haruslah sesuai dengan kasus yang

diperoleh sehingga dalam penginterpretasian model dapat mewakili data yang

diperoleh tersebut.

Umumnya, banyak penelitian yang menggunakan analisis regresi dalam

penelitiannya. Biasanya dengan variabel dependen yang merupakan skala kontinyu

ataupun rasio. Dalam penyusunan instrument penelitian, harus mengetahui dan

paham tentang jenis skala pengukuran agar instrumen bisa diukur sesuai apa yang

hendak diukur dan bisa dipercaya.

Maksud dari skala pengukuran ini untuk mengklasifikasikan variabel yang

akan diukur supaya tidak terjadi kesalahan dalam menentukan analisis data dan

langkah penelitian selanjutnya. Jenis-jenis skala pengukuran ada empat yaitu skala

nominal, skala interval, skala ordinal, dan skala rasio (Riduwan dan Akdon, 2010).

Dalam regresi, apabila pada variabel respon tersebut menggunakan skala

nominal atau ordinal maka analisis regresi tersebut yang dikenal sebagai analisis

regresi logistik. Tergantung bagaimana dan berapa jenis kategorik yang digunakan.

Berdasarkan jenis skala data variabel respon yang digunakan dibagi menjadi 3

macam yaitu regresi logistik biner, regresi logistik multinomial, dan regresi logistik

ordinal (Wulandari, dkk. 2009).

Regresi logistik adalah regresi dimana variabel terikatnya adalah dummy

yaitu 1 dan 0. Analisis regresi ordinal merupakan suatu analisis atau metode

statistika untuk menganalisis variabel respon yang mempunyai skala data ordinal

yang terdiri dari tiga kategorik atau lebih. Variable prediktor yang digunakan dalam

model berupa data kategorik atau data kontinyu.

Menurut Hosmer dan Lemeshow (2000), salah satu metode regresi yang

tepat digunakan untuk variabel respon berskala ordinal yaitu regresi logistik

ordinal. Banyak penelitian yang menggunakan metode regresi logistik ordinal yang

menghubungkan antara variabel respon berskala ordinal dengan variabel prediktor

yang berupa data kategorik atau kuantitatif.

Berdasarkan penjabaran yang telah dijelaskan, terdapat berbagai contoh

data yang telah diteliti sebelumnya. Penelitian semacam ini dimaksudkan guna

memperoleh kisaran kesuksesan dan kegagalan suatu terapan data dengan

menggunakan regresi logistik ordinal tersebut. Penerapan yang biasa kita temui

dalam lingkungan keseharian meliputi pengkategorian suatu data terhadap apa yang

akan diteliti. Salah satu penerapannya yaitu pada bidang pendidikan.

Dalam rangka mewujudkan tujuan nasional di bidang pendidikan maka

pemerintah berupaya meningkatkan kualitas pendidikan dengan mengeluarkan PP

No.19 Tahun 2005, tentang Standar Nasional Pendidikan (SNP) diantaranya yaitu

sistem evaluasi. yaitu mencakup pencapaian Standar Kompetensi Lulusan (SKL).

Pencapaian Standar Kompetensi Lulusan (SKL) dapat diukur dengan nilai

ujian nasional. Hal ini sesuai dengan Peraturan Menteri Pendidikan nomor 34

tahun 2007, bahwa ujian nasional adalah kegiatan pengukuran dan penilaian

kompetensi peserta didik secara nasional untuk jenjang pendidikan dasar dan

menengah yang bertujuan untuk menilai pencapaian kompetensi lulusan secara

nasional pada mata pelajaran yang ditentukan dari kelompok mata pelajaran ilmu

pengetahuan dan teknologi, dalam rangka pencapaian standar nasional. Hasil ujian

nasional digunakan sebagai salah satu pertimbangan untuk penentuan kelulusan

peserta didik dari suatu satuan pendidikan, seleksi masuk jenjang pendidikan

berikutnya, pemetaan mutu satuan atau program pendidikan, akreditasi satuan

pendidikan serta pembi-naan dan pemberian bantuan kepada satuan pendidikan

dalam upaya pening-katan mutu pendidikan.

BAB II

TINJAUAN PUSTAKA

2.1 Regresi Logistik Ordinal

Regresi logistik digunakan jika variabel terikatnya Y berupa variabel

kategori klasifikasi. Perbedaan antara regresi linear dengan regresi logistik adalah

jika regresi linear merupakan suatu metode statistik yang menganalisis hubungan

antara variabel respon dengan variabel prediktor. Selain itu, variabel responnya

berskala interval atau rasio. Persamaan umumnya adalah sebagai berikut:

xY (2.1)

Di mana errornya berdistribusi normal dengan meannya nol dan variansinya

konstan. Sedangkan regresi logistik merupakan suatu metode statistik yang

bertujuan menganalisis variabel respon untuk memperoleh hubungan antara

variabel prediktor dengan probabilitas dari suatu kejadian yang diakibatkan oleh

variabel prediktor. Variabel responnya biasanya berskala ordinal atau nominal,

sedangkan variabel prediktornya bisa diskrit atau kontinyu.

Regresi logistik untuk respon berskala nominal dapat dibedakan menjadi

dua, yaitu regresi logistik biner (binary logistic regression) dan regresi logistik

multinomial (multinomial logistic regression). Regresi logistik biner digunakan

ketika hanya ada dua kemungkinan variabel respon Y , misal membeli dan tidak

membeli. Sedangkan regresi logistik multinomial digunakan ketika pada variabel

respon Y terdapat lebih dari dua kategori.

Model logit kumulatif pertama kali diperkenalkan oleh Walker dan Duncan

(1967) dan kemudian disebut model odds proporsional (proportional odds model)

oleh McCullagh (1980). Jika variabel prediktor 𝒙 = (𝑥1 𝑥2 ⋯ 𝑥𝑝)𝑇, maka peluang

kumulatif logit didefinisikan (Agresti, 2002) sebagai

𝑃(𝑌 ≤ �⃓�𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥), 𝑗 = 1, 2, ⋯ , 𝐽

Kumulatif logit didefinisikan sebagai

𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ �⃓�𝑥) = ln [𝑃(𝑌 ≤ �⃓�𝑥)

1 − 𝑃(𝑌 ≤ �⃓�𝑥)] = ln [

𝑃(𝑌 ≤ �⃓�𝑥)

𝑃(𝑌 > �⃓�𝑥)]

= ln [𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥)

𝜋𝑗=1(𝑥) + 𝜋𝑗=2(𝑥) + ⋯ + 𝜋𝑗(𝑥)] , 𝑗 = 1, 2, ⋯ , 𝐽

Anggap suatu variabel respon multinomial Y dengan keluaran kategori yang

dinyatakan oleh 1,2,...,J dan misalkan x menyatakan suatu vektor kovariat

berdimensi p. Dependensi peluang kumulatif Y terhadap x untuk model

proportional odds sering dinyatakan dalam bentuk

ln [𝑃(𝑌 ≤ �⃓�𝑥)

𝑃(𝑌 > �⃓�𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1

Persamaan di atas dapat diubah dalam bentuk

ln [𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥)

𝜋𝑗=1(𝑥) + 𝜋𝑗=2(𝑥) + ⋯ + 𝜋𝑗(𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1

Model yang secara simultan menggunakan semua kumulatif logit (Agresti, 2002)

adalah

𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ �⃓�𝑥)] = 𝛽0𝑗 + 𝛽𝑇𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1

𝛾𝑗(𝑥) = 𝑃(𝑌 ≤ �⃓�𝑥) merupakan peluang kumulatif dari kejadian (𝑌 ≤ 𝑗).

{𝛽01 , 𝛽02, ⋯ , 𝛽0𝐽−1 } meruapakan parameter intersep yang tidak diketahui yang

memenuhi kondisi 𝛽01 ≤ 𝛽02 ≤ ⋯ ≤ 𝛽0𝐽−1 dan 𝜷 = (𝛽1, 𝛽2, ⋯ , 𝛽𝑝)𝑇merupakan

vektor koefisien regresi yang tidak diketahui yang bersesuaian dengan x.

Jika 𝛾𝑗(𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝑗(𝑥) maka 𝛾1(𝑥) = 𝜋1(𝑥), 𝛾2(𝑥) =

𝜋1(𝑥) + 𝜋2(𝑥) dan 𝛾𝐽(𝑥) = 𝜋1(𝑥) + 𝜋2(𝑥) + ⋯ + 𝜋𝐽(𝑥) = 1. Model regresi

logistik ordinal yang terbentuk jika terdapat J kategori respon adalah

𝑙𝑜𝑔𝑖𝑡 𝛾1(𝑥) = ln [ 𝛾1(𝑥)

1 − 𝛾1(𝑥)] = 𝛽01 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝

𝑙𝑜𝑔𝑖𝑡 𝛾2(𝑥) = ln [ 𝛾2(𝑥)

1 − 𝛾2(𝑥)] = 𝛽02 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝

⋮

𝑙𝑜𝑔𝑖𝑡 𝛾𝐽−1(𝑥) = ln [ 𝛾𝐽−1(𝑥)

1 − 𝛾𝐽−1(𝑥)] = 𝛽0,𝐽−1 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝

dimana 𝛾𝑗(𝑥) = 𝑃(𝑌 ≤ �⃓�𝑥) =exp(𝛽0𝑗+ 𝛽𝑇𝑥)

1− exp(𝛽0𝑗+ 𝛽𝑇𝑥), 𝑗 = 1, 2, ⋯ , 𝐽 − 1 𝑑𝑎𝑛 𝛾𝑗(𝑥) = 1

Model ini disebut model logistik kumulatif karena rasio odds dari suatu kejadian

(𝑌 ≤ 𝑗) adalah independen pada setiap indikator kategori.

Selanjutnya untuk mendapatkan pendugaan parameter regresi logistik

ordinal dapat diperoleh dengan menggunakan metode pendugaan maximum

likelihood estimation ( MLE). Metode MLE dipilih karena mempunyai beberapa

kelebihan dibandingkan dengan metode lain, diantaranya dapat digunakan untuk

model tidak linier seperti regresi logistik, serta hasil penaksirannya unbiased

(Hosmer dan Lemeshow, 2000).

Pendugaan parameter regresi logistik ordinal didapatkan dengan

menurunkan fungsi log likelihood terhadap parameter yang akan diestimasi dan

disamakan dengan nol. Persamaan 𝜕 𝐿(𝛽)

𝜕 𝛽𝑘= 0 digunakan untuk menaksir intersep

parameter 𝛽𝑘 dimana 𝑘 = 1, 2, ⋯ , 𝑝 dan 𝜕 𝐿(𝛽)

𝜕 𝛽0𝑗= 0 dipergunakan untuk menaksir

intersep 𝜃𝑗 𝑑𝑖𝑚𝑎𝑛𝑎 𝑗 = 1, 2, ⋯ , 𝐽 − 1.

Hasil dari persamaan 𝜕 𝐿(𝛽)

𝜕 𝛽𝑘= 0 dan

𝜕 𝐿(𝛽)

𝜕 𝛽0𝑗= 0 merupakan fungsi nonlinear

sehingga diperlukan metode iterasi untuk memperoleh estimasi parameternya.

Metode iterasi yang dipergunakan adalah metode iterative Weighted Least Square

(WLS) yaitu algoritma Newton-Raphson. Iterasi akan berhenti jika terpenuhi

kondisi konvergen, yaitu selisih ‖𝛽(𝑡+1) − 𝛽𝑡‖ ≤ 𝜀, dimana 𝜀 adalah bilangan

yang sangat kecil.

2.2. Odds Ratio

Odds ratio ( ) adalah ukuran asosiasi yang menggambarkan seberapa

besar kemungkinan untuk income itu terjadi. Odds ratio digunakan untuk

interpetasi parameter, bertujuan untuk menentukan hubungan fungsional antara

variabel prediktor dangan variabel respon dan menentukan unit perubahan dalam

variabel prediktor, interpertasi model logit tergantung pada jenis variabel

prediktornya. Interpertasi dari model diskrit adalah sebagai berikut (Hosmer and

Lemeshow, 1989).

a. Variabel Prediktor Dikatomus

Variabel prediktor dengan dua kategori yang dinotasikan dengan kategori X2 dan

X1 disebut variabel prediktor dikatomus, pada variabel prediktor kategori X2

dibandingkan dengan kategori X1 dirumuskan sebagai berikut.

1

1

2

2

)(

/(

/(

/(

/(

12

xXjYP

xXjYP

xXjYP

xXjYP

XX

= exp 121( xx

Log dari odds ratio adalah sebagai berikut.

ln )( expln; 12112 xxxx = 121 xx

Interpertasi persamaan adalah jika suatu respon yang jatuh pada kategori lebih kecil

atau sama dengan j dibandingkan dengan respon yang jatuh pada kategori j+1 untuk

X=x2 adalah sebesar 121 xx kali dari X=x1.

b. Variabel Prediktor Polikatomus

Variabel prediktor dengan kategori lebih dari dua disebut variabel prediktor

polikatomus, seperti halnya pada variabel prediktor dikatomus nilai odds ratio salah

satu kategori dijadadikan pembanding. Perhitungan dan interpertasinya sama

dengan variabel dikatomus.

c. Variabel Prediktor Kontinyu

Interpertasi dari variabel kontinyu secara matematis dapat dituliskan sebagai

berikut.

xxg 10)(

dimana

)()1(1 xgxg dan )()(1 xgsxgs .

Berdasarkan bentuk matematis maka perubahan satu unit pada variabel

prediktor akan memberikan perubahan pada g(x) sebesar 𝛽1, apabila pada variabel

prediktor terjadi perubahan sebesar s unit akan memberikan perubahan pada g(x)

sebesar s1 .

Model logistik ordinal yang telah diperoleh perlu diuji kesesuaiannya.

Pengujian yang dilakukan adalah sebagai berikut.

Uji Univariabel (Parsial)

Hipotesis pengujian ini adalah

𝐻𝑜 ∶ 𝛽𝑘 = 0

𝐻1 ∶ 𝛽𝑘 ≠ 0 , 𝑘 = 1, 2, ⋯ , 𝑝

Statistik uji yang digunakan adalah statistik Wald : 𝑊𝑘2 = (

𝛽�̂�

𝑆𝐸(𝛽�̂�)

2

Daerah penolakan;

𝐻𝑜 ditolak bila 𝑊𝑘2 > 𝜒(𝛼,1)

2 atau p-value kurang dari α

Uji Multivariabel (Serentak)

Hipotesis pengujian ini adalah

𝐻𝑜 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝 = 0

𝐻1 ∶ 𝑃𝑎𝑙𝑖𝑛𝑔 𝑠𝑒𝑑𝑖𝑘𝑖𝑡 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑘 ≠ 0, 𝑘 = 1, 2, ⋯ , 𝑝

Statistik uji yang digunakan statistik uji 𝐺2 atau Likelihood Ratio Test;

𝐺 = −2 ln (ℓ0

ℓ1) = −2 (𝐿0 − 𝐿1)

Dimana ℓ0 = nilai yang dimaksimalkan dari fungsi likelihood di bawah 𝐻0

ℓ1 = nilai yang dimaksimalkan secara keseluruhan (𝐻0 ∪ 𝐻1)

Daerah penolakan;

𝐻0 ditolak bila 𝐺 > 𝜒(𝛼,𝑝)2 dimana p menunjukkan nilai variabel random pada tabel

distribusi chi-square pada derajat bebas p.

Uji Kesesuaian Model

Setelah dilakukan pengujian parameter secara serentak dan parsial, selanjutnya

dilakukan pengujian terhadap kebaikan model yang telah dibentuk. Hipotesis yang

digunakan sebagai berikut.

H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)

H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)

α = 5%

Statistik uji Deviance:

𝐷 = −2 ∑ [𝑦𝑖𝑗 ln (�̂�𝑖𝑗

𝑦𝑖𝑗) + (1 − 𝑦𝑖𝑗) ln (

1 − �̂�𝑖𝑗

1 − 𝑦𝑖𝑗)]

𝑛

𝑖=1

Tolak H0 jika p-value kurang dari α.

Uji Parallel Lines

Pada saat membuat model regresi logistik ordinal, diasumsikan bahwa

hubungan antara variabel independen dengan logit adalah sama untuk semua logit.

Ini berarti bahwa hasil model berupa sebuah garis paralel untuk setiap kategori

variabel respon. Untuk membuktikannya dapat menggunakan Test of parallel lines,

dimana uji tersebut digunakan untuk membuktikan terpenuhinya asumsi bahwa

setiap kategori memiliki hubungan antara variabel independen dengan logit yang

sama untuk semua persamaan logit. Jika nilai signifikansi > α, maka hasil

menyatakan bahwa model yang dihasilkan memiliki parameter yang sama sehingga

pemilihan model link function logit adalah sesuai. Namun jika nilai signifikansi

kurang dari α maka pemilihan link function logit tidak tepat dan analisis pada data

cukup menggunakan regresi logistik multinomial.

Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,

pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.

H0 : hubungan antara variabel independen dengan logit sama untuk semua

persamaan logit

H1 : hubungan antara variabel independen dengan logit tidak sama untuk semua

persamaan logit

α = 5%

Kekuatan Asosiasi

Ada beberapa R2 yang dapat digunakan untuk mengukur kekuatan asosiasi

antara variabel dependen dengan variabel prediktor. R2 yang dimaksud disini tidak

sepenting pada regresi biasa, karena interpretasi R2 pada regresi logistik tidak kaku

seperti pada regresi biasa. Pengukuran kekuatan asosiasi pada pembahasan ini

menggunakan 3 metode, yaitu sebagai berikut.

1. Cox danSnell R2

𝑅𝐶𝑆2 = 1 − (

𝐿(𝑩(0))

𝐿(�̂�))

2𝑛

2. Nagelkerke’s R2

𝑅𝑁2 =

𝑅𝐶𝑆2

1 − 𝐿(𝐵(0))2𝑛

3. McFadden’s R2

𝑅𝐶𝑆2 = 1 − (

𝐿(�̂�)

𝐿(𝑩(0)))

Dimana

𝐿(�̂� ) : fungsi log-likelihood model dengan estimasi parameter.

𝐿(𝑩(0)) : fungsi log-likelihood dengan hanya memuat thresholds.

n : banyaknya kasus

Pengujian Signifikansi Hasil Pendugaan Parameter

Pengujian terhadap parameter model dilakukan untuk memeriksa pengaruh dari

variabel prediktor terhadap respon. Pengujian dilakukan dengan menggunakan

statistik uji Wald (Hosmer dan Lemeshow, 1989:20).

Hipotesis dari pengujian ini adalah :

0:0 cH

:1H paling sedikit ada satu pcc ,...,2,1,0

Statistik ujinya : c

c

SEW

ˆ

ˆ

Statistik uji Wald untuk jumlah sampel besar mengikuti distribusi normal

standart dengan mean 0 dan varians 1. Jika uji Wald ini dikuadratkan, maka akan

didapatkan uji 2W yang mengikuti distribusi Chi-Square dengan derajat bebas 1

untuk sampel besar juga (Hosmer dan Lemeshow, 1989:21).

Daerah penolakannya adalah jika 2

aZW atau jika dapat pula dilihat dari nilai p,

bila nilai P yang ditetapkan maka tolak 0H .

BAB III

STUDI KASUS

Data yang digunakan dalam tugas ini adalah data dari tesis Jumaidin yang

berjudul “FAKTOR-FAKTOR YANG MEMPENGARUHI NILAI UNAS

DENGAN ANALISIS REGRESI LOGISTIK ORDINAL DAN REGRESI

PROBIT ORDINAL (Studi Kasus: Nilai UNAS SMA Negeri 2 Amahai

Kabupaten Maluku Tengah)” yang merupakan data sekunder pada tahun

pembelajaran 2007/2008 yang terdiri:

1. Jurusan Ilmu Pengetahuan Alam (IPA) sebanyak 19 orang

2. Jurusan ilmu Pengetahuan Sosial (IPS) sebanyak 42 orang

Variabel Respon (Y) adalah nilai UNAS SMA dengan tiga kategori yaitu

UNAS 65 Cukup (0), 65 <UNAS < 75 Baik (1) dan UNAS 75 amat baik

(2), hal ini sesuai dengan pengkategorian rata-rata nilai UNAS tiap mata pelajaran

oleh Dinas Pendidikan Propinsi Maluku. Adapun variabel-variabel yang diduga

mempengaruhi probabilitas seorang siswa bernilai kategori cukup, baik dan amat

baik adalah rata-rata nilai UNAS SMP (X1), rata-rata nilai UAS (X2), rata-rata nilai

tryout (X3), rata-rata nilai raport SMA (X4), pendapatan orang tua (X5), jumlah

saudara (X6) dan jurusan yang diambil siswa (X7).

Metode yang digunakan dalam penelitian ini untuk mencapai tujuan

penelitian adalah mengkategorikan variabel respon dengan tiga kategori yaitu Y =

0, Y = 1 dan Y = 2, membuat model regresi logistik ordinal untuk mengetahui ada

tidaknya pengaruh dari setiap variabel bebas terhadap variabel respon.

BAB IV

PEMBAHASAN

Statistika Deskriptif dan Estimasi Parameter

Nilai UNAS SMA Negeri 2 Amahai dibedakan menjadi tiga predikat

(kategori) diantaranya cukup baik (y = 0), baik (y = 1) dan sangat baik (y = 2). Dari

61 siswa, 9,8 persen memiliki nilai UNAS yang sangat baik dan 47,6 persen

terbilang baik, sedangkan sisanya yaitu sebesar 42,6 persen menyandang predikat

cukup baik. Secara ringkas, informasi responden tersebut ditunjukkan pada Gambar

1.

Gambar 1. Informasi Responden Berdasarkan Nilai UNAS

Dalam setiap analisis regresi, penentuan variabel prediktor yang memiliki

pengaruh signifikan terhadap variabel respon sangat perlu untuk diketahui, yaitu

dengan cara meregresikannya kemudian dilakukan pengujian. Adapun model

regresi logistik ordinal yang terbentuk adalah sebagai berikut.

)0(1,347X-X22,1

X803,00,877X-1,695X -13,169XX909,02304.0611

log)(

)0(1,347-X22,1

X803,00,877X-1,695X -13,169XX909,02274.621

log)(

76

54321

2

22

76

54321

1

11

Logit

Logit

Ketujuh variabel dalam model logit tersebut kemudian dilakukan pengujian

kebermaknaan atau uji signifikansi untuk diketahui apakah variabel-variabel

Cukup Baik43%

Baik47%

Amat Baik10%

tersebut memiliki pengaruh signifikan terhadap nilai UNAS di SMAN 2 Amahai.

Pengujian dilakukan secara serentak dan kemudian secara parsial. Hipotesis dalam

pengujian serentak pada kasus ini diantaranya sebagai berikut.

H0 : β1 = β2 =... = β7 = 0

H1 : paling sedikit ada satu 0k , dimana k=1,2,…,7

Tabel 1 Pengujian Signifikansi Variabel Prediktor Terhadap Respon Secara Serentak

Model -2 Log

Likelihood Chi-Square df Sig.

Intercept Only 115,301

Final 0 115,301 7 0,000

Berdasarkan Tabel 1, diperoleh penurunan nilai chi-square sebesar 115,301

dan signifikan pada taraf nyata 5%. Hal ini berarti bahwa terjadi tolak H0 atau

terdapat paling sedikit satu variabel yang berpengaruh signifikan terhadap nilai

UNAS. Untuk mengetahui variabel mana saja yang memiliki pengaruh bila

dimodelkan secara bersama, maka perlu dilakukan uji signifikansi secara parsial.

Statistik uji yang digunakan adalah uji Wald dan hipotesis yang diberikan adalah

sebagai berikut.

H0 : βk = 0, dimana k = 1,2,…,7

H1 : βk ≠ 0

Hasil pengujian signifikansi secara parsial yang ditampilkan pada Tabel 2

menunjukkan bahwa pada taraf kepercayaan 95%, terdapat beberapa variabel yang

tidak berpengaruh parsial terhadap nilai UNAS di SMA Negeri 2 Amahai. Hal ini

ditunjukkan dari nilai p-valuenya yang lebih besar dari taraf nyata 5% atau nilai uji

Wald lebih kecil dari 𝑋1,0.052

= 3,841. Sedangkan variabel yang memiliki pengaruh

parsial terhadap nilai UNAS SMA 2 Amahai diantaranya adalah nilai UNAS SMP

(X1), nilai UAS SMA (X2) dan nilai raport (X4) , karena nilai p-value lebih kecil

dari 5%.

Tabel 2 Pengujian Signifikansi Variabel Prediktor terhadap Variabel Respon Secara Parsial

Variabel Estimasi

Parameter

Std.

Eror

Nilai Uji

Wald P-Value Keputusan

Nilai UNAS SMP (X1) 20,909 8,601 5,910 0,015 Signifikan

Nilai UAS SMA (X2) 13,169 5,847 5,072 0,024 Signifikan

Nilai tryout (X3) -1,695 1,620 1,095 0,295 Tidak Signifikan

Nilai raport (X4) 0,877 0,371 5,598 0,018 Signifikan

Pendapatan ortu (X5) -3,803 2,830 1,806 0,179 Tidak Signifikan

Jumlah keluarga (X6) 0,122 0,303 0,164 0,686 Tidak Signifikan

Jurusan (X7=0) -1,347 1,906 0,500 0,480 Tidak Signifikan 0

Uji Kesesuaian Model

Setelah dilakukan pengujian parameter secara serentak maupun parsial,

selanjutnya dilakukan pengujian terhadap kebaikan model yang telah dibentuk.

Konsep pengujian ini didasarkan pada perbandingan antara hasil prediksi dengan

kenyataannya. Pengujian dilakukan dengan menggunakan statistik uji deviance

dengan α = 5%, dimana hipotesis yang digunakan sebagai berikut.

H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)

H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)

Tolak H0 jika p-value kurang dari α.

Tabel 3 Uji Kesesuaian Model dengan Metode Deviance

𝜒2 Derajat bebas p-value

Deviance 19,404 113 1.000

Berdasarkan Tabel 3, maka keputusan yang diambil adalah terima H0, dan

menunjukkan bahwa model yang terbentuk sesuai. Hal ini berarti bahwa tidak ada

perbedaan antara hasil observasi dengan hasil prediksi.

Uji Parallel Lines

Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,

pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.

H0 : hubungan antara variabel independen dengan logit sama untuk semua

persamaan logit

H1 : hubungan antara variabel independen dengan logit ada yang tidak sama pada

persamaan logit

α = 5%

Hasil pengujian ditampilkan pada Tabel 4 berikut ini.

Tabel 4 Uji Kesesuaian Model dengan Metode Deviance

𝜒2 Derajat bebas p-value

0 7 1.000

Berdasarkan Tabel 4, maka keputusan yang diambil adalah terima H0. Ini

berarti bahwa pemilihan model link function logit sudah sesuai karena memenuhi

asumsi setiap kategori memiliki hubungan antara variabel independen dengan logit

sama untuk semua persamaan logit.

Kekuatan Asosiasi

Adapun pengukuran kekuatan asosiasi dari model yang sudah terbentuk

adalah seperti pada Tabel 5 berikut ini.

Tabel 5 Kekuatan Asosiasi

R2

Cox and Snell 0,849

Nagelkerke 1,000

McFadden 1,000

Berdasarkan Tabel 5, nilai R2 (kekuatan asosiasi) dari berbagai metode

bernilai cukup besar, dengan nilai sebesar 0,849 untuk metode Cox dan Snell, dan

sebesar 1 untuk metode Nagelkerke dan McFadden. Ini menunjukkan bahwa

hubungan variabel dependen dan variabel prediktor cukup erat.

Ketepatan Klasifikasi

Berdasarkan model regresi logistik ordinal yang telah terbentuk, diperoleh

ketepatan klasifikasi yang ditampilkan pada Tabel 6 berikut ini.

Tabel 6 Ketepatan Klasifikasi

Observasi

Prediksi

Total

Ketepatan

Klasifikasi Relatif (%)

Cukup

baik

(Y=0)

Baik

(Y=1)

Sangat

baik

(Y=2)

Kategori Nilai

UNAS

Cukup baik

(Y=0) 24 2 0 26 92.31%

Baik

(Y=1) 2 26 1 29 89.66%

Sangat

baik

(Y=2) 0 0 6 6 100.00%

Total 27 26 28 7

Ketepatan Klasifikasi Keseluruhan 90.80%

Tabel 6 menunjukkan bahwa ketepatan klasifikasi dari model adalah sebesar

90,80%. Ketepatan klasifikasi tersebut cukup tinggi, yang menunjukkan bahwa

model regresi ordinal yang terbentuk tepat dalam memprediksi observasi.

BAB V

KESIMPULAN

Berdasarkan uraian pembahasan sebelumnya, didapatkan model regresi

logistik ordinal sebagai berikut.

)0(1,347X-X22,1X803,0

0,877X-1,695X -13,169XX909,02304.0611

log)(

)0(1,347-X22,1X803,0

0,877X-1,695X -13,169XX909,02274.621

log)(

765

4321

2

22

765

4321

1

11

Logit

Logit

Secara serentak, kesimpulan yang didapatkan adalah sedikitnya terdapat

satu variabel yang signifikan terhadap model. Adapun secara parsial, variabel yang

signifikan pengaruhnya terhadap model regresi logistik ordinal adalah variabel X1,

X2, dan X4.

LAMPIRAN

Documents

REGRESI LOGISTIK ORDINAL - himasta.unimus.ac.id