Upload
yulia-k-riamina
View
266
Download
26
Embed Size (px)
DESCRIPTION
analis multivariat; regresi linier; regresi logistik
Citation preview
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
1
ANALISIS MULTIVARIAT SUTANTO PRIYO HASTONO Departemen Biostatistik FKM UI 2006
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel
independen dengan satu variabel dependen pada waktu yang bersamaan.
Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya
jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal
diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka
diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden.
Dari analisis multivariat kita dapat mengetahui:
a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel
dependen?
b. Apakah variabel independen berhubungan dengan variabel dependen
dipengaruhi variabel lain atau tidak?
c. Bentuk hubungan beberapa variabel independen dengan variabel dependen,
apakah berhubungan langsung atau pengeruh tidak langsung.
Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori
atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis
statistik yang dapat digunakan untuk analisis multivariat:
Variabel Independen Variabel Dependen Jenis Uji
Numerik
(minimal 1 variabel numerik)
Numerik Uji Regresi Linier
Katagori Numerik ANOVA
Katagori
(dapat dengan numerik)
Katagori Uji Regresi Logistik
Kontinyu Katagori Uji Diskriminan
Numerik/Katgori Numerik waktu Uji Regresi Cox
2
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dalam melakukan analisis multivariat kita harus mengetahui terlebih
dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding
Konfounding merupakan kondisi bias dalam mengestimasi efek
pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari
perbandingan yang tidak seimbang antara kelompok expose dengan kelompok
non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan
risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose.
Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun
expose dihilangkan pada kedua kelompok tersebut.
Satu variabel disebut konfounding bila variabel tersebut merupakan faktor
risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli
statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel
tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan
berhubungan dengan variabel independen tapi tidak merupakan hasil dari
variabel independen.
b.Interaksi
Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose
Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit
berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti
efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam
analisis karena pada saat analisis kita harus menentukan apakah akan
melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah
untuk masing-masing strata.
Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel
expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus
dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang
tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing
strata harus dihitung
3
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANALISIS
REGRESI LINIER GANDA
12 Analisis Multiple regression Linear atau sering disebut juga analisis regresi
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier
sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel
independen (variabel bebas) dihubungkan dengan satu variabel dependen
(terikat).. Sedangkan pada Multiple regression Linear merupakan analisis
hubugan antara beberapa variabel independen dengan satu variabel dependen.
Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan
darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat
badan, dan jenis kelamin.
Dalam regresi linier ganda variabel dependennya harus numerik
sedangkan variabel independen boleh semuanya numerik dan boleh juga
campuran numerik dan katagorik. Model persamaan regresi linier ganda
merupakan perluasan regresi linier sederhana, yaitu:
Y = a + b1X1 + b2X2 + …. + bkXk + e
1. Asumsi Regresi Linier
Seperti pada umumnya pengujian statistik, dari analisis regresi linier
ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar
diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi)
tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil.
Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin ‘pada
semua orang (populasi)’, tidak hanya seperti yang teramati di sejumlah orang
pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis
regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam
analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression
4
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Linear harus memenuhi asumsi/persyaratan yang ditetapkan. Adapun asumsi
yang digunakan dalam Multiple regression Lineari sebagai berikut
a. Asumsi Eksistensi (Variabel Random)
Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)
adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi
ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,
sampel yang diambil harus dilakukan secara random. Cara mengetahui
asumsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual
dari model, bila residual menunjukkan adanya mean dan sebaran (varian ata
satandar deviasi) maka asumsi eksistensi terpenuhi.
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier.
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
5
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
2. Kegunaan Analisis Regresi Ganda
Tujuan analisis regresi linier ganda adalah untuk menemukan model
regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan
dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna
untuk dua hal:
a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi
yang ada pada sebuah atau beberapa variabel independen. Disini dapat
diketahui secara probabilitas nilai variabel dependen bila seseorang/individu
mempunyai suatu set variabel dengan independen tertentu. Misalnya kita
melakukan analisis variabel independen umur, BB dan jenis kelamin
dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi,
seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat
badan dan jenis kelamin tertentu.
b. Estimasi, menguantifikasihubungan sebuah atau beberapa variabel
independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat
digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan
dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa
besar hubungan masing-masing independen terhadap variabel independen
lainnya. Dari analisis ini dapat diketahui variabel mana yang paling
besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari
koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
6
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
3. Pemodelan
Satu hal yang penting dalam regresi ganda adalah bagaimana memilih
variabel independen sehingga terbentuk sebuah model yang paling sesuai
menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam
(populasi).
Dalam pembuatan model seringkali dijumpai pandangan yang kurang
tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke
dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel
independen ke dalam model, maka variabel dependen diharapkan diprediksi
dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak
selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel
dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang
tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping
itu, model dengan banyak variabel seringkali malah menyulitkan dalam
interpretasi.
Berdasarkanpertimbangan tersebut pemilihan variabel independen
hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang
dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk
dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk
menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen.
Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk
dalam model, salah satu kriteria yang sering digunakan adalah melihat
perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena
setiap penambahan satu variabel independen akan meningkatkan R2 walaupun
variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan
adalah model dengan nilai R2 yang besar namun variabel independennya dengan
jumlah sedikit.
Berikut langkah-langkah dalam pemodelan regresi linier ganda:
1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat
model. Masing-masing variabel independen dihubungkan dengan variabel
7
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka
variabel tersebut masuk dalam model multivariat. Untuk variabel yang p
value-nya > 0,25 namun secara substansi penting, maka variabel tersebut
dapat masuk ke multivariat.
2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk
dalam model. Ada beberapa metode untuk melakukan pemilihan variabel
independen dalam analisis multivariat regresi linier ganda, yaitu:
a). ENTER, memasukkan semua variabel independen dengan serentak satu
langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode ini
yang tepat/sering digunakan, karena dalam pemodelan kita dapat
melakukan pertimbangan aspek substansi.
b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian
variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke
dalam model, sampai semua variabel yang memenuhi kriteria tersebut
masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel
yang mempunyai korelasi parsial terbesar dengan variabel dependen dan
yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi
parsial adalah adalah korelasi antara variabel independen dengan
dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005
artinya variabel yang dapat masuk model bila variabel tersebut
mempunyai nilai P lebih kecil atau sama dengan 0,05.
c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi
kemudian satu persatu variabel independen dikeluarkan dari model
berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali
dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil
dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah
0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama
dengan 0,10 dikeluarkan dari model.
d). STEPWISE, model ini merupakan kombinasi antara metode backward dan
Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa
8
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
variabel sama sekali di dalam model. Lalu satu variabel hasil
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu
variabel hasil pengkorelasian dimasukkan ke dalam model dan
dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama
masuk sama dengan metode forward yakni variabel yang mempunyai
korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini
diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria
pengeluaran seperti metode backward.
e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu
langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
3) Melakukan diagnostik regresi linier,
a). Melakukan pengujian terhadap kelima asumsi.
b). Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar
variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui
adanya kolinearitas dapat dilihat dai nilai koefisien korelasi ®, bila nilai r
lebih tinggi dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui
dari nilai VIF atau tolerance, bila nilai VIF > 10, atau tolerance sekitar 1
(satu) maka model terjadi kolinearitas.
4). Melakukan analisis interaksi. Setelah memperoleh model yang memuat
variabel-variabel penting, maka langkah selanjutnya adalah memeriksa
adanya interaksi antar variabel independen. Interaksi merupakan keadaan
dimana hubungan antara satu variabel independen dengan dependen
berbeda menurut tingkat variabel independen yang lain.
5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek
reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok.
Untuk masing-masing sampel dibuat model dengan variabel yang sama,
9
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
kemudian bandingkan antara model 1 dan model 2, bila hasilnya
sama/hampir sama maka model regresi reliabel. Bila model reliabel maka
seluruh sampel dapat digunakan untuk pembuatan model.
10
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS:
REGRESI LINIER GANDA Sebagai latihan kita melakukan analisis penelitian “faktor-faktor yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV.
Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur
ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami
prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya
berat badan bayi (BWT).
Kode variabel pada file data : LBW.SAV
Nama Definisi Operasional Hasil Ukur
Id Nomor Identitas
Low Kondisi bayi dalam klasifikasi BBLR 0 = ≥ 2500 g
1 = < 2500 g
Age Umur ibu tahun
Lwt Berat ibu pada saat menstruasi terakhir pounds
Race Suku bangsa/ras 1= putih
2= hitam
3 = lainnya
Smoke Kebiasaan merokok selama hamil 0 = tidak
1 = ya
Ptl Riwayat mengalami prematur 0 = tidak
1 = ya
Ht Riwayat menderita hipertensi 0 = tidak
1 = ya
Ui Terjadi/mengalami iritability Uterine 0 = tidak
1 = ya
Ftv Frekuensi periksa hamil pada trimester pertama 0 ,1, 2 dst..
Bwt Berat badan bayi gram
11
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Data selengkapnya ada di lampiran:
A. Langkah pertama pemodelan: SELEKSI BIVARIAT
Seleksi bivariat masing-masing variabel independen dengan variabel dependen.
Variabel yang dapat masuk model multivariat adalah variabel yang pada analisis
bivariatnya mempunyai nilai p (p value) < 0,25. Namun ketentuan p value<0,25
ini tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun
p value-nya > 0,25 karena secara substansi sangat penting berhubungan dengan
variabel dependen, maka variabel tersebut dapat diikutkan dalam model
multivariat.
Uji yang digunakan pada analisis bivariat tergantung dari variabel yang
digunakan, bila : variabel independennya numerik -> uji korelasi, bila
independennya katagorik -> uji t atau uji anova.
a. Bivariat uji korelasi : melakukan analisis bivariat untuk variabel independen
berjenis numerik: variabel berat badan ibu, umur ibu, frekuensi prematur,
frekuensi anc :
Langkahnya :
1. Klik ‘Analysis’, sorot ke ‘Correlate’, sorot dan klik ‘Bivariate’
2. Muncul dilayar menu ‘Bivariate Correlations’
3. Pada kotak Variables, isikan semua variabel numerik baik untuk variabel
independen (age,lwt,ptl,ftv) dan dependen (bwt)
12
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
4. Klik tombol ‘OK’
Muncul dilayar hasil sbb:
Correlations
Correlations
1 .180* .215** .072 .090.013 .003 .328 .219
189 189 189 189 189.180* 1 .141 -.140 .186*.013 .054 .055 .010189 189 189 189 189.215** .141 1 -.044 .058.003 .054 .544 .426
189 189 189 189 189
.072 -.140 -.044 1 -.155*
.328 .055 .544 .034189 189 189 189 189.090 .186* .058 -.155* 1.219 .010 .426 .034189 189 189 189 189
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
Age of mother
Weight of mother(pounds)
No physician visitsin first trimester
History ofpremature labor
Birth weight (gram)
Age ofmother
Weight ofmother
(pounds)
Nophysician
visits in firsttrimester
History ofpremature labor
Birthweight(gram)
Correlation is significant at the 0.05 level (2-tailed).*.
Correlation is significant at the 0.01 level (2-tailed).**.
13
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel
umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi
prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur,
berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan
demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat.
Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu
p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena
secara substansi frekuensi anc merupakan faktor yang sangat penting
mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan
dalam analisis multivariat.
b. Bivariat uji t: melakukan analisis bivariat untuk variabel independen
berjenis katagorik: merokok dan riwayat hipertensi
1. Merokok
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’ dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘smoke’ dan masukkan ke kotak‘Grouping Variable’.
14
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
1. Klik “Continue”
2. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
115 3054.96 752.409 70.16374 2773.24 660.075 76.732
Smoking statusNoYes
Birth weight (gram)N Mean Std. Deviation
Std. ErrorMean
15
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Independent Samples Test
1.508 .221 2.634 187 .009 281.713 106.969 70.693 492.7
2.709 170.0 .007 281.713 103.974 76.467 487.0
EqualvariancesassumedEqualvariancesnotassumed
Birthweight(gram)
F Sig.
Levene's Testfor Equality of
Variances
t df
Sig.(2-tailed)
MeanDifferen
ce
Std. ErrorDifferenc
e Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat. 2. Riwayat Hipertensi
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’ dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘ht’ dan masukkan ke kotak‘Grouping Variable’. (variabel yang
sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
16
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
6.Klik “Continue”
7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics
177 2972.31 709.226 53.30912 2536.75 917.341 264.813
History of hypertensionNoYes
Birth weight (gram)N Mean Std. Deviation
Std. ErrorMean
17
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Independent Samples Test
1.419 .235 2.019 187 .045 435.56 215.709 10.024 861.1
1.612 11.908 .133 435.56 270.126 -153.5 1025
EqualvariancesassumedEqualvariancesnotassumed
Birthweight(gram)
F Sig.
Levene's Test forEquality ofVariances
t df
Sig.(2-taile
d)
MeanDiffere
nce
Std.Error
Difference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat. B. Langkah Kedua : Pemodelan Multivariat Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat
secara bersama-sama. Variabel yang valid dalam model multivariat adalah
variabel yang mempunyai p value < 0,05. Bila dalam model multivariat dijumpai
variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan
dalam model. Pengeluaran variabel dilakukan tidak serempak, melainkan
bertahap satu per satu dikeluarkan dimulai dari p value yang terbesar. Adapun
proses selengkapnya sbb:
1. Klik ‘Analyisis’, sorot ‘Regression’, sorot dan klik ‘Linier’ lalu muncul menu
regresi linier,
a. Pada kotak ‘dependen isikan variabel dependen (dalam hal ini
berarti bwt) dan kotak ‘independen’ isikan variabel independennya
(dalam hal ini age, lwt, smoke, ht, ptl, ftv)
18
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5. Pada kotak ‘Method’, pilih Enter’
6. Abaikan lainnya
7. Klik ‘OK’, dan hasilnya
Regression
Model Summary
.340a .116 .086 696.829Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), No physician visits in firsttrimester, Smoking status, History of hypertension,History of premature labor, Age of mother, Weight ofmother (pounds)
a.
19
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANOVAb
11543236 6 1923872.611 3.962 .001a
88373817 182 485570.42399917053 188
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), No physician visits in first trimester, Smoking status, Historyof hypertension, History of premature labor, Age of mother, Weight of mother(pounds)
a.
Dependent Variable: Birth weight (gram)b.
Coefficientsa
2315.862 299.442 7.734 .0007.162 10.022 .052 .715 .476
4.793 1.777 .201 2.698 .008
-232.253 105.928 -.156 -2.193 .030-154.002 106.574 -.104 -1.445 .150-574.230 215.481 -.193 -2.665 .008
-2.847 49.705 -.004 -.057 .954
(Constant)Age of motherWeight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertensionNo physician visits in firsttrimester
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Birth weight (gram)a.
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya
keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar
11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik
(lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi
secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus
yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di
cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model.
Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3
variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur
(history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap
berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel
dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba
keluarkan adalah frekuensi anc(No physician..).
20
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Langkahnya:
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel,
namun sekarang anda harus keluarkan variabel ‘no physician’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary
.340a .116 .091 694.929Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), History of hypertension,Smoking status, Age of mother, History of prematurelabor, Weight of mother (pounds)
a.
Coefficientsa
2317.608 297.074 7.801 .0007.051 9.807 .051 .719 .473
4.781 1.759 .201 2.718 .007
-232.224 105.638 -.156 -2.198 .029-153.747 106.191 -.104 -1.448 .149-573.011 213.841 -.192 -2.680 .008
(Constant)Age of motherWeight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertension
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Birth weight (gram)a.
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah
dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square
dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi
dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R
Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk
coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
21
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum
dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Variabel Anc msih ada Anc dikeluarkan perubahan Coef.
Age
bwt
smoke
ptl
hi
ftv
7,1
4,7
-232,2
-154,0
-574,2
-2,8
7,0
4,7
-232,2
153,7
573,0
-
1,4 %
0 %
0 %
0,1 %
0,1 %
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel,
ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel
frekuensi anc kita keluarkan dari model.
Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p
value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473).
Langkah/proses :
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel,
namun sekarang anda harus keluarkan variabel ‘umur (age)’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary
.336a .113 .094 694.016Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), History of hypertension,Smoking status, History of premature labor, Weight ofmother (pounds)
a.
22
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
2449.121 233.779 10.476 .000
5.035 1.721 .211 2.925 .004
-236.420 105.338 -.159 -2.244 .026-145.412 105.417 -.098 -1.379 .169-582.566 213.148 -.195 -2.733 .007
(Constant)Weight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertension
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Birth weight (gram)a.
Setelah variabel umur dikeluarkan, nilai R Square ternyata ada sedikit
perunbahan yaitu menjadi 0,113. sedangkan untuk coefisian B, , hasil
perhitungannya sbb:
Variabel Masih lengkap umur dikeluarkan perubahan Coef.
Age
bwt
smoke
ptl
hi
ftv
7,1
4,7
-232,2
-154,0
-574,2
-2,847
-
5,0
-236,4
145,4
582,5
-
-
6,3 %
1,8 %
6,1 %
1,3 %
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %,
dengan demikian variabel umur kita keluarkan dari model.
Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur,
Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst.
Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan
dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
23
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model Summary
.322a .104 .089 695.707Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), History of hypertension,Smoking status, Weight of mother (pounds)
a.
Coefficientsa
2390.105 230.391 10.374 .000
5.352 1.710 .224 3.130 .002
-263.009 103.812 -.177 -2.534 .012-586.722 213.646 -.197 -2.746 .007
(Constant)Weight of mother(pounds)Smoking statusHistory of hypertension
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Birth weight (gram)a.
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan
perubahan Coef. B dapat dilihat sbb:
Variabel Masih lengkap Prematur keluar perubahan Coef.
Age
bwt
smoke
ptl
hi
ftv
7,1
4,7
-232,2
-154,0
-574,2
-2,847
-
5,3
-236,4
-
582,5
-
-
12,3 %
1,7 %
-
1,3 %
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada
variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel
riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan
dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p value-
nya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model
telah selesai dan model yang terakhir adalah sbb:
24
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model Summaryb
.336a .113 .094 694.016 .222Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Durbin-Watson
Predictors: (Constant), History of premature labor, History ofhypertension, Smoking status, Weight of mother (pounds)
a.
Dependent Variable: Birth weight (gram)b.
Coefficientsa
2449.121 233.779 10.476 .000
5.035 1.721 .211 2.925 .004 .925 1.081
-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060
-145.412 105.417 -.098 -1.379 .169 .947 1.056
(Constant)Weight of mother(pounds)Smoking statusHistory of hypertensionHistory of prematurelabor
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardize
dCoefficients
t Sig.Tolera
nce VIF
CollinearityStatistics
Dependent Variable: Birth weight (gram)a.
Langkah selanjutnya UJI ASUMSI Agar persaman garis yang digunkan untuk memprediksi menghasilkan angka
yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-asumsi
yang diersyaratkan uji regresi linier ganda. Adapun uji asumsinya sbb:
Langkahnya:
1.Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Masukkan dalam kotak Dependen variabel ‘bwt’
3. Masukan dalam kotak Independen variabel berat badan ibu (lwt),
merokok(smoke), riwayat hipertensi (hi) dan variabel riwayat prematur(ptl)
25
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
4.Klik tombol Statistics
5. Klik kotak ‘Collinearity diagnostic’ dan klik kotak ‘Covariance matrix’ (perintah
ini untuk uji asumsi multicoliniarity)
6. Klik kotak ‘Durbin-Watson’ (perintah ini untuk uji asumsi Independensi)
7. Klik Continue
26
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
8. Klik tombol ‘Plot”
9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini
untuk uji asumsi Homoscedasity)
10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk
uji asumsi Normality)
11. Klik Continue
Hasilnya :
a. Asumsi Eksistensi (Variabel Random)
Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)
adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi
ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,
sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi
eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari
model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada
sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil
analisis:
27
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Residuals Statisticsa
2249.77 3602.03 2944.66 245.079 189-2.835 2.682 .000 1.000 189
67.193 292.804 103.399 45.407 189
1955.43 3616.97 2943.73 251.196 189-2082.610 1921.631 .000 686.593 189
-3.001 2.769 .000 .989 189-3.015 2.782 .001 1.005 189
-2102.316 1940.423 .923 708.619 189-3.084 2.835 .000 1.010 189
.768 32.469 3.979 5.320 189
.000 .209 .007 .019 189
.004 .173 .021 .028 189
Predicted ValueStd. Predicted ValueStandard Error ofPredicted ValueAdjusted Predicted ValueResidualStd. ResidualStud. ResidualDeleted ResidualStud. Deleted ResidualMahal. DistanceCook's DistanceCentered Leverage Value
Minimum Maximum Mean Std. Deviation N
Dependent Variable: Birth weight (gram)a.
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan
standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb
.336a .113 .094 694.016 .222Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Durbin-Watson
Predictors: (Constant), History of premature labor, History ofhypertension, Smoking status, Weight of mother (pounds)
a.
Dependent Variable: Birth weight (gram)b.
Dari hasil uji didapatkan koefisien Durbin Watson 0,222, berarti asumsi
independensi terpenuhi.
28
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil
uji asumsi :
ANOVAb
11291987 4 2822996.778 5.861 .000a
88625066 184 481657.96599917053 188
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), History of premature labor, History of hypertension, Smokingstatus, Weight of mother (pounds)
a.
Dependent Variable: Birth weight (gram)b.
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas
terpenuhi
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
29
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
3210-1-2-3
Regression Standardized Predicted Value
3
2
1
0
-1
-2
-3
-4
Regre
ssion
Stud
entiz
ed Re
sidua
lDependent Variable: Birth weight (gram)
Scatterplot
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara
titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi
homoscedasity terpenuhi
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
30
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
3210-1-2-3-4
Regression Standardized Residual
40
30
20
10
0
Freq
uenc
y
Mean = -2.53E-16Std. Dev. = 0.989N = 189
Dependent Variable: Birth weight (gram)
Histogram
31
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
1.00.80.60.40.20.0
Observed Cum Prob
1.0
0.8
0.6
0.4
0.2
0.0
Expe
cted
Cum
Pro
b
Dependent Variable: Birth weight (gram)
Normal P-P Plot of Regression Standardized Residual
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk
distribusinya normal, berarti asumsi normality terpenuhi.
f.Diagostik Multicollinearity
Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi
secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari
nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka
mengindikasikan telah terjadi collinearity.
32
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
2449.121 233.779 10.476 .000
5.035 1.721 .211 2.925 .004 .925 1.081
-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060
-145.412 105.417 -.098 -1.379 .169 .947 1.056
(Constant)Weight of mother(pounds)Smoking statusHistory of hypertensionHistory of prematurelabor
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardize
dCoefficients
t Sig.Tolera
nce VIF
CollinearityStatistics
Dependent Variable: Birth weight (gram)a.
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb:
Model Summaryb
.336a .113 .094 694.016 .222Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Durbin-Watson
Predictors: (Constant), History of premature labor, History ofhypertension, Smoking status, Weight of mother (pounds)
a.
Dependent Variable: Birth weight (gram)b.
33
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
2449.121 233.779 10.476 .000
5.035 1.721 .211 2.925 .004 .925 1.081
-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060
-145.412 105.417 -.098 -1.379 .169 .947 1.056
(Constant)Weight of mother(pounds)Smoking statusHistory of hypertensionHistory of prematurelabor
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardize
dCoefficients
t Sig.Tolera
nce VIF
CollinearityStatistics
Dependent Variable: Birth weight (gram)a.
Interpretasi model:
Setelah dilakuikan analisis ,ternyata variabel independen yang masuk
model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan
riwayat prematur. Pada tabel ‘Model Summary’ terlihat koefisien determinasi (R
square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh
dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan
kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel
berat bayi sebesar 11,3 %.. Kemudian pada kotak ‘ANOVA’, kita lihat hasil uji F
yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat
menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat
diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi
variabel berat bayi.
Pada kotak ‘Coefficient’ kita dapat memperoleh persamaaan garisnya, pada
kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien
regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang
diperoleh adalah
Berat Bayi = 2449,1+5,0 Lwt – 236,4 smoke - 582Hi – 145,4 Ptl
34
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi
dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun
arti koef. B untuk masing-masing variabel adalah sbb:
- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi
akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi
dan prematur
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4
gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah
sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok
dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat
badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap
variabel dependennya. Pada hasil di atas berarti variabel yang paling besar
pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
35
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
REGRESI LOGISTIK
13Berbeda dengan regresi linier yang variabel dependennya numerik,
regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu
variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus,
artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak
puas dll).
A. REGRESI LOGISTIK SEDERHANA
1. Pendahuluan
Analisis regresi logistik adalah salah satu pendekatan model matematis
yang digunakan untuk menganalisis hubungan satu atau beberapa variabel
independen dengan sebuah variabel dependen katagorik yang bersifat
dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal,
merokok dan tidak merokok, dan lain-lain
Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis
variabel dependennya. Regresi linear digunakan apabila variabel dependennya
numerik , sedangkan regresi logistik diogunakan pada data yang dependennya
berbentuk katagorik yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh
analisis penelitian yang mempelajari hubungan antara variabel umur dengan
kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang
sampel, didapatkan hasil :
No 1 2 3 4 5 6 7 8 9 10 11 … … 100
Umur 20 22 23 24 25 27 28 29 30 32 33 … … 70
PJK 0 0 1 0 0 1 0 1 1 0 0 … … 1
36
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian
jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan
diberi kode 0 bila mereka tiodak menderita PJK.
Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier,
misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka
hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua
garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian
penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda.
Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel
dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu
menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan
kejadian PJK.
Untuk mempertajam analisis kita, sekarang dicoba untuk
mengelompokkan variabel independen (variabel umur) dan menhitung nilai
tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK)
untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada
tabel berikut:
37
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
PJK Umur Jumlah
Tidak Ya
Proporsi
Kejadian
20 – 29 10 9 1 0,10
30 – 34 15 13 2 0,13
35 – 39 12 9 3 0,25
40 – 44 15 10 5 0,33
45 – 49 13 7 6 0,46
50 – 54 8 3 5 0,63
55 – 59 17 4 13 0,76
60 – 69 10 2 8 0,80
Total 100 57 43 0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada
kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut
dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara
proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang
landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut
menyerupai huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara
untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada
38
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita
ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut
sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan
berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata
(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai
E(Y/x) akan berkisar antara 0 s.d ∞ (0 ≤ E(Y/x) ≤ ∞).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada
sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh
karena pada regresi logistik dependennya adalah dikotom maka variabel
dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti
pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk
mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian
PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu
berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik
f(z) = 1 .
1 + e-z
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko
tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu.
Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara -∞
sampai +∞.
Bila nilai Z mendekati – ∞ maka f(– ∞) = 1 . = 0
1 + e-(– ∞)
39
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Bila nilai Z mendekati + ∞ maka f(+ ∞) = 1 . = 1
1 + e-(+ ∞)
Fungsi Logistik dapat digambarkan sbb:
1
-∞ 0 +∞
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada
regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang
variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk
huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur
pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang
pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian
seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada
ketinggian tertentu garisnya akan mendatar mendekati nilai 1.
Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu
probabilitas kejadian pada dependen yang dikotom maka model regresi logistik
adalah pilihan yang tepat.
3. Model Logistik
Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan
penjumlahan linear konstanta (α) ditambah dengan β1X1, ditambah β2X2 dan
seterusnya sampai βiXi. Variabel X adalah variabel Independen.
40
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Z = α + β1X1 (Regresi logistik sederhana)
Z = α + β1X1 + β2X2 + … + βiXi (Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f(z) = 1 .
1 + e-(α + β1X1 + β2X2 + … + βiXi)
4. Contoh Kasus
Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari
mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama
vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama
variabel KAT).
Pemberian kode nilai variabel adalah sbb:
Untuk variabel PJK 1 = timbul penyakit jantung koroner
0 = tidak ada penyakit jantung koroner
Untuk variabel KAT 1 = kadar katekolamin darah tinggi
0 = kadar katekolamin darah rendah
Pertanyaan:
a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko
untuk terjadi PJK?
b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko
untuk terjadi PJK?
c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya
tinggi dengan yang kadar katekolaminnya rendah?
Jawab:
Dengan model regresi logistik maka pada soal tersebut modelnya adalah:
f(z) = 1 . 1 + e-z
41
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Nilai f(z) dapat diganti dengan P(X), maka rumusnya:
P(X) = 1 . 1 + e-z
Bila Z = α + β1KAT, maka modelnya :
P(X) = 1 . 1 + e-α + β1KAT
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb:
α = -3,911 dan β1 = 0,652, maka:
P(X) = 1 . 1 + e-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas:
a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.
Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai
KAT=1 pada model di atas, hasilnya:
P(X) = 1 . = 0,037 atau sekitar 4%
1 + e-(-3,911 + 0,652*1)
jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up.
b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah
Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai
KAT=0 pada model di atas, hasilnya:
P(X) = 1 . = 0,019 atau sekitar 2%
1 + e-(-3,911 + 0,652*0)
jadi mereka/individu yang kadar katekolaminnya rendah dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up.
c. Besar risiko kedua kelompok tersebut
P1(X) = 0,037 = 1,947 = 2,0
P0(X) 0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh
secara direk. Arti dari angka di atas adalah mereka yang kaadar
42
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi
dibandingkan mereka yang kadar katekolaminnya rendah.
Model regresi logistik dapat digunakan pada data yang dikumpulkan
melalui rancangan kohort, case control maupun cross sectional.
Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko
individual. Sedangkan pada rancangan case control dan cross sectional tidak
dapat digunakan untuk menghitung risiko individual karena β0 pada rancangan
ini tidak sahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi
yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket:
sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit).
Namun dengan memperlakukan rancangan case control dan cross sectional
sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan
perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan
perhitungan eksponensial β dari persamaan garis regresi logistik.
Odds Ratio (OR) = exp(β) atau dapat ditulis OR = e(β)
Dengan demikian dapat disimpulkan bahwa Individual Risk (ririko
individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan
pada rancangan case control, cross sectional tidak dapat melakukan prediskis
risiko individual. Pada rancangan case control dan cross sectional dan cohort
dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek.
Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk
memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal)
berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat
digunakan dengan model:
P(X) = 1 . 1 + e-(α + β1X1 + β2X2 + … + βiXi
43
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
B. REGRESI LOGISTIK GANDA
Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik
sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda
adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model.
Pada regresi logistik, variabel independennya boleh campuran antara variabel
katagorik dan numerik. Namun sebaiknya variabel independennya berupa
katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah.
Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu:
a. Model Prediksi
Pemodelan dengan tujuan untuk memperoleh model yang tediri dari
beberapa variabel independen yang dianggap terbaik untuk memprediksi
kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap
penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien
regresi logistik sekaligus.
Bentuk kerangka konsep model regresi :
Prosedur pemodelan:
Agar diperoleh model regresi yang hemat dan mampu menjelaskan
hubungan variabel independen dan independen dalam populasi, diperlukan
prosedur pemilihan variabel sbb:
1). Melakukan analisis bivariat antara masing-masing variabel independen
dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p <
0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa
saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara
substansi penting.
X1 X2 X3 X4
Y
44
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
2). Memilih variabel yang dianggap penting yang masuk dalam model,
dengan cara mempertahankan variabel yang mempunyai p value < 0,05
dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel
tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara
bertahap dimulai dari variabel yang mempunyai p value terbesar.
3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan
apakah variabel numerik dijadikan variabel katagorik atau tetap variabel
numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4
kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik
dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok
menunjukkan bentuk garis lurus, maka variabel numerik dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka
dapat dipertimbangkan dirubah dalam bentuk katagorik.
4). Setelah memperoleh model yang memuat variabel-variabel penting, maka
langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke
dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan
logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik.
Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting
dimasukkan dalam model.
b. Model Faktor Risiko
Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel
utama dengan variabel dependen dengan mengontrol beberapa variabel
konfonding.
Bentuk kerangka konsep model faktor risiko:
X1 Y
45
X2 X3 X4
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Tahapan pemodelan:
1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat
konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama
dengan semua variabel konfonding).
2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi
yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara
berurutan satu per satu dari nilai p Wald yang terbesar.
3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel
kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald
terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel
utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih
besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding
dan harus tetap berada dalam model.
46
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI
Untuk latihan, gunakan file data “LBW.SAV”
Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS
(race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA
HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT Masing-masing variabel independen dilakukan analisis bivariat dengan variabel
dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel
tersebut langsung masuk tahap multivariat. Untuk variabel independen yang
hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting,
maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi
bivariat menggunakan uji regresi logistik sederhana.
1.Analisis bivariat antara “umur” dengan”bblr”
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent
dan kotak Covariates.
4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam hal ini berarti masukkan “low”) dan pada kotak
independen isikan variabel independennya (dalam hal ini berarti masukkan
“age”).
Sehingga tampilannya sbb:
47
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5. Klik tombol ‘Options’ , klik ‘CI for Exp(B)’
6. Klik ‘Continue’
7. Klik “OK”, dan hasilnya sbb:
Block 1: Method = Enter
Omnibus Tests of Model Coefficients
2.760 1 .0972.760 1 .0972.760 1 .097
StepBlockModel
Step 1Chi-square df Sig.
Variables in the Equation
-.051 .032 2.635 1 .105 .950 .893 1.011
.385 .732 .276 1 .599 1.469
ageConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: age.a.
48
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada
bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25
sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan
SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI:
0,89-1,01)
2.Analisis bivariat antara “ras” dengan “bblr”
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent
dan kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates
variabel ‘age’ dikeluarkan dan gantilah dengan mengisikan variabel ‘race’.
Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis
katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras
49
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari
kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada
bagian Reference category, lalu klik Change, dan tampilannya:
6. Klik Continue, layar ke menu logistic
7. Klik OK
Categorical Variables Codings
96 .000 .00026 1.000 .00067 .000 1.000
WhiteBlackOther
RaceFrequency (1) (2)
Parameter coding
Omnibus Tests of Model Coefficients
5.010 2 .0825.010 2 .0825.010 2 .082
StepBlockModel
Step 1Chi-square df Sig.
50
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
4.922 2 .085.845 .463 3.323 1 .068 2.328 .939 5.772.636 .348 3.345 1 .067 1.889 .955 3.736
-1.155 .239 23.330 1 .000 .315
racerace(1)race(2)Constant
Step 1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race.a.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras
dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy,
terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam
akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit
putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai
risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.
3. Analisis bivariat antara “hipertensi” dengan “bblr”
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent
dan kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
“ht”. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients
4.022 1 .0454.022 1 .0454.022 1 .045
StepBlockModel
Step 1Chi-square df Sig.
51
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
1.214 .608 3.979 1 .046 3.365 1.021 11.088-.877 .165 28.249 1 .000 .416
htConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: ht.a.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam
multivariat
4. Analisis bivariat antara “kelainan uterus” dengan “bblr”
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak
Dependent dan kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates
isikan “ui”. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients
5.076 1 .0245.076 1 .0245.076 1 .024
StepBlockModel
Step 1Chi-square df Sig.
Variables in the Equation
.947 .417 5.162 1 .023 2.578 1.139 5.834-.947 .176 29.072 1 .000 .388
uiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: ui.a.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat
lanjut ke multivariat
52
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Analisis bivariat antara “periksa hamil” dengan “bblr”
1.Pilih “Analyze”
2.Pilih “Regression”
3.Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
4.Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
“ftv”. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients
.773 1 .379
.773 1 .379
.773 1 .379
StepBlockModel
Step 1Chi-square df Sig.
Variables in the Equation
-.135 .157 .744 1 .389 .874 .643 1.188-.687 .195 12.427 1 .000 .503
ftvConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)
Variable(s) entered on step 1: ftv.a.
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak
dapat lanjut ke multivariat, namun karena secara substansi variabel periksa
hamil sangat penting, maka variabel ini dapat dianalisis multivariat.
6.Analisis bivariat antara “merokok” dengan “bblr”
Omnibus Tests of Model Coefficients
4.867 1 .0274.867 1 .0274.867 1 .027
StepBlockModel
Step 1Chi-square df Sig.
53
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
.704 .320 4.852 1 .028 2.022 1.081 3.783-1.087 .215 25.627 1 .000 .337
smokeConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: smoke.a.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat.
7.Analisis bivariat antara “prematur” dengan “bblr”
Omnibus Tests of Model Coefficients
6.779 1 .0096.779 1 .0096.779 1 .009
StepBlockModel
Step 1Chi-square df Sig.
Variables in the Equation
.802 .317 6.391 1 .011 2.230 1.197 4.151-.964 .175 30.370 1 .000 .381
ptlConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: ptl.a.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat
Hasil seleksi bivariat :
Variabel P value
Umur
Ras
Hipertensi
Kelainan uterus
Periksa hamil
Merokok
Prematur
0,097
0,082
0,045
0,024
0,379
0,027
0,009
54
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa
hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis
multivariat oleh karena secara substansi periksa hamil merupakan variabel yang
sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut
dengan kejadian bblr.
1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel
dependen.
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy.
5. Klik Option, pilih ‘CI for exp(B)’
6. Klik ‘Continue’
55
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
7. Kilik ‘OK’
Logistic Regression
Variables in the Equation
-.041 .036 1.249 1 .264 .960 .894 1.0316.783 2 .034
1.009 .502 4.034 1 .045 2.743 1.025 7.3451.003 .426 5.560 1 .018 2.727 1.185 6.280
.964 .391 6.090 1 .014 2.622 1.219 5.639
.630 .340 3.429 1 .064 1.877 .964 3.6541.361 .631 4.648 1 .031 3.902 1.132 13.451
.802 .458 3.066 1 .080 2.229 .909 5.468
.009 .161 .003 1 .954 1.009 .736 1.384-1.183 .919 1.659 1 .198 .306
ageracerace(1)race(2)smokeptlhtuiftvConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.a.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui
dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv
dikeluarkan dari model.
Dengan langkah yang sama akhirnya diperoleh hasil sbb.
56
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Logistic Regression
Variables in the Equation
-.040 .036 1.275 1 .259 .960 .896 1.0306.781 2 .034
1.009 .503 4.035 1 .045 2.744 1.025 7.3471.002 .425 5.562 1 .018 2.723 1.184 6.262.963 .390 6.086 1 .014 2.620 1.219 5.632.629 .340 3.423 1 .064 1.875 .963 3.651
1.358 .629 4.663 1 .031 3.889 1.134 13.341.800 .457 3.063 1 .080 2.226 .908 5.454
-1.184 .919 1.661 1 .197 .306
ageracerace(1)race(2)smokeptlhtuiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.a.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race,
smoke, ptl, ht, dan ui.
Variabel OR ftv ada OR ftv tak ada perubahan OR
Age
Race(1)
Race(2)
Smoke
Ptl
Ht
ui
ftv
0.960
2.743
2.727
2.622
1.877
3.902
2.229
1.009
0.960
2.744
2.723
2.620
1.875
3.889
2.226
0 %
0 %
0 %
0 %
0,1 %
0.3 %
0,1 %
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian
dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah
umur, dengan demikian dikelurkan dar model dan hasilnya
Hasilnyanya :
57
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538
.991 .387 6.569 1 .010 2.694 1.263 5.747
.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537
.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117
racerace(1)race(2)smokeptlhtuiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race, smoke, ptl, ht, ui.a.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel
yang masih aktif di model.
Variabel OR age ada OR age tak ada perubahan OR
Age
Race(1)
Race(2)
Smoke
Ptl
Ht
ui
ftv
0.960
2.743
2.727
2.622
1.877
3.902
2.229
1.009
-
2.968
2.883
2.694
1.779
3.912
2.350
8,2 %
5,7 %
2,7 %
5,2 %
0.3 %
5,4 %
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan
demikian variabel umur dikeluarkan dari model
Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl
dikeluarkan model, hasilnya
58
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
8.245 2 .0161.064 .499 4.545 1 .033 2.897 1.090 7.7041.083 .413 6.877 1 .009 2.955 1.315 6.6401.094 .380 8.299 1 .004 2.986 1.419 6.2861.359 .630 4.660 1 .031 3.894 1.133 13.3791.006 .438 5.262 1 .022 2.734 1.158 6.458
-2.092 .380 30.307 1 .000 .123
racerace(1)race(2)smokehtuiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race, smoke, ht, ui.a.
Setelah ptl dikeluarkan, kita lihat perubahan OR nya:
Variabel OR ptl ada OR ptl tak ada perubahan OR
Age
Race(1)
Race(2)
Smoke
Ptl
Ht
ui
ftv
0.960
2.743
2.727
2.622
1.877
3.902
2.229
1.009
-
2.897
2.955
2.986
-
3.894
2.734
-
5,6 %
8,3 %
13,8 %
-
0.2 %
22,6 %
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:
59
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
8.286 2 .0161.062 .500 4.513 1 .034 2.894 1.086 7.7121.085 .411 6.949 1 .008 2.958 1.321 6.626
.996 .382 6.794 1 .009 2.707 1.280 5.7261.221 .629 3.764 1 .052 3.390 .988 11.640
.696 .325 4.596 1 .032 2.007 1.062 3.793-2.025 .372 29.586 1 .000 .132
racerace(1)race(2)smokehtptlConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race, smoke, ht, ptl.a.
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan :
Variabel OR ui ada OR ui tak ada perubahan OR
Age
Race(1)
Race(2)
Smoke
Ptl
Ht
ui
ftv
0.960
2.743
2.727
2.622
1.877
3.902
2.229
1.009
-
2.894
2.958
2.707
2.007
3.390
-
-
5,5 %
8,4 %
3,2 %
6,9 %
13.1 %
-
-
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:
60
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538
.991 .387 6.569 1 .010 2.694 1.263 5.747
.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537
.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117
racerace(1)race(2)smokeptlhtuiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race, smoke, ptl, ht, ui.a.
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi,
kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus
sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi.
Langkahnya:
1. klik analysis, klik regression, klik binary ogistik
2. Kotak dependen isikan low
3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui
4. Klik tombol Next
5. isikan : smoke*ht ke kotak kovariat
6. klik OK
lihat hasilnya pada bagian Block 2
Block 2: Method = Enter Omnibus Tests of Model Coefficients
Chi-
square df Sig. Step 1 Step .000 1 .994 Block .000 1 .994 Model 26.560 7 .000
61
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
7.900 2 .0191.088 .502 4.692 1 .030 2.969 1.109 7.9461.059 .419 6.387 1 .011 2.883 1.268 6.555
.990 .397 6.211 1 .013 2.692 1.236 5.865
.576 .336 2.937 1 .087 1.779 .921 3.4381.360 .831 2.680 1 .102 3.896 .765 19.852
.854 .451 3.584 1 .058 2.350 .970 5.693
.010 1.283 .000 1 .994 1.010 .082 12.491-2.146 .386 30.875 1 .000 .117
racerace(1)race(2)smokeptlhtuiht by smokeConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: ht * smoke .a.
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya
memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05,
berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa
ada interaksi:
MODEL TERAKHIR Variables in the Equation
7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538
.991 .387 6.569 1 .010 2.694 1.263 5.747
.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537
.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117
racerace(1)race(2)smokeptlhtuiConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: race, smoke, ptl, ht, ui.a.
62
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Interpretasi:
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat
Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B)
pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka
nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model.
Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel
riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis
didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang
menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi
dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race,
merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk
variabel yang lain.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap
variabel dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin
besar nilai exp (B) berarti semakin besar pengaruhnya terhadap variabel
dependen yang dianalisis. Dalam data ini berarti hipertensi yang paling besar
pengaruhnya terhadap kejadian bayi BBLR.
63
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS KEDUA :
REGRESI LOGISTIK MODEL FAKTOR RISIKO
Tujuan analisis :
Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive
Variabel independen utama : Pkerjaan
Variabel dependen : Eksklusive
Variabel konfounding : umur, berat badan ibu dan sikap
A. Langkah pertama: menyusun model mencakup semua variabel dan variabel
interaksi
Cara
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan
variabel independen utama beserta variabel konfounding dan interaksinya
(dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu,
kerja*sikap)
4. Klik ‘OK’, dan hasilnya sbb:
Logistic Regression
Variables in the Equation
-20.275 28420.722 .000 1 .999 .000 .000 .1.681 1.197 1.972 1 .160 5.372 .514 56.109-.052 .114 .208 1 .648 .949 .760 1.186
20.279 28420.722 .000 1 .999 6E+008 .000 ..148 .159 .869 1 .351 1.160 .849 1.583
-1.505 1.432 1.105 1 .293 .222
kerjaumur1sikapkerja by umur1kerja by sikapConstant
Step 1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .a.
64
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:
Logistic Regression
Variables in the Equation
-.445 1.718 .067 1 .795 .641 .022 18.5572.217 1.146 3.741 1 .053 9.177 .971 86.749-.060 .114 .274 1 .601 .942 .753 1.178
.175 .156 1.264 1 .261 1.191 .878 1.616
-1.881 1.483 1.610 1 .205 .152
kerjaumur1sikapkerja bysikapConstant
Step 1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .a.
Dari output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
karana p valuenya > 0,05. Setelah dikeluarkan hasilnya:
Variables in the Equation
1.376 .666 4.273 1 .039 3.959 1.074 14.5922.260 1.157 3.812 1 .051 9.582 .991 92.609
.035 .076 .212 1 .645 1.036 .893 1.202
-2.876 1.239 5.384 1 .020 .056
kerjaumur1sikapConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.forEXP(B)
Variable(s) entered on step 1: kerja, umur1, sikap.a.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel
interasksi, langkah selanjutnya uji konfounding
65
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
UJI KONFOUNDING Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan
dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka
varaibel tsb dianggap sebagai variabel konfounding.
Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model
hasiilnya sbb:’
Variables in the Equation
1.413 .660 4.585 1 .032 4.110 1.127 14.9852.378 1.135 4.389 1 .036 10.783 1.165 99.754
-2.624 1.113 5.555 1 .018 .073
kerjaumur1Constant
Step 1
a
B S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)
Variable(s) entered on step 1: kerja, umur1.a.
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 – 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya:
Variables in the Equation
1.698 .618 7.545 1 .006 5.464 1.627 18.357
-.754 .429 3.091 1 .079 .471
kerjaConstant
Step1
a
B S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)
Variable(s) entered on step 1: kerja.a.
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
66
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model terakhir :
Variables in the Equation
1.413 .660 4.585 1 .032 4.110 1.127 14.9852.378 1.135 4.389 1 .036 10.783 1.165 99.754
-2.624 1.113 5.555 1 .018 .073
kerjaumur1Constant
Step 1
a
B S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)
Variable(s) entered on step 1: kerja, umur1.a.
Interpretasi:
Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding
hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb:
Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai
peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah
dikontrol variabel ”umur”.
67
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Lampiran data LBW. SAV.
Id Low age lwt race smoke ptl ht ui ftv bwt
1 1 28 120 3 1 1 0 1 0 709
2 1 29 130 1 0 0 0 1 2 1021
3 1 34 187 2 1 0 1 0 0 1135
4 1 25 105 3 0 1 1 0 0 1330
5 1 25 85 3 0 0 0 1 0 1474
6 1 27 150 3 0 0 0 0 0 1588
7 1 23 97 3 0 0 0 1 1 1588
8 1 24 128 2 0 1 0 0 1 1701
9 1 24 132 3 0 0 1 0 0 1729
10 1 21 165 1 1 0 1 0 1 1790
11 1 32 105 1 1 0 0 0 0 1818
12 1 19 91 1 1 2 0 1 0 1885
13 1 25 115 3 0 0 0 0 0 1893
14 1 16 130 3 0 0 0 0 1 1899
15 1 25 92 1 1 0 0 0 0 1928
16 1 20 150 1 1 0 0 0 2 1928
17 1 21 200 2 0 0 0 1 2 1928
18 1 24 155 1 1 1 0 0 0 1936
19 1 21 103 3 0 0 0 0 0 1970
20 1 20 125 3 0 0 0 1 0 2055
21 1 25 89 3 0 2 0 0 1 2055
22 1 19 102 1 0 0 0 0 2 2082
23 1 19 112 1 1 0 0 1 0 2084
24 1 26 117 1 1 1 0 0 0 2084
25 1 24 138 1 0 0 0 0 0 2100
26 1 17 130 3 1 1 0 1 0 2125
27 1 20 120 2 1 0 0 0 3 2126
28 1 22 130 1 1 1 0 1 1 2187
29 1 27 130 2 0 0 0 1 0 2187
30 1 20 80 3 1 0 0 1 0 2211
68
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
31 1 17 110 1 1 0 0 0 0 2225
32 1 25 105 3 0 1 0 0 1 2240
33 1 20 109 3 0 0 0 0 0 2240
34 1 18 148 3 0 0 0 0 0 2282
35 1 18 110 2 1 1 0 0 0 2296
36 1 20 121 1 1 1 0 1 0 2296
37 1 21 100 3 0 1 0 0 4 2301
38 1 26 96 3 0 0 0 0 0 2325
39 1 31 102 1 1 1 0 0 1 2353
40 1 15 110 1 0 0 0 0 0 2353
41 1 23 187 2 1 0 0 0 1 2367
42 1 20 122 2 1 0 0 0 0 2381
43 1 24 105 2 1 0 0 0 0 2381
44 1 15 115 3 0 0 0 1 0 2381
45 1 23 120 3 0 0 0 0 0 2395
46 1 30 142 1 1 1 0 0 0 2410
47 1 22 130 1 1 0 0 0 1 2410
48 1 17 120 1 1 0 0 0 3 2414
49 1 23 110 1 1 1 0 0 0 2424
50 1 17 120 2 0 0 0 0 2 2438
51 1 26 154 3 0 1 1 0 1 2442
52 1 20 105 3 0 0 0 0 3 2450
53 1 26 190 1 1 0 0 0 0 2466
54 1 14 101 3 1 1 0 0 0 2466
55 1 28 95 1 1 0 0 0 2 2466
56 1 14 100 3 0 0 0 0 2 2495
57 1 23 94 3 1 0 0 0 0 2495
58 1 17 142 2 0 0 1 0 0 2495
59 1 21 130 1 1 0 1 0 3 2495
60 0 19 182 2 0 0 0 1 0 2523
61 0 33 155 3 0 0 0 0 3 2551
62 0 20 105 1 1 0 0 0 1 2557
63 0 21 108 1 1 0 0 1 2 2594
64 0 18 107 1 1 0 0 1 0 2600
69
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
65 0 21 124 3 0 0 0 0 0 2622
66 0 22 118 1 0 0 0 0 1 2637
67 0 17 103 3 0 0 0 0 1 2637
68 0 29 123 1 1 0 0 0 1 2663
69 0 26 113 1 1 0 0 0 0 2665
70 0 19 95 3 0 0 0 0 0 2722
71 0 19 150 3 0 0 0 0 1 2733
72 0 22 95 3 0 0 1 0 0 2750
73 0 30 107 3 0 1 0 1 2 2750
74 0 18 100 1 1 0 0 0 0 2769
75 0 18 100 1 1 0 0 0 0 2769
76 0 15 98 2 0 0 0 0 0 2778
77 0 25 118 1 1 0 0 0 3 2782
78 0 20 120 3 0 0 0 1 0 2807
79 0 28 120 1 1 0 0 0 1 2821
80 0 32 121 3 0 0 0 0 2 2835
81 0 31 100 1 0 0 0 1 3 2835
82 0 36 202 1 0 0 0 0 1 2836
83 0 28 120 3 0 0 0 0 0 2863
84 0 25 120 3 0 0 0 1 2 2877
85 0 28 167 1 0 0 0 0 0 2877
86 0 17 122 1 1 0 0 0 0 2906
87 0 29 150 1 0 0 0 0 2 2920
88 0 26 168 2 1 0 0 0 0 2920
89 0 17 113 2 0 0 0 0 1 2920
90 0 17 113 2 0 0 0 0 1 2920
91 0 24 90 1 1 1 0 0 1 2948
92 0 35 121 2 1 1 0 0 1 2948
93 0 25 155 1 0 0 0 0 1 2977
94 0 25 125 2 0 0 0 0 0 2977
95 0 29 140 1 1 0 0 0 2 2977
96 0 19 138 1 1 0 0 0 2 2977
97 0 27 124 1 1 0 0 0 0 2992
98 0 31 215 1 1 0 0 0 2 3005
70
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
99 0 33 109 1 1 0 0 0 1 3033
100 0 21 185 2 1 0 0 0 2 3042
101 0 19 189 1 0 0 0 0 2 3062
102 0 23 130 2 0 0 0 0 1 3062
103 0 21 160 1 0 0 0 0 0 3062
104 0 18 90 1 1 0 0 1 0 3076
105 0 18 90 1 1 0 0 1 0 3076
106 0 32 132 1 0 0 0 0 4 3080
107 0 19 132 3 0 0 0 0 0 3090
108 0 24 115 1 0 0 0 0 2 3090
109 0 22 85 3 1 0 0 0 0 3090
110 0 22 120 1 0 0 1 0 1 3100
111 0 23 128 3 0 0 0 0 0 3104
112 0 22 130 1 1 0 0 0 0 3132
113 0 30 95 1 1 0 0 0 2 3147
114 0 19 115 3 0 0 0 0 0 3175
115 0 16 110 3 0 0 0 0 0 3175
116 0 21 110 3 1 0 0 1 0 3203
117 0 30 153 3 0 0 0 0 0 3203
118 0 20 103 3 0 0 0 0 0 3203
119 0 17 119 3 0 0 0 0 0 3225
120 0 17 119 3 0 0 0 0 0 3225
121 0 23 119 3 0 0 0 0 2 3232
122 0 24 110 3 0 0 0 0 0 3232
123 0 28 140 1 0 0 0 0 0 3234
124 0 26 133 3 1 2 0 0 0 3260
125 0 20 169 3 0 1 0 1 1 3274
126 0 24 115 3 0 0 0 0 2 3274
127 0 28 250 3 1 0 0 0 6 3303
128 0 20 141 1 0 2 0 1 1 3317
129 0 22 158 2 0 1 0 0 2 3317
130 0 22 112 1 1 2 0 0 0 3317
131 0 31 150 3 1 0 0 0 2 3321
132 0 23 115 3 1 0 0 0 1 3331
71
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
133 0 16 112 2 0 0 0 0 0 3374
134 0 16 135 1 1 0 0 0 0 3374
135 0 18 229 2 0 0 0 0 0 3402
136 0 25 140 1 0 0 0 0 1 3416
137 0 32 134 1 1 1 0 0 4 3430
138 0 20 121 2 1 0 0 0 0 3444
139 0 23 190 1 0 0 0 0 0 3459
140 0 22 131 1 0 0 0 0 1 3460
141 0 32 170 1 0 0 0 0 0 3473
142 0 30 110 3 0 0 0 0 0 3475
143 0 20 127 3 0 0 0 0 0 3487
144 0 23 123 3 0 0 0 0 0 3544
145 0 17 120 3 1 0 0 0 0 3572
146 0 19 105 3 0 0 0 0 0 3572
147 0 23 130 1 0 0 0 0 0 3586
148 0 36 175 1 0 0 0 0 0 3600
149 0 22 125 1 0 0 0 0 1 3614
150 0 24 133 1 0 0 0 0 0 3614
151 0 21 134 3 0 0 0 0 2 3629
152 0 19 235 1 1 0 1 0 0 3629
153 0 25 95 1 1 3 0 1 0 3637
154 0 16 135 1 1 0 0 0 0 3643
155 0 29 135 1 0 0 0 0 1 3651
156 0 29 154 1 0 0 0 0 1 3651
157 0 19 147 1 1 0 0 0 0 3651
158 0 19 147 1 1 0 0 0 0 3651
159 0 30 137 1 0 0 0 0 1 3699
160 0 24 110 1 0 0 0 0 1 3728
161 0 19 184 1 1 0 1 0 0 3756
162 0 24 110 3 0 1 0 0 0 3770
163 0 23 110 1 0 0 0 0 1 3770
164 0 20 120 3 0 0 0 0 0 3770
165 0 25 241 2 0 0 1 0 0 3790
166 0 30 112 1 0 0 0 0 1 3799
72
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
167 0 22 169 1 0 0 0 0 0 3827
168 0 18 120 1 1 0 0 0 2 3856
169 0 16 170 2 0 0 0 0 4 3860
170 0 32 186 1 0 0 0 0 2 3860
171 0 18 120 3 0 0 0 0 1 3884
172 0 29 130 1 1 0 0 0 2 3884
173 0 33 117 1 0 0 0 1 1 3912
174 0 20 170 1 1 0 0 0 0 3940
175 0 28 134 3 0 0 0 0 1 3941
176 0 14 135 1 0 0 0 0 0 3941
177 0 28 130 3 0 0 0 0 0 3969
178 0 25 120 1 0 0 0 0 2 3983
179 0 16 95 3 0 0 0 0 1 3997
180 0 20 158 1 0 0 0 0 1 3997
181 0 26 160 3 0 0 0 0 0 4054
182 0 21 115 1 0 0 0 0 1 4054
183 0 22 129 1 0 0 0 0 0 4111
184 0 25 130 1 0 0 0 0 2 4153
185 0 31 120 1 0 0 0 0 2 4167
186 0 35 170 1 0 1 0 0 1 4174
187 0 19 120 1 1 0 0 0 0 4238
188 0 24 116 1 0 0 0 0 1 4593
189 0 45 123 1 0 0 0 0 1 4990
73