SUTANTO Analisis Multivariat

SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006

1

ANALISIS MULTIVARIAT SUTANTO PRIYO HASTONO Departemen Biostatistik FKM UI 2006


ANALISIS MULTIVARIAT

11

Proses analisis multivariat dengan menghubungkan beberapa variabel

independen dengan satu variabel dependen pada waktu yang bersamaan.

Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya

jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal

diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka

diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden.

Dari analisis multivariat kita dapat mengetahui:

a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel

dependen?

b. Apakah variabel independen berhubungan dengan variabel dependen

dipengaruhi variabel lain atau tidak?

c. Bentuk hubungan beberapa variabel independen dengan variabel dependen,

apakah berhubungan langsung atau pengeruh tidak langsung.

Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori

atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis

statistik yang dapat digunakan untuk analisis multivariat:

Variabel Independen Variabel Dependen Jenis Uji

Numerik

(minimal 1 variabel numerik)

Numerik Uji Regresi Linier

Katagori Numerik ANOVA

Katagori

(dapat dengan numerik)

Katagori Uji Regresi Logistik

Kontinyu Katagori Uji Diskriminan

Numerik/Katgori Numerik waktu Uji Regresi Cox

2


Dalam melakukan analisis multivariat kita harus mengetahui terlebih

dahulu mengenai konsep konfounding dan Interaksi.

a.Konfounding

Konfounding merupakan kondisi bias dalam mengestimasi efek

pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari

perbandingan yang tidak seimbang antara kelompok expose dengan kelompok

non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan

risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose.

Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun

expose dihilangkan pada kedua kelompok tersebut.

Satu variabel disebut konfounding bila variabel tersebut merupakan faktor

risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli

statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel

tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan

berhubungan dengan variabel independen tapi tidak merupakan hasil dari

variabel independen.

b.Interaksi

Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose

Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit

berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti

efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam

analisis karena pada saat analisis kita harus menentukan apakah akan

melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah

untuk masing-masing strata.

Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel

expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus

dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang

tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing

strata harus dihitung

3


ANALISIS

REGRESI LINIER GANDA

12 Analisis Multiple regression Linear atau sering disebut juga analisis regresi

linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier

sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel

independen (variabel bebas) dihubungkan dengan satu variabel dependen

(terikat).. Sedangkan pada Multiple regression Linear merupakan analisis

hubugan antara beberapa variabel independen dengan satu variabel dependen.

Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan

darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat

badan, dan jenis kelamin.

Dalam regresi linier ganda variabel dependennya harus numerik

sedangkan variabel independen boleh semuanya numerik dan boleh juga

campuran numerik dan katagorik. Model persamaan regresi linier ganda

merupakan perluasan regresi linier sederhana, yaitu:

Y = a + b1X1 + b2X2 + …. + bkXk + e

1. Asumsi Regresi Linier

Seperti pada umumnya pengujian statistik, dari analisis regresi linier

ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar

diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi)

tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil.

Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin ‘pada

semua orang (populasi)’, tidak hanya seperti yang teramati di sejumlah orang

pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis

regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam

analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression

4


Linear harus memenuhi asumsi/persyaratan yang ditetapkan. Adapun asumsi

yang digunakan dalam Multiple regression Lineari sebagai berikut

a. Asumsi Eksistensi (Variabel Random)

Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)

adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi

ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,

sampel yang diambil harus dilakukan secara random. Cara mengetahui

asumsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual

dari model, bila residual menunjukkan adanya mean dan sebaran (varian ata

satandar deviasi) maka asumsi eksistensi terpenuhi.

b. Asumsi Independensi

Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai

dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai

observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk

mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin

Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,

sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi

c. Asumsi Linieritas

Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak

pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk

mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)

bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier.

d. Asumsi Homoscedascity

Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity

dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran

tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka

dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi

homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola

tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka

diduga variannya terjadi heteroscedasticity.

5


e. Asumsi Normalitas

Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.

dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar

garis diagonal dan mengikuti arah garis diagonal, maka model regresi

memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.

2. Kegunaan Analisis Regresi Ganda

Tujuan analisis regresi linier ganda adalah untuk menemukan model

regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan

dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna

untuk dua hal:

a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi

yang ada pada sebuah atau beberapa variabel independen. Disini dapat

diketahui secara probabilitas nilai variabel dependen bila seseorang/individu

mempunyai suatu set variabel dengan independen tertentu. Misalnya kita

melakukan analisis variabel independen umur, BB dan jenis kelamin

dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi,

seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat

badan dan jenis kelamin tertentu.

b. Estimasi, menguantifikasihubungan sebuah atau beberapa variabel

independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat

digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan

dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa

besar hubungan masing-masing independen terhadap variabel independen

lainnya. Dari analisis ini dapat diketahui variabel mana yang paling

besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari

koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.

6


3. Pemodelan

Satu hal yang penting dalam regresi ganda adalah bagaimana memilih

variabel independen sehingga terbentuk sebuah model yang paling sesuai

menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam

(populasi).

Dalam pembuatan model seringkali dijumpai pandangan yang kurang

tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke

dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel

independen ke dalam model, maka variabel dependen diharapkan diprediksi

dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak

selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel

dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang

tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping

itu, model dengan banyak variabel seringkali malah menyulitkan dalam

interpretasi.

Berdasarkanpertimbangan tersebut pemilihan variabel independen

hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang

dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk

dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk

menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen.

Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk

dalam model, salah satu kriteria yang sering digunakan adalah melihat

perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena

setiap penambahan satu variabel independen akan meningkatkan R2 walaupun

variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan

adalah model dengan nilai R2 yang besar namun variabel independennya dengan

jumlah sedikit.

Berikut langkah-langkah dalam pemodelan regresi linier ganda:

1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat

model. Masing-masing variabel independen dihubungkan dengan variabel

7


dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka

variabel tersebut masuk dalam model multivariat. Untuk variabel yang p

value-nya > 0,25 namun secara substansi penting, maka variabel tersebut

dapat masuk ke multivariat.

2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk

dalam model. Ada beberapa metode untuk melakukan pemilihan variabel

independen dalam analisis multivariat regresi linier ganda, yaitu:

a). ENTER, memasukkan semua variabel independen dengan serentak satu

langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode ini

yang tepat/sering digunakan, karena dalam pemodelan kita dapat

melakukan pertimbangan aspek substansi.

b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian

variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke

dalam model, sampai semua variabel yang memenuhi kriteria tersebut

masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel

yang mempunyai korelasi parsial terbesar dengan variabel dependen dan

yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi

parsial adalah adalah korelasi antara variabel independen dengan

dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005

artinya variabel yang dapat masuk model bila variabel tersebut

mempunyai nilai P lebih kecil atau sama dengan 0,05.

c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi

kemudian satu persatu variabel independen dikeluarkan dari model

berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali

dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil

dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah

0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama

dengan 0,10 dikeluarkan dari model.

d). STEPWISE, model ini merupakan kombinasi antara metode backward dan

Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa

8


variabel sama sekali di dalam model. Lalu satu variabel hasil

pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu

variabel hasil pengkorelasian dimasukkan ke dalam model dan

dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama

masuk sama dengan metode forward yakni variabel yang mempunyai

korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini

diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria

pengeluaran seperti metode backward.

e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu

langkah, tanpa melewati kriteria kemaknaan statistik tertentu.

3) Melakukan diagnostik regresi linier,

a). Melakukan pengujian terhadap kelima asumsi.

b). Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar

variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui

adanya kolinearitas dapat dilihat dai nilai koefisien korelasi ®, bila nilai r

lebih tinggi dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui

dari nilai VIF atau tolerance, bila nilai VIF > 10, atau tolerance sekitar 1

(satu) maka model terjadi kolinearitas.

4). Melakukan analisis interaksi. Setelah memperoleh model yang memuat

variabel-variabel penting, maka langkah selanjutnya adalah memeriksa

adanya interaksi antar variabel independen. Interaksi merupakan keadaan

dimana hubungan antara satu variabel independen dengan dependen

berbeda menurut tingkat variabel independen yang lain.

5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek

reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok.

Untuk masing-masing sampel dibuat model dengan variabel yang sama,

9


kemudian bandingkan antara model 1 dan model 2, bila hasilnya

sama/hampir sama maka model regresi reliabel. Bila model reliabel maka

seluruh sampel dapat digunakan untuk pembuatan model.

10


KASUS:

REGRESI LINIER GANDA Sebagai latihan kita melakukan analisis penelitian “faktor-faktor yang

berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV.

Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur

ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami

prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya

berat badan bayi (BWT).

Kode variabel pada file data : LBW.SAV

Nama Definisi Operasional Hasil Ukur

Id Nomor Identitas

Low Kondisi bayi dalam klasifikasi BBLR 0 = ≥ 2500 g

1 = < 2500 g

Age Umur ibu tahun

Lwt Berat ibu pada saat menstruasi terakhir pounds

Race Suku bangsa/ras 1= putih

2= hitam

3 = lainnya

Smoke Kebiasaan merokok selama hamil 0 = tidak

1 = ya

Ptl Riwayat mengalami prematur 0 = tidak

1 = ya

Ht Riwayat menderita hipertensi 0 = tidak

1 = ya

Ui Terjadi/mengalami iritability Uterine 0 = tidak

1 = ya

Ftv Frekuensi periksa hamil pada trimester pertama 0 ,1, 2 dst..

Bwt Berat badan bayi gram

11


Data selengkapnya ada di lampiran:

A. Langkah pertama pemodelan: SELEKSI BIVARIAT

Seleksi bivariat masing-masing variabel independen dengan variabel dependen.

Variabel yang dapat masuk model multivariat adalah variabel yang pada analisis

bivariatnya mempunyai nilai p (p value) < 0,25. Namun ketentuan p value<0,25

ini tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun

p value-nya > 0,25 karena secara substansi sangat penting berhubungan dengan

variabel dependen, maka variabel tersebut dapat diikutkan dalam model

multivariat.

Uji yang digunakan pada analisis bivariat tergantung dari variabel yang

digunakan, bila : variabel independennya numerik -> uji korelasi, bila

independennya katagorik -> uji t atau uji anova.

a. Bivariat uji korelasi : melakukan analisis bivariat untuk variabel independen

berjenis numerik: variabel berat badan ibu, umur ibu, frekuensi prematur,

frekuensi anc :

Langkahnya :

1. Klik ‘Analysis’, sorot ke ‘Correlate’, sorot dan klik ‘Bivariate’

2. Muncul dilayar menu ‘Bivariate Correlations’

3. Pada kotak Variables, isikan semua variabel numerik baik untuk variabel

independen (age,lwt,ptl,ftv) dan dependen (bwt)

12


4. Klik tombol ‘OK’

Muncul dilayar hasil sbb:

Correlations

Correlations

1 .180* .215** .072 .090.013 .003 .328 .219

189 189 189 189 189.180* 1 .141 -.140 .186*.013 .054 .055 .010189 189 189 189 189.215** .141 1 -.044 .058.003 .054 .544 .426

189 189 189 189 189

.072 -.140 -.044 1 -.155*

.328 .055 .544 .034189 189 189 189 189.090 .186* .058 -.155* 1.219 .010 .426 .034189 189 189 189 189

Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

Age of mother

Weight of mother(pounds)

No physician visitsin first trimester

History ofpremature labor

Birth weight (gram)

Age ofmother

Weight ofmother

(pounds)

Nophysician

visits in firsttrimester

History ofpremature labor

Birthweight(gram)

Correlation is significant at the 0.05 level (2-tailed).*.

Correlation is significant at the 0.01 level (2-tailed).**.

13


Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel

umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi

prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur,

berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan

demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat.

Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu

p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena

secara substansi frekuensi anc merupakan faktor yang sangat penting

mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan

dalam analisis multivariat.

b. Bivariat uji t: melakukan analisis bivariat untuk variabel independen

berjenis katagorik: merokok dan riwayat hipertensi

1. Merokok

Langkahnya:

1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu

“Compare Means’, lalu pilih “Independen-Samples T Test”

2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’ dan

‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel

numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel

katagoriknya, ingat jangan sampai terbalik.

3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’

4.Klik variabel ‘smoke’ dan masukkan ke kotak‘Grouping Variable’.

14


5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta

mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu

bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada

Group 1” dan 1 pada “Group 2”

1. Klik “Continue”

2. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:

T-Test

Group Statistics

115 3054.96 752.409 70.16374 2773.24 660.075 76.732

Smoking statusNoYes

Birth weight (gram)N Mean Std. Deviation

Std. ErrorMean

15


Independent Samples Test

1.508 .221 2.634 187 .009 281.713 106.969 70.693 492.7

2.709 170.0 .007 281.713 103.974 76.467 487.0

EqualvariancesassumedEqualvariancesnotassumed

Birthweight(gram)

F Sig.

Levene's Testfor Equality of

Variances

t df

Sig.(2-tailed)

MeanDifferen

ce

Std. ErrorDifferenc

e Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat. 2. Riwayat Hipertensi

Langkahnya:

1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu

“Compare Means’, lalu pilih “Independen-Samples T Test”

2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’ dan

‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel

numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel

katagoriknya, ingat jangan sampai terbalik.

3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’

4.Klik variabel ‘ht’ dan masukkan ke kotak‘Grouping Variable’. (variabel yang

sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan

16


5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta

mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu

bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada

Group 1” dan 1 pada “Group 2”

6.Klik “Continue”

7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:

Group Statistics

177 2972.31 709.226 53.30912 2536.75 917.341 264.813

History of hypertensionNoYes

Birth weight (gram)N Mean Std. Deviation

Std. ErrorMean

17


Independent Samples Test

1.419 .235 2.019 187 .045 435.56 215.709 10.024 861.1

1.612 11.908 .133 435.56 270.126 -153.5 1025

EqualvariancesassumedEqualvariancesnotassumed

Birthweight(gram)

F Sig.

Levene's Test forEquality ofVariances

t df

Sig.(2-taile

d)

MeanDiffere

nce

Std.Error

Difference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat. B. Langkah Kedua : Pemodelan Multivariat Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat

secara bersama-sama. Variabel yang valid dalam model multivariat adalah

variabel yang mempunyai p value < 0,05. Bila dalam model multivariat dijumpai

variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan

dalam model. Pengeluaran variabel dilakukan tidak serempak, melainkan

bertahap satu per satu dikeluarkan dimulai dari p value yang terbesar. Adapun

proses selengkapnya sbb:

1. Klik ‘Analyisis’, sorot ‘Regression’, sorot dan klik ‘Linier’ lalu muncul menu

regresi linier,

a. Pada kotak ‘dependen isikan variabel dependen (dalam hal ini

berarti bwt) dan kotak ‘independen’ isikan variabel independennya

(dalam hal ini age, lwt, smoke, ht, ptl, ftv)

18


5. Pada kotak ‘Method’, pilih Enter’

6. Abaikan lainnya

7. Klik ‘OK’, dan hasilnya

Regression

Model Summary

.340a .116 .086 696.829Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), No physician visits in firsttrimester, Smoking status, History of hypertension,History of premature labor, Age of mother, Weight ofmother (pounds)

a.

19


ANOVAb

11543236 6 1923872.611 3.962 .001a

88373817 182 485570.42399917053 188

RegressionResidualTotal

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), No physician visits in first trimester, Smoking status, Historyof hypertension, History of premature labor, Age of mother, Weight of mother(pounds)

a.

Dependent Variable: Birth weight (gram)b.

Coefficientsa

2315.862 299.442 7.734 .0007.162 10.022 .052 .715 .476

4.793 1.777 .201 2.698 .008

-232.253 105.928 -.156 -2.193 .030-154.002 106.574 -.104 -1.445 .150-574.230 215.481 -.193 -2.665 .008

-2.847 49.705 -.004 -.057 .954

(Constant)Age of motherWeight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertensionNo physician visits in firsttrimester

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Birth weight (gram)a.

Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya

keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar

11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik

(lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi

secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus

yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di

cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model.

Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3

variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur

(history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap

berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel

dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba

keluarkan adalah frekuensi anc(No physician..).

20


Langkahnya:

1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’

2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan

biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel,

namun sekarang anda harus keluarkan variabel ‘no physician’ dan

masukkan ke kotak Variable di sebelah kiri.

3. Klik OK, dan hasilnya sbb:

Model Summary

.340a .116 .091 694.929Model1



Predictors: (Constant), History of hypertension,Smoking status, Age of mother, History of prematurelabor, Weight of mother (pounds)

a.

Coefficientsa

2317.608 297.074 7.801 .0007.051 9.807 .051 .719 .473

4.781 1.759 .201 2.718 .007

-232.224 105.638 -.156 -2.198 .029-153.747 106.191 -.104 -1.448 .149-573.011 213.841 -.192 -2.680 .008

(Constant)Age of motherWeight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertension

Model1

B Std. Error


Beta


t Sig.


Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah

dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square

dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi

dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R

Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk

coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,

21


berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum

dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:

Variabel Anc msih ada Anc dikeluarkan perubahan Coef.

Age

bwt

smoke

ptl

hi

ftv

7,1

4,7

-232,2

-154,0

-574,2

-2,8

7,0

4,7

-232,2

153,7

573,0

-

1,4 %

0 %

0 %

0,1 %

0,1 %

Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel,

ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel

frekuensi anc kita keluarkan dari model.

Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p

value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473).

Langkah/proses :

1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’

2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan

biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel,

namun sekarang anda harus keluarkan variabel ‘umur (age)’ dan

masukkan ke kotak Variable di sebelah kiri.

3. Klik OK, dan hasilnya sbb:

Model Summary

.336a .113 .094 694.016Model1



Predictors: (Constant), History of hypertension,Smoking status, History of premature labor, Weight ofmother (pounds)

a.

22


Coefficientsa

2449.121 233.779 10.476 .000

5.035 1.721 .211 2.925 .004

-236.420 105.338 -.159 -2.244 .026-145.412 105.417 -.098 -1.379 .169-582.566 213.148 -.195 -2.733 .007

(Constant)Weight of mother(pounds)Smoking statusHistory of premature laborHistory of hypertension

Model1

B Std. Error


Beta


t Sig.


Setelah variabel umur dikeluarkan, nilai R Square ternyata ada sedikit

perunbahan yaitu menjadi 0,113. sedangkan untuk coefisian B, , hasil

perhitungannya sbb:

Variabel Masih lengkap umur dikeluarkan perubahan Coef.

Age

bwt

smoke

ptl

hi

ftv

7,1

4,7

-232,2

-154,0

-574,2

-2,847

-

5,0

-236,4

145,4

582,5

-

-

6,3 %

1,8 %

6,1 %

1,3 %

Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %,

dengan demikian variabel umur kita keluarkan dari model.

Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur,

Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst.

Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan

dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:

23


Model Summary

.322a .104 .089 695.707Model1



Predictors: (Constant), History of hypertension,Smoking status, Weight of mother (pounds)

a.

Coefficientsa

2390.105 230.391 10.374 .000

5.352 1.710 .224 3.130 .002

-263.009 103.812 -.177 -2.534 .012-586.722 213.646 -.197 -2.746 .007

(Constant)Weight of mother(pounds)Smoking statusHistory of hypertension

Model1

B Std. Error


Beta


t Sig.


Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan

perubahan Coef. B dapat dilihat sbb:

Variabel Masih lengkap Prematur keluar perubahan Coef.

Age

bwt

smoke

ptl

hi

ftv

7,1

4,7

-232,2

-154,0

-574,2

-2,847

-

5,3

-236,4

-

582,5

-

-

12,3 %

1,7 %

-

1,3 %

Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada

variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel

riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan

dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p value-

nya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model

telah selesai dan model yang terakhir adalah sbb:

24


Model Summaryb

.336a .113 .094 694.016 .222Model1



Durbin-Watson

Predictors: (Constant), History of premature labor, History ofhypertension, Smoking status, Weight of mother (pounds)

a.


Coefficientsa

2449.121 233.779 10.476 .000

5.035 1.721 .211 2.925 .004 .925 1.081

-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060

-145.412 105.417 -.098 -1.379 .169 .947 1.056

(Constant)Weight of mother(pounds)Smoking statusHistory of hypertensionHistory of prematurelabor

Model1

B Std. Error


Beta

Standardize

dCoefficients

t Sig.Tolera

nce VIF

CollinearityStatistics


Langkah selanjutnya UJI ASUMSI Agar persaman garis yang digunkan untuk memprediksi menghasilkan angka

yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-asumsi

yang diersyaratkan uji regresi linier ganda. Adapun uji asumsinya sbb:

Langkahnya:

1.Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’

2. Masukkan dalam kotak Dependen variabel ‘bwt’

3. Masukan dalam kotak Independen variabel berat badan ibu (lwt),

merokok(smoke), riwayat hipertensi (hi) dan variabel riwayat prematur(ptl)

25


4.Klik tombol Statistics

5. Klik kotak ‘Collinearity diagnostic’ dan klik kotak ‘Covariance matrix’ (perintah

ini untuk uji asumsi multicoliniarity)

6. Klik kotak ‘Durbin-Watson’ (perintah ini untuk uji asumsi Independensi)

7. Klik Continue

26


8. Klik tombol ‘Plot”

9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini

untuk uji asumsi Homoscedasity)

10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk

uji asumsi Normality)

11. Klik Continue

Hasilnya :

a. Asumsi Eksistensi (Variabel Random)

Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)

adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi

ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,

sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi

eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari

model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada

sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil

analisis:

27


Residuals Statisticsa

2249.77 3602.03 2944.66 245.079 189-2.835 2.682 .000 1.000 189

67.193 292.804 103.399 45.407 189

1955.43 3616.97 2943.73 251.196 189-2082.610 1921.631 .000 686.593 189

-3.001 2.769 .000 .989 189-3.015 2.782 .001 1.005 189

-2102.316 1940.423 .923 708.619 189-3.084 2.835 .000 1.010 189

.768 32.469 3.979 5.320 189

.000 .209 .007 .019 189

.004 .173 .021 .028 189

Predicted ValueStd. Predicted ValueStandard Error ofPredicted ValueAdjusted Predicted ValueResidualStd. ResidualStud. ResidualDeleted ResidualStud. Deleted ResidualMahal. DistanceCook's DistanceCentered Leverage Value

Minimum Maximum Mean Std. Deviation N


Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan

standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi

b. Asumsi Independensi

Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai

dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai

observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk

mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin

Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,

sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi

Model Summaryb

.336a .113 .094 694.016 .222Model1



Durbin-Watson


a.


Dari hasil uji didapatkan koefisien Durbin Watson 0,222, berarti asumsi

independensi terpenuhi.

28


c. Asumsi Linieritas

Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak

pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk

mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)

bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil

uji asumsi :

ANOVAb

11291987 4 2822996.778 5.861 .000a

88625066 184 481657.96599917053 188

RegressionResidualTotal

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), History of premature labor, History of hypertension, Smokingstatus, Weight of mother (pounds)

a.


Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas

terpenuhi

d. Asumsi Homoscedascity

Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity

dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran

tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka

dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi

homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola

tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka

diduga variannya terjadi heteroscedasticity.

29


3210-1-2-3

Regression Standardized Predicted Value

3

2

1

0

-1

-2

-3

-4

Regre

ssion

Stud

entiz

ed Re

sidua

lDependent Variable: Birth weight (gram)

Scatterplot

Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara

titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi

homoscedasity terpenuhi

e. Asumsi Normalitas

Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.

dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar

garis diagonal dan mengikuti arah garis diagonal, maka model regresi

memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.

30


3210-1-2-3-4

Regression Standardized Residual

40

30

20

10

0

Freq

uenc

y

Mean = -2.53E-16Std. Dev. = 0.989N = 189

Dependent Variable: Birth weight (gram)

Histogram

31


1.00.80.60.40.20.0

Observed Cum Prob

1.0

0.8

0.6

0.4

0.2

0.0

Expe

cted

Cum

Pro

b

Dependent Variable: Birth weight (gram)

Normal P-P Plot of Regression Standardized Residual

Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk

distribusinya normal, berarti asumsi normality terpenuhi.

f.Diagostik Multicollinearity

Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi

secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari

nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka

mengindikasikan telah terjadi collinearity.

32


Coefficientsa

2449.121 233.779 10.476 .000

5.035 1.721 .211 2.925 .004 .925 1.081

-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060

-145.412 105.417 -.098 -1.379 .169 .947 1.056


Model1

B Std. Error


Beta

Standardize

dCoefficients

t Sig.Tolera

nce VIF



Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb:

Model Summaryb

.336a .113 .094 694.016 .222Model1



Durbin-Watson


a.


33


Coefficientsa

2449.121 233.779 10.476 .000

5.035 1.721 .211 2.925 .004 .925 1.081

-236.420 105.338 -.159 -2.244 .026 .964 1.037-582.566 213.148 -.195 -2.733 .007 .943 1.060

-145.412 105.417 -.098 -1.379 .169 .947 1.056


Model1

B Std. Error


Beta

Standardize

dCoefficients

t Sig.Tolera

nce VIF



Interpretasi model:

Setelah dilakuikan analisis ,ternyata variabel independen yang masuk

model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan

riwayat prematur. Pada tabel ‘Model Summary’ terlihat koefisien determinasi (R

square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh

dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan

kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel

berat bayi sebesar 11,3 %.. Kemudian pada kotak ‘ANOVA’, kita lihat hasil uji F

yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat

menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat

diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi

variabel berat bayi.

Pada kotak ‘Coefficient’ kita dapat memperoleh persamaaan garisnya, pada

kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien

regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang

diperoleh adalah

Berat Bayi = 2449,1+5,0 Lwt – 236,4 smoke - 582Hi – 145,4 Ptl

34


Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi

dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun

arti koef. B untuk masing-masing variabel adalah sbb:

- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi

akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi

dan prematur

- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4

gram setelah dikontrol variabel berat badan, hipertensi dan prematur.

- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah

sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok

dan prematur.

Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar

peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat

badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap

variabel dependennya. Pada hasil di atas berarti variabel yang paling besar

pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..

35


REGRESI LOGISTIK

13Berbeda dengan regresi linier yang variabel dependennya numerik,

regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu

variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus,

artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak

puas dll).

A. REGRESI LOGISTIK SEDERHANA

1. Pendahuluan

Analisis regresi logistik adalah salah satu pendekatan model matematis

yang digunakan untuk menganalisis hubungan satu atau beberapa variabel

independen dengan sebuah variabel dependen katagorik yang bersifat

dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang

mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal,

merokok dan tidak merokok, dan lain-lain

Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis

variabel dependennya. Regresi linear digunakan apabila variabel dependennya

numerik , sedangkan regresi logistik diogunakan pada data yang dependennya

berbentuk katagorik yang dikotom.

Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh

analisis penelitian yang mempelajari hubungan antara variabel umur dengan

kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang

sampel, didapatkan hasil :

No 1 2 3 4 5 6 7 8 9 10 11 … … 100

Umur 20 22 23 24 25 27 28 29 30 32 33 … … 70

PJK 0 0 1 0 0 1 0 1 1 0 0 … … 1

36


Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian

jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan

diberi kode 0 bila mereka tiodak menderita PJK.

Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier,

misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka

hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua

garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian

penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda.

Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel

dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu

menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan

kejadian PJK.

Untuk mempertajam analisis kita, sekarang dicoba untuk

mengelompokkan variabel independen (variabel umur) dan menhitung nilai

tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK)

untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada

tabel berikut:

37


PJK Umur Jumlah

Tidak Ya

Proporsi

Kejadian

20 – 29 10 9 1 0,10

30 – 34 15 13 2 0,13

35 – 39 12 9 3 0,25

40 – 44 15 10 5 0,33

45 – 49 13 7 6 0,46

50 – 54 8 3 5 0,63

55 – 59 17 4 13 0,76

60 – 69 10 2 8 0,80

Total 100 57 43 0,43

Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada

kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut

dengan grafik dan hasilnya dapat dilihat pada grafik berikut:

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69

Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara

proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang

landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut

menyerupai huruf S.

Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara

untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada

38


sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita

ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel

dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut

sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai

dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan

berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka

untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata

(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai

E(Y/x) akan berkisar antara 0 s.d ∞ (0 ≤ E(Y/x) ≤ ∞).

Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada

sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh

karena pada regresi logistik dependennya adalah dikotom maka variabel

dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti

pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk

mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian

PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu

berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).

2. Model Logistik

f(z) = 1 .

1 + e-z

f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko

tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu.

Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara -∞

sampai +∞.

Bila nilai Z mendekati – ∞ maka f(– ∞) = 1 . = 0

1 + e-(– ∞)

39


Bila nilai Z mendekati + ∞ maka f(+ ∞) = 1 . = 1

1 + e-(+ ∞)

Fungsi Logistik dapat digambarkan sbb:

1

-∞ 0 +∞

Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada

regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang

variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk

huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur

pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang

pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian

seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada

ketinggian tertentu garisnya akan mendatar mendekati nilai 1.

Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu

probabilitas kejadian pada dependen yang dikotom maka model regresi logistik

adalah pilihan yang tepat.

3. Model Logistik

Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan

penjumlahan linear konstanta (α) ditambah dengan β1X1, ditambah β2X2 dan

seterusnya sampai βiXi. Variabel X adalah variabel Independen.

40


Z = α + β1X1 (Regresi logistik sederhana)

Z = α + β1X1 + β2X2 + … + βiXi (Regresi logistik berganda)

Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah

f(z) = 1 .

1 + e-(α + β1X1 + β2X2 + … + βiXi)

4. Contoh Kasus

Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari

mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama

vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama

variabel KAT).

Pemberian kode nilai variabel adalah sbb:

Untuk variabel PJK 1 = timbul penyakit jantung koroner

0 = tidak ada penyakit jantung koroner

Untuk variabel KAT 1 = kadar katekolamin darah tinggi

0 = kadar katekolamin darah rendah

Pertanyaan:

a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko

untuk terjadi PJK?

b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko

untuk terjadi PJK?

c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya

tinggi dengan yang kadar katekolaminnya rendah?

Jawab:

Dengan model regresi logistik maka pada soal tersebut modelnya adalah:

f(z) = 1 . 1 + e-z

41


Nilai f(z) dapat diganti dengan P(X), maka rumusnya:

P(X) = 1 . 1 + e-z

Bila Z = α + β1KAT, maka modelnya :

P(X) = 1 . 1 + e-α + β1KAT

Misdalkan didapatkan hasil analisis dengan paket program statistik sbb:

α = -3,911 dan β1 = 0,652, maka:

P(X) = 1 . 1 + e-(-3,911 + 0,652KAT)

Dari model tersebut coba kita jawab pertanyaan di atas:

a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.

Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai

KAT=1 pada model di atas, hasilnya:

P(X) = 1 . = 0,037 atau sekitar 4%

1 + e-(-3,911 + 0,652*1)

jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah

mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up.

b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah

Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai

KAT=0 pada model di atas, hasilnya:

P(X) = 1 . = 0,019 atau sekitar 2%

1 + e-(-3,911 + 0,652*0)

jadi mereka/individu yang kadar katekolaminnya rendah dalam darah

mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up.

c. Besar risiko kedua kelompok tersebut

P1(X) = 0,037 = 1,947 = 2,0

P0(X) 0,019

Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh

secara direk. Arti dari angka di atas adalah mereka yang kaadar

42


katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi

dibandingkan mereka yang kadar katekolaminnya rendah.

Model regresi logistik dapat digunakan pada data yang dikumpulkan

melalui rancangan kohort, case control maupun cross sectional.

Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko

individual. Sedangkan pada rancangan case control dan cross sectional tidak

dapat digunakan untuk menghitung risiko individual karena β0 pada rancangan

ini tidak sahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi

yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket:

sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit).

Namun dengan memperlakukan rancangan case control dan cross sectional

sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan

perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan

perhitungan eksponensial β dari persamaan garis regresi logistik.

Odds Ratio (OR) = exp(β) atau dapat ditulis OR = e(β)

Dengan demikian dapat disimpulkan bahwa Individual Risk (ririko

individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan

pada rancangan case control, cross sectional tidak dapat melakukan prediskis

risiko individual. Pada rancangan case control dan cross sectional dan cohort

dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek.

Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk

memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal)

berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat

digunakan dengan model:

P(X) = 1 . 1 + e-(α + β1X1 + β2X2 + … + βiXi

43


B. REGRESI LOGISTIK GANDA

Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik

sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda

adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model.

Pada regresi logistik, variabel independennya boleh campuran antara variabel

katagorik dan numerik. Namun sebaiknya variabel independennya berupa

katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah.

Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu:

a. Model Prediksi

Pemodelan dengan tujuan untuk memperoleh model yang tediri dari

beberapa variabel independen yang dianggap terbaik untuk memprediksi

kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap

penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien

regresi logistik sekaligus.

Bentuk kerangka konsep model regresi :

Prosedur pemodelan:

Agar diperoleh model regresi yang hemat dan mampu menjelaskan

hubungan variabel independen dan independen dalam populasi, diperlukan

prosedur pemilihan variabel sbb:

1). Melakukan analisis bivariat antara masing-masing variabel independen

dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p <

0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa

saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara

substansi penting.

X1 X2 X3 X4

Y

44


2). Memilih variabel yang dianggap penting yang masuk dalam model,

dengan cara mempertahankan variabel yang mempunyai p value < 0,05

dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel

tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara

bertahap dimulai dari variabel yang mempunyai p value terbesar.

3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan

apakah variabel numerik dijadikan variabel katagorik atau tetap variabel

numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4

kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik

dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok

menunjukkan bentuk garis lurus, maka variabel numerik dapat

dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka

dapat dipertimbangkan dirubah dalam bentuk katagorik.

4). Setelah memperoleh model yang memuat variabel-variabel penting, maka

langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke

dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan

logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik.

Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting

dimasukkan dalam model.

b. Model Faktor Risiko

Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel

utama dengan variabel dependen dengan mengontrol beberapa variabel

konfonding.

Bentuk kerangka konsep model faktor risiko:

X1 Y

45

X2 X3 X4


Tahapan pemodelan:

1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat

konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama

dengan semua variabel konfonding).

2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi

yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara

berurutan satu per satu dari nilai p Wald yang terbesar.

3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel

kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald

terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel

utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih

besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding

dan harus tetap berada dalam model.

46


KASUS I :

REGRESI LOGISTIK MODEL PREDIKSI

Untuk latihan, gunakan file data “LBW.SAV”

Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS

(race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA

HAMIL (ftv) dengan BBLR (low).

Adapun langkahnya:

A. SELEKSI BIVARIAT Masing-masing variabel independen dilakukan analisis bivariat dengan variabel

dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel

tersebut langsung masuk tahap multivariat. Untuk variabel independen yang

hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting,

maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi

bivariat menggunakan uji regresi logistik sederhana.

1.Analisis bivariat antara “umur” dengan”bblr”

1. Pilih “Analyze”

2. Pilih “Regression”

3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent

dan kotak Covariates.

4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai

dependen (dalam hal ini berarti masukkan “low”) dan pada kotak

independen isikan variabel independennya (dalam hal ini berarti masukkan

“age”).

Sehingga tampilannya sbb:

47


5. Klik tombol ‘Options’ , klik ‘CI for Exp(B)’

6. Klik ‘Continue’

7. Klik “OK”, dan hasilnya sbb:

Block 1: Method = Enter

Omnibus Tests of Model Coefficients

2.760 1 .0972.760 1 .0972.760 1 .097

StepBlockModel

Step 1Chi-square df Sig.

Variables in the Equation

-.051 .032 2.635 1 .105 .950 .893 1.011

.385 .732 .276 1 .599 1.469

ageConstant

Step1

a

B S.E. Wald df Sig. Exp(B) Lower Upper

95.0% C.I.forEXP(B)

Variable(s) entered on step 1: age.a.

48


Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada

bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25

sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan

SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI:

0,89-1,01)

2.Analisis bivariat antara “ras” dengan “bblr”





4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates

variabel ‘age’ dikeluarkan dan gantilah dengan mengisikan variabel ‘race’.

Tampilannya sbb:

5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis

katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras

49


putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari

kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada

bagian Reference category, lalu klik Change, dan tampilannya:

6. Klik Continue, layar ke menu logistic

7. Klik OK

Categorical Variables Codings

96 .000 .00026 1.000 .00067 .000 1.000

WhiteBlackOther

RaceFrequency (1) (2)

Parameter coding


5.010 2 .0825.010 2 .0825.010 2 .082

StepBlockModel


50



4.922 2 .085.845 .463 3.323 1 .068 2.328 .939 5.772.636 .348 3.345 1 .067 1.889 .955 3.736

-1.155 .239 23.330 1 .000 .315

racerace(1)race(2)Constant

Step 1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: race.a.

Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras

dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy,

terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam

akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit

putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai

risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.

3. Analisis bivariat antara “hipertensi” dengan “bblr”





4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan

“ht”. Klik OK, Tampilannya sbb:


4.022 1 .0454.022 1 .0454.022 1 .045

StepBlockModel


51



1.214 .608 3.979 1 .046 3.365 1.021 11.088-.877 .165 28.249 1 .000 .416

htConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: ht.a.

Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam

multivariat

4. Analisis bivariat antara “kelainan uterus” dengan “bblr”



3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak

Dependent dan kotak Covariates.

4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates

isikan “ui”. Klik OK, Tampilannya sbb:


5.076 1 .0245.076 1 .0245.076 1 .024

StepBlockModel



.947 .417 5.162 1 .023 2.578 1.139 5.834-.947 .176 29.072 1 .000 .388

uiConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: ui.a.

Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat

lanjut ke multivariat

52


5.Analisis bivariat antara “periksa hamil” dengan “bblr”

1.Pilih “Analyze”

2.Pilih “Regression”

3.Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan

kotak Covariates.

4.Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan

“ftv”. Klik OK, Tampilannya sbb:


.773 1 .379

.773 1 .379

.773 1 .379

StepBlockModel



-.135 .157 .744 1 .389 .874 .643 1.188-.687 .195 12.427 1 .000 .503

ftvConstant

Step1

a

B S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)

Variable(s) entered on step 1: ftv.a.

Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak

dapat lanjut ke multivariat, namun karena secara substansi variabel periksa

hamil sangat penting, maka variabel ini dapat dianalisis multivariat.

6.Analisis bivariat antara “merokok” dengan “bblr”


4.867 1 .0274.867 1 .0274.867 1 .027

StepBlockModel


53



.704 .320 4.852 1 .028 2.022 1.081 3.783-1.087 .215 25.627 1 .000 .337

smokeConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: smoke.a.

Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat.

7.Analisis bivariat antara “prematur” dengan “bblr”


6.779 1 .0096.779 1 .0096.779 1 .009

StepBlockModel



.802 .317 6.391 1 .011 2.230 1.197 4.151-.964 .175 30.370 1 .000 .381

ptlConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: ptl.a.

Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat

Hasil seleksi bivariat :

Variabel P value

Umur

Ras

Hipertensi

Kelainan uterus

Periksa hamil

Merokok

Prematur

0,097

0,082

0,045

0,024

0,379

0,027

0,009

54


Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa

hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis

multivariat oleh karena secara substansi periksa hamil merupakan variabel yang

sangat penting berhubungan dengan kejadian bblr.

B. PEMODELAN MULTIVARIAT

Selanjutnya dilakukan analisis multivariat keenam variabel tersebut

dengan kejadian bblr.

1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel

dependen.



3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan

kotak Covariates.

4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan

variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy.

5. Klik Option, pilih ‘CI for exp(B)’

6. Klik ‘Continue’

55


7. Kilik ‘OK’

Logistic Regression


-.041 .036 1.249 1 .264 .960 .894 1.0316.783 2 .034

1.009 .502 4.034 1 .045 2.743 1.025 7.3451.003 .426 5.560 1 .018 2.727 1.185 6.280

.964 .391 6.090 1 .014 2.622 1.219 5.639

.630 .340 3.429 1 .064 1.877 .964 3.6541.361 .631 4.648 1 .031 3.902 1.132 13.451

.802 .458 3.066 1 .080 2.229 .909 5.468

.009 .161 .003 1 .954 1.009 .736 1.384-1.183 .919 1.659 1 .198 .306

ageracerace(1)race(2)smokeptlhtuiftvConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.a.

Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui

dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv

dikeluarkan dari model.

Dengan langkah yang sama akhirnya diperoleh hasil sbb.

56


Logistic Regression


-.040 .036 1.275 1 .259 .960 .896 1.0306.781 2 .034

1.009 .503 4.035 1 .045 2.744 1.025 7.3471.002 .425 5.562 1 .018 2.723 1.184 6.262.963 .390 6.086 1 .014 2.620 1.219 5.632.629 .340 3.423 1 .064 1.875 .963 3.651

1.358 .629 4.663 1 .031 3.889 1.134 13.341.800 .457 3.063 1 .080 2.226 .908 5.454

-1.184 .919 1.661 1 .197 .306

ageracerace(1)race(2)smokeptlhtuiConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.a.

Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race,

smoke, ptl, ht, dan ui.

Variabel OR ftv ada OR ftv tak ada perubahan OR

Age

Race(1)

Race(2)

Smoke

Ptl

Ht

ui

ftv

0.960

2.743

2.727

2.622

1.877

3.902

2.229

1.009

0.960

2.744

2.723

2.620

1.875

3.889

2.226

0 %

0 %

0 %

0 %

0,1 %

0.3 %

0,1 %

Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian

dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah

umur, dengan demikian dikelurkan dar model dan hasilnya

Hasilnyanya :

57



7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538

.991 .387 6.569 1 .010 2.694 1.263 5.747

.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537

.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117

racerace(1)race(2)smokeptlhtuiConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: race, smoke, ptl, ht, ui.a.

Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel

yang masih aktif di model.

Variabel OR age ada OR age tak ada perubahan OR

Age

Race(1)

Race(2)

Smoke

Ptl

Ht

ui

ftv

0.960

2.743

2.727

2.622

1.877

3.902

2.229

1.009

-

2.968

2.883

2.694

1.779

3.912

2.350

8,2 %

5,7 %

2,7 %

5,2 %

0.3 %

5,4 %

Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan

demikian variabel umur dikeluarkan dari model

Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl

dikeluarkan model, hasilnya

58



8.245 2 .0161.064 .499 4.545 1 .033 2.897 1.090 7.7041.083 .413 6.877 1 .009 2.955 1.315 6.6401.094 .380 8.299 1 .004 2.986 1.419 6.2861.359 .630 4.660 1 .031 3.894 1.133 13.3791.006 .438 5.262 1 .022 2.734 1.158 6.458

-2.092 .380 30.307 1 .000 .123

racerace(1)race(2)smokehtuiConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: race, smoke, ht, ui.a.

Setelah ptl dikeluarkan, kita lihat perubahan OR nya:

Variabel OR ptl ada OR ptl tak ada perubahan OR

Age

Race(1)

Race(2)

Smoke

Ptl

Ht

ui

ftv

0.960

2.743

2.727

2.622

1.877

3.902

2.229

1.009

-

2.897

2.955

2.986

-

3.894

2.734

-

5,6 %

8,3 %

13,8 %

-

0.2 %

22,6 %

Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:

59



8.286 2 .0161.062 .500 4.513 1 .034 2.894 1.086 7.7121.085 .411 6.949 1 .008 2.958 1.321 6.626

.996 .382 6.794 1 .009 2.707 1.280 5.7261.221 .629 3.764 1 .052 3.390 .988 11.640

.696 .325 4.596 1 .032 2.007 1.062 3.793-2.025 .372 29.586 1 .000 .132

racerace(1)race(2)smokehtptlConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: race, smoke, ht, ptl.a.

Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan :

Variabel OR ui ada OR ui tak ada perubahan OR

Age

Race(1)

Race(2)

Smoke

Ptl

Ht

ui

ftv

0.960

2.743

2.727

2.622

1.877

3.902

2.229

1.009

-

2.894

2.958

2.707

2.007

3.390

-

-

5,5 %

8,4 %

3,2 %

6,9 %

13.1 %

-

-

Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:

60



7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538

.991 .387 6.569 1 .010 2.694 1.263 5.747

.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537

.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117


Step1

a


95.0% C.I.forEXP(B)


C. UJI INTERAKSI

Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi,

kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus

sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi.

Langkahnya:

1. klik analysis, klik regression, klik binary ogistik

2. Kotak dependen isikan low

3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui

4. Klik tombol Next

5. isikan : smoke*ht ke kotak kovariat

6. klik OK

lihat hasilnya pada bagian Block 2

Block 2: Method = Enter Omnibus Tests of Model Coefficients

Chi-

square df Sig. Step 1 Step .000 1 .994 Block .000 1 .994 Model 26.560 7 .000

61



7.900 2 .0191.088 .502 4.692 1 .030 2.969 1.109 7.9461.059 .419 6.387 1 .011 2.883 1.268 6.555

.990 .397 6.211 1 .013 2.692 1.236 5.865

.576 .336 2.937 1 .087 1.779 .921 3.4381.360 .831 2.680 1 .102 3.896 .765 19.852

.854 .451 3.584 1 .058 2.350 .970 5.693

.010 1.283 .000 1 .994 1.010 .082 12.491-2.146 .386 30.875 1 .000 .117

racerace(1)race(2)smokeptlhtuiht by smokeConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: ht * smoke .a.

Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya

memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05,

berarti : tidak ada interaksi antara merokok dengan hipertensi.

Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa

ada interaksi:

MODEL TERAKHIR Variables in the Equation

7.968 2 .0191.088 .501 4.723 1 .030 2.968 1.113 7.9161.059 .418 6.422 1 .011 2.883 1.271 6.538

.991 .387 6.569 1 .010 2.694 1.263 5.747

.576 .334 2.975 1 .085 1.779 .925 3.4221.364 .633 4.640 1 .031 3.912 1.131 13.537

.855 .451 3.585 1 .058 2.350 .970 5.692-2.146 .386 30.917 1 .000 .117


Step1

a


95.0% C.I.forEXP(B)


62


Interpretasi:

Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat

Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case

control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B)

pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka

nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model.

Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan

kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel

riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis

didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang

menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi

dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race,

merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk

variabel yang lain.

Untuk melihat variabel mana yang paling besar pengaruhnya terhadap

variabel dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin

besar nilai exp (B) berarti semakin besar pengaruhnya terhadap variabel

dependen yang dianalisis. Dalam data ini berarti hipertensi yang paling besar

pengaruhnya terhadap kejadian bayi BBLR.

63


KASUS KEDUA :

REGRESI LOGISTIK MODEL FAKTOR RISIKO

Tujuan analisis :

Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive

Variabel independen utama : Pkerjaan

Variabel dependen : Eksklusive

Variabel konfounding : umur, berat badan ibu dan sikap

A. Langkah pertama: menyusun model mencakup semua variabel dan variabel

interaksi

Cara



3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan

Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai

dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan

variabel independen utama beserta variabel konfounding dan interaksinya

(dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu,

kerja*sikap)

4. Klik ‘OK’, dan hasilnya sbb:

Logistic Regression


-20.275 28420.722 .000 1 .999 .000 .000 .1.681 1.197 1.972 1 .160 5.372 .514 56.109-.052 .114 .208 1 .648 .949 .760 1.186

20.279 28420.722 .000 1 .999 6E+008 .000 ..148 .159 .869 1 .351 1.160 .849 1.583

-1.505 1.432 1.105 1 .293 .222

kerjaumur1sikapkerja by umur1kerja by sikapConstant

Step 1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .a.

64


Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:

Logistic Regression


-.445 1.718 .067 1 .795 .641 .022 18.5572.217 1.146 3.741 1 .053 9.177 .971 86.749-.060 .114 .274 1 .601 .942 .753 1.178

.175 .156 1.264 1 .261 1.191 .878 1.616

-1.881 1.483 1.610 1 .205 .152

kerjaumur1sikapkerja bysikapConstant

Step 1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .a.

Dari output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model

karana p valuenya > 0,05. Setelah dikeluarkan hasilnya:


1.376 .666 4.273 1 .039 3.959 1.074 14.5922.260 1.157 3.812 1 .051 9.582 .991 92.609

.035 .076 .212 1 .645 1.036 .893 1.202

-2.876 1.239 5.384 1 .020 .056

kerjaumur1sikapConstant

Step1

a


95.0% C.I.forEXP(B)

Variable(s) entered on step 1: kerja, umur1, sikap.a.

Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel

interasksi, langkah selanjutnya uji konfounding

65


UJI KONFOUNDING Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan

dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka

varaibel tsb dianggap sebagai variabel konfounding.

Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model

hasiilnya sbb:’


1.413 .660 4.585 1 .032 4.110 1.127 14.9852.378 1.135 4.389 1 .036 10.783 1.165 99.754

-2.624 1.113 5.555 1 .018 .073

kerjaumur1Constant

Step 1

a


Variable(s) entered on step 1: kerja, umur1.a.

Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 – 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya:


1.698 .618 7.545 1 .006 5.464 1.627 18.357

-.754 .429 3.091 1 .079 .471

kerjaConstant

Step1

a


Variable(s) entered on step 1: kerja.a.

Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.

66


Model terakhir :


1.413 .660 4.585 1 .032 4.110 1.127 14.9852.378 1.135 4.389 1 .036 10.783 1.165 99.754

-2.624 1.113 5.555 1 .018 .073

kerjaumur1Constant

Step 1

a


Variable(s) entered on step 1: kerja, umur1.a.

Interpretasi:

Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding

hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb:

Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai

peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah

dikontrol variabel ”umur”.

67


Lampiran data LBW. SAV.

Id Low age lwt race smoke ptl ht ui ftv bwt

1 1 28 120 3 1 1 0 1 0 709

2 1 29 130 1 0 0 0 1 2 1021

3 1 34 187 2 1 0 1 0 0 1135

4 1 25 105 3 0 1 1 0 0 1330

5 1 25 85 3 0 0 0 1 0 1474

6 1 27 150 3 0 0 0 0 0 1588

7 1 23 97 3 0 0 0 1 1 1588

8 1 24 128 2 0 1 0 0 1 1701

9 1 24 132 3 0 0 1 0 0 1729

10 1 21 165 1 1 0 1 0 1 1790

11 1 32 105 1 1 0 0 0 0 1818

12 1 19 91 1 1 2 0 1 0 1885

13 1 25 115 3 0 0 0 0 0 1893

14 1 16 130 3 0 0 0 0 1 1899

15 1 25 92 1 1 0 0 0 0 1928

16 1 20 150 1 1 0 0 0 2 1928

17 1 21 200 2 0 0 0 1 2 1928

18 1 24 155 1 1 1 0 0 0 1936

19 1 21 103 3 0 0 0 0 0 1970

20 1 20 125 3 0 0 0 1 0 2055

21 1 25 89 3 0 2 0 0 1 2055

22 1 19 102 1 0 0 0 0 2 2082

23 1 19 112 1 1 0 0 1 0 2084

24 1 26 117 1 1 1 0 0 0 2084

25 1 24 138 1 0 0 0 0 0 2100

26 1 17 130 3 1 1 0 1 0 2125

27 1 20 120 2 1 0 0 0 3 2126

28 1 22 130 1 1 1 0 1 1 2187

29 1 27 130 2 0 0 0 1 0 2187

30 1 20 80 3 1 0 0 1 0 2211

68


31 1 17 110 1 1 0 0 0 0 2225

32 1 25 105 3 0 1 0 0 1 2240

33 1 20 109 3 0 0 0 0 0 2240

34 1 18 148 3 0 0 0 0 0 2282

35 1 18 110 2 1 1 0 0 0 2296

36 1 20 121 1 1 1 0 1 0 2296

37 1 21 100 3 0 1 0 0 4 2301

38 1 26 96 3 0 0 0 0 0 2325

39 1 31 102 1 1 1 0 0 1 2353

40 1 15 110 1 0 0 0 0 0 2353

41 1 23 187 2 1 0 0 0 1 2367

42 1 20 122 2 1 0 0 0 0 2381

43 1 24 105 2 1 0 0 0 0 2381

44 1 15 115 3 0 0 0 1 0 2381

45 1 23 120 3 0 0 0 0 0 2395

46 1 30 142 1 1 1 0 0 0 2410

47 1 22 130 1 1 0 0 0 1 2410

48 1 17 120 1 1 0 0 0 3 2414

49 1 23 110 1 1 1 0 0 0 2424

50 1 17 120 2 0 0 0 0 2 2438

51 1 26 154 3 0 1 1 0 1 2442

52 1 20 105 3 0 0 0 0 3 2450

53 1 26 190 1 1 0 0 0 0 2466

54 1 14 101 3 1 1 0 0 0 2466

55 1 28 95 1 1 0 0 0 2 2466

56 1 14 100 3 0 0 0 0 2 2495

57 1 23 94 3 1 0 0 0 0 2495

58 1 17 142 2 0 0 1 0 0 2495

59 1 21 130 1 1 0 1 0 3 2495

60 0 19 182 2 0 0 0 1 0 2523

61 0 33 155 3 0 0 0 0 3 2551

62 0 20 105 1 1 0 0 0 1 2557

63 0 21 108 1 1 0 0 1 2 2594

64 0 18 107 1 1 0 0 1 0 2600

69


65 0 21 124 3 0 0 0 0 0 2622

66 0 22 118 1 0 0 0 0 1 2637

67 0 17 103 3 0 0 0 0 1 2637

68 0 29 123 1 1 0 0 0 1 2663

69 0 26 113 1 1 0 0 0 0 2665

70 0 19 95 3 0 0 0 0 0 2722

71 0 19 150 3 0 0 0 0 1 2733

72 0 22 95 3 0 0 1 0 0 2750

73 0 30 107 3 0 1 0 1 2 2750

74 0 18 100 1 1 0 0 0 0 2769

75 0 18 100 1 1 0 0 0 0 2769

76 0 15 98 2 0 0 0 0 0 2778

77 0 25 118 1 1 0 0 0 3 2782

78 0 20 120 3 0 0 0 1 0 2807

79 0 28 120 1 1 0 0 0 1 2821

80 0 32 121 3 0 0 0 0 2 2835

81 0 31 100 1 0 0 0 1 3 2835

82 0 36 202 1 0 0 0 0 1 2836

83 0 28 120 3 0 0 0 0 0 2863

84 0 25 120 3 0 0 0 1 2 2877

85 0 28 167 1 0 0 0 0 0 2877

86 0 17 122 1 1 0 0 0 0 2906

87 0 29 150 1 0 0 0 0 2 2920

88 0 26 168 2 1 0 0 0 0 2920

89 0 17 113 2 0 0 0 0 1 2920

90 0 17 113 2 0 0 0 0 1 2920

91 0 24 90 1 1 1 0 0 1 2948

92 0 35 121 2 1 1 0 0 1 2948

93 0 25 155 1 0 0 0 0 1 2977

94 0 25 125 2 0 0 0 0 0 2977

95 0 29 140 1 1 0 0 0 2 2977

96 0 19 138 1 1 0 0 0 2 2977

97 0 27 124 1 1 0 0 0 0 2992

98 0 31 215 1 1 0 0 0 2 3005

70


99 0 33 109 1 1 0 0 0 1 3033

100 0 21 185 2 1 0 0 0 2 3042

101 0 19 189 1 0 0 0 0 2 3062

102 0 23 130 2 0 0 0 0 1 3062

103 0 21 160 1 0 0 0 0 0 3062

104 0 18 90 1 1 0 0 1 0 3076

105 0 18 90 1 1 0 0 1 0 3076

106 0 32 132 1 0 0 0 0 4 3080

107 0 19 132 3 0 0 0 0 0 3090

108 0 24 115 1 0 0 0 0 2 3090

109 0 22 85 3 1 0 0 0 0 3090

110 0 22 120 1 0 0 1 0 1 3100

111 0 23 128 3 0 0 0 0 0 3104

112 0 22 130 1 1 0 0 0 0 3132

113 0 30 95 1 1 0 0 0 2 3147

114 0 19 115 3 0 0 0 0 0 3175

115 0 16 110 3 0 0 0 0 0 3175

116 0 21 110 3 1 0 0 1 0 3203

117 0 30 153 3 0 0 0 0 0 3203

118 0 20 103 3 0 0 0 0 0 3203

119 0 17 119 3 0 0 0 0 0 3225

120 0 17 119 3 0 0 0 0 0 3225

121 0 23 119 3 0 0 0 0 2 3232

122 0 24 110 3 0 0 0 0 0 3232

123 0 28 140 1 0 0 0 0 0 3234

124 0 26 133 3 1 2 0 0 0 3260

125 0 20 169 3 0 1 0 1 1 3274

126 0 24 115 3 0 0 0 0 2 3274

127 0 28 250 3 1 0 0 0 6 3303

128 0 20 141 1 0 2 0 1 1 3317

129 0 22 158 2 0 1 0 0 2 3317

130 0 22 112 1 1 2 0 0 0 3317

131 0 31 150 3 1 0 0 0 2 3321

132 0 23 115 3 1 0 0 0 1 3331

71


133 0 16 112 2 0 0 0 0 0 3374

134 0 16 135 1 1 0 0 0 0 3374

135 0 18 229 2 0 0 0 0 0 3402

136 0 25 140 1 0 0 0 0 1 3416

137 0 32 134 1 1 1 0 0 4 3430

138 0 20 121 2 1 0 0 0 0 3444

139 0 23 190 1 0 0 0 0 0 3459

140 0 22 131 1 0 0 0 0 1 3460

141 0 32 170 1 0 0 0 0 0 3473

142 0 30 110 3 0 0 0 0 0 3475

143 0 20 127 3 0 0 0 0 0 3487

144 0 23 123 3 0 0 0 0 0 3544

145 0 17 120 3 1 0 0 0 0 3572

146 0 19 105 3 0 0 0 0 0 3572

147 0 23 130 1 0 0 0 0 0 3586

148 0 36 175 1 0 0 0 0 0 3600

149 0 22 125 1 0 0 0 0 1 3614

150 0 24 133 1 0 0 0 0 0 3614

151 0 21 134 3 0 0 0 0 2 3629

152 0 19 235 1 1 0 1 0 0 3629

153 0 25 95 1 1 3 0 1 0 3637

154 0 16 135 1 1 0 0 0 0 3643

155 0 29 135 1 0 0 0 0 1 3651

156 0 29 154 1 0 0 0 0 1 3651

157 0 19 147 1 1 0 0 0 0 3651

158 0 19 147 1 1 0 0 0 0 3651

159 0 30 137 1 0 0 0 0 1 3699

160 0 24 110 1 0 0 0 0 1 3728

161 0 19 184 1 1 0 1 0 0 3756

162 0 24 110 3 0 1 0 0 0 3770

163 0 23 110 1 0 0 0 0 1 3770

164 0 20 120 3 0 0 0 0 0 3770

165 0 25 241 2 0 0 1 0 0 3790

166 0 30 112 1 0 0 0 0 1 3799

72


167 0 22 169 1 0 0 0 0 0 3827

168 0 18 120 1 1 0 0 0 2 3856

169 0 16 170 2 0 0 0 0 4 3860

170 0 32 186 1 0 0 0 0 2 3860

171 0 18 120 3 0 0 0 0 1 3884

172 0 29 130 1 1 0 0 0 2 3884

173 0 33 117 1 0 0 0 1 1 3912

174 0 20 170 1 1 0 0 0 0 3940

175 0 28 134 3 0 0 0 0 1 3941

176 0 14 135 1 0 0 0 0 0 3941

177 0 28 130 3 0 0 0 0 0 3969

178 0 25 120 1 0 0 0 0 2 3983

179 0 16 95 3 0 0 0 0 1 3997

180 0 20 158 1 0 0 0 0 1 3997

181 0 26 160 3 0 0 0 0 0 4054

182 0 21 115 1 0 0 0 0 1 4054

183 0 22 129 1 0 0 0 0 0 4111

184 0 25 130 1 0 0 0 0 2 4153

185 0 31 120 1 0 0 0 0 2 4167

186 0 35 170 1 0 1 0 0 1 4174

187 0 19 120 1 1 0 0 0 0 4238

188 0 24 116 1 0 0 0 0 1 4593

189 0 45 123 1 0 0 0 0 1 4990

73

Documents

SUTANTO Analisis Multivariat