PENERAPAN ANALISIS REGRESI GENERALIZED ...repository.ub.ac.id/3939/1/Pratiwi, Betty Woro.pdf(Studi Kasus pada Dinas Kesehatan Kota Malang) SKRIPSI Sebagai salah satu syarat untuk memperoleh

i

PENERAPAN ANALISIS REGRESI GENERALIZED POISSON,

BINOMIAL NEGATIF, DAN LAGRANGE POISSON UNTUK

MENANGANI DATA YANG MENGALAMI OVERDISPERSI

(Studi Kasus pada Dinas Kesehatan Kota Malang)

SKRIPSI

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains dalam

bidang Statistika

Oleh:

BETTY WORO PRATIWI

125090500111013

PROGAM STUDI STATISTIKA

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS BRAWIJAYA

MALANG

2017

ii

iii

LEMBAR PENGESAHAN SKRIPSI





oleh:

BETTY WORO PRATIWI

125090500111013

Setelah dipertahankan di depan Majelis Penguji

pada tanggal 25 Juli 2017

dan dinyatakan memenuhi syarat untuk memperoleh gelar

Sarjana Sains dalam bidang Statistika

Dosen Pembimbing

(Achmad Efendi, S.Si., M.Sc., Ph.D.)

NIP. 198102192005011001

Mengetahui,

Ketua Jurusan Matematika

Fakultas MIPA

Universitas Brawijaya

Ratno Bagus Edy Wibowo, S.Si, M.Si, Ph.D

NIP. 197509082000031003

iv

v

LEMBAR PERNYATAAN

Saya yang bertanda tangan di bawah ini :

Nama : BETTY WORO PRATIWI

NIM : 125090500111013

Jurusan : MATEMATIKA

Program Studi : STATISTIKA

Skripsi berjudul :





Dengan ini menyatakan bahwa:

1. Isi dari skripsi yang saya buat adalah benar-benar karya

sendiri dan tidak menjiplak karya orang lain, selain nama-nama

yang termaktub di isi dan tertulis di daftar pustaka

dalam skripsi ini.

2. Apabila di kemudian hari ternyata skripsi yang saya tulis

terbukti hasil jiplakan, maka saya akan bersedia

menanggung segala resiko yang akan saya terima.

Demikian pernyataan ini saya buat dengan segala kesadaran.

Malang, 25 Juli 2017

Yang menyatakan,

BETTY WORO PRATIWI

NIM. 125090500111013

vi

vii





ABSTRAK

Analisis regresi merupakan metode untuk meramalkan nilai variabel respon

dari nilai satu atau lebih variabel prediktor. Untuk data cacahan yang

berdistribusi poisson, digunakan analisis regresi poisson. Tahapan metode

regresi poisson adalah melakukan uji distribusi poisson, uji asumsi non

multikolinearitas, mengestimasi parameter, uji asumsi overdispersi,

melakukan uji simultan dan uji parsial. Namun pada regresi poisson

seringkali data mengalami overdispersi, sehingga perlu dilakukan

penanganan overdispersi dengan analisis regresi generalized poisson,

regresi binomial negatif, dan regresi poisson lagrange. Tujuan penelitian

ini adalah menerapkan analisis regresi generalized poisson, regresi

binomial negatif, dan regresi poisson lagrange untuk mengetahui faktor apa

saja yang berpengaruh terhadap jumlah kasus Demam Berdarah Dengue

(DBD) di Kota Malang. Dari ketiga model yang terbentuk, dipilih model

terbaik dengan membandingkan nilai khi kuadrat pearson, dan dicari

variabel yang memiliki pengaruh signifikan. DBD merupakan salah satu

penyakit menular yang menjadi masalah kesehatan masyarakat di Indonesia

karena jumlah penderita yang cenderung meningkat dan semakin luas

penyebarannya, sehingga perlu dilakukan upaya pencegahan oleh

Pemerintah demi menekan angka kasus DBD Malang. Model terbaik

adalah regresi binomial negatif yaitu 𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021Xi1 +0,0167Xi2. Dari lima variabel prediktor yang digunakan dalam penelitian

ini, terdapat satu variabel prediktor yang berpengaruh signifikan terdapat

jumlah kasus DBD di Kota Malang yaitu presentase rumah tangga berpola

hidup bersih dan sehat (ber-PHBS).

Kata Kunci : Binomial Negatif, Demam Berdarah Dengue (DBD),

Generalized Poisson, Lagrange Poisson, Regresi Poisson.

viii

ix

APPLICATION OF GENERALIZED POISSON, NEGATIVE

BINOMIAL, AND LAGRANGE POISSON REGRESSION TO

HANDLE OVERDISPERSION

(Case Study at Malang Ministry of Health)

ABSTRACT

Regression analysis is a method to predict the value of response variables

from the value of one or more predictor variables. Poisson regression

analysis was used at poisson distributed data. Stages of the Poisson

regression method are the Poisson distribution test, non-multicolinearity

assumption test, parameter estimation, overdispersion assumption test,

simultaneous test and partial test. However, in poisson regression,

overdispersion data was used to happen, so it needed to be handled with

generalized poisson regression analysis, negative binomial regression, and

lagrange poisson regression. The purpose of this research is to apply

generalized poisson regression analysis, negative binomial regression, and

lagrange poisson regression to find out the factors that affect the number of

Dengue Hemorrhagic Fever (DHF) cases in Malang. From the formed three

models, the best model is chosen by comparing the pearson chi squares,

and variables that have significant influence is searched. DHF is one of the

infectious diseases that become public health problems in Indonesia

because of the increasing number of patients and the widespread spreading,

so it’s necessary to do prevention by the Government in order to reduce the

number of DHF cases in Malang. The best model is the negative binomial

regression that is 𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021Xi1 + 0,0167Xi2 . From

five predictor variables that is used in this research, there is one predictor

variable that significantly influences the number of dengue fever cases in

Malang city, that is the percentage of households with clean and healthy

life pattern (PHBS).

Keywords: Negative Binomial, Dengue Hemorrhagic Fever (DHF),

Generalized Poisson, Lagrange Poisson, Poisson Regression.

x

xi

KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang telah memberikan berkah,

rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penulisan

skripsi dengan judul “Penerapan Analisis Regresi Generalized Poisson,

Binomial Negatif, Dan Lagrange Poisson untuk Menangani Data yang

Mengalami Overdispersi (Studi Kasus Pada Dinas Kesehatan Kota

Malang)”. Selama penyusunan skripsi ini, penulis telah mendapatkan

bantuan dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis

mengucapkan terima kasih yang sebanyak-banyaknya kepada:

1. Bapak Achmad Efendi, S.Si., M.Sc., Ph.D selaku dosen

pembimbing yang telah memberikan bimbingan serta nasihat

sehingga skripsi ini dapat diselesaikan dengan baik. 2. Ibu Ir. Heni Kusdarwati, M.S. selaku dosen penguji I yang telah

memberikan saran dan bimbingan sehingga skripsi ini dapat

diselesaikan dengan baik.

3. Ibu Prof. Dr. Ir. Ni Wayan Surya Wardhani, M.S. selaku dosen penguji

II yang telah memberikan saran dan bimbingan sehingga skripsi ini

dapat diselesaikan dengan baik.

4. Bapak Ratno Bagus Edy Wibowo, S.Si., M.Si., Ph.D. selaku Ketua

Jurusan Matematika Fakultas MIPA Universitas Brawijaya.

5. Mama, Ayah, Adik Bella, Om Nono, Tante Indah, Mbak Ayu, Mas

Agung, serta seluruh keluarga besar yang telah memberikan dukungan

berupa doa, motivasi, dan materi kepada penulis dalam penyusunan

laporan.

6. Sahabat tercinta Shinta Ayu Alifa dan Irfa Sepsaria yang banyak

membantu dan memberikan semangat, doa, serta dukungan dalam

penyusunan skripsi.

7. Ari Purwanto dan Eka Fitria Damayanti atas ilmu, bantuan, serta

motivasi yang telah banyak diberikan dalam penyusunan skripsi ini.

8. Teman-teman Statistika 2012 dan 2013 yang telah memberikan

banyak bantuan, semangat, doa, dan berjuang bersama dalam

menyelesaikan skripsi.

9. Teman-teman Cientifico Choir yang selalu memberikan semangat,

doa, keceriaan, pengalaman dalam bidang non akademik.

10. Sahabat LDF Yana, Dila, Alfi, Rizma, Ditya, Dinda, serta FG Shinta,

Sofi, dan Desy atas bantuan, doa, dan semangat yang diberikan.

xii

xiii

11. Dinas Kesehatan Kota Malang yang telah memberikan izin kepada

penulis untuk melaksanakan penelitian.

12. Semua pihak yang secara langsung maupun tidak langsung telah

membantu penulis dalam penyelesaian skripsi ini yang tidak bisa

disebutkan satu per satu.

Penulis menyadari bahwa penyusunan skripsi ini masih memiliki

banyak kekurangan. Oleh karena itu, kritik dan saran yang membangun dari

pembaca sangat berguna untuk penyusunan laporan yang lebih baik di lain

kesempatan. Penulis berharap semoga skripsi ini bermanfaat bagi semua

pihak yang membutuhkan.

Malang, Juli 2017

Penulis

xiv

xv

DAFTAR ISI

ABSTRAK ........................................................................................ vii

ABSTRACT ..................................................................................... ix

KATA PENGANTAR ..................................................................... xi

DAFTAR ISI ................................................................................... xv

DAFTAR TABEL ............................................................................ xix

DAFTAR GAMBAR ....................................................................... xxi

DAFTAR LAMPIRAN ................................................................... xxiii

BAB I PENDAHULUAN

1.1 Latar Belakang .......................................................... 1

1.2 Rumusan Masalah ...................................................... 2

1.3 Tujuan Penelitian ........................................................ 2

1.4 Batasan Masalah ......................................................... 3

1.5 Manfaat Penelitian ...................................................... 3

BAB II TINJAUAN PUSTAKA

2.1 Distribusi Poisson....................................................... 5

2.2 Multikolinearitas ........................................................ 7

2.3 Overdispersi................................................................ 7

2.4 Analisis Regresi Poisson ............................................ 8

2.4.1 Pendugaan Parameter Model Regresi Poisson ... 8

2.5 Analisis Regresi Genralized Poisson ......................... 9

2.5.1 Pendugaan Parameter Model Regresi Generalized

Poisson ................................................................ 9

2.6 Analisis Regresi Binomial Negatif ............................. 11

2.6.1 Pendugaan Parameter Model Regresi Binomial

Negatif ................................................................ 12

2.7 Analisis Regresi Poisson Lagrange ........................... 13

2.7.1 Pendugaan Parameter Model Regresi Lagrange

Poisson ................................................................ 13

2.8 Pengujian Secara Simultan ......................................... 14

2.9 Pengujian Secara Parsial ............................................ 15

2.10 Uji Kelayakan Model (Goodness of Fit) .................... 15

2.11 Penyakit Demam Berdarah Dengue ........................... 16

BAB III METODE PENELITIAN

3.1 Sumber Data ............................................................... 19

xvi

xvii

3.2 Variabel Penelitian ..................................................... 19

3.3 Langkah-langkah Penelitian ....................................... 19

BAB IV HASIL DAN PEMBAHASAN

4.1 Distribusi Poisson....................................................... 23

4.2 Multikolinearitas ........................................................ 23

4.3 Regresi Poisson .......................................................... 24

4.4.1 Pembentukan Model Regresi ............................ 24

4.4.2 Uji Signifikansi Secara Simultan ...................... 25

4.4.3 Uji Signifikansi Secara Parsial ......................... 25

4.4 Overdispersi................................................................ 25

4.5 Regresi Generalized Poisson ...................................... 26




4.6 Regresi Binomial Negatif ........................................... 28




4.7 Regresi Poisson Lagrange .......................................... 30




4.8 Uji Kelayakan Model (Goodness of Fit) .................... 32

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan ................................................................. 35

5.2 Saran ........................................................................... 35

DAFTAR PUSTAKA ..................................................................... 37

LAMPIRAN ..................................................................................... 39

xviii

xix

DAFTAR TABEL

Tabel 4.1 Hasil Pengujian Asumsi Non Multikolinearitas .............. 23

Tabel 4.2 Hasil Pendugaan Parameter Regresi Poisson .................. 24

Tabel 4.3 Hasil Pengujian Signifikansi Parameter Model Regresi

Poisson Secara Simultan ................................................. 24


Poisson Secara Parsial .................................................... 25

Tabel 4.5 Hasil Pendugaan Parameter Regresi Generalized Poisson 26


Generalized Poisson Secara Simultan ............................ 26


Generalized Poisson Secara Parsial ................................ 27

Tabel 4.8 Hasil Pendugaan Parameter Regresi Binomial Negatif .. 28


Binomial Negatif Secara Simultan .................................. 29


Binomial Negatif Secara Parsial ..................................... 29

Tabel 4.11 Hasil Pendugaan Parameter Regresi Poisson Lagrange .. 30


Poisson Lagrange Secara Simultan ................................ 31


Poisson Lagrange Secara Parsial .................................... 31

Tabel 4.14 Hasil Khi Kuadrat Pearson ............................................. 33

xx

xxi

DAFTAR GAMBAR

Gambar 3.1 Diagram Alir Analisis Regresi Poisson .......................... 20

xxii

xxiii

DAFTAR LAMPIRAN

Lampiran 1 Data Kasus Deman Berdarah Kota Malang tahun 2015 39

Lampiran 2 Hasil Pengujian Sebaran Variabel Respon ................... 40

Lampiran 3 Hasil Pengujian Asumsi Non Multikolinearitas ........... 41

Lampiran 4 Hasil Pendugaan Parameter Regresi Poisson ............... 42

Lampiran 5 Hasil Pendugaan Parameter Regresi Generalized Poisson 43

Lampiran 6 Hasil Pendugaan Parameter Regresi Binomial Negatif 44

Lampiran 7 Hasil Pendugaan Parameter Regresi Poisson Lagrange 45

Lampiran 8 Algoritma RStudio untuk Model Regresi Poisson ....... 46

Lampiran 9 Algoritma RStudio untuk Model Regresi Binomial

Negatif47 ...................................................................... 47

Lampiran 10 Algoritma RStudio untuk Model Regresi Generalized

Poisson dan Regresi Poisson Lagrange ....................... 48

Lampiran 11 Hasil Analisis Regresi Generalized Poisson tanpa Variabel

X3 .................................................................................. 57


X3 dan X5 ...................................................................... 58


X3, X5, dan X4 ............................................................... 59

Lampiran 14 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5

...................................................................................... 60

Lampiran 15 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5

dan X3 ........................................................................... 61

Lampiran 16 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5,

X3, dan X4 ..................................................................... 62

Lampiran 17 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5

...................................................................................... 63

Lampiran 18 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5

dan X1 ........................................................................... 64

Lampiran 19 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5,

X1, dan X4 ..................................................................... 65

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Penyakit demam berdarah dengue (DBD) merupakan salah

satu penyakit menular yang sebagian besar menyerang anak-anak.

DBD menjadi masalah kesehatan masyarakat di Indonesia karena

jumlah penderita yang cenderung meningkat dan semakin luas

penyebarannya. Selain itu, Indonesia juga masih memiliki banyak

daerah yang endemik. Daerah endemik DBD pada umumnya

merupakan sumber penyebaran penyakit ke wilayah lain. Setiap

kejadian luar biasa DBD umumnya dimulai dengan peningkatan

jumlah kasus di wilayah tersebut. Penyakit DBD mempunyai

perjalanan yang sangat cepat dan penanganannya sering terlambat

sehingga banyak pasien yang meninggal (Widoyono, 2011).

Berdasarkan profil kesehatan Kota Malang tahun 2015 oleh

Dinas Kesehatan Kota Malang, penyakit DBD merupakan salah satu

kejadian luar biasa (KLB) dengan jumlah peristiwa mencapai 136

pada tahun 2012, meningkat menjadi 409 kasus pada tahun 2013,

pada tahun 2014 mengalami penurunan menajdi 160, dan meningkat

kembali menjadi 298 pada tahun 2015. Penyakit DBD masih

menyebar luas di Kota Malang walaupun kejadiannya menurun pada

tahun 2014 jika dibandingkan dengan tahun 2013. Mengingat

bahayanya kasus DBD yang dapat menyebabkan penderitanya

meninggal, perlu dilakukan penanganan lebih lanjut dengan terlebih

dahulu menganalisis faktor-faktor apa yang memiliki pengaruh

signifikan terhadap kasus DBD, sehingga dapat dilakukan upaya

pencegahan oleh Pemerintah demi menekan angka jumlah kasus

DBD di Kota Malang.

Analisis regresi memungkinkan untuk meramalkan nilai suatu

variabel respon dari nilai-nilai satu atau lebih variabel prediktor.

Metode ini umumnya digunakan dalam bisnis, ilmu sosial, ilmu

biologi, dan disiplin ilmu lainnya. Pada analisis regresi linier,

variabel respon berdistribusi normal. Dalam beberapa kasus,

ditemukan variabel respon yang diamati berdistribusi Poisson. Suatu

variabel disebut berdistribusi Poisson apabila peristiwa yang diamati

terjadi selama selang waktu tertentu atau di suatu daerah tertentu.

2

Bila variabel respon berdistribusi Poisson, analisis regresi yang

digunakan adalah analisis regresi Poisson.

Analisis regresi Poisson diterapkan untuk mengetahui faktor-

faktor yang memiliki pengaruh signifikan pada kasus demam

berdarah dengue. Namun, sering kali data mengalami overdispersi,

yaitu keadaan di mana data memiliki nilai ragam yang lebih besar

dibandingkan nilai rata-rata, sehingga model regresi poisson menjadi

tidak layak untuk digunakan. Untuk menangani overdispersi,

terdapat beberapa metode yang dapat digunakan diantaranya dengan

analisis binomial negatif, generalized poisson, dan lagrange poisson.

Dalam penelitian ini, faktor-faktor yang akan dianalisis diantaranya

jumlah sarana kesehatan, rumah tangga berperilaku hidup bersih dan

sehat (Ber-PHBS), jumlah rumah tangga miskin, indeks kepadatan

penduduk, dan angka bebas jentik di setiap puskesmas di Kota

Malang. Data yang digunakan adalah data sekunder yang diambil

dari Dinas Kesehatan Pemerintah Kota Malang pada tahun 2015.

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, rumusan masalah dari

penelitian ini adalah :

1. Bagaimana model regresi Generalized Poisson, Binomial

Negatif, dan Lagrange poisson pada data jumlah kasus DBD?

2. Apakah model regresi terbaik yang dapat digunakan untuk

mengetahui faktor-faktor yang berpengaruh signifikan

terhadap kasus DBD?

3. Variabel apa yang memiliki pengaruh signifikan pada kasus

DBD?

1.3 Tujuan Penelitian

Tujuan dari penelitian ini adalah sebagai berikut :

1. Membentuk model regresi Generalized Poisson, Binomial

Negatif, dan Lagrange poisson pada kasus DBD.

2. Mengetahui model terbaik yang dapat digunakan untuk

mengetahui faktor-faktor yang berpengaruh signifikan

terhadap kasus DBD.

3. Mengetahui variabel yang memiliki pengaruh signifikan pada

kasus DBD.

3

1.4 Batasan Masalah

Masalah dalam penelitian ini hanya dibatasi pada data demam

berdarah yang diperoleh dari Dinas Kesehatan Pemerintah Kota

Malang pada tahun 2015.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah diharapkan mampu memberi

informasi dalam dunia kesehatan tentang variabel yang berpengaruh

terhadap kasus DBD serta menambah pengetahuan aplikasi statistika

dalam dunia kesehatan.

5

BAB II

TINJAUAN PUSTAKA

2.1 Distribusi Poisson

Percobaan Poisson yaitu banyaknya hasil percobaan yang terjadi

selama suatu selang waktu tertentu atau di suatu daerah tertentu.

Selang waktu yang dimaksud dapat berupa panjangnya, misalnya

satu menit, satu hari, satu minggu, satu bulan, dst. Sebagai contoh

percobaan Poisson, missal di suatu gerbang tol yang dilewati ribuan

mobil dalam suatu hari, terjadi kecelakaan dari sekian banyak mobil

yang lewat. Daerah tertentu yang dimaksud dapat berupa suatu ruas

garis, suatu luas, suatu volume, dst. Sebagai contoh, percobaan

mungkin saja menyatakan banyaknya kesalahan ketik per halaman.

(Walpole, 1995)

Menurut Walpole (1995), sebaran peluang bagi variabel acak

Poisson adalah:

𝑝(𝑦; 𝜇) =𝑒−𝜇𝜇𝑦

𝑦! , untuk 𝑦 = 0,1,2,3,… (2.1)

Di mana :

y: banyaknya sukses yang terjadi dalam selang waktu atau daerah

tertentu

𝜇: rata-rata banyaknya sukses yang terjadi dalam selang waktu atau

daerah tertentu

e: 2.718

Rata-rata dan ragam dari distribusi Poisson adalah 𝐸(𝑦) = 𝜇 dan

𝑉𝑎𝑟(𝑦) = 𝜇. Hal tersebut dapat dibuktikan dengan penjabaran

sebagai berikut:

𝐸(𝑌) = ∑ [𝑦. 𝑝(𝑦; 𝜇)]∞𝑦=0

= ∑ [𝑦.𝑒−𝜇𝜇𝑦

𝑦!]∞

𝑦=0

= ∑ [𝑦.𝑒−𝜇 𝜇𝑦

𝑦(𝑦−1)!]∞

𝑦=0

= ∑ [𝑦.𝑒−𝜇𝜇 𝜇𝑦−1

𝑦(𝑦−1)!]∞

𝑦=0

= 𝜇 ∑ [𝑒−𝜇 𝜇𝑦−1

(𝑦−1)!]∞

𝑦=0

misal 𝑥 = 𝑦 − 1, maka diperoleh persamaan:

6

𝐸(𝑌) = 𝜇∑𝑒−𝜇 𝜇𝑥

𝑥!∞𝑥=0

karena ∑ [𝑝(𝑥; 𝜇)]∞𝑥=0 = 1, maka:

𝐸(𝑌) = 𝜇×1 = 𝜇

untuk ragam dalam variabel acak Poisson adalah sebagai berikut:

𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

𝐸(𝑌2) = ∑ [𝑦2. 𝑝(𝑦)]∞𝑦=0

= ∑ [(𝑦(𝑦 − 1) + 𝑦). 𝑝(𝑦)]∞𝑦=0

= ∑ [𝑦(𝑦 − 1). 𝑝(𝑦)]∞𝑦=0 + ∑ 𝑦. 𝑝(𝑦)∞

𝑦=0

= ∑ [𝑦(𝑦 − 1). 𝑝(𝑦)]∞𝑦=0 + 𝜇

= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇𝑦

𝑦!]∞

𝑦=0 + 𝜇

= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇𝑦

𝑦(𝑦−1)(𝑦−2)!]∞

𝑦=0 + 𝜇

= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇2𝜇𝑦−2

𝑦(𝑦−1)(𝑦−2)!]∞

𝑦=0 + 𝜇

= 𝜇2 ∑ [𝑒−𝜇𝜇𝑦−2

(𝑦−2)!]∞

𝑦=0 + 𝜇

misalkan x= 𝑦 − 2, maka diperoleh persamaan:

𝐸(𝑌2) = 𝜇2∑ [𝑒−𝜇𝜇𝑥

𝑥!]∞

𝑥=0 + 𝜇 = 𝜇2 + 𝜇

karena ∑𝑒−𝜇 𝜇𝑥

𝑥!∞𝑥=0 = 1, maka:

𝐸(𝑌2) = 𝜇2 + 𝜇

sehingga didapatkan ragam untuk variabel acak Poisson adalah:

𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

= 𝜇2 + 𝜇 − 𝜇2

= 𝜇

Untuk mengetahui apakah suatu data berdistribusi Poisson atau

tidak, dapat diketahui dengan uji Kolmogorov Smirnov dengan

hipotesis sebagai berikut:

H0 ∶ data berdistribusi 𝑃𝑜𝑖𝑠𝑠𝑜𝑛

H1 ∶ data tidak berdistribusi 𝑃𝑜𝑖𝑠𝑠𝑜𝑛

Statistik uji yang digunakan adalah:

𝐷𝑛 = 𝑆𝑢𝑝|𝑆𝑛(𝑦) − 𝐹0(𝑦)| (2.2)

di mana:

𝐷𝑛 : Jarak tegak maksimum antara fungsi distribusi empiris

dengan fungsi distribusi Poisson

7

𝑆𝑛(𝑦) : Suatu fungsi peluang kumulatif data sampel

𝐹0(𝑦) : Suatu fungsi distribusi kumulatif Poisson

Jika nilai statistic uji 𝐷𝑛 > nilai statistic Kolmogorov Smirnov

pada tabel, maka H0 ditolak.

2.2 Multikolinearitas

Multikolinearitas merupakan asumsi yang harus dipenuhi dalam

analisis regresi Poisson. Ketika semua atau sebagian variabel

prediktor berkorelasi antara satu sama lain, maka dapat dikatakan

terjadi multikolinearitas.

Menurut Kutner, dkk (2005), salah satu metode untuk

mendeteksi keberadaan multikolinearitas yang dapat digunakan

secara umum adalah Variance Inflation Factors (VIF). Persamaan

dari VIF adalah sebagai berikut:

(𝑉𝐼𝐹)𝑘 = (1 − 𝑅𝑝2)−1

(2.3)

Di mana 𝑅𝑝2 merupakan koefisien determinasi dari model regresi

buatan di mana 𝑋𝑝 sebagai variabel respon diregresikan dengan

variabel X lainnya sebagai variabel prediktor. Jika nilai VIF kurang

dari 10, maka tidak terjadi multikolinearitas pada model regresi.

2.3 Overdispersi

Overdispersi adalah keadaan di mana data memiliki nilai ragam

yang lebih besar dibandingkan nilai rata-rata, sedangkan

underdispersi adalah ketika data memiliki nilai rata-rata lebih besar

dibandingkan nilai ragam. Pada regresi Poisson, data harus memiliki

nilai rata-rata dan ragam yang bernilai sama atau disebut juga dengan

equidispersi (Ismail dan Jemain 2007).

Pengujian overdispersi pada regresi Poisson dilakukan dengan

menggunakan statistik uji Khi Kuadrat Pearson dibagi nilai derajat

bebas (n-k) di mana n merupakan banyaknya pengamatan dan k

merupakan banyaknya parameter. Rumus pengujian overdispersi

secara matematis ditulis sebagai berikut:

𝜙 =𝜒2

𝑑𝑏 (2.4)

dengan 𝜙 merupakan parameter dispersi. Berikut merupakan statistik

uji Khi Kuadrat Pearson:

𝜒2 = ∑(𝑦𝑖−𝜇)

2

𝑉𝑎𝑟 (𝑌)𝑛𝑖=1 (2.5)

8

di mana :

𝑦𝑖 : nilai variabel respon pada pengamatan ke-i

𝜇 : penduga bagi respon rata-rata

Apabila hasil pembagian statistik uji khi kuadrat Pearson dengan

derajat bebas menghasilkan nilai > 1, dapat dikatakan terjadi

overdispersi.

2.4 Analisis Regresi Poisson

Model regresi untuk data cacahan yang mengikuti distribusi

Poisson adalah model regresi Poisson. Distribusi Poisson sering

digunakan untuk kejadian-kejadian yang jarang terjadi dengan data

berupa cacahan yang mempunyai nilai non negatif (Kismiantini

2008).

Model regresi Poisson merupakan model standar untuk data

diskrit dan termasuk dalam model regresi linier (Cameron dan

Trivedi, 1998). Pada model regresi Poisson nilai µ merupakan fungsi

dari variable penjelas. Regresi Poisson memiliki fungsi kepekatan

peluang sebagai berikut:

𝑓(𝑦𝑖; 𝜇𝑖) =𝑒−𝜇𝑖𝜇𝑦𝑖

𝑦𝑖! (2.6)

di mana 𝑦𝑖 adalah jumlah kejadian dan 𝜇𝑖 adalah rata-rata jumlah

kejadian yang terjadi dalam interval waktu tertentu. Sedangkan

model 𝜇𝑖 dari regresi poisson dinyatakan dalam bentuk sebagai

berikut:

�̂� = �̂�𝑖 = exp(β̂0 + β̂1Xi1 + β̂2Xi2 +⋯+ β̂pXip) (2.7)

2.4.1 Pendugaan Parameter Model Regresi Poisson

Metode Maksimum Likelihood Estimation (MLE) adalah

salah satu metode pendugaan parameter untuk suatu model yang

diketahui distribusinya. Menurut Kutner (2005), untuk model regresi

Poisson, fungsi likelihood adalah sebagai berikut:

𝐿(𝛽) = ∏ 𝑓𝑖(𝑦𝑖) = ∏[𝜇(𝑋𝑖,𝛽)]

𝑦𝑖𝑒𝑥𝑝[−𝜇(𝑋𝑖,𝛽)]

𝑦𝑖!𝑛𝑖=1

𝑛𝑖=1 (2.8)

={∏ [𝜇(𝑋𝑖,𝛽)]

𝑦𝑖𝑛𝑖=1 }𝑒𝑥𝑝[−∑ 𝜇(𝑋𝑖,𝛽)

𝑛𝑖=1 ]

∏ 𝑦𝑖!𝑛𝑖=1

9

dan persamaan log likelihood adalah:

ln 𝐿(𝛽) = ∑ 𝑦𝑖 ln 𝜇(𝑋𝑖,𝛽)𝑛𝑖=1 − ∑ 𝜇(𝑋𝑖,𝛽)

𝑛𝑖=1 − ∑ ln(𝑦𝑖!)

𝑛𝑖=1 (2.9)

Dugaan MLE untuk parameter model regresi Poisson

dinyatakan dengan �̂� dan diperoleh dari solusi turunan pertama

fungsi log likelihoodnya adalah:

𝐿(𝑦, 𝛽) =𝜕 ln 𝐿(𝛽)

𝜕𝛽 (2.10)

Penyelesaian persamaan ini dapat dilakukan dengan prosedur

iterative menggunakan iterasi Newton-Raphson.

2.5 Analisis Regresi Generalized Poisson

Rata-rata sampel sama dengan ragam sampel merupakan asumsi

yang mendasari distribusi poisson. Jika terjadi pelanggaran terhadap

asumsi tersebut maka terjadi kondisi over/under dispersi yang

menyebabkan model regresi poisson tidak efisien. Oleh sebab itu

digunakan suatu model yang sesuai untuk mengatasi

over/underdispersi yaitu model regresi Generalized Poisson.

Menurut Wang dan Famoye dalam Ismail dan Jemain (2007), regresi

generalized poisson memiliki fungsi kepekatan peluang sebagai

berikut:

𝑓𝑖(𝑦𝑖 , 𝜇𝑖, 𝜙) = (𝜇𝑖

1+𝜙𝜇𝑖)𝑦𝑖 (1+𝜙𝑦𝑖)

𝑦𝑖−1

𝑦𝑖!𝑒𝑥𝑝 [

−𝜇𝑖(1+𝜙𝑦𝑖)

1+𝜙𝜇𝑖], (2.11)

𝑖 = 0,1,2,…

di mana ∅ merupakan parameter dispersi. Model 𝜇𝑖 dari regresi

Generalized Poisson dituliskan dalam bentuk sebagai berikut:

�̂� = �̂�𝑖 = exp (∑ βjXjipj=0 ) (2.12)

di mana �̂� merupakan penduga bagi β. Rata-rata dan ragam dari

𝑦𝑖 adalah sebagai berikut:

𝐸(𝑌𝑖) = 𝜇𝑖 (2.13)

𝑉(𝑌𝑖) = 𝜇𝑖(1 + 𝜇𝑖)2 (2.14)

Model regresi Generalized Poisson adalah generalisasi dari

model regresi Poisson. Pada model regresi Generalized Poisson jika

𝜙 = 0 maka model akan tereduksi menjadi model regresi Poisson.

Kondisi overdispersi ditunjukkan dengan nilai 𝜙 > 0, sedangkan

underdispersi jika 𝜙 < 0.

10

2.5.1 Pendugaan Parameter Regresi Generalized Poisson

Menurut Ismail dan Jemain (2007), metode yang digunakan

untuk pendugaan parameter dalam Generalized Poisson adalah

metode Maximum Likelihood Estimation (MLE) dengan cara

memaksimumkan fungsi likelihood. Fungsi likelihood dari

Generalized Poisson adalah sebagai berikut:

𝐿(𝛽; 𝜙) = ∏ [𝜇𝑖

1+𝜙𝜇𝑖]𝑦𝑖[(1+𝜙𝜇𝑖)

𝑦𝑖−1

𝑦𝑖!] 𝑒𝑥𝑝 [

−𝜇𝑖(1+𝜙𝜇𝑖)

1+𝜙𝜇𝑖]𝑛

𝑖=1 (2.15)

Fungsi ln likelihood dari Generalized Poisson adalah sebagai

berikut:

ln 𝑙 (𝛽; 𝜙) = ∑ [𝑦𝑖 ln (𝜇𝑖

1+𝜙𝑖) + (𝑦𝑖 − 1) ln(1 + 𝜙𝑖) −

𝑛𝑖=1

ln(𝑦𝑖!) − (𝜇𝑖(1+𝜙𝜇𝑖)

1+𝜙𝜇𝑖)] (2.16)

Terdapat dua tahap pendugaan, yaitu pendugaan terhadap

parameter 𝛽 dan 𝜙

1. Pendugaan terhadap 𝛽

Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝛽

dilakukan dengan Maximum Likelihood Estimation (MLE) dengan

menurunkan fungsi likelihood terhadap 𝛽 dan disamakan dengan nol

sehingga diperoleh persamaan: 𝜕𝐿(𝛽)

𝜕𝛽𝑗= ∑

(𝑦𝑖−𝜇𝑖)𝑥𝑖𝑗

(1+ 𝜙𝜇𝑖)2

𝑛𝑖=1 = 0 (2.17)

𝑗 = 1,2, … , 𝑝

Persamaan diselesaikan dengan metode Iteratively Reweighted

Least Square (IRLS) dan Fisher Scoring. Metode iterasi IRLS adalah

metode yang digunakan untuk memecahkan masalah optimasi

tertentu dengan fungsi tujuan. Persamaan iteratif regresi IRLS

dengan metode Fisher Scoring adalah sebagai berikut:

𝜷(𝑟) = 𝜷(𝑟−1) + (𝐗𝑇𝐖(r−1)𝐗)

−1𝐗𝑇𝐖(𝑟−1)𝐤(𝑟−1), (2.18)

𝑟 = 1,2, … , 𝑛

di mana:

𝜷(𝑟) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-r

𝜷(𝑟−1) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-(r-1)

𝐗𝑇 = matriks kebalikan variabel prediktor berukuran (𝑝 + 1)×𝑛

11

𝐖(𝑟−1) = diagonal matriks pembobot dengan elemen 𝑤𝑖 pada iterasi

ke-(r-1). Pada distribusi Generalized Poisson, elemen

diagonal ke-i dari W adalah:

𝑾𝑖 =𝜇𝑖

(1+𝜙𝜇𝑖)2 (2.19)

𝐤(𝑟−1) = vektor kolom dengan elemen ke-i

𝐤𝑖 =(𝑦𝑖−𝜇𝑖)

𝜇𝑖 (2.20)

Penduga awal bagi β diperoleh melalui metode MLE dengan

meregresikan logaritma dari variabel respon terhadap variabel

prediktor. Kemudian dilakukan iterasi sampai didapatkan penduga

bagi β yang konvergen yaitu ketika ‖𝜷(𝑟) − 𝜷(𝑟−1)‖ < 10−5

2. Pendugaan terhadap 𝜙

Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝜙

dilakukan dengan MLE dengan menerapkan metode iterasi Newton-

Raphson seperti berikut:

�̂�𝑟 = �̂�(𝑟−1) −𝑓′(�̂�(𝑟−1))

𝑓"(�̂�(𝑟−1)) (2.21)

Di mana 𝑓′ merupakan turunan pertama dari persamaan (2.16)

terhadap �̂�, dan 𝑓" merupakan turunan kedua dari persamaan (2.16)

terhadap �̂�. Agar memenuhi syarat 1 + 𝜙𝜇𝑖 > 0 dan 1 + 𝜙𝑦𝑖 > 0,

maka perlu dilakukan pembatasan terhadap nilai �̂� pada proses

iterasi, yaitu: �̂� =

{

−

1

max(𝜇𝑖)+1; 𝑗𝑖𝑘𝑎 𝜙 < 0 𝑑𝑎𝑛 𝜙 ≤ −

1

max(𝜇𝑖)

−1

max(𝑦𝑖)+1; 𝑗𝑖𝑘𝑎 𝜙 < 0 𝑑𝑎𝑛 𝜙 ≤ −

1

max(𝑦𝑖)

min (−1

max(𝜇𝑖)+1, −

1

max(𝑦𝑖)+1) ; 𝑗𝑖𝑘𝑎 𝜙 < 0, 𝜙 ≤ −

1

max(𝜇𝑖), 𝑑𝑎𝑛 𝜙 ≤ −

1

max(𝑦𝑖)

(2.22)

2.6 Analisis Regresi Binomial Negatif

Binomial negatif termasuk anggota sebaran keluarga

eksponensial sehingga regresi binomial negatif merupakan salah satu

model regresi dari Generalized Linear Model (GLM). Regresi

binomial negatif dapat digunakan sebagai alternatif untuk

memodelkan data poisson yang mengalami overdispersi. Menurut

12

Berk dan Macdonald (2008), fungsi kepekatan peluang regresi

binomial negatif adalah sebagai berikut:

𝑓𝑖(𝑦𝑖 , 𝜇𝑖 , 𝜙) =Γ(𝑦𝑖+

1

𝜙)

Γ(1

𝜙)𝑦𝑖!

(1

1+𝜙𝜇𝑖)

1

𝜙(𝜙𝜇𝑖

1+𝜙𝜇𝑖)𝑦𝑖

, 𝑦𝑖 = 0,1,2,… (2.23)

Model 𝜇𝑖 dari regresi Binomial Negatif dinyatakan dalam

bentuk yang sama dengan model regresi Generalized Poisson.

Sebaran binomial negatif mempunyai rata-rata dan ragam sebagai

berikut:

𝐸(𝑌𝑖) = 𝜇𝑖 (2.24)

𝑉(𝑌𝑖) = 𝜇𝑖 + 𝜙𝜇𝑖2 (2.25)

2.6.1 Pendugaan Parameter Regresi Binomial Negatif

Pendugaan parameter regresi binomial negatif dilakukan

dengan menggunakan metode Maximum Likelihood Estimation

(MLE). Fungsi likelihood dari binomial negative adalah:

𝐿(𝛽;𝜙) = ∑ [(∑ ln(𝑟 + 𝜙−1)𝑦𝑖−1𝑟=0 ) − ln(𝑦𝑖!) + 𝑦𝑖 ln(𝜙𝜇𝑖) −

𝑛𝑖=1

(𝜙−1 + 𝑦𝑖) ln(1 + 𝜙𝜇𝑖)] (2.26)

Dengan fungsi ln likelihood sebagai berikut:

ln 𝑙(𝛽; 𝜙) =∑ [(∑ ln(𝑟 + 𝜙−1)𝑦𝑖−1𝑟=0 ) − ln(𝑦𝑖!) + 𝑦𝑖 ln(𝜙𝜇𝑖) −

𝑛𝑖=1

(𝑦𝑖 +1

𝜙) ln(𝜙𝜇𝑖 + 1)] (2.27)

Menurut Simarmata dan Ispriyanti (2011), pendugaan

parameter regresi Binomial Negatif dapat dilakukan dengan langkah-

langkah sebagai berikut:

1. Menentukan penduga awal bagi 𝜙, misal 𝜙1̂ = 0

2. Menduga 𝜷 dengan iterasi Fisher Scoring dengan asumsi 𝜙 =𝜙1̂. Berikut adalah rumus untuk iterasi Fisher Scoring:

�̂�𝑖+1 = �̂�𝑖 + (𝑿𝑻𝑾𝑿)

−1𝑿𝑻𝑾𝒛 (2.28)

W adalah matriks pembobot dengan ukuran n × n , di mana

elemen diagonal ke-i adalah 𝑤𝑖 dan vektor kolom dengan elemen

ke-i yaitu 𝑧𝑖, di mana:

𝑤𝑖 =𝜇𝑖

1+𝜙𝜇𝑖 dan 𝑧𝑖 =

(𝑦𝑖−𝜇𝑖)

𝜇𝑖 (2.29)

Iterasi berakhir jika �̂�𝑖+1 = �̂�𝑖

13

3. �̂� yang dihasilkan dari iterasi Fisher Scoring digunakan untuk

menduga parameter 𝜙 dengan iterasi Newton-Raphson.

Persamaan iterasi Newton-Raphson adalah:

�̂�𝑖+1 = �̂�𝑖 −𝑓′(𝜙)

𝑓"(𝜙) (2.30)

Iterasi berakhir jika �̂�𝑖+1 = �̂�𝑖

4. Jika |�̂�𝑖+1 − �̂�𝑖| < 𝜀 maka pendugaan selesai, jika tidak maka

gunakan parameter 𝜙𝑖 = �̂�𝑖+1 dan kembali ke langkah 2.

2.7 Analisis Regresi Lagrange poisson

Sebaran lagrange poisson merupakan pengembangan dari

sebaran Poisson. Regresi lagrange poisson adalah salah satu

alternatif untuk memodelkan data poisson yang mengalami

overdispersi. Menurut Consul dan Famoye dalam Ismail dan Jemain

(2007), fungsi kepekatan peluang regresi Lagrange poisson adalah

sebagai berikut:

𝑓(𝑦𝑖; 𝜇𝑖; 𝜙) = 𝜇𝑖[𝜇𝑖 + (𝜙 − 1)𝑦𝑖]𝑦𝑖−1 [

exp−[𝜇𝑖+(𝜙−1)𝑦𝑖]

𝑦𝑖!], (2.31)

𝑦𝑖 = 0,1,2,…

Model 𝜇𝑖 regresi Lagrange poisson dapat dinyatakan dalam

bentuk yang sama dengan model regresi Poisson dan Generalized

Poisson yaitu pada persamaan (2.11). Model regresi lagrange poisson

memiliki rata-rata dan ragam sebagai berikut:

𝐸(𝑌𝑖) = 𝜇𝑖 (2.32)

𝑉(𝑌𝑖) = 𝜙2𝜇𝑖 (2.33)

2.7.1 Pendugaan Parameter Regresi Lagrange poisson

Pendugaan parameter regresi lagrange poisson dilakukan

dengan metode Maximum Likelihood Estimation (MLE). Fungsi

likelihood dari lagrange poisson menurut Ismail dan Jemain (2007)

adalah sebagai berikut:

𝐿(𝛽) = ∑ log(𝜇𝑖) + (𝑦𝑖 − 1) log(𝜇𝑖 + (𝜙 − 1)𝑦𝑖) − 𝑦𝑖𝑛𝑖=1 log(𝜙) −

𝜇𝑖+(𝜙−1)𝑦𝑖

𝜙− log(𝑦𝑖!) (2.34)

Pendugaan parameter regresi Lagrange poisson dilakukan

dalam dua tahap yaitu pendugaan terhadap 𝛽 dan 𝜙.

1. Pendugaan terhadap 𝛽

14

Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝛽

dilakukan dengan metode kemungkinan maksimum untuk GLM,

sehingga diperoleh persamaan:

𝜕𝐿(𝛽)

𝜕𝛽𝑗= ∑

𝜕𝐿𝑖

𝜕𝛽𝑗= ∑

(𝑦𝑖−�̂�𝑖)𝑥𝑖𝑗

�̂�𝑖2

𝑛𝑖=1

𝑛𝑖=1 = 0, (2.35)

𝑗 = 1,2, … , 𝑝

Menurut Agresti (2002), untuk memperoleh �̂� persamaan

diselesaikan dengan metode gabungan Iteratively Reweighted Least

Square (IRLS) dan Fisher Scoring. Metode iterasi IRLS adalah

metode yang digunakan untuk memecahkan masalah optimasi

tertentu dengan fungsi tujuan. Persamaan iterative regresi IRLS

menggunakan metode Fisher Scoring adalah:

𝜷(𝑟) = 𝜷(𝑟−1) + (𝐗𝑇𝐖(r−1)𝐗)

−1𝐗𝑇𝐖(𝑟−1)𝐳(𝑟−1), (2.36)

𝑟 = 1,2, … , 𝑛

di mana:

𝜷(𝑟) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-r

𝜷(𝑟−1) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-(r-1)

𝐗𝑇 = matriks kebalikan variabel prediktor berukuran (𝑝 + 1)×𝑛

𝐖(𝑟−1) = diagonal matriks pembobot dengan elemen 𝑤𝑖 pada iterasi

ke-(r-1)

𝐳(𝑟−1) = vektor kolom dengan elemen ke-i

𝑧𝑖 =(𝑦𝑖−𝜇𝑖)

𝜇𝑖 (2.37)

Penduga awal bagi β diperoleh melalui metode MLE dengan

meregresikan logaritma dari variabel respon terhadap variabel

prediktor. Kemudian dilakukan iterasi sampai didapatkan penduga

bagi β yang konvergen yaitu ketika ‖𝜷(𝑟) − 𝜷(𝑟−1)‖ < 10−5

2. Pendugaan terhadap 𝜙

Pendugaan terhadap 𝜙 dilakukan menggunakan metode momen

dengan menyamakan statistic uji Khi-Kuadrat Pearson dengan

derajat bebas (n-k).

∑(𝑦𝑖−�̂�𝑖)

2

�̂�𝑖𝜙2

𝑛𝑖=1 = 𝑛 − 𝑘 (2.38)

Sehingga diperoleh persamaan:

�̂� = √∑(𝑦𝑖−�̂�𝑖)

2

�̂�𝑖(𝑛−𝑘)𝑛𝑖=1 (2.39)

15

2.8 Pengujian Secara Simultan

Pengujian parameter secara simultan atau serentak bertujuan

mengetahui signifikansi koefisien regresi secara keseluruhan.

Pengujian secara simultan dapat dilakukan dengan statistik uji G

(Agresti, 2007). Hipotesis yang digunakan adalah sebagai berikut:

H0 ∶ βj = 0, tidak ada pengaruh antara variabel prediktor dengan

variabel respon

H1 : minimal ada satu j dimana βj ≠ 0, minimal terdapat satu

variabel prediktor berpengaruh terhadap variabel respon.


G = −2 ln[L0 − Lp] (2.40)

Di mana:

𝐿0: ln likelihood model tanpa variabel prediktor

𝐿𝑝: ln likelihood model dengan p variabel prediktor

Statistik uji G mengikuti sebaran 𝜒2 dengan derajat bebas (db) p. Hipotesis nol ditolak apabila statistik uji 𝐺 > 𝜒𝑝(𝛼)

2

2.9 Pengujian Secara Parsial

Setelah melakukan pengujian secara simultan, uji yang harus

dilakukan adalah pengujian secara pasrial, Pengujian parameter

model secara parsial dilakukan untuk mengetahui pengaruh masing-

masing variabel prediktor terhadap variabel respon. Menurut Hosmer

dan Lemeshow (2000) statistik uji yang digunakan untuk pengujian

secara parsial adalah statistic uji Wald. Hipotesis yang digunakan

adalah sebagai berikut:

H0 : βj = 0 ; variabel prediktor tidak berpengaruh terhadap variabel

respon

H1 : βj ≠ 0 ; variabel prediktor berpengaruh terhadap variabel respon


𝑊𝑗 = (�̂�𝑗

𝑠𝑒(�̂�𝑗))2

(2.41)

di mana :

𝛽𝑗 : koefisien model variabel prediktor ke-j.

𝑆𝐸(𝛽𝑗) : standard error dari pendugaan maximum likelihood

Hipotesis nol di tolak jika statistik uji 𝑊𝑗2 > 𝜒1(𝛼)

2

16

2.10 Uji Kelayakan Model (Goodness of Fit)

Menurut Ismail dan Jemain (2007), salah satu metode yang

dapat digunakan untuk meguji kelayakan model adalah Uji Khi

Kuadrat Pearson dengan hippotesis sebagai berikut:

H0: model layak

H1: model tidak layak

Rumus yang digunakan untuk menghitung nilai Khi Kuadrat

Pearson adalah sebagai berikut:

𝜒2 = ∑(𝑦𝑖−𝜇)

2

𝑉𝑎𝑟 (𝑌)𝑛𝑖=1 (2.42)

di mana:

𝑦𝑖 : nilai variabel respon pada pengamatan ke-i

𝜇 : penduga bagi respon rata-rata ke-i

Keputusan menerima H0 dilakukan apabila 𝜒2 < 𝜒𝛼(𝑛−𝑝)2 atau

𝑃[𝜒𝛼(𝑛−𝑝)2 < 𝜒2] lebih kecil dari taraf nyata (𝛼). Hal ini

menunjukkan bahwa model yang diperoleh layak. Model yang lebih

baik untuk digunakan adalah model yang memiliki nilai Khi Kuadr

Pearson lebih kecil.

2.11 Penyakit Demam Berdarah Dengue

Menurut Widoyono (2011), penyakit demam berdarah

dengue (DBD) yang disebut juga dengue hemorrhagic fever (DHF),

dengue fever (DF), demam dengue (DD), dan dengue shock

syndrome (DSS) disebabkan oleh virus dengue dari kelompok

Arbovirus B, yaitu arthropod-borne virus atau virus yang disebabkan

oleh artropoda. Virus ini termasuk genus Flavivirus dan family

Flaviviridae. Vektor utama penyakit DBD adalah nyamuk Aedes

aegepty di daerah perkotaan dan Aedes albopictus di daerah

pedesaan. Ciri-ciri nyamuk Aedes aegepty adalah:

1. Sayap dan badannya belang-belang atau bergaris-garis putih

2. Berkembang biak di air jernih yang tidak beralaskan tanah

seperti bak mandi, wc, pot tanaman air, dll.

3. Jarak terbang kurang lebih 100m.

4. Nyamuk betina bersifat multiple biters yang berarti

menggigit beberapa orang karena berpindah tempat sebelum

kenyang.

5. Tahan dalam suhu panas dan kelembaban tinggi.

17

Di Kota Malang, penyakit DBD merupakan salah satu

kejadian luar biasa (KLB) dengan jumlah yang terus meningkat.

Mengingat bahayanya penyakit DBD yang dapat menyebabkan

kematian, perlu dilakukan penanganan lebih lanjut dengan terlebih

dahulu menganalisis faktor-faktor apa yang memiliki pengaruh

signifikan terhadap kasus DBD, sehingga dapat dilakukan upaya

pencegahan oleh Pemerintah demi menekan angka jumlah kasus

DBD di Kota Malang. Pada penelitian ini, variabel yang digunakan

antara lain adalah sebagai berikut:

1. Jumlah penderita penyakit DBD di Kota Malang pada setiap

puskesmas tahun 2015.

2. Jumlah sarana kesehatan. Banyaknya sarana kesehatan dapat

membantu meminimalisasi penyebaran virus dengue yang

menyebabkan penyakit DBD.

3. Presentase rumah tangga berperilaku hidup bersih dan sehat

(PHBS). Banyaknya rumah tangga berperilaku hidup bersih

dan sehat dapat menekan angka pertumbuhan nyamuk aedes

aegepty yang menyebarkan virus dengue.

4. Jumlah rumah tangga miskin. Karena faktor ekonomi,

sebagian besar rumah tangga miskin memiliki

kecenderungan kurang memperhatikan kesehatan dan

kebersihan yang dapat menyebabkan pesatnya penyebaran

virus dengue.

5. Indeks kepadatan penduduk. Padatnya penduduk pada suatu

wilayah dapat menyebabkan penyebaran virus dengue terjadi

lebih pesat.

6. Angka bebas jentik yang menunjukkan presentase rumah

atau tempat umum yang tidak ditemukan jentik.

19

BAB III

METODE PENELITIAN

3.1 Sumber Data

Data yang digunakan pada penelitian ini adalah data sekunder.

Data sekunder pada penelitian ini adalah data penduduk Kota

Malang yang diperoleh dari Dinas Kesehatan Pemerintah Kota

Malang tahun 2015.

3.2 Variabel Penelitian

Variabel pada penelitian ini berupa variabel respon dan

variabel prediktor.

3.2.1 Variabel Respon (Y)

Pada penelitian ini, variabel respon adalah jumlah penderita

penyakit DBD di Kota Malang pada setiap puskesmas tahun 2015.

3.2.2 Variabel Prediktor (X)

Berikut adalah variabel prediktor pada penelitian ini :

1. Jumlah sarana kesehatan (X1)

2. Presentase rumah tangga ber-PHBS (X2)

3. Jumlah rumah tangga miskin (X3)

4. Indeks kepadatan penduduk (X4)

5. Angka bebas jentik (X5)

3.3 Langkah-langkah Penelitian

Langkah-langkah analisis data pada penelitian ini adalah

sebagai berikut:

1. Melakukan pengujian distribusi Poisson menggunakan

persamaan (2.2)

2. Melakukan uji asumsi non multikolinearitas dengan

persamaan (2.3)

3. Melakukan pendugaan parameter regresi poisson dengan

persamaan (2.7)

4. Mendeteksi adanya overdispersi menggunakan persamaan

(2.4).

5. Jika tidak terdapat overdispersi, model regresi poisson layak

digunakan.

6. Jika terdapat overdospersi, lakukan pendugaan parameter

model Regresi Generalized Poisson, Binomial Negatif, dan

20

Lagrange poisson dengan metode MLE sehingga diperoleh

model seperti pada persamaan (2.12)

7. Pengujian signifikansi parameter regresi

a. Pengujian secara simultan dengan persamaan (2.40)

b. Pengujian secara parsial dengan persamaan (2.41)

8. Melakuikan uji kelayakan model dengan persamaan (2.42) dan

menentukan model terbaik

Adapun diagram alir penelitian disajikan dalam Gambar 3.1 :

21

Tidak

Ya

Pemeriksaan Overdispersi

Mulai

Data

Pengujian Distribusi

Uji Multikolinearitas

Pendugaan parameter regresi

Poisson

A

Terjadi

overdispersi

B

Analisis

regresi

Poisson selesai

22

Tidak

Ya

Gambar 3.1 Diagram Alir Analisis Regresi Poisson

Pengujian secara simultan

Pendugaan parameter regresi

Generalized Poisson, Binomial

Negatif, dan Lagrange poisson

B

Uji Kelayakan Model

Selesai

Pemilihan Model Terbaik

Hasil pengujian

signifikan

Model tidak

sesuai

Model sesuai

Pengujian secara parsial

A

23

BAB IV

HASIL DAN PEMBAHASAN

4.1 Distribusi Poisson

Sebelum melakukan analisis regresi poisson, terlebih dahulu

harus dilakukan pemeriksaan distribusi variabel respon untuk

mengetahui apakah data mengikuti sebaran poisson. Uji yang

digunakan adalah Kolmogorov Smirnov. Berdasarkan hasil pengujian

dengan R Studio pada lampiran 2, diperoleh nilai D sebesar

0.1943029. Nilai tersebut lebih besar dari nilai Kolmogorov Smirnov

pada tabel dengan α = 5% yaitu sebesar 0,338, maka dapat

disimpulkan bahwa variabel respon mengikuti sebaran poisson.

Setelah variabel respon terbukti berdistribusi poisson, lakukan

pengujian asumsi multikolinearitas dan overdispersi.

4.2 Multikolinearitas

Asumsi yang harus dipenuhi dalam analisis regresi Poisson

adalah multikolinearitas. Ketika semua atau sebagian variabel

prediktor berkorelasi satu sama lain, maka dapat dikatakan terdapat

multikolinearitas antar variabel. Salah satu metode yang dapat

digunakan untuk mendeteksi multikolinearitas adalah Variance

Inflation Factors (VIF). Hasil pengujian VIF dapat dilihat pada tabel

4.1 berdasarkan lampiran 2.

Tabel 4.1 Hasil pengujian Asumsi Non Multikolinearitas

Variabel VIF

Jumlah Sarana Kesehatan 1,700134

Rumah Tangga Ber-PHBS 1,225789

Jumlah Rumah Tangga Miskin 1,473269

Kepadatan Penduduk 1,537637

Angka Bebas Jentik 1,132469

Berdasarkan tabel 4.1, dapat dilihat bahwa nilai VIF untuk

semua variabel prediktor memiliki nilai kurang dari 10, sehingga

dapat disimpulkan bahwa antar variabel prediktor tidak terdapat

multikolinearitas. Setelah asumsi pertama terpenuhi yaitu tidak

terdapat multikolinearitas, dilakukan pengujian asumsi kedua yaitu

data tidak mengalami overdispersi.

24

4.3 Regresi Poisson

4.3.1 Pembentukan Model Regresi

Hasil pembentukan model regresi poisson dengan metode

Maximum Likelihood Estimation disajikan pada tabel 4.2, sesuai

dengan lampiran 4.

Tabel 4.2 Hasil Pendugaan Parameter Regresi Poisson

Variabel Koefisien Standard Error

Konstanta 1,21500 1,02400

X1 0,09545 0,05428

X2 0,01909 0,00371

X3 0,00004 0,00002

X4 0,00006 0,00003

X5 -0,01092 0,01272

Berdasarkan Tabel 4.2, model regresi poisson dapat ditulis

sebagai berikut:

𝑌 = 𝜇𝑖 = exp 1,21500 + 0,09545Xi1 + 0,01909Xi2 + 0,00004Xi3

+ 0,00006Xi4 − 0,01902Xi5 Berdasarkan model yang terbentuk, semakin tinggi jumlah

sarana kesehatan, rumah tangga ber-PHBS, jumlah rumah tangga

miskin, dan kepadatan penduduk, jumlah kasus DBD akan

mengalami peningkatan. Sedangkan semakin tinggi angka bebas

jentik, kasus DBD mengalami penurunan.

4.3.2 Uji Signifikansi Parameter Secara Simultan

Pengujian parameter secara simultan bertujuan untuk

mengetahui signifikansi koefisien regresi secara serentak atau

bersama-sama. Hasil pengujian disajikan pada tabel 4.3. Hipotesis

yang digunakan adalah:

H0 ∶ β1 = β2 = ⋯ = β5 = 0

H1 : minimal ada satu j dimana βj ≠ 0

Tabel 4.3 Hasil Pengujian Signifikasi Parameter Model Regresi

Poisson Sacara Simultan

Model Statitsik Uji G 𝝌𝒅𝒃(𝜶)𝟐 Keputusan

Poisson 40,935 3,325 Tolak H0

Berdasarkan hasil pengujian, dapat disimpulkan bahwa pada

model poisson, semua variabel prediktor secara bersama-sama

menentukan banyaknya kasus DBD.

25

4.3.3 Uji Signifikansi Parameter Secara Parsial

Pengujian secara parsial bertujuan untuk mengetahui

signifikansi koefisien regresi pada masing-masing variabel prediktor

dengan hipotesis sebagai berikut:

H0 ∶ β1 = β2 = ⋯ = β5 = 0

H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.4 Hasil Pengujian Signifikansi Parameter Model Regresi

Poisson Secara Parsial

Variabel Statistik Uji Wald P-value

Konstanta 1,187 0,23530000

X1 1,758 0,07870000

X2 5,151 0,00000026

X3 2,191 0,28500000

X4 2,355 0,01850000

X5 -0,858 0,39080000

Hasil uji Wald menunjukkan bahwa presentase rumah tangga

ber-PHBS, jumlah rumah tangga miskin, dan kepadatan penduduk

memiliki pengaruh secara parsial terhadap jumlah kasus DBD.

Selanjutnya dilakukan pengujian apakah data mengalami

overdispersi atau tidak.

4.4 Overdispersi

Asumsi yang harus dipenuhi dalam melakukan analisis regresi

Poisson selanjutnya adalah data tidak mengalami overdispersi.

Overdispersi dapat diketahui dengan melihat nilai rata-rata dan

ragam variabel respon. Jika ragam lebih besar dari rata-rata, dapat

dikatakan data tersebut overdispersi. Selain itu, overdipsersi dapat

diketahui dengan nilai uji chi square pearson kemudian dibagi

dengan derajat bebas, berdasarkan hasil pengujian yang disajikan

pada lampiran 3, diperoleh parameter dispersi ϕ = 8,261 > 1, maka

dapat disimpulkan bahwa data mengalami overdispersi. Jika data

mengalami overdispersi, analisis regresi Poisson memiliki hasil yang

tidak efisien sehingga perlu dilakukan penanganan overdispersi.

Beberapa analisis yang dapat digunakan untuk menangani data yang

mengalami overdispersi diantaranta Regresi Generalized Poisson,

Regresi Binomial Negatif, dan Regresi Lagrange poisson.

26

4.5 Regresi Generalized Poisson


Regresi generalized poisson adalah salah satu model regresi

yang sesuai digunakan pada data yang mengalami overdispersi.

Pembentukan model generalized poisson memperoleh hasil yang

disajikan pada tabel 4.5 berdasarkan lampiran 5:

Tabel 4.5 Hasil Pendugaan Parameter Regresi Generalized Poisson


Konstanta 1,7741 1,7753

X1 0,1375 0,0948

X2 0,0193 0,0061

X3 0,0000 0,0000

X4 0,0001 0,0000

X5 -0,0175 0,0217

Berdasarkan Tabel 4.5, model regresi generalized poisson

dapat ditulis seagai berikut:

𝑌 = 𝜇𝑖 = exp 1,7741 + 0,1375𝑋𝑖1 + 0,0193𝑋𝑖2 + 0,0000𝑋𝑖3

+ 0,0001𝑋𝑖4 − 0,0175𝑋𝑖5 Berdasarkan model yang terbentuk, semakin tinggi jumlah

sarana kesehatan, presentase rumah tangga ber-PHBS, jumlah

keluarga miskin, dan kepadatan penduduk, jumlah kasus DBD

mengalami peningkatan. Sedangkan semakin tinggi presentase angka

bebas jentik, kasus DBD mengalami penurunan. Selanjutnya

dilakukan uji signifikansi parameter secara simultan/bersama-sama.


Pengujian parameter secara simultan bertujuan untuk

mengetahui signifikansi koefisien regresi secara serentak atau

bersama-sama. Hipotesis yang digunakan adalah sebagai berikut:

H0 ∶ β1 = β2 = ⋯ = β5 = 0


Tabel 4.6 Hasil Pengujian Signfikansi Parameter Model Regresi

Generalized Poisson Secara Simultan


Generalized

Poisson 10,0019 3,325 Tolak H0

27


model generalized poisson, semua variabel prediktor secara bersama-

sama menentukan banyaknya kasus DBD.


Pengujian secara parsial bertujuan untuk mengetahui

signifikansi koefisien regresi pada masing-masing variabel prediktor.

Hipotesis yang digunakan adalah sebagai berikut:

H0 ∶ β1 = β2 = ⋯ = β5 = 0

H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.7 Hasil Pengujian Signfikansi Parameter Model Regresi

Generalized Poisson Secara Parsial


Konstanta 0,9993 0,3176

X1 1,4498 0,1471

X2 3,1554 0,0016

X3 0,7745 0,4386

X4 1,2298 0,2188

X5 -0,8063 0,4200

Hasil uji Wald menunjukkan bahwa presesntase rumah tangga

ber-PHBS (X2) memiliki pengaruh secara parsial terhadap

banyaknya kasus DBD. Untuk melakukan uji parameter secara

parsial digunakan metode backward. Variabel prediktor dengan nilai

P-value paling besar melebihi 5% dikeluarkan dari model sehingga

terbentuk model baru. Dapat dilihat dari tabel 4.7, variabel prediktor

yang memiliki P-value terbesar adalah jumlah rumah tangga miskin

(X3), sehingga variabel X3 dikeluarkan dari model. Terbentuk

estimasi parameter yang baru seperti pada Lampiran 11. Model yang

terbentuk adalah sebagai berikut:

𝑌 = 𝜇𝑖 = exp 1,7368 + 0,1773𝑋𝑖1 + 0,0180𝑋𝑖2 + 0,0001𝑋𝑖4

− 0,0156𝑋𝑖5 Berdasarkan Lampiran 11 didapatkan variabel X5 memiliki

P-value terbesar sehingga dikeluarkan dari model, dan model yang

terbentuk adalah:

𝑌 = 𝜇𝑖 = exp 0,5876 + 0,1649𝑋𝑖1 + 0,0176𝑋𝑖2 + 0,0001𝑋𝑖4 Berdasarkan Lampiran 12 diperoleh variabel X4 memiliki


terbentuk adalah:

28

𝑌 = 𝜇𝑖 = exp 1,2478 + 0,1173𝑋𝑖1 + 0,0176𝑋𝑖2 Model menunjukkan bahwa setiap kenaikan 1 unit sarana

kesehatan akan meningkatkan kasus DBD sebanyak exp(0,1173) =

1,124 kasus, dan setiap kenaikan 1% rumah tangga ber-PHBS akan

meningkatkan jumlah kasus DBD sebanyak exp(0,0176) = 1,017

kasus. Selanjutnya dilakukan pendugaan parameter Regresi Binomial

Negatif.

4.6 Regresi Binomial Negatif


Salah satu alternatif untuk memodelkan data overdispersi

adalah model regresi binomial negatif. Berdasarkan hasil pengujian

yang terdapat pada lampiran 6, model regresi binomial negatif yang

terbentuk adalah sebagai berikut:

Tabel 4.8 Hasil Pendugaan Parameter Regresi Binomial Negatif


Konstanta 1,6600 1,746

X1 0,1242 9,270

X2 0,0191 6,030

X3 0,0000 3,309

X4 0,0001 4,367

X5 -0,0159 2,140

Berdasarkan Tabel 4.8, model regresi binomial negatif dapat

ditulis sebagai berikut:

𝑌 = 𝜇𝑖 = exp 1,6600 + 0,1242𝑋𝑖1 + 0,0191𝑋𝑖2 + 0,0000𝑋𝑖3


sarana kesehatan, presentase rumah tangga ber-PHBS, jumlah rumah

tangga miskin dan kepadatan penduduk, maka jumlah kasus DBD

akan meningkat. Sebaliknya, semakin tinggi presentase angka bebas

jentik, maka jumlah kasus DBD akan mengalami penurunan.

Selanjutnya dilakukan uji signifikansi parameter secara simultan.


Hasil pengujian signifikansi parameter secara simultan pada

model regresi binomial negatif disajikan pada tabel 4.9. Hipotesis

yang digunakan adalah sebagai berikut:

29

H0 ∶ β1 = β2 = ⋯ = β5 = 0


Tabel 4.9 Hasil Pengujian Signifikansi Parameter Regresi Binomial

Negatif Secara Simultan


Binomial

Negatif 14,714 3,325 Tolak H0


model binomial negatif semua variabel prediktor secara bersama-

sama tidak menentukan banyaknya kasus DBD.


Hasil pengujiansignifikansi parameter secara parsial untuk

model regresi binomial negatif dapat dilihat pada tabel 4.10.

Hipotesis yang digunakan adalah:

H0 ∶ β1 = β2 = ⋯ = β5 = 0

H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.10 Hasil Pengujian Signifikansi Parameter Regresi Binomial

Negatif Secara Parsial


Konstanta 0,951 0,34159

X1 1,340 0,18024

X2 3,163 0,00156

X3 0,933 0,35084

X4 1,263 0,20642

X5 -0,742 0,45806

Hasil uji Wald menunjukkan bahwa variabel X2 memiliki

pengaruh secara parsial terhadap banyaknya kasus DBD. Untuk

melakukan uji parameter secara parsial digunakan metode backward.

Variabel prediktor dengan nilai P-value paling besar melebihi 5%

dikeluarkan dari model sehingga terbentuk model baru. Dapat dilihat

dari tabel 4.10, variabel prediktor yang memiliki P-value terbesar

adalah presentase angka bebas jentik (X5), sehingga variabel X5

dikeluarkan dari model. Terbentuk estimasi parameter yang baru

seperti pada Lampiran 14. Model yang terbentuk adalah sebagai

berikut:

30

𝑌 = 𝜇𝑖 = exp 0,5003 + 0,1189𝑋𝑖1 + 0,0185𝑋𝑖2 + 0,0000𝑋𝑖3

+ 0,0001𝑋𝑖4 Berdasarkan Lampiran 14 didapatkan variabel X3 memiliki


terbentuk adalah:



terbentuk adalah:

𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021𝑋𝑖1 + 0,0167𝑋𝑖2 Model menunjukkan bahwa setiap kenaikan 1 unit sarana

kesehatan akan meningkatkan kasus DBD sebanyak exp(0,1021) =

1,128 kasus, dan setiap kenaikan 1% rumah tangga ber-PHBS akan

meningkatkan jumlah kasus DBD sebanyak exp(0,0167) = 1,016

kasus. Selanjutnya dilakukan pendugaan parameter Regresi

Lagrange poisson.

4.7 Regresi Lagrange poisson


Regresi lagrange poisson adalah salah satu model regresi yang

sesuai digunakan pada data yang mengalami overdispersi.

Pembentukan model lagrange poisson memperoleh hasil yang

disajikan pada tabel 4.11 berdasarkan lampiran 7.

Tabel 4.11 Hasil Pendugaan Parameter Regresi Lagrange poisson


Konstanta 1,2148 0,5789

X1 0,0954 0,4110

X2 0,0191 0,0160

X3 0,0000 0,3056

X4 0,0001 0,2709

X5 -0,0109 0,6882

Berdasarkan Tabel 4.11, model regresi lagrange poisson dapat

ditulis seagai berikut:

𝑌 = 𝜇𝑖 = exp 1,2148 + 0,0954𝑋𝑖1 + 0,0191𝑋𝑖2 + 0,0000𝑋𝑖3


sarana kesehatan, rumah tangga ber-PHBS, jumlah rumah tangga

31

miskin, dan kepadatan penduduk, jumlah kasus DBD akan

mengalami peningkatan. Sedangkan semakin tinggi angka bebas

jentik, kasus DBD mengalami penurunan.


Hasil pengujian signifikansi parameter secara simultan pada

model regresi lagrange poisson disajikan pada tabel 4.12. Hipotesis


H0 ∶ β1 = β2 = ⋯ = β5 = 0



Lagrange poisson Secara Simultan


Lagrange

poisson 7,7622 3,325 Tolak H0


model lagrange poisson seluruh variabel prediktor secara bersama-

sama menentukan banyaknya kasus DBD.


Hasil pengujiansignifikansi parameter secara parsial untuk

model regresi lagrange poisson dapat dilihat pada tabel 4.13.

Hipotesis yang digunakan adalah:

H0 ∶ β1 = β2 = ⋯ = β5 = 0

H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.13 Hasil Pengujian Seignifikansi Parameter Model Regresi

Lagrange poisson Secara Parsial


Konstanta 0,5550 0,5789

X1 0,8222 0,4110

X2 2,4085 0,0160

X3 1,0244 0,3056

X4 1,1009 0,2709

X5 -0,4013 0,6882

Hasil uji Wald menunjukkan bahwa presentase rumah tangga

ber-PHBS memiliki pengaruh secara parsial terhadap banyaknya

kasus DBD. Setelah didapatkan beberapa model dari analisis untuk

mengatasi overdipsersi, dilanjutkan dengan memilih model yang

32

terbaik. Untuk melakukan uji parameter secara parsial digunakan

metode backward. Variabel prediktor dengan nilai P-value paling

besar melebihi 5% dikeluarkan dari model sehingga terbentuk model

baru. Dapat dilihat dari tabel 4.13, variabel prediktor yang memiliki

P-value terbesar adalah presentase angka bebas jentik (X5), sehingga

variabel X5 dikeluarkan dari model. Terbentuk estimasi parameter

yang baru seperti pada Lampiran 17. Model yang terbentuk adalah

sebagai berikut:

𝑌 = 𝜇𝑖 = exp 0,4334 + 0,0922𝑋𝑖1 + 0,0187𝑋𝑖2 + 0,0000𝑋𝑖3

+ 0,0001𝑋𝑖4 Berdasarkan Lampiran 18 didapatkan variabel X1 memiliki


terbentuk adalah:



terbentuk adalah:

𝑌 = 𝜇𝑖 = exp 1,1248 + 0,0196𝑋𝑖2 + 0,0000𝑋𝑖3 Model menunjukkan bahwa setiap kenaikan 1% rumah tangga

ber-PHBS akan meningkatkan kasus DBD sebanyak exp(0,0196) =

1,019 kasus, dan setiap kenaikan 1 rumah tangga miskin akan

meningkatkan jumlah kasus DBD sebanyak exp(0,0000) = 1 kasus.

Pada pengujian dengan regresi generalized poisson, binomial

negatif, dan lagrange poisson didapatkan beberapa hasil yang tidak

logis. Menurut teori, jumlah sarana kesehatan dan presentase rumah

tangga ber-PHBS seharusnya berbanding terbalik terhadap jumlah

kasus DBD. Namun pada penelitian kali ini, jumlah sarana kesehatan

dan presentase rumah tangga ber-PHBS berbanding lurus terhadap

jumlah kasus DBD. Menurut peneliti, hal ini disebabkan

meningkatnya jumlah sarana kesehatan dan presentase rumah tangga

ber-PHBS juga diiringi dengan jumlah penduduk yang terus

mengalami peningkatan sehingga menyebabkan jumlah kasus DBD

turut meningkat.

4.8 Uji Kelayakan Model

Uji Kelayakan model dapat dilakukan dengan melihat nilai

Khi Kuadrat Pearson yang dapat dilihat pada tabel 4.14. Hipotesis


33

H0 ∶ model layak

H1 : model tidak layak Tabel 4.14 Hasil Uji Khi Kuadrat Pearson

Model Khi Kuadrat

Pearson 𝝌𝜶 𝒏−𝒑

𝟐 Keputusan

Regresi Generalized

Poisson 13,78

18,3

Terima H0

Regresi Binomial

Negatif 0,22 Terima H0

Regresi Lagrange

poisson 9,00 Terima H0

Tabel 4.14 menunjukkan bahwa model regresi Generalized

Poisson, Binomial Negatif, dan Lagrange Poisson layakuntuk

digunakan. Model Binomial Negatif menghasilkan nilai Khi Kuadrat

Pearson paling kecil dibandingkan model regresi generalized

poisson dan regresi lagrange poisson, sehingga regresi Binomial

Negatif lebih tepat untuk memodelkan data kasus DBD di Kota

Malang pada tahun 2015.

35

BAB V

KESIMPULAN

5.1 Kesimpulan

1. Berdasarkan hasil analisis pada penelitian ini didapatkan model

sebagai berikut:

a. Model Regresi Generalized Poisson

Y = 𝜇𝑖 = exp 1,2478 + 0,1173𝑋𝑖1 + 0,0176𝑋𝑖2 b. Model Regresi Binomial Negatif

Y = 𝜇𝑖 = exp 1,3605 + 0,1021𝑋𝑖1 + 0,0167𝑋𝑖2 c. Model Regresi Lagrange poisson

Y = 𝜇𝑖 = exp 1,1248 + 0,0196𝑋𝑖2 + 0,0000𝑋𝑖3 2. Berdasarkan nilai Khi Kuadrat Pearson, ketiga model layak

digunakan, dan model terbaik yang digunakan adalah model

regresi Binomial Negatif karena menghasilkan nilai 𝜒2 paling

kecil.

3. Dari 5 variabel prediktor pada penelitian ini, terdapat 1 variabel

yang berpengaruh signifikan terhadap kasus DBD di Kota

Malang pada tahun 2015, yaitu presentase rumah tangga ber-

PHBS.

5.2 Saran

1. Model regresi Binomial Negatif dapat digunakan sebagai

pertimbangan bagi Dinas Kesehatan Kota Malang dalam

mengambil tindakan pencegahan penyebaran jumlah kasus DBD

di Kota Malang.

2. Untuk penelitian selanjutnya, diharapkan ada pengecekan lanjut

terhadap pengaruh rumah tangga berpola hidup bersih dan sehat

terhadap jumlah kasus DBD.

36

37

DAFTAR PUSTAKA

Agresti, A. 2002. Categorical Data Analysis Second Edition. Wiley-

Interscience, Canada

Agresti, A. 2007. An Introduction to Categorical Data Analysis

Second Edition. Wiley-Interscience, Canada

Berk, R. dan J. M. MacDonald, 2008. Overdispersion and Poisson

Regression. Springer, Philadelphia.

Cameron, A. C. Dan P. K. Trivedi, 1998. Regression Analysis of

Count Data. Cambridge University Press, Cambridge.

Hosmer, D.W. dan S. Lemeshow. 2000. Applied Logistic

Reegression, Second Edition. Jon Wiley and Sons. New York.

Ismail, N. dan A.A. Jemain. 2007. Handling Overdispersion with

Negative Binomial and Generalized Poisson Regression

Models. Casuality Actuarial Society Forum.

Kismiantini. 2008. Perbandingan Model Regresi Poisson dan Model

Regresi Binomial Negatif. Jurnal FMIPA Universitas Negeri

Yogyakarta, Yogyakarta.

Kutner, M. H., Nachtshelm, C. J., Neter, J., and Li, W. 2005. Applied

Linear Statistical Models, Fifth Edition. McGraw-Hill

Companies Inc, New York.

Simarmata, R.T dan D. Ispriyanti. 2011. Penanganan Overdispersi

pada Model Regresi Poisson menggunakan Model Regresi

Binomial Negatif. Jurnal Media Statistika Universitas

Diponegoro, Semarang.

Walpole, R. E. 1995. Pengantar Statistika. Gramedia Pustaka

Utama, Jakarta

38

Widoyono. 2008. Penyakit Tropis: Epidemiologi, Penularan,

Pencegahan, dan Pemberantasannya. Penerbit Erlangga,

Jakarta

39

Lampiran 1. Data Kasus Demam Berdarah Kota Malang tahun

2015

No. Puskesmas Y X1 X2 X3 X4 X5

1 Kedungkandang 10 4 68.18 15438 3624 79.57

2 Gribig 20 4 68.51 6138 5739 82.52

3 Arjowinangun 14 6 47.17 10811 4776 86.84

4 Janti 22 5 45.52 16742 10019 79.53

5 Ciptomulyo 7 3 37.63 7220 7281 74.91

6 Mulyorejo 18 6 100.00 5771 5368 81.86

7 Arjuno 13 3 60.08 6325 11534 81.21

8 Bareng 25 4 81.67 7058 12658 80.37

9 Rampal Celaket 10 3 83.78 4333 7819 78.23

10 Cisadea 11 1 56.39 5306 12164 87.71

11 Kendalkerep 5 2 52.45 12733 11864 95.1

12 Pandanwangi 14 5 36.05 11610 8252 78.95

13 Dinoyo 42 5 87.82 12479 9155 90.36

14 Mojolangu 33 3 80.00 6574 6634 80.44

15 Kendalsari 29 2 84.50 8686 11274 77.01

Keterangan:

Y = Jumlah Kasus DBD

X1 = Jumlah Sarana Kesehatan

X2 = Presentase Rumah Tangga Ber-PHBS (%)

X3 = Jumlah Rumah Tangga Miskin

X4 = Kepadatan Penduduk

X5 = Angka Bebas Jentik (%)

40

Lampiran 2. Hasil Pengujian Sebaran Variabel Respon

Y=c(3.66, 7.33, 5.13, 8.06, 2.56, 6.59, 4.76, 9.16, 3.66, 4.03, 1.83,

5.13, 15.38, 12.09, 10.62)

KS=function(Y){

m=sort(unique(unlist(Y)),decreasing=FALSE)

FS=ppois(m,mean(Y),lower.tail=TRUE)

frek=as.matrix(table(Y))

FT=cumsum(frek)/length(Y)

D=max(abs(FT-FS))

D

}

KS(Y) [1] 0.1943029

41

Lampiran 3. Hasil Pengujian Asumsi Non Multikolinearitas

library(car)

model=lm(Y~X1+X2+X3+X4+X5)

VIF=vif(model)

VIF X1 X2 X3 X4 X5 1.700134 1.225789 1.473269 1.537637 1.132469

42

Lampiran 4. Hasil Pendugaan Parameter Regresi Poisson

Call:

glm(formula = Y ~ X1 + X2 + X3 + X4 + X5, family = poisson)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.7042 -1.3236 0.0691 0.6717 3.4714

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 1.215e+00 1.024e+00 1.187 0.2353

X1 9.545e-02 5.428e-02 1.758 0.0787 .

X2 1.909e-02 3.706e-03 5.151 2.59e-07 ***

X3 4.284e-05 1.955e-05 2.191 0.0285 *

X4 5.924e-05 2.516e-05 2.355 0.0185 *

X5 -1.092e-02 1.272e-02 -0.858 0.3908

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

Null deviance: 79.363 on 14 degrees of freedom

Residual deviance: 40.935 on 9 degrees of freedom

AIC: 121.89

Number of Fisher Scoring iterations: 4

P

41.16417

overdispersi

4.573797

43

Lampiran 5. Hasil Pendugaan Parameter Regresi Generalized

Poisson

Call: gpois_glm(formula = form, type = "generalized", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.7741 1.7753 0.9993 0.3176 x1 0.1375 0.0948 1.4498 0.1471 x2 0.0193 0.0061 3.1554 0.0016 ** x3 0.0000 0.0000 0.7745 0.4386 x4 0.0001 0.0000 1.2298 0.2188 x5 -0.0175 0.0217 -0.8063 0.4200 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 0.03798141 Likelihood ratio test: G: 10.0019 Sig.: 0.1246 Chi squared pearson: Chi: 13.7778 Sig.: 0.1305 log-likelihood: -49.1248 Iterations: 13

44

Lampiran 6. Hasil Pendugaan Parameter Regresi Binomial

Negatif

Call: glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5, init.theta = 10.08347863, link = log) Deviance Residuals: Min 1Q Median 3Q Max -1.5823 -0.8768 0.2207 0.4288 1.8922 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.660e+00 1.746e+00 0.951 0.34159 X1 1.242e-01 9.270e-02 1.340 0.18024 X2 1.907e-02 6.030e-03 3.163 0.00156 ** X3 3.087e-05 3.309e-05 0.933 0.35084 X4 5.517e-05 4.367e-05 1.263 0.20642 X5 -1.588e-02 2.140e-02 -0.742 0.45806 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for Negative Binomial(10.0835) family taken to be 1) Null deviance: 28.645 on 14 degrees of freedom Residual deviance: 14.714 on 9 degrees of freedom AIC: 112.4 Number of Fisher Scoring iterations: 1

Theta: 10.08

Std. Err.: 5.73

2 x log-likelihood: -98.404

Chi_Squared_Pearson :0.2223828 Sig :0.9999999

45

Lampiran 7. Hasil Pendugaan Parameter Regresi Lagrange

poisson

Call: gpois_glm(formula = form, type = "lagrange", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.2148 2.1890 0.5550 0.5789 x1 0.0954 0.1161 0.8222 0.4110 x2 0.0191 0.0079 2.4085 0.0160 * x3 0.0000 0.0000 1.0244 0.3056 x4 0.0001 0.0001 1.1009 0.2709 x5 -0.0109 0.0272 -0.4013 0.6882 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 2.138644 Likelihood ratio test: G: 7.7622 Sig.: 0.256 Chi squared pearson: Chi: 9 Sig.: 0.4373 log-likelihood: -50.2542 Iterations: 1

46

Lampiran 8.Algoritma RStudio untuk Model Regresi Poisson

n=15 p=5 Y=data[,1] X0=cbind(rep(1,n)) X1=data[,2] X2=data[,3] X3=data[,4] X4=data[,5] X5=data[,6] regpois=glm(formula=Y~X1+X2+X3+X4+X5,family=poisson) summary(regpois) b0=summary(regpois)$coef[1,1] b1=summary(regpois)$coef[2,1] b2=summary(regpois)$coef[3,1] b3=summary(regpois)$coef[4,1] b4=summary(regpois)$coef[5,1] b5=summary(regpois)$coef[6,1] mu=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5) psi=10.0835 vary=mu+(psi*(U^2)) Chi_Squared_Pearson=sum((Y-mu)^2/vary) Sig <- pchisq(Chi_Squared_Pearson, df=n-p, lower.tail=FALSE)

47

Lampiran 9. Algoritma RStudio untuk Model Regresi Binomial

Negatif

local({pkg <- select.list(sort(.packages(all.available =

TRUE)),graphics=TRUE)

if(nchar(pkg)) library(pkg, character.only=TRUE)})

n=15

p=5

Y=data[,1]

X0=cbind(rep(1,n))

X1=data[,2]

X2=data[,3]

X3=data[,4]

X4=data[,5]

X5=data[,6]

regnb=glm.nb(formula=Y~X1+X2+X3+X4+X5)

summary(regnb)

b0=summary(regnb)$coef[1,1]






U=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5)

db=n-(p+1)

Pearson=sum((Y-U)^2/U)

overdispersi=Pearson/db

48

Lampiran 10. Algoritma RStudio untuk Model Regresi

Generalized Poisson dan Lagrange poisson

dgpois <- function(y, mu, phi){

den <- (mu/(1+phi*mu))^y*(1+phi*y)^(y-1)/factorial(y)*

exp(-mu*(1+phi*y)/(1+phi*mu))

return(den)

}

gpr_fit <- function(formula, data){

#preparation

n <- nrow(data)

mf <- model.frame(formula,data)

Xmat <- model.matrix(formula,mf)

p <- ncol(Xmat)

yresp <- model.extract(mf,'response')

#initial

modinit <- glm(formula=formula, family='poisson',

data=data)

beta <- coef(modinit)

phi <- 1e-03

iter <- 0

error <- 1

tol <- 1e-05

#log likelihood function

llh_gpois <- function(param,y,X){

p <- length(param)

beta <- param[-p]

phi <- param[p]

mu <- exp(Xmat%*%beta)

den <- 0

for(i in seq_along(y)){

den[i] <- dgpois(y=y[i], mu=mu[i], phi=phi)

49

}

llh <- sum(log(den))

return(llh)

}

#log likelihood gradient to phi

grad_phi <- function(phi,y,mu){

comp <- -(y*mu/(1+phi*mu))+

y*(y-1)/(1+phi*y)-mu*(y-

mu)/(1+phi*mu)^2

return(sum(comp))

}

#Estimation

repeat{

iter <- iter+1

#Beta via IWLS


W <- matrix(0,nrow=n, ncol=n)

diag(W) <- mu/(1+phi*mu)^2

k <- as.vector(yresp-mu)/mu

beta_new <-

beta+solve(t(Xmat)%*%W%*%Xmat)%*%t(Xmat)%*%W%*%k

#phi via root of log likelihood gradient to phi

findphi <- pracma::fzero(f=grad_phi, x=phi,

y=yresp, mu=mu)

phi <- findphi[['x']]

#restriction to avoid zero

if(phi<0 && phi<=-1/max(yresp)){

phi <- -1/(max(yresp)+1)

}else if(phi<0 && phi<=-1/max(mu)){

phi <- -1/(max(mu)+1)

50

}else if(phi<0 && phi<=-1/max(yresp) && phi<=-

1/max(mu)){

phi <- min(-1/(max(yresp)+1), -

1/(max(mu)+1))

}else{

phi <- phi

}

#convergence check

error <- sqrt(sum((beta_new-beta)^2))

beta <- beta_new

if(error<tol){break}

}

#var beta

var_beta <- solve(t(Xmat)%*%W%*%Xmat)

se_beta <- sqrt(diag(var_beta))

#wald statistic

wald <- beta/se_beta

p_val <- 2*pnorm(abs(wald), mean=0, sd=1,

lower.tail=FALSE)

#chisq pearson

vary <- mu*(1+phi*mu)^2

chi_pearson <- sum((yresp-mu)^2/vary)

pval_chip <- pchisq(chi_pearson, df=n-p,

lower.tail=FALSE)

out <- list(beta=beta, phi=phi, se=se_beta, wald=wald,

sig=p_val,

chi_pear=chi_pearson,

pval_chipear=pval_chip, dimX=c(n,p),

51

varcov=var_beta,

loglik=llh_gpois(param=c(beta,phi),

y=yresp, X=Xmat), iter=iter,

error=error)

return(out)

}

dlgrpois <- function(y, mu, phi){

den <- mu*(mu+(phi-1)*y)^(y-1)*phi^(-y)*

exp(-(mu+(phi-1)*y)/phi)/factorial(y)

return(den)

}

lgrpr_fit <- function(formula,data){

#preparation

n <- nrow(data)



p <- ncol(Xmat)


#initial


data=data)


phi <- 0.9999

iter <- 0

error <- 1

tol <- 1e-05


llh_lgrpois <- function(param,y,X){

p <- length(param)

beta <- param[-p]

52

phi <- param[p]


den <- 0


den[i] <- dlgrpois(y=y[i], mu=mu[i],

phi=phi)

}


return(llh)

}

#mom function for phi

mom_phi <- function(y, mu){

calc <- sqrt(sum((y-mu)^2/mu)/(n-p))

return(calc)

}

#Estimation

repeat{

iter <- iter+1

#Beta via IWLS



diag(W) <- mu


beta_new <-


#phi via mom

phi <- mom_phi(y=yresp, mu=mu)

#convergence check


53

beta <- beta_new


}

#var beta

var_beta <- phi^2*solve(t(Xmat)%*%W%*%Xmat)


#wald statistic



lower.tail=FALSE)

#chisq pearson

vary <- phi^2*mu



lower.tail=FALSE)


sig=p_val,



varcov=var_beta,

loglik=llh_lgrpois(param=c(beta,phi),


error=error)

return(out)

}

gpois_glm <- function(formula, type, data){

call <- match.call()

#define saturated formula (intercept only)

54

fL0 <- paste(formula)

fL0 <- as.formula(paste(fL0[2],'~',1))

#modeling

if(type=='generalized'){

fullmdl <- gpr_fit(formula=formula, data=data)

satmdl <- gpr_fit(formula=fL0, data=data)

}else if(type=='lagrange'){

fullmdl <- lgrpr_fit(formula=formula, data=data)

satmdl <- lgrpr_fit(formula=fL0, data=data)

}else{

stop('type not supported')

}

#likelihood ratio test

out <- fullmdl

l0 <- satmdl[['loglik']]

lp <- out[['loglik']]

n <- out[['dimX']][1]

p <- out[['dimX']][2]

q <- length(satmdl[['beta']])

G <- -2*(l0-lp)

pval_G <- pchisq(G, df=p, lower.tail=FALSE)

out[['G_stat']] <- G

out[['pval_G']] <- pval_G

out[['call']] <- call

class(out) <- 'gpois'

return(out)

}

print.gpois <- function(object){

#coefficient output

est <- round(object[['beta']],4)

55

se <- round(object[['se']],4)

wald <- round(object[['wald']],4)

pval <- round(object[['sig']],4)

#notation

code <- c()

for(j in pval){

if(j<=.001){code <- c(code, '***')

}else if(j<=.01){code <- c(code, '**')

}else if(j<=.05){code <- c(code, '*')

}else if(j<=.1){code <- c(code, '.')

}else{code <- c(code, ' ')}

}

coeff <- data.frame(est,se,wald,pval,code)

colnames(coeff) <- c('Estimate', 'Std. Error',

'Wald (z)', 'Sig.', ' ')

rownames(coeff) <- labels(est)[[1]]

#print output

cat('Call:\n')

print(object[['call']])

cat('\n')

cat('Coefficients:\n')

print(coeff)

cat('\n')

cat('-----\n')

cat('Sig. codes: 0 â€ ˜ ***â€ ™ 0.001 â€ ˜ **â€ ™ 0.01

â€ ˜ *â€ ™ 0.05 â€ ˜ .â€ ™ 0.1 â€ ˜ â€ ™ 1\n')

cat('\nDispersion parameter (phi):', object[['phi']], '\n')

cat('\nLikelihood ratio test:\n')

cat('G: ', round(object[['G_stat']],4), '\n')

cat('Sig.: ', round(object[['pval_G']],4), '\n')

cat('\nChi squared pearson:\n')

cat('Chi: ', round(object[['chi_pear']],4), '\n')

56

cat('Sig.: ', round(object[['pval_chipear']],4), '\n')

cat('\nlog-likelihood: ', round(object[['loglik']],4), '\n')

cat('Iterations: ', object[['iter']], '\n')

}

57

Lampiran 11. Hasil Analisis Regresi Generalized Poisson tanpa

Variabel X3

Variabel Koefisien Standard

Error

Wald P-

Value

Konstanta 1,7368 1,8426 0,9426 0,3459

X1 0,1773 0,0920 1,9285 0,0538

X2 0,0180 0,0057 3,1490 0,0016

X4 0,0001 0,0000 1,3311 0,1832

X5 -0,0156 0,0219 -0,7105 0,4774

58


Variabel X3 dan X5


Error

Wald P-

Value

Konstanta 0,5876 0,7641 0,7690 0,4419

X1 0,1649 0,0912 1,8078 0,0706

X2 0,0176 0,0057 3,0699 0,0022

X4 0,0001 0,0000 1,2211 0,2221

59


Variabel X3, X5, dan X4


Error

Wald P-

Value

Konstanta 1,2478 0,5082 2,4552 0,0141

X1 0,1173 0,0807 1,4525 0,1464

X2 0,0176 0,0060 2,9144 0,0036

60

Lampiran 14. Hasil Analisis Regresi Binomial Negatif tanpa

Variabel X5


Error

Wald P-

Value

Konstanta 0,5003 0,7869 0,636 0,5249

X1 0,1189 0,0936 1,270 0,2042

X2 0,0185 0,0061 3,039 0,0024

X3 0,0000 0,0000 0,802 0,4223

X4 0,0001 0,0000 1,152 0,2493

61


Variabel X5 dan X3


Error

Wald P-

Value

Konstanta 0,6598 0,7446 0,886 0,3755

X1 0,1550 0,0896 1,730 0,0836

X2 0,0168 0,0056 3,006 0,0026

X4 0,0001 0,0000 1,277 0,2015

62




Error

Wald P-

Value

Konstanta 1,3605 0,4921 2,765 0,0057

X1 0,1021 0,0793 1,288 0,1979

X2 0,0167 0,0058 2,842 0,0045

63

Lampiran 17. Hasil Analisis Regresi Lagrange poisson tanpa

Variabel X5


Error

Wald P-

Value

Konstanta 0,4334 0,9465 0,4579 0,6470

X1 0,0922 0,1103 0,8358 0,4033

X2 0,0187 0,0075 2,4982 0,0125

X3 0,0000 0,0000 0,9962 0,3192

X4 0,0001 0,0001 1,0855 0,2777

64


Variabel X5 dan X1


Error

Wald P-

Value

Konstanta 0,7440 0,8406 0,8850 0,3761

X2 0,0205 0,0070 2,9260 0,0034

X3 0,0000 0,0000 1,4581 0,1448

X4 0,0000 0,0000 0,8069 0,4197

65




Error

Wald P-

Value

Konstanta 1,1248 0,6697 1,6795 0,0031

X2 0,0196 0,0067 2,9384 0,0033

X3 0,0000 0,0000 1,4103 0,1584

37

DAFTAR PUSTAKA

Agresti, A. 2002. Categorical Data Analysis Second Edition. Wiley-

Interscience, Canada

Agresti, A. 2007. An Introduction to Categorical Data Analysis

Second Edition. Wiley-Interscience, Canada

Berk, R. dan J. M. MacDonald, 2008. Overdispersion and Poisson

Regression. Springer, Philadelphia.

Cameron, A. C. Dan P. K. Trivedi, 1998. Regression Analysis of

Count Data. Cambridge University Press, Cambridge.

Hosmer, D.W. dan S. Lemeshow. 2000. Applied Logistic

Reegression, Second Edition. Jon Wiley and Sons. New York.

Ismail, N. dan A.A. Jemain. 2007. Handling Overdispersion with

Negative Binomial and Generalized Poisson Regression

Models. Casuality Actuarial Society Forum.

Kismiantini. 2008. Perbandingan Model Regresi Poisson dan Model

Regresi Binomial Negatif. Jurnal FMIPA Universitas Negeri

Yogyakarta, Yogyakarta.

Kutner, M. H., Nachtshelm, C. J., Neter, J., and Li, W. 2005. Applied

Linear Statistical Models, Fifth Edition. McGraw-Hill

Companies Inc, New York.

Simarmata, R.T dan D. Ispriyanti. 2011. Penanganan Overdispersi

pada Model Regresi Poisson menggunakan Model Regresi

Binomial Negatif. Jurnal Media Statistika Universitas

Diponegoro, Semarang.

Walpole, R. E. 1995. Pengantar Statistika. Gramedia Pustaka

Utama, Jakarta

38

Widoyono. 2008. Penyakit Tropis: Epidemiologi, Penularan,

Pencegahan, dan Pemberantasannya. Penerbit Erlangga,

Jakarta

39

Lampiran 1. Data Kasus Demam Berdarah Kota Malang tahun

2015

No. Puskesmas Y X1 X2 X3 X4 X5

1 Kedungkandang 10 4 68.18 15438 3624 79.57

2 Gribig 20 4 68.51 6138 5739 82.52

3 Arjowinangun 14 6 47.17 10811 4776 86.84

4 Janti 22 5 45.52 16742 10019 79.53

5 Ciptomulyo 7 3 37.63 7220 7281 74.91

6 Mulyorejo 18 6 100.00 5771 5368 81.86

7 Arjuno 13 3 60.08 6325 11534 81.21

8 Bareng 25 4 81.67 7058 12658 80.37

9 Rampal Celaket 10 3 83.78 4333 7819 78.23

10 Cisadea 11 1 56.39 5306 12164 87.71

11 Kendalkerep 5 2 52.45 12733 11864 95.1

12 Pandanwangi 14 5 36.05 11610 8252 78.95

13 Dinoyo 42 5 87.82 12479 9155 90.36

14 Mojolangu 33 3 80.00 6574 6634 80.44

15 Kendalsari 29 2 84.50 8686 11274 77.01

Keterangan:

Y = Jumlah Kasus DBD

X1 = Jumlah Sarana Kesehatan

X2 = Presentase Rumah Tangga Ber-PHBS (%)

X3 = Jumlah Rumah Tangga Miskin

X4 = Kepadatan Penduduk

X5 = Angka Bebas Jentik (%)

40

Lampiran 2. Hasil Pengujian Sebaran Variabel Respon

Y=c(3.66, 7.33, 5.13, 8.06, 2.56, 6.59, 4.76, 9.16, 3.66, 4.03, 1.83,

5.13, 15.38, 12.09, 10.62)

KS=function(Y){

m=sort(unique(unlist(Y)),decreasing=FALSE)

FS=ppois(m,mean(Y),lower.tail=TRUE)

frek=as.matrix(table(Y))

FT=cumsum(frek)/length(Y)

D=max(abs(FT-FS))

D

}

KS(Y) [1] 0.1943029

41

Lampiran 3. Hasil Pengujian Asumsi Non Multikolinearitas

library(car)

model=lm(Y~X1+X2+X3+X4+X5)

VIF=vif(model)

VIF X1 X2 X3 X4 X5 1.700134 1.225789 1.473269 1.537637 1.132469

42

Lampiran 4. Hasil Pendugaan Parameter Regresi Poisson

Call:

glm(formula = Y ~ X1 + X2 + X3 + X4 + X5, family = poisson)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.7042 -1.3236 0.0691 0.6717 3.4714

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 1.215e+00 1.024e+00 1.187 0.2353

X1 9.545e-02 5.428e-02 1.758 0.0787 .

X2 1.909e-02 3.706e-03 5.151 2.59e-07 ***

X3 4.284e-05 1.955e-05 2.191 0.0285 *

X4 5.924e-05 2.516e-05 2.355 0.0185 *

X5 -1.092e-02 1.272e-02 -0.858 0.3908

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

Null deviance: 79.363 on 14 degrees of freedom

Residual deviance: 40.935 on 9 degrees of freedom

AIC: 121.89

Number of Fisher Scoring iterations: 4

P

41.16417

overdispersi

4.573797

43

Lampiran 5. Hasil Pendugaan Parameter Regresi Generalized

Poisson

Call: gpois_glm(formula = form, type = "generalized", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.7741 1.7753 0.9993 0.3176 x1 0.1375 0.0948 1.4498 0.1471 x2 0.0193 0.0061 3.1554 0.0016 ** x3 0.0000 0.0000 0.7745 0.4386 x4 0.0001 0.0000 1.2298 0.2188 x5 -0.0175 0.0217 -0.8063 0.4200 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 0.03798141 Likelihood ratio test: G: 10.0019 Sig.: 0.1246 Chi squared pearson: Chi: 13.7778 Sig.: 0.1305 log-likelihood: -49.1248 Iterations: 13

44

Lampiran 6. Hasil Pendugaan Parameter Regresi Binomial

Negatif

Call: glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5, init.theta = 10.08347863, link = log) Deviance Residuals: Min 1Q Median 3Q Max -1.5823 -0.8768 0.2207 0.4288 1.8922 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.660e+00 1.746e+00 0.951 0.34159 X1 1.242e-01 9.270e-02 1.340 0.18024 X2 1.907e-02 6.030e-03 3.163 0.00156 ** X3 3.087e-05 3.309e-05 0.933 0.35084 X4 5.517e-05 4.367e-05 1.263 0.20642 X5 -1.588e-02 2.140e-02 -0.742 0.45806 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for Negative Binomial(10.0835) family taken to be 1) Null deviance: 28.645 on 14 degrees of freedom Residual deviance: 14.714 on 9 degrees of freedom AIC: 112.4 Number of Fisher Scoring iterations: 1

Theta: 10.08

Std. Err.: 5.73

2 x log-likelihood: -98.404

Chi_Squared_Pearson :0.2223828 Sig :0.9999999

45

Lampiran 7. Hasil Pendugaan Parameter Regresi Lagrange

poisson

Call: gpois_glm(formula = form, type = "lagrange", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.2148 2.1890 0.5550 0.5789 x1 0.0954 0.1161 0.8222 0.4110 x2 0.0191 0.0079 2.4085 0.0160 * x3 0.0000 0.0000 1.0244 0.3056 x4 0.0001 0.0001 1.1009 0.2709 x5 -0.0109 0.0272 -0.4013 0.6882 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 2.138644 Likelihood ratio test: G: 7.7622 Sig.: 0.256 Chi squared pearson: Chi: 9 Sig.: 0.4373 log-likelihood: -50.2542 Iterations: 1

46

Lampiran 8.Algoritma RStudio untuk Model Regresi Poisson

n=15 p=5 Y=data[,1] X0=cbind(rep(1,n)) X1=data[,2] X2=data[,3] X3=data[,4] X4=data[,5] X5=data[,6] regpois=glm(formula=Y~X1+X2+X3+X4+X5,family=poisson) summary(regpois) b0=summary(regpois)$coef[1,1] b1=summary(regpois)$coef[2,1] b2=summary(regpois)$coef[3,1] b3=summary(regpois)$coef[4,1] b4=summary(regpois)$coef[5,1] b5=summary(regpois)$coef[6,1] mu=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5) psi=10.0835 vary=mu+(psi*(U^2)) Chi_Squared_Pearson=sum((Y-mu)^2/vary) Sig <- pchisq(Chi_Squared_Pearson, df=n-p, lower.tail=FALSE)

47

Lampiran 9. Algoritma RStudio untuk Model Regresi Binomial

Negatif

local({pkg <- select.list(sort(.packages(all.available =

TRUE)),graphics=TRUE)

if(nchar(pkg)) library(pkg, character.only=TRUE)})

n=15

p=5

Y=data[,1]

X0=cbind(rep(1,n))

X1=data[,2]

X2=data[,3]

X3=data[,4]

X4=data[,5]

X5=data[,6]

regnb=glm.nb(formula=Y~X1+X2+X3+X4+X5)

summary(regnb)







U=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5)

db=n-(p+1)

Pearson=sum((Y-U)^2/U)

overdispersi=Pearson/db

48

Lampiran 10. Algoritma RStudio untuk Model Regresi

Generalized Poisson dan Lagrange poisson

dgpois <- function(y, mu, phi){

den <- (mu/(1+phi*mu))^y*(1+phi*y)^(y-1)/factorial(y)*

exp(-mu*(1+phi*y)/(1+phi*mu))

return(den)

}

gpr_fit <- function(formula, data){

#preparation

n <- nrow(data)



p <- ncol(Xmat)


#initial


data=data)


phi <- 1e-03

iter <- 0

error <- 1

tol <- 1e-05


llh_gpois <- function(param,y,X){

p <- length(param)

beta <- param[-p]

phi <- param[p]


den <- 0


den[i] <- dgpois(y=y[i], mu=mu[i], phi=phi)

49

}


return(llh)

}

#log likelihood gradient to phi

grad_phi <- function(phi,y,mu){

comp <- -(y*mu/(1+phi*mu))+

y*(y-1)/(1+phi*y)-mu*(y-

mu)/(1+phi*mu)^2

return(sum(comp))

}

#Estimation

repeat{

iter <- iter+1

#Beta via IWLS



diag(W) <- mu/(1+phi*mu)^2


beta_new <-


#phi via root of log likelihood gradient to phi

findphi <- pracma::fzero(f=grad_phi, x=phi,

y=yresp, mu=mu)

phi <- findphi[['x']]

#restriction to avoid zero

if(phi<0 && phi<=-1/max(yresp)){

phi <- -1/(max(yresp)+1)

}else if(phi<0 && phi<=-1/max(mu)){

phi <- -1/(max(mu)+1)

50

}else if(phi<0 && phi<=-1/max(yresp) && phi<=-

1/max(mu)){

phi <- min(-1/(max(yresp)+1), -

1/(max(mu)+1))

}else{

phi <- phi

}

#convergence check


beta <- beta_new


}

#var beta

var_beta <- solve(t(Xmat)%*%W%*%Xmat)


#wald statistic



lower.tail=FALSE)

#chisq pearson

vary <- mu*(1+phi*mu)^2



lower.tail=FALSE)


sig=p_val,



51

varcov=var_beta,

loglik=llh_gpois(param=c(beta,phi),


error=error)

return(out)

}

dlgrpois <- function(y, mu, phi){

den <- mu*(mu+(phi-1)*y)^(y-1)*phi^(-y)*

exp(-(mu+(phi-1)*y)/phi)/factorial(y)

return(den)

}

lgrpr_fit <- function(formula,data){

#preparation

n <- nrow(data)



p <- ncol(Xmat)


#initial


data=data)


phi <- 0.9999

iter <- 0

error <- 1

tol <- 1e-05


llh_lgrpois <- function(param,y,X){

p <- length(param)

beta <- param[-p]

52

phi <- param[p]


den <- 0


den[i] <- dlgrpois(y=y[i], mu=mu[i],

phi=phi)

}


return(llh)

}

#mom function for phi

mom_phi <- function(y, mu){

calc <- sqrt(sum((y-mu)^2/mu)/(n-p))

return(calc)

}

#Estimation

repeat{

iter <- iter+1

#Beta via IWLS



diag(W) <- mu


beta_new <-


#phi via mom

phi <- mom_phi(y=yresp, mu=mu)

#convergence check


53

beta <- beta_new


}

#var beta

var_beta <- phi^2*solve(t(Xmat)%*%W%*%Xmat)


#wald statistic



lower.tail=FALSE)

#chisq pearson

vary <- phi^2*mu



lower.tail=FALSE)


sig=p_val,



varcov=var_beta,

loglik=llh_lgrpois(param=c(beta,phi),


error=error)

return(out)

}

gpois_glm <- function(formula, type, data){

call <- match.call()

#define saturated formula (intercept only)

54

fL0 <- paste(formula)

fL0 <- as.formula(paste(fL0[2],'~',1))

#modeling

if(type=='generalized'){

fullmdl <- gpr_fit(formula=formula, data=data)

satmdl <- gpr_fit(formula=fL0, data=data)

}else if(type=='lagrange'){

fullmdl <- lgrpr_fit(formula=formula, data=data)

satmdl <- lgrpr_fit(formula=fL0, data=data)

}else{

stop('type not supported')

}

#likelihood ratio test

out <- fullmdl

l0 <- satmdl[['loglik']]

lp <- out[['loglik']]

n <- out[['dimX']][1]

p <- out[['dimX']][2]

q <- length(satmdl[['beta']])

G <- -2*(l0-lp)

pval_G <- pchisq(G, df=p, lower.tail=FALSE)

out[['G_stat']] <- G

out[['pval_G']] <- pval_G

out[['call']] <- call

class(out) <- 'gpois'

return(out)

}

print.gpois <- function(object){

#coefficient output

est <- round(object[['beta']],4)

55

se <- round(object[['se']],4)

wald <- round(object[['wald']],4)

pval <- round(object[['sig']],4)

#notation

code <- c()

for(j in pval){

if(j<=.001){code <- c(code, '***')

}else if(j<=.01){code <- c(code, '**')

}else if(j<=.05){code <- c(code, '*')

}else if(j<=.1){code <- c(code, '.')

}else{code <- c(code, ' ')}

}

coeff <- data.frame(est,se,wald,pval,code)

colnames(coeff) <- c('Estimate', 'Std. Error',

'Wald (z)', 'Sig.', ' ')

rownames(coeff) <- labels(est)[[1]]

#print output

cat('Call:\n')

print(object[['call']])

cat('\n')

cat('Coefficients:\n')

print(coeff)

cat('\n')

cat('-----\n')

cat('Sig. codes: 0 â€ ˜ ***â€ ™ 0.001 â€ ˜ **â€ ™ 0.01

â€ ˜ *â€ ™ 0.05 â€ ˜ .â€ ™ 0.1 â€ ˜ â€ ™ 1\n')

cat('\nDispersion parameter (phi):', object[['phi']], '\n')

cat('\nLikelihood ratio test:\n')

cat('G: ', round(object[['G_stat']],4), '\n')

cat('Sig.: ', round(object[['pval_G']],4), '\n')

cat('\nChi squared pearson:\n')

cat('Chi: ', round(object[['chi_pear']],4), '\n')

56

cat('Sig.: ', round(object[['pval_chipear']],4), '\n')

cat('\nlog-likelihood: ', round(object[['loglik']],4), '\n')

cat('Iterations: ', object[['iter']], '\n')

}

57


Variabel X3


Error

Wald P-

Value

Konstanta 1,7368 1,8426 0,9426 0,3459

X1 0,1773 0,0920 1,9285 0,0538

X2 0,0180 0,0057 3,1490 0,0016

X4 0,0001 0,0000 1,3311 0,1832

X5 -0,0156 0,0219 -0,7105 0,4774

58


Variabel X3 dan X5


Error

Wald P-

Value

Konstanta 0,5876 0,7641 0,7690 0,4419

X1 0,1649 0,0912 1,8078 0,0706

X2 0,0176 0,0057 3,0699 0,0022

X4 0,0001 0,0000 1,2211 0,2221

59




Error

Wald P-

Value

Konstanta 1,2478 0,5082 2,4552 0,0141

X1 0,1173 0,0807 1,4525 0,1464

X2 0,0176 0,0060 2,9144 0,0036

60


Variabel X5


Error

Wald P-

Value

Konstanta 0,5003 0,7869 0,636 0,5249

X1 0,1189 0,0936 1,270 0,2042

X2 0,0185 0,0061 3,039 0,0024

X3 0,0000 0,0000 0,802 0,4223

X4 0,0001 0,0000 1,152 0,2493

61


Variabel X5 dan X3


Error

Wald P-

Value

Konstanta 0,6598 0,7446 0,886 0,3755

X1 0,1550 0,0896 1,730 0,0836

X2 0,0168 0,0056 3,006 0,0026

X4 0,0001 0,0000 1,277 0,2015

62




Error

Wald P-

Value

Konstanta 1,3605 0,4921 2,765 0,0057

X1 0,1021 0,0793 1,288 0,1979

X2 0,0167 0,0058 2,842 0,0045

63

Lampiran 17. Hasil Analisis Regresi Lagrange poisson tanpa

Variabel X5


Error

Wald P-

Value

Konstanta 0,4334 0,9465 0,4579 0,6470

X1 0,0922 0,1103 0,8358 0,4033

X2 0,0187 0,0075 2,4982 0,0125

X3 0,0000 0,0000 0,9962 0,3192

X4 0,0001 0,0001 1,0855 0,2777

64


Variabel X5 dan X1


Error

Wald P-

Value

Konstanta 0,7440 0,8406 0,8850 0,3761

X2 0,0205 0,0070 2,9260 0,0034

X3 0,0000 0,0000 1,4581 0,1448

X4 0,0000 0,0000 0,8069 0,4197

65




Error

Wald P-

Value

Konstanta 1,1248 0,6697 1,6795 0,0031

X2 0,0196 0,0067 2,9384 0,0033

X3 0,0000 0,0000 1,4103 0,1584

Documents

PENERAPAN ANALISIS REGRESI GENERALIZED ...repository.ub.ac.id/3939/1/Pratiwi, Betty Woro.pdf(Studi Kasus pada Dinas Kesehatan Kota Malang) SKRIPSI Sebagai salah satu syarat untuk memperoleh