Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
i
PENERAPAN ANALISIS REGRESI GENERALIZED POISSON,
BINOMIAL NEGATIF, DAN LAGRANGE POISSON UNTUK
MENANGANI DATA YANG MENGALAMI OVERDISPERSI
(Studi Kasus pada Dinas Kesehatan Kota Malang)
SKRIPSI
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains dalam
bidang Statistika
Oleh:
BETTY WORO PRATIWI
125090500111013
PROGAM STUDI STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2017
ii
iii
LEMBAR PENGESAHAN SKRIPSI
PENERAPAN ANALISIS REGRESI GENERALIZED POISSON,
BINOMIAL NEGATIF, DAN LAGRANGE POISSON UNTUK
MENANGANI DATA YANG MENGALAMI OVERDISPERSI
(Studi Kasus pada Dinas Kesehatan Kota Malang)
oleh:
BETTY WORO PRATIWI
125090500111013
Setelah dipertahankan di depan Majelis Penguji
pada tanggal 25 Juli 2017
dan dinyatakan memenuhi syarat untuk memperoleh gelar
Sarjana Sains dalam bidang Statistika
Dosen Pembimbing
(Achmad Efendi, S.Si., M.Sc., Ph.D.)
NIP. 198102192005011001
Mengetahui,
Ketua Jurusan Matematika
Fakultas MIPA
Universitas Brawijaya
Ratno Bagus Edy Wibowo, S.Si, M.Si, Ph.D
NIP. 197509082000031003
iv
v
LEMBAR PERNYATAAN
Saya yang bertanda tangan di bawah ini :
Nama : BETTY WORO PRATIWI
NIM : 125090500111013
Jurusan : MATEMATIKA
Program Studi : STATISTIKA
Skripsi berjudul :
PENERAPAN ANALISIS REGRESI GENERALIZED POISSON,
BINOMIAL NEGATIF, DAN LAGRANGE POISSON UNTUK
MENANGANI DATA YANG MENGALAMI OVERDISPERSI
(Studi Kasus pada Dinas Kesehatan Kota Malang)
Dengan ini menyatakan bahwa:
1. Isi dari skripsi yang saya buat adalah benar-benar karya
sendiri dan tidak menjiplak karya orang lain, selain nama-nama
yang termaktub di isi dan tertulis di daftar pustaka
dalam skripsi ini.
2. Apabila di kemudian hari ternyata skripsi yang saya tulis
terbukti hasil jiplakan, maka saya akan bersedia
menanggung segala resiko yang akan saya terima.
Demikian pernyataan ini saya buat dengan segala kesadaran.
Malang, 25 Juli 2017
Yang menyatakan,
BETTY WORO PRATIWI
NIM. 125090500111013
vi
vii
PENERAPAN ANALISIS REGRESI GENERALIZED POISSON,
BINOMIAL NEGATIF, DAN LAGRANGE POISSON UNTUK
MENANGANI DATA YANG MENGALAMI OVERDISPERSI
(Studi Kasus pada Dinas Kesehatan Kota Malang)
ABSTRAK
Analisis regresi merupakan metode untuk meramalkan nilai variabel respon
dari nilai satu atau lebih variabel prediktor. Untuk data cacahan yang
berdistribusi poisson, digunakan analisis regresi poisson. Tahapan metode
regresi poisson adalah melakukan uji distribusi poisson, uji asumsi non
multikolinearitas, mengestimasi parameter, uji asumsi overdispersi,
melakukan uji simultan dan uji parsial. Namun pada regresi poisson
seringkali data mengalami overdispersi, sehingga perlu dilakukan
penanganan overdispersi dengan analisis regresi generalized poisson,
regresi binomial negatif, dan regresi poisson lagrange. Tujuan penelitian
ini adalah menerapkan analisis regresi generalized poisson, regresi
binomial negatif, dan regresi poisson lagrange untuk mengetahui faktor apa
saja yang berpengaruh terhadap jumlah kasus Demam Berdarah Dengue
(DBD) di Kota Malang. Dari ketiga model yang terbentuk, dipilih model
terbaik dengan membandingkan nilai khi kuadrat pearson, dan dicari
variabel yang memiliki pengaruh signifikan. DBD merupakan salah satu
penyakit menular yang menjadi masalah kesehatan masyarakat di Indonesia
karena jumlah penderita yang cenderung meningkat dan semakin luas
penyebarannya, sehingga perlu dilakukan upaya pencegahan oleh
Pemerintah demi menekan angka kasus DBD Malang. Model terbaik
adalah regresi binomial negatif yaitu 𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021Xi1 +0,0167Xi2. Dari lima variabel prediktor yang digunakan dalam penelitian
ini, terdapat satu variabel prediktor yang berpengaruh signifikan terdapat
jumlah kasus DBD di Kota Malang yaitu presentase rumah tangga berpola
hidup bersih dan sehat (ber-PHBS).
Kata Kunci : Binomial Negatif, Demam Berdarah Dengue (DBD),
Generalized Poisson, Lagrange Poisson, Regresi Poisson.
viii
ix
APPLICATION OF GENERALIZED POISSON, NEGATIVE
BINOMIAL, AND LAGRANGE POISSON REGRESSION TO
HANDLE OVERDISPERSION
(Case Study at Malang Ministry of Health)
ABSTRACT
Regression analysis is a method to predict the value of response variables
from the value of one or more predictor variables. Poisson regression
analysis was used at poisson distributed data. Stages of the Poisson
regression method are the Poisson distribution test, non-multicolinearity
assumption test, parameter estimation, overdispersion assumption test,
simultaneous test and partial test. However, in poisson regression,
overdispersion data was used to happen, so it needed to be handled with
generalized poisson regression analysis, negative binomial regression, and
lagrange poisson regression. The purpose of this research is to apply
generalized poisson regression analysis, negative binomial regression, and
lagrange poisson regression to find out the factors that affect the number of
Dengue Hemorrhagic Fever (DHF) cases in Malang. From the formed three
models, the best model is chosen by comparing the pearson chi squares,
and variables that have significant influence is searched. DHF is one of the
infectious diseases that become public health problems in Indonesia
because of the increasing number of patients and the widespread spreading,
so it’s necessary to do prevention by the Government in order to reduce the
number of DHF cases in Malang. The best model is the negative binomial
regression that is 𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021Xi1 + 0,0167Xi2 . From
five predictor variables that is used in this research, there is one predictor
variable that significantly influences the number of dengue fever cases in
Malang city, that is the percentage of households with clean and healthy
life pattern (PHBS).
Keywords: Negative Binomial, Dengue Hemorrhagic Fever (DHF),
Generalized Poisson, Lagrange Poisson, Poisson Regression.
x
xi
KATA PENGANTAR
Puji syukur kehadirat Allah SWT yang telah memberikan berkah,
rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penulisan
skripsi dengan judul “Penerapan Analisis Regresi Generalized Poisson,
Binomial Negatif, Dan Lagrange Poisson untuk Menangani Data yang
Mengalami Overdispersi (Studi Kasus Pada Dinas Kesehatan Kota
Malang)”. Selama penyusunan skripsi ini, penulis telah mendapatkan
bantuan dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis
mengucapkan terima kasih yang sebanyak-banyaknya kepada:
1. Bapak Achmad Efendi, S.Si., M.Sc., Ph.D selaku dosen
pembimbing yang telah memberikan bimbingan serta nasihat
sehingga skripsi ini dapat diselesaikan dengan baik. 2. Ibu Ir. Heni Kusdarwati, M.S. selaku dosen penguji I yang telah
memberikan saran dan bimbingan sehingga skripsi ini dapat
diselesaikan dengan baik.
3. Ibu Prof. Dr. Ir. Ni Wayan Surya Wardhani, M.S. selaku dosen penguji
II yang telah memberikan saran dan bimbingan sehingga skripsi ini
dapat diselesaikan dengan baik.
4. Bapak Ratno Bagus Edy Wibowo, S.Si., M.Si., Ph.D. selaku Ketua
Jurusan Matematika Fakultas MIPA Universitas Brawijaya.
5. Mama, Ayah, Adik Bella, Om Nono, Tante Indah, Mbak Ayu, Mas
Agung, serta seluruh keluarga besar yang telah memberikan dukungan
berupa doa, motivasi, dan materi kepada penulis dalam penyusunan
laporan.
6. Sahabat tercinta Shinta Ayu Alifa dan Irfa Sepsaria yang banyak
membantu dan memberikan semangat, doa, serta dukungan dalam
penyusunan skripsi.
7. Ari Purwanto dan Eka Fitria Damayanti atas ilmu, bantuan, serta
motivasi yang telah banyak diberikan dalam penyusunan skripsi ini.
8. Teman-teman Statistika 2012 dan 2013 yang telah memberikan
banyak bantuan, semangat, doa, dan berjuang bersama dalam
menyelesaikan skripsi.
9. Teman-teman Cientifico Choir yang selalu memberikan semangat,
doa, keceriaan, pengalaman dalam bidang non akademik.
10. Sahabat LDF Yana, Dila, Alfi, Rizma, Ditya, Dinda, serta FG Shinta,
Sofi, dan Desy atas bantuan, doa, dan semangat yang diberikan.
xii
xiii
11. Dinas Kesehatan Kota Malang yang telah memberikan izin kepada
penulis untuk melaksanakan penelitian.
12. Semua pihak yang secara langsung maupun tidak langsung telah
membantu penulis dalam penyelesaian skripsi ini yang tidak bisa
disebutkan satu per satu.
Penulis menyadari bahwa penyusunan skripsi ini masih memiliki
banyak kekurangan. Oleh karena itu, kritik dan saran yang membangun dari
pembaca sangat berguna untuk penyusunan laporan yang lebih baik di lain
kesempatan. Penulis berharap semoga skripsi ini bermanfaat bagi semua
pihak yang membutuhkan.
Malang, Juli 2017
Penulis
xiv
xv
DAFTAR ISI
ABSTRAK ........................................................................................ vii
ABSTRACT ..................................................................................... ix
KATA PENGANTAR ..................................................................... xi
DAFTAR ISI ................................................................................... xv
DAFTAR TABEL ............................................................................ xix
DAFTAR GAMBAR ....................................................................... xxi
DAFTAR LAMPIRAN ................................................................... xxiii
BAB I PENDAHULUAN
1.1 Latar Belakang .......................................................... 1
1.2 Rumusan Masalah ...................................................... 2
1.3 Tujuan Penelitian ........................................................ 2
1.4 Batasan Masalah ......................................................... 3
1.5 Manfaat Penelitian ...................................................... 3
BAB II TINJAUAN PUSTAKA
2.1 Distribusi Poisson....................................................... 5
2.2 Multikolinearitas ........................................................ 7
2.3 Overdispersi................................................................ 7
2.4 Analisis Regresi Poisson ............................................ 8
2.4.1 Pendugaan Parameter Model Regresi Poisson ... 8
2.5 Analisis Regresi Genralized Poisson ......................... 9
2.5.1 Pendugaan Parameter Model Regresi Generalized
Poisson ................................................................ 9
2.6 Analisis Regresi Binomial Negatif ............................. 11
2.6.1 Pendugaan Parameter Model Regresi Binomial
Negatif ................................................................ 12
2.7 Analisis Regresi Poisson Lagrange ........................... 13
2.7.1 Pendugaan Parameter Model Regresi Lagrange
Poisson ................................................................ 13
2.8 Pengujian Secara Simultan ......................................... 14
2.9 Pengujian Secara Parsial ............................................ 15
2.10 Uji Kelayakan Model (Goodness of Fit) .................... 15
2.11 Penyakit Demam Berdarah Dengue ........................... 16
BAB III METODE PENELITIAN
3.1 Sumber Data ............................................................... 19
xvi
xvii
3.2 Variabel Penelitian ..................................................... 19
3.3 Langkah-langkah Penelitian ....................................... 19
BAB IV HASIL DAN PEMBAHASAN
4.1 Distribusi Poisson....................................................... 23
4.2 Multikolinearitas ........................................................ 23
4.3 Regresi Poisson .......................................................... 24
4.4.1 Pembentukan Model Regresi ............................ 24
4.4.2 Uji Signifikansi Secara Simultan ...................... 25
4.4.3 Uji Signifikansi Secara Parsial ......................... 25
4.4 Overdispersi................................................................ 25
4.5 Regresi Generalized Poisson ...................................... 26
4.5.1 Pembentukan Model Regresi ............................ 26
4.5.2 Uji Signifikansi Secara Simultan ...................... 26
4.5.3 Uji Signifikansi Secara Parsial ......................... 27
4.6 Regresi Binomial Negatif ........................................... 28
4.6.1 Pembentukan Model Regresi ............................ 28
4.6.2 Uji Signifikansi Secara Simultan ...................... 28
4.6.3 Uji Signifikansi Secara Parsial ......................... 29
4.7 Regresi Poisson Lagrange .......................................... 30
4.4.1 Pembentukan Model Regresi ............................ 30
4.4.2 Uji Signifikansi Secara Simultan ...................... 30
4.4.3 Uji Signifikansi Secara Parsial ......................... 30
4.8 Uji Kelayakan Model (Goodness of Fit) .................... 32
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan ................................................................. 35
5.2 Saran ........................................................................... 35
DAFTAR PUSTAKA ..................................................................... 37
LAMPIRAN ..................................................................................... 39
xviii
xix
DAFTAR TABEL
Tabel 4.1 Hasil Pengujian Asumsi Non Multikolinearitas .............. 23
Tabel 4.2 Hasil Pendugaan Parameter Regresi Poisson .................. 24
Tabel 4.3 Hasil Pengujian Signifikansi Parameter Model Regresi
Poisson Secara Simultan ................................................. 24
Tabel 4.4 Hasil Pengujian Signifikansi Parameter Model Regresi
Poisson Secara Parsial .................................................... 25
Tabel 4.5 Hasil Pendugaan Parameter Regresi Generalized Poisson 26
Tabel 4.6 Hasil Pengujian Signifikansi Parameter Model Regresi
Generalized Poisson Secara Simultan ............................ 26
Tabel 4.7 Hasil Pengujian Signifikansi Parameter Model Regresi
Generalized Poisson Secara Parsial ................................ 27
Tabel 4.8 Hasil Pendugaan Parameter Regresi Binomial Negatif .. 28
Tabel 4.9 Hasil Pengujian Signifikansi Parameter Model Regresi
Binomial Negatif Secara Simultan .................................. 29
Tabel 4.10 Hasil Pengujian Signifikansi Parameter Model Regresi
Binomial Negatif Secara Parsial ..................................... 29
Tabel 4.11 Hasil Pendugaan Parameter Regresi Poisson Lagrange .. 30
Tabel 4.12 Hasil Pengujian Signifikansi Parameter Model Regresi
Poisson Lagrange Secara Simultan ................................ 31
Tabel 4.13 Hasil Pengujian Signifikansi Parameter Model Regresi
Poisson Lagrange Secara Parsial .................................... 31
Tabel 4.14 Hasil Khi Kuadrat Pearson ............................................. 33
xx
xxi
DAFTAR GAMBAR
Gambar 3.1 Diagram Alir Analisis Regresi Poisson .......................... 20
xxii
xxiii
DAFTAR LAMPIRAN
Lampiran 1 Data Kasus Deman Berdarah Kota Malang tahun 2015 39
Lampiran 2 Hasil Pengujian Sebaran Variabel Respon ................... 40
Lampiran 3 Hasil Pengujian Asumsi Non Multikolinearitas ........... 41
Lampiran 4 Hasil Pendugaan Parameter Regresi Poisson ............... 42
Lampiran 5 Hasil Pendugaan Parameter Regresi Generalized Poisson 43
Lampiran 6 Hasil Pendugaan Parameter Regresi Binomial Negatif 44
Lampiran 7 Hasil Pendugaan Parameter Regresi Poisson Lagrange 45
Lampiran 8 Algoritma RStudio untuk Model Regresi Poisson ....... 46
Lampiran 9 Algoritma RStudio untuk Model Regresi Binomial
Negatif47 ...................................................................... 47
Lampiran 10 Algoritma RStudio untuk Model Regresi Generalized
Poisson dan Regresi Poisson Lagrange ....................... 48
Lampiran 11 Hasil Analisis Regresi Generalized Poisson tanpa Variabel
X3 .................................................................................. 57
Lampiran 12 Hasil Analisis Regresi Generalized Poisson tanpa Variabel
X3 dan X5 ...................................................................... 58
Lampiran 13 Hasil Analisis Regresi Generalized Poisson tanpa Variabel
X3, X5, dan X4 ............................................................... 59
Lampiran 14 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5
...................................................................................... 60
Lampiran 15 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5
dan X3 ........................................................................... 61
Lampiran 16 Hasil Analisis Regresi Binomial Negatif tanpa Variabel X5,
X3, dan X4 ..................................................................... 62
Lampiran 17 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5
...................................................................................... 63
Lampiran 18 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5
dan X1 ........................................................................... 64
Lampiran 19 Hasil Analisis Regresi Poisson Lagrange tanpa Variabel X5,
X1, dan X4 ..................................................................... 65
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Penyakit demam berdarah dengue (DBD) merupakan salah
satu penyakit menular yang sebagian besar menyerang anak-anak.
DBD menjadi masalah kesehatan masyarakat di Indonesia karena
jumlah penderita yang cenderung meningkat dan semakin luas
penyebarannya. Selain itu, Indonesia juga masih memiliki banyak
daerah yang endemik. Daerah endemik DBD pada umumnya
merupakan sumber penyebaran penyakit ke wilayah lain. Setiap
kejadian luar biasa DBD umumnya dimulai dengan peningkatan
jumlah kasus di wilayah tersebut. Penyakit DBD mempunyai
perjalanan yang sangat cepat dan penanganannya sering terlambat
sehingga banyak pasien yang meninggal (Widoyono, 2011).
Berdasarkan profil kesehatan Kota Malang tahun 2015 oleh
Dinas Kesehatan Kota Malang, penyakit DBD merupakan salah satu
kejadian luar biasa (KLB) dengan jumlah peristiwa mencapai 136
pada tahun 2012, meningkat menjadi 409 kasus pada tahun 2013,
pada tahun 2014 mengalami penurunan menajdi 160, dan meningkat
kembali menjadi 298 pada tahun 2015. Penyakit DBD masih
menyebar luas di Kota Malang walaupun kejadiannya menurun pada
tahun 2014 jika dibandingkan dengan tahun 2013. Mengingat
bahayanya kasus DBD yang dapat menyebabkan penderitanya
meninggal, perlu dilakukan penanganan lebih lanjut dengan terlebih
dahulu menganalisis faktor-faktor apa yang memiliki pengaruh
signifikan terhadap kasus DBD, sehingga dapat dilakukan upaya
pencegahan oleh Pemerintah demi menekan angka jumlah kasus
DBD di Kota Malang.
Analisis regresi memungkinkan untuk meramalkan nilai suatu
variabel respon dari nilai-nilai satu atau lebih variabel prediktor.
Metode ini umumnya digunakan dalam bisnis, ilmu sosial, ilmu
biologi, dan disiplin ilmu lainnya. Pada analisis regresi linier,
variabel respon berdistribusi normal. Dalam beberapa kasus,
ditemukan variabel respon yang diamati berdistribusi Poisson. Suatu
variabel disebut berdistribusi Poisson apabila peristiwa yang diamati
terjadi selama selang waktu tertentu atau di suatu daerah tertentu.
2
Bila variabel respon berdistribusi Poisson, analisis regresi yang
digunakan adalah analisis regresi Poisson.
Analisis regresi Poisson diterapkan untuk mengetahui faktor-
faktor yang memiliki pengaruh signifikan pada kasus demam
berdarah dengue. Namun, sering kali data mengalami overdispersi,
yaitu keadaan di mana data memiliki nilai ragam yang lebih besar
dibandingkan nilai rata-rata, sehingga model regresi poisson menjadi
tidak layak untuk digunakan. Untuk menangani overdispersi,
terdapat beberapa metode yang dapat digunakan diantaranya dengan
analisis binomial negatif, generalized poisson, dan lagrange poisson.
Dalam penelitian ini, faktor-faktor yang akan dianalisis diantaranya
jumlah sarana kesehatan, rumah tangga berperilaku hidup bersih dan
sehat (Ber-PHBS), jumlah rumah tangga miskin, indeks kepadatan
penduduk, dan angka bebas jentik di setiap puskesmas di Kota
Malang. Data yang digunakan adalah data sekunder yang diambil
dari Dinas Kesehatan Pemerintah Kota Malang pada tahun 2015.
1.2 Rumusan Masalah
Berdasarkan latar belakang tersebut, rumusan masalah dari
penelitian ini adalah :
1. Bagaimana model regresi Generalized Poisson, Binomial
Negatif, dan Lagrange poisson pada data jumlah kasus DBD?
2. Apakah model regresi terbaik yang dapat digunakan untuk
mengetahui faktor-faktor yang berpengaruh signifikan
terhadap kasus DBD?
3. Variabel apa yang memiliki pengaruh signifikan pada kasus
DBD?
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah sebagai berikut :
1. Membentuk model regresi Generalized Poisson, Binomial
Negatif, dan Lagrange poisson pada kasus DBD.
2. Mengetahui model terbaik yang dapat digunakan untuk
mengetahui faktor-faktor yang berpengaruh signifikan
terhadap kasus DBD.
3. Mengetahui variabel yang memiliki pengaruh signifikan pada
kasus DBD.
3
1.4 Batasan Masalah
Masalah dalam penelitian ini hanya dibatasi pada data demam
berdarah yang diperoleh dari Dinas Kesehatan Pemerintah Kota
Malang pada tahun 2015.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah diharapkan mampu memberi
informasi dalam dunia kesehatan tentang variabel yang berpengaruh
terhadap kasus DBD serta menambah pengetahuan aplikasi statistika
dalam dunia kesehatan.
5
BAB II
TINJAUAN PUSTAKA
2.1 Distribusi Poisson
Percobaan Poisson yaitu banyaknya hasil percobaan yang terjadi
selama suatu selang waktu tertentu atau di suatu daerah tertentu.
Selang waktu yang dimaksud dapat berupa panjangnya, misalnya
satu menit, satu hari, satu minggu, satu bulan, dst. Sebagai contoh
percobaan Poisson, missal di suatu gerbang tol yang dilewati ribuan
mobil dalam suatu hari, terjadi kecelakaan dari sekian banyak mobil
yang lewat. Daerah tertentu yang dimaksud dapat berupa suatu ruas
garis, suatu luas, suatu volume, dst. Sebagai contoh, percobaan
mungkin saja menyatakan banyaknya kesalahan ketik per halaman.
(Walpole, 1995)
Menurut Walpole (1995), sebaran peluang bagi variabel acak
Poisson adalah:
𝑝(𝑦; 𝜇) =𝑒−𝜇𝜇𝑦
𝑦! , untuk 𝑦 = 0,1,2,3,… (2.1)
Di mana :
y: banyaknya sukses yang terjadi dalam selang waktu atau daerah
tertentu
𝜇: rata-rata banyaknya sukses yang terjadi dalam selang waktu atau
daerah tertentu
e: 2.718
Rata-rata dan ragam dari distribusi Poisson adalah 𝐸(𝑦) = 𝜇 dan
𝑉𝑎𝑟(𝑦) = 𝜇. Hal tersebut dapat dibuktikan dengan penjabaran
sebagai berikut:
𝐸(𝑌) = ∑ [𝑦. 𝑝(𝑦; 𝜇)]∞𝑦=0
= ∑ [𝑦.𝑒−𝜇𝜇𝑦
𝑦!]∞
𝑦=0
= ∑ [𝑦.𝑒−𝜇 𝜇𝑦
𝑦(𝑦−1)!]∞
𝑦=0
= ∑ [𝑦.𝑒−𝜇𝜇 𝜇𝑦−1
𝑦(𝑦−1)!]∞
𝑦=0
= 𝜇 ∑ [𝑒−𝜇 𝜇𝑦−1
(𝑦−1)!]∞
𝑦=0
misal 𝑥 = 𝑦 − 1, maka diperoleh persamaan:
6
𝐸(𝑌) = 𝜇∑𝑒−𝜇 𝜇𝑥
𝑥!∞𝑥=0
karena ∑ [𝑝(𝑥; 𝜇)]∞𝑥=0 = 1, maka:
𝐸(𝑌) = 𝜇×1 = 𝜇
untuk ragam dalam variabel acak Poisson adalah sebagai berikut:
𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
𝐸(𝑌2) = ∑ [𝑦2. 𝑝(𝑦)]∞𝑦=0
= ∑ [(𝑦(𝑦 − 1) + 𝑦). 𝑝(𝑦)]∞𝑦=0
= ∑ [𝑦(𝑦 − 1). 𝑝(𝑦)]∞𝑦=0 + ∑ 𝑦. 𝑝(𝑦)∞
𝑦=0
= ∑ [𝑦(𝑦 − 1). 𝑝(𝑦)]∞𝑦=0 + 𝜇
= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇𝑦
𝑦!]∞
𝑦=0 + 𝜇
= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇𝑦
𝑦(𝑦−1)(𝑦−2)!]∞
𝑦=0 + 𝜇
= ∑ [𝑦(𝑦 − 1).𝑒−𝜇𝜇2𝜇𝑦−2
𝑦(𝑦−1)(𝑦−2)!]∞
𝑦=0 + 𝜇
= 𝜇2 ∑ [𝑒−𝜇𝜇𝑦−2
(𝑦−2)!]∞
𝑦=0 + 𝜇
misalkan x= 𝑦 − 2, maka diperoleh persamaan:
𝐸(𝑌2) = 𝜇2∑ [𝑒−𝜇𝜇𝑥
𝑥!]∞
𝑥=0 + 𝜇 = 𝜇2 + 𝜇
karena ∑𝑒−𝜇 𝜇𝑥
𝑥!∞𝑥=0 = 1, maka:
𝐸(𝑌2) = 𝜇2 + 𝜇
sehingga didapatkan ragam untuk variabel acak Poisson adalah:
𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
= 𝜇2 + 𝜇 − 𝜇2
= 𝜇
Untuk mengetahui apakah suatu data berdistribusi Poisson atau
tidak, dapat diketahui dengan uji Kolmogorov Smirnov dengan
hipotesis sebagai berikut:
H0 ∶ data berdistribusi 𝑃𝑜𝑖𝑠𝑠𝑜𝑛
H1 ∶ data tidak berdistribusi 𝑃𝑜𝑖𝑠𝑠𝑜𝑛
Statistik uji yang digunakan adalah:
𝐷𝑛 = 𝑆𝑢𝑝|𝑆𝑛(𝑦) − 𝐹0(𝑦)| (2.2)
di mana:
𝐷𝑛 : Jarak tegak maksimum antara fungsi distribusi empiris
dengan fungsi distribusi Poisson
7
𝑆𝑛(𝑦) : Suatu fungsi peluang kumulatif data sampel
𝐹0(𝑦) : Suatu fungsi distribusi kumulatif Poisson
Jika nilai statistic uji 𝐷𝑛 > nilai statistic Kolmogorov Smirnov
pada tabel, maka H0 ditolak.
2.2 Multikolinearitas
Multikolinearitas merupakan asumsi yang harus dipenuhi dalam
analisis regresi Poisson. Ketika semua atau sebagian variabel
prediktor berkorelasi antara satu sama lain, maka dapat dikatakan
terjadi multikolinearitas.
Menurut Kutner, dkk (2005), salah satu metode untuk
mendeteksi keberadaan multikolinearitas yang dapat digunakan
secara umum adalah Variance Inflation Factors (VIF). Persamaan
dari VIF adalah sebagai berikut:
(𝑉𝐼𝐹)𝑘 = (1 − 𝑅𝑝2)−1
(2.3)
Di mana 𝑅𝑝2 merupakan koefisien determinasi dari model regresi
buatan di mana 𝑋𝑝 sebagai variabel respon diregresikan dengan
variabel X lainnya sebagai variabel prediktor. Jika nilai VIF kurang
dari 10, maka tidak terjadi multikolinearitas pada model regresi.
2.3 Overdispersi
Overdispersi adalah keadaan di mana data memiliki nilai ragam
yang lebih besar dibandingkan nilai rata-rata, sedangkan
underdispersi adalah ketika data memiliki nilai rata-rata lebih besar
dibandingkan nilai ragam. Pada regresi Poisson, data harus memiliki
nilai rata-rata dan ragam yang bernilai sama atau disebut juga dengan
equidispersi (Ismail dan Jemain 2007).
Pengujian overdispersi pada regresi Poisson dilakukan dengan
menggunakan statistik uji Khi Kuadrat Pearson dibagi nilai derajat
bebas (n-k) di mana n merupakan banyaknya pengamatan dan k
merupakan banyaknya parameter. Rumus pengujian overdispersi
secara matematis ditulis sebagai berikut:
𝜙 =𝜒2
𝑑𝑏 (2.4)
dengan 𝜙 merupakan parameter dispersi. Berikut merupakan statistik
uji Khi Kuadrat Pearson:
𝜒2 = ∑(𝑦𝑖−𝜇)
2
𝑉𝑎𝑟 (𝑌)𝑛𝑖=1 (2.5)
8
di mana :
𝑦𝑖 : nilai variabel respon pada pengamatan ke-i
𝜇 : penduga bagi respon rata-rata
Apabila hasil pembagian statistik uji khi kuadrat Pearson dengan
derajat bebas menghasilkan nilai > 1, dapat dikatakan terjadi
overdispersi.
2.4 Analisis Regresi Poisson
Model regresi untuk data cacahan yang mengikuti distribusi
Poisson adalah model regresi Poisson. Distribusi Poisson sering
digunakan untuk kejadian-kejadian yang jarang terjadi dengan data
berupa cacahan yang mempunyai nilai non negatif (Kismiantini
2008).
Model regresi Poisson merupakan model standar untuk data
diskrit dan termasuk dalam model regresi linier (Cameron dan
Trivedi, 1998). Pada model regresi Poisson nilai µ merupakan fungsi
dari variable penjelas. Regresi Poisson memiliki fungsi kepekatan
peluang sebagai berikut:
𝑓(𝑦𝑖; 𝜇𝑖) =𝑒−𝜇𝑖𝜇𝑦𝑖
𝑦𝑖! (2.6)
di mana 𝑦𝑖 adalah jumlah kejadian dan 𝜇𝑖 adalah rata-rata jumlah
kejadian yang terjadi dalam interval waktu tertentu. Sedangkan
model 𝜇𝑖 dari regresi poisson dinyatakan dalam bentuk sebagai
berikut:
�̂� = �̂�𝑖 = exp(β̂0 + β̂1Xi1 + β̂2Xi2 +⋯+ β̂pXip) (2.7)
2.4.1 Pendugaan Parameter Model Regresi Poisson
Metode Maksimum Likelihood Estimation (MLE) adalah
salah satu metode pendugaan parameter untuk suatu model yang
diketahui distribusinya. Menurut Kutner (2005), untuk model regresi
Poisson, fungsi likelihood adalah sebagai berikut:
𝐿(𝛽) = ∏ 𝑓𝑖(𝑦𝑖) = ∏[𝜇(𝑋𝑖,𝛽)]
𝑦𝑖𝑒𝑥𝑝[−𝜇(𝑋𝑖,𝛽)]
𝑦𝑖!𝑛𝑖=1
𝑛𝑖=1 (2.8)
={∏ [𝜇(𝑋𝑖,𝛽)]
𝑦𝑖𝑛𝑖=1 }𝑒𝑥𝑝[−∑ 𝜇(𝑋𝑖,𝛽)
𝑛𝑖=1 ]
∏ 𝑦𝑖!𝑛𝑖=1
9
dan persamaan log likelihood adalah:
ln 𝐿(𝛽) = ∑ 𝑦𝑖 ln 𝜇(𝑋𝑖,𝛽)𝑛𝑖=1 − ∑ 𝜇(𝑋𝑖,𝛽)
𝑛𝑖=1 − ∑ ln(𝑦𝑖!)
𝑛𝑖=1 (2.9)
Dugaan MLE untuk parameter model regresi Poisson
dinyatakan dengan �̂� dan diperoleh dari solusi turunan pertama
fungsi log likelihoodnya adalah:
𝐿(𝑦, 𝛽) =𝜕 ln 𝐿(𝛽)
𝜕𝛽 (2.10)
Penyelesaian persamaan ini dapat dilakukan dengan prosedur
iterative menggunakan iterasi Newton-Raphson.
2.5 Analisis Regresi Generalized Poisson
Rata-rata sampel sama dengan ragam sampel merupakan asumsi
yang mendasari distribusi poisson. Jika terjadi pelanggaran terhadap
asumsi tersebut maka terjadi kondisi over/under dispersi yang
menyebabkan model regresi poisson tidak efisien. Oleh sebab itu
digunakan suatu model yang sesuai untuk mengatasi
over/underdispersi yaitu model regresi Generalized Poisson.
Menurut Wang dan Famoye dalam Ismail dan Jemain (2007), regresi
generalized poisson memiliki fungsi kepekatan peluang sebagai
berikut:
𝑓𝑖(𝑦𝑖 , 𝜇𝑖, 𝜙) = (𝜇𝑖
1+𝜙𝜇𝑖)𝑦𝑖 (1+𝜙𝑦𝑖)
𝑦𝑖−1
𝑦𝑖!𝑒𝑥𝑝 [
−𝜇𝑖(1+𝜙𝑦𝑖)
1+𝜙𝜇𝑖], (2.11)
𝑖 = 0,1,2,…
di mana ∅ merupakan parameter dispersi. Model 𝜇𝑖 dari regresi
Generalized Poisson dituliskan dalam bentuk sebagai berikut:
�̂� = �̂�𝑖 = exp (∑ βjXjipj=0 ) (2.12)
di mana �̂� merupakan penduga bagi β. Rata-rata dan ragam dari
𝑦𝑖 adalah sebagai berikut:
𝐸(𝑌𝑖) = 𝜇𝑖 (2.13)
𝑉(𝑌𝑖) = 𝜇𝑖(1 + 𝜇𝑖)2 (2.14)
Model regresi Generalized Poisson adalah generalisasi dari
model regresi Poisson. Pada model regresi Generalized Poisson jika
𝜙 = 0 maka model akan tereduksi menjadi model regresi Poisson.
Kondisi overdispersi ditunjukkan dengan nilai 𝜙 > 0, sedangkan
underdispersi jika 𝜙 < 0.
10
2.5.1 Pendugaan Parameter Regresi Generalized Poisson
Menurut Ismail dan Jemain (2007), metode yang digunakan
untuk pendugaan parameter dalam Generalized Poisson adalah
metode Maximum Likelihood Estimation (MLE) dengan cara
memaksimumkan fungsi likelihood. Fungsi likelihood dari
Generalized Poisson adalah sebagai berikut:
𝐿(𝛽; 𝜙) = ∏ [𝜇𝑖
1+𝜙𝜇𝑖]𝑦𝑖[(1+𝜙𝜇𝑖)
𝑦𝑖−1
𝑦𝑖!] 𝑒𝑥𝑝 [
−𝜇𝑖(1+𝜙𝜇𝑖)
1+𝜙𝜇𝑖]𝑛
𝑖=1 (2.15)
Fungsi ln likelihood dari Generalized Poisson adalah sebagai
berikut:
ln 𝑙 (𝛽; 𝜙) = ∑ [𝑦𝑖 ln (𝜇𝑖
1+𝜙𝑖) + (𝑦𝑖 − 1) ln(1 + 𝜙𝑖) −
𝑛𝑖=1
ln(𝑦𝑖!) − (𝜇𝑖(1+𝜙𝜇𝑖)
1+𝜙𝜇𝑖)] (2.16)
Terdapat dua tahap pendugaan, yaitu pendugaan terhadap
parameter 𝛽 dan 𝜙
1. Pendugaan terhadap 𝛽
Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝛽
dilakukan dengan Maximum Likelihood Estimation (MLE) dengan
menurunkan fungsi likelihood terhadap 𝛽 dan disamakan dengan nol
sehingga diperoleh persamaan: 𝜕𝐿(𝛽)
𝜕𝛽𝑗= ∑
(𝑦𝑖−𝜇𝑖)𝑥𝑖𝑗
(1+ 𝜙𝜇𝑖)2
𝑛𝑖=1 = 0 (2.17)
𝑗 = 1,2, … , 𝑝
Persamaan diselesaikan dengan metode Iteratively Reweighted
Least Square (IRLS) dan Fisher Scoring. Metode iterasi IRLS adalah
metode yang digunakan untuk memecahkan masalah optimasi
tertentu dengan fungsi tujuan. Persamaan iteratif regresi IRLS
dengan metode Fisher Scoring adalah sebagai berikut:
𝜷(𝑟) = 𝜷(𝑟−1) + (𝐗𝑇𝐖(r−1)𝐗)
−1𝐗𝑇𝐖(𝑟−1)𝐤(𝑟−1), (2.18)
𝑟 = 1,2, … , 𝑛
di mana:
𝜷(𝑟) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-r
𝜷(𝑟−1) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-(r-1)
𝐗𝑇 = matriks kebalikan variabel prediktor berukuran (𝑝 + 1)×𝑛
11
𝐖(𝑟−1) = diagonal matriks pembobot dengan elemen 𝑤𝑖 pada iterasi
ke-(r-1). Pada distribusi Generalized Poisson, elemen
diagonal ke-i dari W adalah:
𝑾𝑖 =𝜇𝑖
(1+𝜙𝜇𝑖)2 (2.19)
𝐤(𝑟−1) = vektor kolom dengan elemen ke-i
𝐤𝑖 =(𝑦𝑖−𝜇𝑖)
𝜇𝑖 (2.20)
Penduga awal bagi β diperoleh melalui metode MLE dengan
meregresikan logaritma dari variabel respon terhadap variabel
prediktor. Kemudian dilakukan iterasi sampai didapatkan penduga
bagi β yang konvergen yaitu ketika ‖𝜷(𝑟) − 𝜷(𝑟−1)‖ < 10−5
2. Pendugaan terhadap 𝜙
Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝜙
dilakukan dengan MLE dengan menerapkan metode iterasi Newton-
Raphson seperti berikut:
�̂�𝑟 = �̂�(𝑟−1) −𝑓′(�̂�(𝑟−1))
𝑓"(�̂�(𝑟−1)) (2.21)
Di mana 𝑓′ merupakan turunan pertama dari persamaan (2.16)
terhadap �̂�, dan 𝑓" merupakan turunan kedua dari persamaan (2.16)
terhadap �̂�. Agar memenuhi syarat 1 + 𝜙𝜇𝑖 > 0 dan 1 + 𝜙𝑦𝑖 > 0,
maka perlu dilakukan pembatasan terhadap nilai �̂� pada proses
iterasi, yaitu: �̂� =
{
−
1
max(𝜇𝑖)+1; 𝑗𝑖𝑘𝑎 𝜙 < 0 𝑑𝑎𝑛 𝜙 ≤ −
1
max(𝜇𝑖)
−1
max(𝑦𝑖)+1; 𝑗𝑖𝑘𝑎 𝜙 < 0 𝑑𝑎𝑛 𝜙 ≤ −
1
max(𝑦𝑖)
min (−1
max(𝜇𝑖)+1, −
1
max(𝑦𝑖)+1) ; 𝑗𝑖𝑘𝑎 𝜙 < 0, 𝜙 ≤ −
1
max(𝜇𝑖), 𝑑𝑎𝑛 𝜙 ≤ −
1
max(𝑦𝑖)
(2.22)
2.6 Analisis Regresi Binomial Negatif
Binomial negatif termasuk anggota sebaran keluarga
eksponensial sehingga regresi binomial negatif merupakan salah satu
model regresi dari Generalized Linear Model (GLM). Regresi
binomial negatif dapat digunakan sebagai alternatif untuk
memodelkan data poisson yang mengalami overdispersi. Menurut
12
Berk dan Macdonald (2008), fungsi kepekatan peluang regresi
binomial negatif adalah sebagai berikut:
𝑓𝑖(𝑦𝑖 , 𝜇𝑖 , 𝜙) =Γ(𝑦𝑖+
1
𝜙)
Γ(1
𝜙)𝑦𝑖!
(1
1+𝜙𝜇𝑖)
1
𝜙(𝜙𝜇𝑖
1+𝜙𝜇𝑖)𝑦𝑖
, 𝑦𝑖 = 0,1,2,… (2.23)
Model 𝜇𝑖 dari regresi Binomial Negatif dinyatakan dalam
bentuk yang sama dengan model regresi Generalized Poisson.
Sebaran binomial negatif mempunyai rata-rata dan ragam sebagai
berikut:
𝐸(𝑌𝑖) = 𝜇𝑖 (2.24)
𝑉(𝑌𝑖) = 𝜇𝑖 + 𝜙𝜇𝑖2 (2.25)
2.6.1 Pendugaan Parameter Regresi Binomial Negatif
Pendugaan parameter regresi binomial negatif dilakukan
dengan menggunakan metode Maximum Likelihood Estimation
(MLE). Fungsi likelihood dari binomial negative adalah:
𝐿(𝛽;𝜙) = ∑ [(∑ ln(𝑟 + 𝜙−1)𝑦𝑖−1𝑟=0 ) − ln(𝑦𝑖!) + 𝑦𝑖 ln(𝜙𝜇𝑖) −
𝑛𝑖=1
(𝜙−1 + 𝑦𝑖) ln(1 + 𝜙𝜇𝑖)] (2.26)
Dengan fungsi ln likelihood sebagai berikut:
ln 𝑙(𝛽; 𝜙) =∑ [(∑ ln(𝑟 + 𝜙−1)𝑦𝑖−1𝑟=0 ) − ln(𝑦𝑖!) + 𝑦𝑖 ln(𝜙𝜇𝑖) −
𝑛𝑖=1
(𝑦𝑖 +1
𝜙) ln(𝜙𝜇𝑖 + 1)] (2.27)
Menurut Simarmata dan Ispriyanti (2011), pendugaan
parameter regresi Binomial Negatif dapat dilakukan dengan langkah-
langkah sebagai berikut:
1. Menentukan penduga awal bagi 𝜙, misal 𝜙1̂ = 0
2. Menduga 𝜷 dengan iterasi Fisher Scoring dengan asumsi 𝜙 =𝜙1̂. Berikut adalah rumus untuk iterasi Fisher Scoring:
�̂�𝑖+1 = �̂�𝑖 + (𝑿𝑻𝑾𝑿)
−1𝑿𝑻𝑾𝒛 (2.28)
W adalah matriks pembobot dengan ukuran n × n , di mana
elemen diagonal ke-i adalah 𝑤𝑖 dan vektor kolom dengan elemen
ke-i yaitu 𝑧𝑖, di mana:
𝑤𝑖 =𝜇𝑖
1+𝜙𝜇𝑖 dan 𝑧𝑖 =
(𝑦𝑖−𝜇𝑖)
𝜇𝑖 (2.29)
Iterasi berakhir jika �̂�𝑖+1 = �̂�𝑖
13
3. �̂� yang dihasilkan dari iterasi Fisher Scoring digunakan untuk
menduga parameter 𝜙 dengan iterasi Newton-Raphson.
Persamaan iterasi Newton-Raphson adalah:
�̂�𝑖+1 = �̂�𝑖 −𝑓′(𝜙)
𝑓"(𝜙) (2.30)
Iterasi berakhir jika �̂�𝑖+1 = �̂�𝑖
4. Jika |�̂�𝑖+1 − �̂�𝑖| < 𝜀 maka pendugaan selesai, jika tidak maka
gunakan parameter 𝜙𝑖 = �̂�𝑖+1 dan kembali ke langkah 2.
2.7 Analisis Regresi Lagrange poisson
Sebaran lagrange poisson merupakan pengembangan dari
sebaran Poisson. Regresi lagrange poisson adalah salah satu
alternatif untuk memodelkan data poisson yang mengalami
overdispersi. Menurut Consul dan Famoye dalam Ismail dan Jemain
(2007), fungsi kepekatan peluang regresi Lagrange poisson adalah
sebagai berikut:
𝑓(𝑦𝑖; 𝜇𝑖; 𝜙) = 𝜇𝑖[𝜇𝑖 + (𝜙 − 1)𝑦𝑖]𝑦𝑖−1 [
exp−[𝜇𝑖+(𝜙−1)𝑦𝑖]
𝑦𝑖!], (2.31)
𝑦𝑖 = 0,1,2,…
Model 𝜇𝑖 regresi Lagrange poisson dapat dinyatakan dalam
bentuk yang sama dengan model regresi Poisson dan Generalized
Poisson yaitu pada persamaan (2.11). Model regresi lagrange poisson
memiliki rata-rata dan ragam sebagai berikut:
𝐸(𝑌𝑖) = 𝜇𝑖 (2.32)
𝑉(𝑌𝑖) = 𝜙2𝜇𝑖 (2.33)
2.7.1 Pendugaan Parameter Regresi Lagrange poisson
Pendugaan parameter regresi lagrange poisson dilakukan
dengan metode Maximum Likelihood Estimation (MLE). Fungsi
likelihood dari lagrange poisson menurut Ismail dan Jemain (2007)
adalah sebagai berikut:
𝐿(𝛽) = ∑ log(𝜇𝑖) + (𝑦𝑖 − 1) log(𝜇𝑖 + (𝜙 − 1)𝑦𝑖) − 𝑦𝑖𝑛𝑖=1 log(𝜙) −
𝜇𝑖+(𝜙−1)𝑦𝑖
𝜙− log(𝑦𝑖!) (2.34)
Pendugaan parameter regresi Lagrange poisson dilakukan
dalam dua tahap yaitu pendugaan terhadap 𝛽 dan 𝜙.
1. Pendugaan terhadap 𝛽
14
Menurut Ismail dan Jemain (2007), pendugaan terhadap 𝛽
dilakukan dengan metode kemungkinan maksimum untuk GLM,
sehingga diperoleh persamaan:
𝜕𝐿(𝛽)
𝜕𝛽𝑗= ∑
𝜕𝐿𝑖
𝜕𝛽𝑗= ∑
(𝑦𝑖−�̂�𝑖)𝑥𝑖𝑗
�̂�𝑖2
𝑛𝑖=1
𝑛𝑖=1 = 0, (2.35)
𝑗 = 1,2, … , 𝑝
Menurut Agresti (2002), untuk memperoleh �̂� persamaan
diselesaikan dengan metode gabungan Iteratively Reweighted Least
Square (IRLS) dan Fisher Scoring. Metode iterasi IRLS adalah
metode yang digunakan untuk memecahkan masalah optimasi
tertentu dengan fungsi tujuan. Persamaan iterative regresi IRLS
menggunakan metode Fisher Scoring adalah:
𝜷(𝑟) = 𝜷(𝑟−1) + (𝐗𝑇𝐖(r−1)𝐗)
−1𝐗𝑇𝐖(𝑟−1)𝐳(𝑟−1), (2.36)
𝑟 = 1,2, … , 𝑛
di mana:
𝜷(𝑟) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-r
𝜷(𝑟−1) = vektor 𝛽 berukuran (𝑝 + 1)×1 pada iterasi ke-(r-1)
𝐗𝑇 = matriks kebalikan variabel prediktor berukuran (𝑝 + 1)×𝑛
𝐖(𝑟−1) = diagonal matriks pembobot dengan elemen 𝑤𝑖 pada iterasi
ke-(r-1)
𝐳(𝑟−1) = vektor kolom dengan elemen ke-i
𝑧𝑖 =(𝑦𝑖−𝜇𝑖)
𝜇𝑖 (2.37)
Penduga awal bagi β diperoleh melalui metode MLE dengan
meregresikan logaritma dari variabel respon terhadap variabel
prediktor. Kemudian dilakukan iterasi sampai didapatkan penduga
bagi β yang konvergen yaitu ketika ‖𝜷(𝑟) − 𝜷(𝑟−1)‖ < 10−5
2. Pendugaan terhadap 𝜙
Pendugaan terhadap 𝜙 dilakukan menggunakan metode momen
dengan menyamakan statistic uji Khi-Kuadrat Pearson dengan
derajat bebas (n-k).
∑(𝑦𝑖−�̂�𝑖)
2
�̂�𝑖𝜙2
𝑛𝑖=1 = 𝑛 − 𝑘 (2.38)
Sehingga diperoleh persamaan:
�̂� = √∑(𝑦𝑖−�̂�𝑖)
2
�̂�𝑖(𝑛−𝑘)𝑛𝑖=1 (2.39)
15
2.8 Pengujian Secara Simultan
Pengujian parameter secara simultan atau serentak bertujuan
mengetahui signifikansi koefisien regresi secara keseluruhan.
Pengujian secara simultan dapat dilakukan dengan statistik uji G
(Agresti, 2007). Hipotesis yang digunakan adalah sebagai berikut:
H0 ∶ βj = 0, tidak ada pengaruh antara variabel prediktor dengan
variabel respon
H1 : minimal ada satu j dimana βj ≠ 0, minimal terdapat satu
variabel prediktor berpengaruh terhadap variabel respon.
Statistik uji yang digunakan adalah:
G = −2 ln[L0 − Lp] (2.40)
Di mana:
𝐿0: ln likelihood model tanpa variabel prediktor
𝐿𝑝: ln likelihood model dengan p variabel prediktor
Statistik uji G mengikuti sebaran 𝜒2 dengan derajat bebas (db) p. Hipotesis nol ditolak apabila statistik uji 𝐺 > 𝜒𝑝(𝛼)
2
2.9 Pengujian Secara Parsial
Setelah melakukan pengujian secara simultan, uji yang harus
dilakukan adalah pengujian secara pasrial, Pengujian parameter
model secara parsial dilakukan untuk mengetahui pengaruh masing-
masing variabel prediktor terhadap variabel respon. Menurut Hosmer
dan Lemeshow (2000) statistik uji yang digunakan untuk pengujian
secara parsial adalah statistic uji Wald. Hipotesis yang digunakan
adalah sebagai berikut:
H0 : βj = 0 ; variabel prediktor tidak berpengaruh terhadap variabel
respon
H1 : βj ≠ 0 ; variabel prediktor berpengaruh terhadap variabel respon
Statistik uji yang digunakan adalah:
𝑊𝑗 = (�̂�𝑗
𝑠𝑒(�̂�𝑗))2
(2.41)
di mana :
𝛽𝑗 : koefisien model variabel prediktor ke-j.
𝑆𝐸(𝛽𝑗) : standard error dari pendugaan maximum likelihood
Hipotesis nol di tolak jika statistik uji 𝑊𝑗2 > 𝜒1(𝛼)
2
16
2.10 Uji Kelayakan Model (Goodness of Fit)
Menurut Ismail dan Jemain (2007), salah satu metode yang
dapat digunakan untuk meguji kelayakan model adalah Uji Khi
Kuadrat Pearson dengan hippotesis sebagai berikut:
H0: model layak
H1: model tidak layak
Rumus yang digunakan untuk menghitung nilai Khi Kuadrat
Pearson adalah sebagai berikut:
𝜒2 = ∑(𝑦𝑖−𝜇)
2
𝑉𝑎𝑟 (𝑌)𝑛𝑖=1 (2.42)
di mana:
𝑦𝑖 : nilai variabel respon pada pengamatan ke-i
𝜇 : penduga bagi respon rata-rata ke-i
Keputusan menerima H0 dilakukan apabila 𝜒2 < 𝜒𝛼(𝑛−𝑝)2 atau
𝑃[𝜒𝛼(𝑛−𝑝)2 < 𝜒2] lebih kecil dari taraf nyata (𝛼). Hal ini
menunjukkan bahwa model yang diperoleh layak. Model yang lebih
baik untuk digunakan adalah model yang memiliki nilai Khi Kuadr
Pearson lebih kecil.
2.11 Penyakit Demam Berdarah Dengue
Menurut Widoyono (2011), penyakit demam berdarah
dengue (DBD) yang disebut juga dengue hemorrhagic fever (DHF),
dengue fever (DF), demam dengue (DD), dan dengue shock
syndrome (DSS) disebabkan oleh virus dengue dari kelompok
Arbovirus B, yaitu arthropod-borne virus atau virus yang disebabkan
oleh artropoda. Virus ini termasuk genus Flavivirus dan family
Flaviviridae. Vektor utama penyakit DBD adalah nyamuk Aedes
aegepty di daerah perkotaan dan Aedes albopictus di daerah
pedesaan. Ciri-ciri nyamuk Aedes aegepty adalah:
1. Sayap dan badannya belang-belang atau bergaris-garis putih
2. Berkembang biak di air jernih yang tidak beralaskan tanah
seperti bak mandi, wc, pot tanaman air, dll.
3. Jarak terbang kurang lebih 100m.
4. Nyamuk betina bersifat multiple biters yang berarti
menggigit beberapa orang karena berpindah tempat sebelum
kenyang.
5. Tahan dalam suhu panas dan kelembaban tinggi.
17
Di Kota Malang, penyakit DBD merupakan salah satu
kejadian luar biasa (KLB) dengan jumlah yang terus meningkat.
Mengingat bahayanya penyakit DBD yang dapat menyebabkan
kematian, perlu dilakukan penanganan lebih lanjut dengan terlebih
dahulu menganalisis faktor-faktor apa yang memiliki pengaruh
signifikan terhadap kasus DBD, sehingga dapat dilakukan upaya
pencegahan oleh Pemerintah demi menekan angka jumlah kasus
DBD di Kota Malang. Pada penelitian ini, variabel yang digunakan
antara lain adalah sebagai berikut:
1. Jumlah penderita penyakit DBD di Kota Malang pada setiap
puskesmas tahun 2015.
2. Jumlah sarana kesehatan. Banyaknya sarana kesehatan dapat
membantu meminimalisasi penyebaran virus dengue yang
menyebabkan penyakit DBD.
3. Presentase rumah tangga berperilaku hidup bersih dan sehat
(PHBS). Banyaknya rumah tangga berperilaku hidup bersih
dan sehat dapat menekan angka pertumbuhan nyamuk aedes
aegepty yang menyebarkan virus dengue.
4. Jumlah rumah tangga miskin. Karena faktor ekonomi,
sebagian besar rumah tangga miskin memiliki
kecenderungan kurang memperhatikan kesehatan dan
kebersihan yang dapat menyebabkan pesatnya penyebaran
virus dengue.
5. Indeks kepadatan penduduk. Padatnya penduduk pada suatu
wilayah dapat menyebabkan penyebaran virus dengue terjadi
lebih pesat.
6. Angka bebas jentik yang menunjukkan presentase rumah
atau tempat umum yang tidak ditemukan jentik.
19
BAB III
METODE PENELITIAN
3.1 Sumber Data
Data yang digunakan pada penelitian ini adalah data sekunder.
Data sekunder pada penelitian ini adalah data penduduk Kota
Malang yang diperoleh dari Dinas Kesehatan Pemerintah Kota
Malang tahun 2015.
3.2 Variabel Penelitian
Variabel pada penelitian ini berupa variabel respon dan
variabel prediktor.
3.2.1 Variabel Respon (Y)
Pada penelitian ini, variabel respon adalah jumlah penderita
penyakit DBD di Kota Malang pada setiap puskesmas tahun 2015.
3.2.2 Variabel Prediktor (X)
Berikut adalah variabel prediktor pada penelitian ini :
1. Jumlah sarana kesehatan (X1)
2. Presentase rumah tangga ber-PHBS (X2)
3. Jumlah rumah tangga miskin (X3)
4. Indeks kepadatan penduduk (X4)
5. Angka bebas jentik (X5)
3.3 Langkah-langkah Penelitian
Langkah-langkah analisis data pada penelitian ini adalah
sebagai berikut:
1. Melakukan pengujian distribusi Poisson menggunakan
persamaan (2.2)
2. Melakukan uji asumsi non multikolinearitas dengan
persamaan (2.3)
3. Melakukan pendugaan parameter regresi poisson dengan
persamaan (2.7)
4. Mendeteksi adanya overdispersi menggunakan persamaan
(2.4).
5. Jika tidak terdapat overdispersi, model regresi poisson layak
digunakan.
6. Jika terdapat overdospersi, lakukan pendugaan parameter
model Regresi Generalized Poisson, Binomial Negatif, dan
20
Lagrange poisson dengan metode MLE sehingga diperoleh
model seperti pada persamaan (2.12)
7. Pengujian signifikansi parameter regresi
a. Pengujian secara simultan dengan persamaan (2.40)
b. Pengujian secara parsial dengan persamaan (2.41)
8. Melakuikan uji kelayakan model dengan persamaan (2.42) dan
menentukan model terbaik
Adapun diagram alir penelitian disajikan dalam Gambar 3.1 :
21
Tidak
Ya
Pemeriksaan Overdispersi
Mulai
Data
Pengujian Distribusi
Uji Multikolinearitas
Pendugaan parameter regresi
Poisson
A
Terjadi
overdispersi
B
Analisis
regresi
Poisson selesai
22
Tidak
Ya
Gambar 3.1 Diagram Alir Analisis Regresi Poisson
Pengujian secara simultan
Pendugaan parameter regresi
Generalized Poisson, Binomial
Negatif, dan Lagrange poisson
B
Uji Kelayakan Model
Selesai
Pemilihan Model Terbaik
Hasil pengujian
signifikan
Model tidak
sesuai
Model sesuai
Pengujian secara parsial
A
23
BAB IV
HASIL DAN PEMBAHASAN
4.1 Distribusi Poisson
Sebelum melakukan analisis regresi poisson, terlebih dahulu
harus dilakukan pemeriksaan distribusi variabel respon untuk
mengetahui apakah data mengikuti sebaran poisson. Uji yang
digunakan adalah Kolmogorov Smirnov. Berdasarkan hasil pengujian
dengan R Studio pada lampiran 2, diperoleh nilai D sebesar
0.1943029. Nilai tersebut lebih besar dari nilai Kolmogorov Smirnov
pada tabel dengan α = 5% yaitu sebesar 0,338, maka dapat
disimpulkan bahwa variabel respon mengikuti sebaran poisson.
Setelah variabel respon terbukti berdistribusi poisson, lakukan
pengujian asumsi multikolinearitas dan overdispersi.
4.2 Multikolinearitas
Asumsi yang harus dipenuhi dalam analisis regresi Poisson
adalah multikolinearitas. Ketika semua atau sebagian variabel
prediktor berkorelasi satu sama lain, maka dapat dikatakan terdapat
multikolinearitas antar variabel. Salah satu metode yang dapat
digunakan untuk mendeteksi multikolinearitas adalah Variance
Inflation Factors (VIF). Hasil pengujian VIF dapat dilihat pada tabel
4.1 berdasarkan lampiran 2.
Tabel 4.1 Hasil pengujian Asumsi Non Multikolinearitas
Variabel VIF
Jumlah Sarana Kesehatan 1,700134
Rumah Tangga Ber-PHBS 1,225789
Jumlah Rumah Tangga Miskin 1,473269
Kepadatan Penduduk 1,537637
Angka Bebas Jentik 1,132469
Berdasarkan tabel 4.1, dapat dilihat bahwa nilai VIF untuk
semua variabel prediktor memiliki nilai kurang dari 10, sehingga
dapat disimpulkan bahwa antar variabel prediktor tidak terdapat
multikolinearitas. Setelah asumsi pertama terpenuhi yaitu tidak
terdapat multikolinearitas, dilakukan pengujian asumsi kedua yaitu
data tidak mengalami overdispersi.
24
4.3 Regresi Poisson
4.3.1 Pembentukan Model Regresi
Hasil pembentukan model regresi poisson dengan metode
Maximum Likelihood Estimation disajikan pada tabel 4.2, sesuai
dengan lampiran 4.
Tabel 4.2 Hasil Pendugaan Parameter Regresi Poisson
Variabel Koefisien Standard Error
Konstanta 1,21500 1,02400
X1 0,09545 0,05428
X2 0,01909 0,00371
X3 0,00004 0,00002
X4 0,00006 0,00003
X5 -0,01092 0,01272
Berdasarkan Tabel 4.2, model regresi poisson dapat ditulis
sebagai berikut:
𝑌 = 𝜇𝑖 = exp 1,21500 + 0,09545Xi1 + 0,01909Xi2 + 0,00004Xi3
+ 0,00006Xi4 − 0,01902Xi5 Berdasarkan model yang terbentuk, semakin tinggi jumlah
sarana kesehatan, rumah tangga ber-PHBS, jumlah rumah tangga
miskin, dan kepadatan penduduk, jumlah kasus DBD akan
mengalami peningkatan. Sedangkan semakin tinggi angka bebas
jentik, kasus DBD mengalami penurunan.
4.3.2 Uji Signifikansi Parameter Secara Simultan
Pengujian parameter secara simultan bertujuan untuk
mengetahui signifikansi koefisien regresi secara serentak atau
bersama-sama. Hasil pengujian disajikan pada tabel 4.3. Hipotesis
yang digunakan adalah:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : minimal ada satu j dimana βj ≠ 0
Tabel 4.3 Hasil Pengujian Signifikasi Parameter Model Regresi
Poisson Sacara Simultan
Model Statitsik Uji G 𝝌𝒅𝒃(𝜶)𝟐 Keputusan
Poisson 40,935 3,325 Tolak H0
Berdasarkan hasil pengujian, dapat disimpulkan bahwa pada
model poisson, semua variabel prediktor secara bersama-sama
menentukan banyaknya kasus DBD.
25
4.3.3 Uji Signifikansi Parameter Secara Parsial
Pengujian secara parsial bertujuan untuk mengetahui
signifikansi koefisien regresi pada masing-masing variabel prediktor
dengan hipotesis sebagai berikut:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.4 Hasil Pengujian Signifikansi Parameter Model Regresi
Poisson Secara Parsial
Variabel Statistik Uji Wald P-value
Konstanta 1,187 0,23530000
X1 1,758 0,07870000
X2 5,151 0,00000026
X3 2,191 0,28500000
X4 2,355 0,01850000
X5 -0,858 0,39080000
Hasil uji Wald menunjukkan bahwa presentase rumah tangga
ber-PHBS, jumlah rumah tangga miskin, dan kepadatan penduduk
memiliki pengaruh secara parsial terhadap jumlah kasus DBD.
Selanjutnya dilakukan pengujian apakah data mengalami
overdispersi atau tidak.
4.4 Overdispersi
Asumsi yang harus dipenuhi dalam melakukan analisis regresi
Poisson selanjutnya adalah data tidak mengalami overdispersi.
Overdispersi dapat diketahui dengan melihat nilai rata-rata dan
ragam variabel respon. Jika ragam lebih besar dari rata-rata, dapat
dikatakan data tersebut overdispersi. Selain itu, overdipsersi dapat
diketahui dengan nilai uji chi square pearson kemudian dibagi
dengan derajat bebas, berdasarkan hasil pengujian yang disajikan
pada lampiran 3, diperoleh parameter dispersi ϕ = 8,261 > 1, maka
dapat disimpulkan bahwa data mengalami overdispersi. Jika data
mengalami overdispersi, analisis regresi Poisson memiliki hasil yang
tidak efisien sehingga perlu dilakukan penanganan overdispersi.
Beberapa analisis yang dapat digunakan untuk menangani data yang
mengalami overdispersi diantaranta Regresi Generalized Poisson,
Regresi Binomial Negatif, dan Regresi Lagrange poisson.
26
4.5 Regresi Generalized Poisson
4.5.1 Pembentukan Model Regresi
Regresi generalized poisson adalah salah satu model regresi
yang sesuai digunakan pada data yang mengalami overdispersi.
Pembentukan model generalized poisson memperoleh hasil yang
disajikan pada tabel 4.5 berdasarkan lampiran 5:
Tabel 4.5 Hasil Pendugaan Parameter Regresi Generalized Poisson
Variabel Koefisien Standard Error
Konstanta 1,7741 1,7753
X1 0,1375 0,0948
X2 0,0193 0,0061
X3 0,0000 0,0000
X4 0,0001 0,0000
X5 -0,0175 0,0217
Berdasarkan Tabel 4.5, model regresi generalized poisson
dapat ditulis seagai berikut:
𝑌 = 𝜇𝑖 = exp 1,7741 + 0,1375𝑋𝑖1 + 0,0193𝑋𝑖2 + 0,0000𝑋𝑖3
+ 0,0001𝑋𝑖4 − 0,0175𝑋𝑖5 Berdasarkan model yang terbentuk, semakin tinggi jumlah
sarana kesehatan, presentase rumah tangga ber-PHBS, jumlah
keluarga miskin, dan kepadatan penduduk, jumlah kasus DBD
mengalami peningkatan. Sedangkan semakin tinggi presentase angka
bebas jentik, kasus DBD mengalami penurunan. Selanjutnya
dilakukan uji signifikansi parameter secara simultan/bersama-sama.
4.5.2 Uji Signifikansi Parameter Secara Simultan
Pengujian parameter secara simultan bertujuan untuk
mengetahui signifikansi koefisien regresi secara serentak atau
bersama-sama. Hipotesis yang digunakan adalah sebagai berikut:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : minimal ada satu j dimana βj ≠ 0
Tabel 4.6 Hasil Pengujian Signfikansi Parameter Model Regresi
Generalized Poisson Secara Simultan
Model Statitsik Uji G 𝝌𝒅𝒃(𝜶)𝟐 Keputusan
Generalized
Poisson 10,0019 3,325 Tolak H0
27
Berdasarkan hasil pengujian, dapat disimpulkan bahwa pada
model generalized poisson, semua variabel prediktor secara bersama-
sama menentukan banyaknya kasus DBD.
4.5.3 Uji Signifikansi Parameter Secara Parsial
Pengujian secara parsial bertujuan untuk mengetahui
signifikansi koefisien regresi pada masing-masing variabel prediktor.
Hipotesis yang digunakan adalah sebagai berikut:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.7 Hasil Pengujian Signfikansi Parameter Model Regresi
Generalized Poisson Secara Parsial
Variabel Statistik Uji Wald P-value
Konstanta 0,9993 0,3176
X1 1,4498 0,1471
X2 3,1554 0,0016
X3 0,7745 0,4386
X4 1,2298 0,2188
X5 -0,8063 0,4200
Hasil uji Wald menunjukkan bahwa presesntase rumah tangga
ber-PHBS (X2) memiliki pengaruh secara parsial terhadap
banyaknya kasus DBD. Untuk melakukan uji parameter secara
parsial digunakan metode backward. Variabel prediktor dengan nilai
P-value paling besar melebihi 5% dikeluarkan dari model sehingga
terbentuk model baru. Dapat dilihat dari tabel 4.7, variabel prediktor
yang memiliki P-value terbesar adalah jumlah rumah tangga miskin
(X3), sehingga variabel X3 dikeluarkan dari model. Terbentuk
estimasi parameter yang baru seperti pada Lampiran 11. Model yang
terbentuk adalah sebagai berikut:
𝑌 = 𝜇𝑖 = exp 1,7368 + 0,1773𝑋𝑖1 + 0,0180𝑋𝑖2 + 0,0001𝑋𝑖4
− 0,0156𝑋𝑖5 Berdasarkan Lampiran 11 didapatkan variabel X5 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
𝑌 = 𝜇𝑖 = exp 0,5876 + 0,1649𝑋𝑖1 + 0,0176𝑋𝑖2 + 0,0001𝑋𝑖4 Berdasarkan Lampiran 12 diperoleh variabel X4 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
28
𝑌 = 𝜇𝑖 = exp 1,2478 + 0,1173𝑋𝑖1 + 0,0176𝑋𝑖2 Model menunjukkan bahwa setiap kenaikan 1 unit sarana
kesehatan akan meningkatkan kasus DBD sebanyak exp(0,1173) =
1,124 kasus, dan setiap kenaikan 1% rumah tangga ber-PHBS akan
meningkatkan jumlah kasus DBD sebanyak exp(0,0176) = 1,017
kasus. Selanjutnya dilakukan pendugaan parameter Regresi Binomial
Negatif.
4.6 Regresi Binomial Negatif
4.6.1 Pembentukan Model Regresi
Salah satu alternatif untuk memodelkan data overdispersi
adalah model regresi binomial negatif. Berdasarkan hasil pengujian
yang terdapat pada lampiran 6, model regresi binomial negatif yang
terbentuk adalah sebagai berikut:
Tabel 4.8 Hasil Pendugaan Parameter Regresi Binomial Negatif
Variabel Koefisien Standard Error
Konstanta 1,6600 1,746
X1 0,1242 9,270
X2 0,0191 6,030
X3 0,0000 3,309
X4 0,0001 4,367
X5 -0,0159 2,140
Berdasarkan Tabel 4.8, model regresi binomial negatif dapat
ditulis sebagai berikut:
𝑌 = 𝜇𝑖 = exp 1,6600 + 0,1242𝑋𝑖1 + 0,0191𝑋𝑖2 + 0,0000𝑋𝑖3
+ 0,0001𝑋𝑖4 − 0,0159𝑋𝑖5 Berdasarkan model yang terbentuk, semakin tinggi jumlah
sarana kesehatan, presentase rumah tangga ber-PHBS, jumlah rumah
tangga miskin dan kepadatan penduduk, maka jumlah kasus DBD
akan meningkat. Sebaliknya, semakin tinggi presentase angka bebas
jentik, maka jumlah kasus DBD akan mengalami penurunan.
Selanjutnya dilakukan uji signifikansi parameter secara simultan.
4.6.2 Uji Signifikansi Parameter Secara Simultan
Hasil pengujian signifikansi parameter secara simultan pada
model regresi binomial negatif disajikan pada tabel 4.9. Hipotesis
yang digunakan adalah sebagai berikut:
29
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : minimal ada satu j dimana βj ≠ 0
Tabel 4.9 Hasil Pengujian Signifikansi Parameter Regresi Binomial
Negatif Secara Simultan
Model Statitsik Uji G 𝝌𝒅𝒃(𝜶)𝟐 Keputusan
Binomial
Negatif 14,714 3,325 Tolak H0
Berdasarkan hasil pengujian, dapat disimpulkan bahwa pada
model binomial negatif semua variabel prediktor secara bersama-
sama tidak menentukan banyaknya kasus DBD.
4.6.3 Uji Signifikansi Parameter Secara Parsial
Hasil pengujiansignifikansi parameter secara parsial untuk
model regresi binomial negatif dapat dilihat pada tabel 4.10.
Hipotesis yang digunakan adalah:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.10 Hasil Pengujian Signifikansi Parameter Regresi Binomial
Negatif Secara Parsial
Variabel Statistik Uji Wald P-value
Konstanta 0,951 0,34159
X1 1,340 0,18024
X2 3,163 0,00156
X3 0,933 0,35084
X4 1,263 0,20642
X5 -0,742 0,45806
Hasil uji Wald menunjukkan bahwa variabel X2 memiliki
pengaruh secara parsial terhadap banyaknya kasus DBD. Untuk
melakukan uji parameter secara parsial digunakan metode backward.
Variabel prediktor dengan nilai P-value paling besar melebihi 5%
dikeluarkan dari model sehingga terbentuk model baru. Dapat dilihat
dari tabel 4.10, variabel prediktor yang memiliki P-value terbesar
adalah presentase angka bebas jentik (X5), sehingga variabel X5
dikeluarkan dari model. Terbentuk estimasi parameter yang baru
seperti pada Lampiran 14. Model yang terbentuk adalah sebagai
berikut:
30
𝑌 = 𝜇𝑖 = exp 0,5003 + 0,1189𝑋𝑖1 + 0,0185𝑋𝑖2 + 0,0000𝑋𝑖3
+ 0,0001𝑋𝑖4 Berdasarkan Lampiran 14 didapatkan variabel X3 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
𝑌 = 𝜇𝑖 = exp 0,6598 + 0,1550𝑋𝑖1 + 0,0168𝑋𝑖2 + 0,0001𝑋𝑖4 Berdasarkan Lampiran 15 diperoleh variabel X4 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
𝑌 = 𝜇𝑖 = exp 1,3605 + 0,1021𝑋𝑖1 + 0,0167𝑋𝑖2 Model menunjukkan bahwa setiap kenaikan 1 unit sarana
kesehatan akan meningkatkan kasus DBD sebanyak exp(0,1021) =
1,128 kasus, dan setiap kenaikan 1% rumah tangga ber-PHBS akan
meningkatkan jumlah kasus DBD sebanyak exp(0,0167) = 1,016
kasus. Selanjutnya dilakukan pendugaan parameter Regresi
Lagrange poisson.
4.7 Regresi Lagrange poisson
4.7.1 Pembentukan Model Regresi
Regresi lagrange poisson adalah salah satu model regresi yang
sesuai digunakan pada data yang mengalami overdispersi.
Pembentukan model lagrange poisson memperoleh hasil yang
disajikan pada tabel 4.11 berdasarkan lampiran 7.
Tabel 4.11 Hasil Pendugaan Parameter Regresi Lagrange poisson
Variabel Koefisien Standard Error
Konstanta 1,2148 0,5789
X1 0,0954 0,4110
X2 0,0191 0,0160
X3 0,0000 0,3056
X4 0,0001 0,2709
X5 -0,0109 0,6882
Berdasarkan Tabel 4.11, model regresi lagrange poisson dapat
ditulis seagai berikut:
𝑌 = 𝜇𝑖 = exp 1,2148 + 0,0954𝑋𝑖1 + 0,0191𝑋𝑖2 + 0,0000𝑋𝑖3
+ 0,0001𝑋𝑖4 − 0,0109𝑋𝑖5 Berdasarkan model yang terbentuk, semakin tinggi jumlah
sarana kesehatan, rumah tangga ber-PHBS, jumlah rumah tangga
31
miskin, dan kepadatan penduduk, jumlah kasus DBD akan
mengalami peningkatan. Sedangkan semakin tinggi angka bebas
jentik, kasus DBD mengalami penurunan.
4.7.2 Uji Signifikansi Parameter Secara Simultan
Hasil pengujian signifikansi parameter secara simultan pada
model regresi lagrange poisson disajikan pada tabel 4.12. Hipotesis
yang digunakan adalah sebagai berikut:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : minimal ada satu j dimana βj ≠ 0
Tabel 4.12 Hasil Pengujian Signifikansi Parameter Model Regresi
Lagrange poisson Secara Simultan
Model Statitsik Uji G 𝝌𝒅𝒃(𝜶)𝟐 Keputusan
Lagrange
poisson 7,7622 3,325 Tolak H0
Berdasarkan hasil pengujian, dapat disimpulkan bahwa pada
model lagrange poisson seluruh variabel prediktor secara bersama-
sama menentukan banyaknya kasus DBD.
4.7.3 Uji Signifikansi Parameter Secara Parsial
Hasil pengujiansignifikansi parameter secara parsial untuk
model regresi lagrange poisson dapat dilihat pada tabel 4.13.
Hipotesis yang digunakan adalah:
H0 ∶ β1 = β2 = ⋯ = β5 = 0
H1 : β1 = β2 = ⋯ = β5 ≠ 0 Tabel 4.13 Hasil Pengujian Seignifikansi Parameter Model Regresi
Lagrange poisson Secara Parsial
Variabel Statistik Uji Wald P-value
Konstanta 0,5550 0,5789
X1 0,8222 0,4110
X2 2,4085 0,0160
X3 1,0244 0,3056
X4 1,1009 0,2709
X5 -0,4013 0,6882
Hasil uji Wald menunjukkan bahwa presentase rumah tangga
ber-PHBS memiliki pengaruh secara parsial terhadap banyaknya
kasus DBD. Setelah didapatkan beberapa model dari analisis untuk
mengatasi overdipsersi, dilanjutkan dengan memilih model yang
32
terbaik. Untuk melakukan uji parameter secara parsial digunakan
metode backward. Variabel prediktor dengan nilai P-value paling
besar melebihi 5% dikeluarkan dari model sehingga terbentuk model
baru. Dapat dilihat dari tabel 4.13, variabel prediktor yang memiliki
P-value terbesar adalah presentase angka bebas jentik (X5), sehingga
variabel X5 dikeluarkan dari model. Terbentuk estimasi parameter
yang baru seperti pada Lampiran 17. Model yang terbentuk adalah
sebagai berikut:
𝑌 = 𝜇𝑖 = exp 0,4334 + 0,0922𝑋𝑖1 + 0,0187𝑋𝑖2 + 0,0000𝑋𝑖3
+ 0,0001𝑋𝑖4 Berdasarkan Lampiran 18 didapatkan variabel X1 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
𝑌 = 𝜇𝑖 = exp 0,7440 + 0,0205𝑋𝑖2 + 0,0000𝑋𝑖3 + 0,0000𝑋𝑖4 Berdasarkan Lampiran 19 diperoleh variabel X4 memiliki
P-value terbesar sehingga dikeluarkan dari model, dan model yang
terbentuk adalah:
𝑌 = 𝜇𝑖 = exp 1,1248 + 0,0196𝑋𝑖2 + 0,0000𝑋𝑖3 Model menunjukkan bahwa setiap kenaikan 1% rumah tangga
ber-PHBS akan meningkatkan kasus DBD sebanyak exp(0,0196) =
1,019 kasus, dan setiap kenaikan 1 rumah tangga miskin akan
meningkatkan jumlah kasus DBD sebanyak exp(0,0000) = 1 kasus.
Pada pengujian dengan regresi generalized poisson, binomial
negatif, dan lagrange poisson didapatkan beberapa hasil yang tidak
logis. Menurut teori, jumlah sarana kesehatan dan presentase rumah
tangga ber-PHBS seharusnya berbanding terbalik terhadap jumlah
kasus DBD. Namun pada penelitian kali ini, jumlah sarana kesehatan
dan presentase rumah tangga ber-PHBS berbanding lurus terhadap
jumlah kasus DBD. Menurut peneliti, hal ini disebabkan
meningkatnya jumlah sarana kesehatan dan presentase rumah tangga
ber-PHBS juga diiringi dengan jumlah penduduk yang terus
mengalami peningkatan sehingga menyebabkan jumlah kasus DBD
turut meningkat.
4.8 Uji Kelayakan Model
Uji Kelayakan model dapat dilakukan dengan melihat nilai
Khi Kuadrat Pearson yang dapat dilihat pada tabel 4.14. Hipotesis
yang digunakan adalah sebagai berikut:
33
H0 ∶ model layak
H1 : model tidak layak Tabel 4.14 Hasil Uji Khi Kuadrat Pearson
Model Khi Kuadrat
Pearson 𝝌𝜶 𝒏−𝒑
𝟐 Keputusan
Regresi Generalized
Poisson 13,78
18,3
Terima H0
Regresi Binomial
Negatif 0,22 Terima H0
Regresi Lagrange
poisson 9,00 Terima H0
Tabel 4.14 menunjukkan bahwa model regresi Generalized
Poisson, Binomial Negatif, dan Lagrange Poisson layakuntuk
digunakan. Model Binomial Negatif menghasilkan nilai Khi Kuadrat
Pearson paling kecil dibandingkan model regresi generalized
poisson dan regresi lagrange poisson, sehingga regresi Binomial
Negatif lebih tepat untuk memodelkan data kasus DBD di Kota
Malang pada tahun 2015.
35
BAB V
KESIMPULAN
5.1 Kesimpulan
1. Berdasarkan hasil analisis pada penelitian ini didapatkan model
sebagai berikut:
a. Model Regresi Generalized Poisson
Y = 𝜇𝑖 = exp 1,2478 + 0,1173𝑋𝑖1 + 0,0176𝑋𝑖2 b. Model Regresi Binomial Negatif
Y = 𝜇𝑖 = exp 1,3605 + 0,1021𝑋𝑖1 + 0,0167𝑋𝑖2 c. Model Regresi Lagrange poisson
Y = 𝜇𝑖 = exp 1,1248 + 0,0196𝑋𝑖2 + 0,0000𝑋𝑖3 2. Berdasarkan nilai Khi Kuadrat Pearson, ketiga model layak
digunakan, dan model terbaik yang digunakan adalah model
regresi Binomial Negatif karena menghasilkan nilai 𝜒2 paling
kecil.
3. Dari 5 variabel prediktor pada penelitian ini, terdapat 1 variabel
yang berpengaruh signifikan terhadap kasus DBD di Kota
Malang pada tahun 2015, yaitu presentase rumah tangga ber-
PHBS.
5.2 Saran
1. Model regresi Binomial Negatif dapat digunakan sebagai
pertimbangan bagi Dinas Kesehatan Kota Malang dalam
mengambil tindakan pencegahan penyebaran jumlah kasus DBD
di Kota Malang.
2. Untuk penelitian selanjutnya, diharapkan ada pengecekan lanjut
terhadap pengaruh rumah tangga berpola hidup bersih dan sehat
terhadap jumlah kasus DBD.
36
37
DAFTAR PUSTAKA
Agresti, A. 2002. Categorical Data Analysis Second Edition. Wiley-
Interscience, Canada
Agresti, A. 2007. An Introduction to Categorical Data Analysis
Second Edition. Wiley-Interscience, Canada
Berk, R. dan J. M. MacDonald, 2008. Overdispersion and Poisson
Regression. Springer, Philadelphia.
Cameron, A. C. Dan P. K. Trivedi, 1998. Regression Analysis of
Count Data. Cambridge University Press, Cambridge.
Hosmer, D.W. dan S. Lemeshow. 2000. Applied Logistic
Reegression, Second Edition. Jon Wiley and Sons. New York.
Ismail, N. dan A.A. Jemain. 2007. Handling Overdispersion with
Negative Binomial and Generalized Poisson Regression
Models. Casuality Actuarial Society Forum.
Kismiantini. 2008. Perbandingan Model Regresi Poisson dan Model
Regresi Binomial Negatif. Jurnal FMIPA Universitas Negeri
Yogyakarta, Yogyakarta.
Kutner, M. H., Nachtshelm, C. J., Neter, J., and Li, W. 2005. Applied
Linear Statistical Models, Fifth Edition. McGraw-Hill
Companies Inc, New York.
Simarmata, R.T dan D. Ispriyanti. 2011. Penanganan Overdispersi
pada Model Regresi Poisson menggunakan Model Regresi
Binomial Negatif. Jurnal Media Statistika Universitas
Diponegoro, Semarang.
Walpole, R. E. 1995. Pengantar Statistika. Gramedia Pustaka
Utama, Jakarta
38
Widoyono. 2008. Penyakit Tropis: Epidemiologi, Penularan,
Pencegahan, dan Pemberantasannya. Penerbit Erlangga,
Jakarta
39
Lampiran 1. Data Kasus Demam Berdarah Kota Malang tahun
2015
No. Puskesmas Y X1 X2 X3 X4 X5
1 Kedungkandang 10 4 68.18 15438 3624 79.57
2 Gribig 20 4 68.51 6138 5739 82.52
3 Arjowinangun 14 6 47.17 10811 4776 86.84
4 Janti 22 5 45.52 16742 10019 79.53
5 Ciptomulyo 7 3 37.63 7220 7281 74.91
6 Mulyorejo 18 6 100.00 5771 5368 81.86
7 Arjuno 13 3 60.08 6325 11534 81.21
8 Bareng 25 4 81.67 7058 12658 80.37
9 Rampal Celaket 10 3 83.78 4333 7819 78.23
10 Cisadea 11 1 56.39 5306 12164 87.71
11 Kendalkerep 5 2 52.45 12733 11864 95.1
12 Pandanwangi 14 5 36.05 11610 8252 78.95
13 Dinoyo 42 5 87.82 12479 9155 90.36
14 Mojolangu 33 3 80.00 6574 6634 80.44
15 Kendalsari 29 2 84.50 8686 11274 77.01
Keterangan:
Y = Jumlah Kasus DBD
X1 = Jumlah Sarana Kesehatan
X2 = Presentase Rumah Tangga Ber-PHBS (%)
X3 = Jumlah Rumah Tangga Miskin
X4 = Kepadatan Penduduk
X5 = Angka Bebas Jentik (%)
40
Lampiran 2. Hasil Pengujian Sebaran Variabel Respon
Y=c(3.66, 7.33, 5.13, 8.06, 2.56, 6.59, 4.76, 9.16, 3.66, 4.03, 1.83,
5.13, 15.38, 12.09, 10.62)
KS=function(Y){
m=sort(unique(unlist(Y)),decreasing=FALSE)
FS=ppois(m,mean(Y),lower.tail=TRUE)
frek=as.matrix(table(Y))
FT=cumsum(frek)/length(Y)
D=max(abs(FT-FS))
D
}
KS(Y) [1] 0.1943029
41
Lampiran 3. Hasil Pengujian Asumsi Non Multikolinearitas
library(car)
model=lm(Y~X1+X2+X3+X4+X5)
VIF=vif(model)
VIF X1 X2 X3 X4 X5 1.700134 1.225789 1.473269 1.537637 1.132469
42
Lampiran 4. Hasil Pendugaan Parameter Regresi Poisson
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.7042 -1.3236 0.0691 0.6717 3.4714
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.215e+00 1.024e+00 1.187 0.2353
X1 9.545e-02 5.428e-02 1.758 0.0787 .
X2 1.909e-02 3.706e-03 5.151 2.59e-07 ***
X3 4.284e-05 1.955e-05 2.191 0.0285 *
X4 5.924e-05 2.516e-05 2.355 0.0185 *
X5 -1.092e-02 1.272e-02 -0.858 0.3908
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 79.363 on 14 degrees of freedom
Residual deviance: 40.935 on 9 degrees of freedom
AIC: 121.89
Number of Fisher Scoring iterations: 4
P
41.16417
overdispersi
4.573797
43
Lampiran 5. Hasil Pendugaan Parameter Regresi Generalized
Poisson
Call: gpois_glm(formula = form, type = "generalized", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.7741 1.7753 0.9993 0.3176 x1 0.1375 0.0948 1.4498 0.1471 x2 0.0193 0.0061 3.1554 0.0016 ** x3 0.0000 0.0000 0.7745 0.4386 x4 0.0001 0.0000 1.2298 0.2188 x5 -0.0175 0.0217 -0.8063 0.4200 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 0.03798141 Likelihood ratio test: G: 10.0019 Sig.: 0.1246 Chi squared pearson: Chi: 13.7778 Sig.: 0.1305 log-likelihood: -49.1248 Iterations: 13
44
Lampiran 6. Hasil Pendugaan Parameter Regresi Binomial
Negatif
Call: glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5, init.theta = 10.08347863, link = log) Deviance Residuals: Min 1Q Median 3Q Max -1.5823 -0.8768 0.2207 0.4288 1.8922 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.660e+00 1.746e+00 0.951 0.34159 X1 1.242e-01 9.270e-02 1.340 0.18024 X2 1.907e-02 6.030e-03 3.163 0.00156 ** X3 3.087e-05 3.309e-05 0.933 0.35084 X4 5.517e-05 4.367e-05 1.263 0.20642 X5 -1.588e-02 2.140e-02 -0.742 0.45806 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for Negative Binomial(10.0835) family taken to be 1) Null deviance: 28.645 on 14 degrees of freedom Residual deviance: 14.714 on 9 degrees of freedom AIC: 112.4 Number of Fisher Scoring iterations: 1
Theta: 10.08
Std. Err.: 5.73
2 x log-likelihood: -98.404
Chi_Squared_Pearson :0.2223828 Sig :0.9999999
45
Lampiran 7. Hasil Pendugaan Parameter Regresi Lagrange
poisson
Call: gpois_glm(formula = form, type = "lagrange", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.2148 2.1890 0.5550 0.5789 x1 0.0954 0.1161 0.8222 0.4110 x2 0.0191 0.0079 2.4085 0.0160 * x3 0.0000 0.0000 1.0244 0.3056 x4 0.0001 0.0001 1.1009 0.2709 x5 -0.0109 0.0272 -0.4013 0.6882 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 2.138644 Likelihood ratio test: G: 7.7622 Sig.: 0.256 Chi squared pearson: Chi: 9 Sig.: 0.4373 log-likelihood: -50.2542 Iterations: 1
46
Lampiran 8.Algoritma RStudio untuk Model Regresi Poisson
n=15 p=5 Y=data[,1] X0=cbind(rep(1,n)) X1=data[,2] X2=data[,3] X3=data[,4] X4=data[,5] X5=data[,6] regpois=glm(formula=Y~X1+X2+X3+X4+X5,family=poisson) summary(regpois) b0=summary(regpois)$coef[1,1] b1=summary(regpois)$coef[2,1] b2=summary(regpois)$coef[3,1] b3=summary(regpois)$coef[4,1] b4=summary(regpois)$coef[5,1] b5=summary(regpois)$coef[6,1] mu=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5) psi=10.0835 vary=mu+(psi*(U^2)) Chi_Squared_Pearson=sum((Y-mu)^2/vary) Sig <- pchisq(Chi_Squared_Pearson, df=n-p, lower.tail=FALSE)
47
Lampiran 9. Algoritma RStudio untuk Model Regresi Binomial
Negatif
local({pkg <- select.list(sort(.packages(all.available =
TRUE)),graphics=TRUE)
if(nchar(pkg)) library(pkg, character.only=TRUE)})
n=15
p=5
Y=data[,1]
X0=cbind(rep(1,n))
X1=data[,2]
X2=data[,3]
X3=data[,4]
X4=data[,5]
X5=data[,6]
regnb=glm.nb(formula=Y~X1+X2+X3+X4+X5)
summary(regnb)
b0=summary(regnb)$coef[1,1]
b1=summary(regnb)$coef[2,1]
b2=summary(regnb)$coef[3,1]
b3=summary(regnb)$coef[4,1]
b4=summary(regnb)$coef[5,1]
b5=summary(regnb)$coef[6,1]
U=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5)
db=n-(p+1)
Pearson=sum((Y-U)^2/U)
overdispersi=Pearson/db
48
Lampiran 10. Algoritma RStudio untuk Model Regresi
Generalized Poisson dan Lagrange poisson
dgpois <- function(y, mu, phi){
den <- (mu/(1+phi*mu))^y*(1+phi*y)^(y-1)/factorial(y)*
exp(-mu*(1+phi*y)/(1+phi*mu))
return(den)
}
gpr_fit <- function(formula, data){
#preparation
n <- nrow(data)
mf <- model.frame(formula,data)
Xmat <- model.matrix(formula,mf)
p <- ncol(Xmat)
yresp <- model.extract(mf,'response')
#initial
modinit <- glm(formula=formula, family='poisson',
data=data)
beta <- coef(modinit)
phi <- 1e-03
iter <- 0
error <- 1
tol <- 1e-05
#log likelihood function
llh_gpois <- function(param,y,X){
p <- length(param)
beta <- param[-p]
phi <- param[p]
mu <- exp(Xmat%*%beta)
den <- 0
for(i in seq_along(y)){
den[i] <- dgpois(y=y[i], mu=mu[i], phi=phi)
49
}
llh <- sum(log(den))
return(llh)
}
#log likelihood gradient to phi
grad_phi <- function(phi,y,mu){
comp <- -(y*mu/(1+phi*mu))+
y*(y-1)/(1+phi*y)-mu*(y-
mu)/(1+phi*mu)^2
return(sum(comp))
}
#Estimation
repeat{
iter <- iter+1
#Beta via IWLS
mu <- exp(Xmat%*%beta)
W <- matrix(0,nrow=n, ncol=n)
diag(W) <- mu/(1+phi*mu)^2
k <- as.vector(yresp-mu)/mu
beta_new <-
beta+solve(t(Xmat)%*%W%*%Xmat)%*%t(Xmat)%*%W%*%k
#phi via root of log likelihood gradient to phi
findphi <- pracma::fzero(f=grad_phi, x=phi,
y=yresp, mu=mu)
phi <- findphi[['x']]
#restriction to avoid zero
if(phi<0 && phi<=-1/max(yresp)){
phi <- -1/(max(yresp)+1)
}else if(phi<0 && phi<=-1/max(mu)){
phi <- -1/(max(mu)+1)
50
}else if(phi<0 && phi<=-1/max(yresp) && phi<=-
1/max(mu)){
phi <- min(-1/(max(yresp)+1), -
1/(max(mu)+1))
}else{
phi <- phi
}
#convergence check
error <- sqrt(sum((beta_new-beta)^2))
beta <- beta_new
if(error<tol){break}
}
#var beta
var_beta <- solve(t(Xmat)%*%W%*%Xmat)
se_beta <- sqrt(diag(var_beta))
#wald statistic
wald <- beta/se_beta
p_val <- 2*pnorm(abs(wald), mean=0, sd=1,
lower.tail=FALSE)
#chisq pearson
vary <- mu*(1+phi*mu)^2
chi_pearson <- sum((yresp-mu)^2/vary)
pval_chip <- pchisq(chi_pearson, df=n-p,
lower.tail=FALSE)
out <- list(beta=beta, phi=phi, se=se_beta, wald=wald,
sig=p_val,
chi_pear=chi_pearson,
pval_chipear=pval_chip, dimX=c(n,p),
51
varcov=var_beta,
loglik=llh_gpois(param=c(beta,phi),
y=yresp, X=Xmat), iter=iter,
error=error)
return(out)
}
dlgrpois <- function(y, mu, phi){
den <- mu*(mu+(phi-1)*y)^(y-1)*phi^(-y)*
exp(-(mu+(phi-1)*y)/phi)/factorial(y)
return(den)
}
lgrpr_fit <- function(formula,data){
#preparation
n <- nrow(data)
mf <- model.frame(formula,data)
Xmat <- model.matrix(formula,mf)
p <- ncol(Xmat)
yresp <- model.extract(mf,'response')
#initial
modinit <- glm(formula=formula, family='poisson',
data=data)
beta <- coef(modinit)
phi <- 0.9999
iter <- 0
error <- 1
tol <- 1e-05
#log likelihood function
llh_lgrpois <- function(param,y,X){
p <- length(param)
beta <- param[-p]
52
phi <- param[p]
mu <- exp(Xmat%*%beta)
den <- 0
for(i in seq_along(y)){
den[i] <- dlgrpois(y=y[i], mu=mu[i],
phi=phi)
}
llh <- sum(log(den))
return(llh)
}
#mom function for phi
mom_phi <- function(y, mu){
calc <- sqrt(sum((y-mu)^2/mu)/(n-p))
return(calc)
}
#Estimation
repeat{
iter <- iter+1
#Beta via IWLS
mu <- exp(Xmat%*%beta)
W <- matrix(0,nrow=n, ncol=n)
diag(W) <- mu
k <- as.vector(yresp-mu)/mu
beta_new <-
beta+solve(t(Xmat)%*%W%*%Xmat)%*%t(Xmat)%*%W%*%k
#phi via mom
phi <- mom_phi(y=yresp, mu=mu)
#convergence check
error <- sqrt(sum((beta_new-beta)^2))
53
beta <- beta_new
if(error<tol){break}
}
#var beta
var_beta <- phi^2*solve(t(Xmat)%*%W%*%Xmat)
se_beta <- sqrt(diag(var_beta))
#wald statistic
wald <- beta/se_beta
p_val <- 2*pnorm(abs(wald), mean=0, sd=1,
lower.tail=FALSE)
#chisq pearson
vary <- phi^2*mu
chi_pearson <- sum((yresp-mu)^2/vary)
pval_chip <- pchisq(chi_pearson, df=n-p,
lower.tail=FALSE)
out <- list(beta=beta, phi=phi, se=se_beta, wald=wald,
sig=p_val,
chi_pear=chi_pearson,
pval_chipear=pval_chip, dimX=c(n,p),
varcov=var_beta,
loglik=llh_lgrpois(param=c(beta,phi),
y=yresp, X=Xmat), iter=iter,
error=error)
return(out)
}
gpois_glm <- function(formula, type, data){
call <- match.call()
#define saturated formula (intercept only)
54
fL0 <- paste(formula)
fL0 <- as.formula(paste(fL0[2],'~',1))
#modeling
if(type=='generalized'){
fullmdl <- gpr_fit(formula=formula, data=data)
satmdl <- gpr_fit(formula=fL0, data=data)
}else if(type=='lagrange'){
fullmdl <- lgrpr_fit(formula=formula, data=data)
satmdl <- lgrpr_fit(formula=fL0, data=data)
}else{
stop('type not supported')
}
#likelihood ratio test
out <- fullmdl
l0 <- satmdl[['loglik']]
lp <- out[['loglik']]
n <- out[['dimX']][1]
p <- out[['dimX']][2]
q <- length(satmdl[['beta']])
G <- -2*(l0-lp)
pval_G <- pchisq(G, df=p, lower.tail=FALSE)
out[['G_stat']] <- G
out[['pval_G']] <- pval_G
out[['call']] <- call
class(out) <- 'gpois'
return(out)
}
print.gpois <- function(object){
#coefficient output
est <- round(object[['beta']],4)
55
se <- round(object[['se']],4)
wald <- round(object[['wald']],4)
pval <- round(object[['sig']],4)
#notation
code <- c()
for(j in pval){
if(j<=.001){code <- c(code, '***')
}else if(j<=.01){code <- c(code, '**')
}else if(j<=.05){code <- c(code, '*')
}else if(j<=.1){code <- c(code, '.')
}else{code <- c(code, ' ')}
}
coeff <- data.frame(est,se,wald,pval,code)
colnames(coeff) <- c('Estimate', 'Std. Error',
'Wald (z)', 'Sig.', ' ')
rownames(coeff) <- labels(est)[[1]]
#print output
cat('Call:\n')
print(object[['call']])
cat('\n')
cat('Coefficients:\n')
print(coeff)
cat('\n')
cat('-----\n')
cat('Sig. codes: 0 †˜ ***†™ 0.001 †˜ **†™ 0.01
†˜ *†™ 0.05 †˜ .†™ 0.1 †˜ †™ 1\n')
cat('\nDispersion parameter (phi):', object[['phi']], '\n')
cat('\nLikelihood ratio test:\n')
cat('G: ', round(object[['G_stat']],4), '\n')
cat('Sig.: ', round(object[['pval_G']],4), '\n')
cat('\nChi squared pearson:\n')
cat('Chi: ', round(object[['chi_pear']],4), '\n')
56
cat('Sig.: ', round(object[['pval_chipear']],4), '\n')
cat('\nlog-likelihood: ', round(object[['loglik']],4), '\n')
cat('Iterations: ', object[['iter']], '\n')
}
57
Lampiran 11. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,7368 1,8426 0,9426 0,3459
X1 0,1773 0,0920 1,9285 0,0538
X2 0,0180 0,0057 3,1490 0,0016
X4 0,0001 0,0000 1,3311 0,1832
X5 -0,0156 0,0219 -0,7105 0,4774
58
Lampiran 12. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3 dan X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,5876 0,7641 0,7690 0,4419
X1 0,1649 0,0912 1,8078 0,0706
X2 0,0176 0,0057 3,0699 0,0022
X4 0,0001 0,0000 1,2211 0,2221
59
Lampiran 13. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3, X5, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,2478 0,5082 2,4552 0,0141
X1 0,1173 0,0807 1,4525 0,1464
X2 0,0176 0,0060 2,9144 0,0036
60
Lampiran 14. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,5003 0,7869 0,636 0,5249
X1 0,1189 0,0936 1,270 0,2042
X2 0,0185 0,0061 3,039 0,0024
X3 0,0000 0,0000 0,802 0,4223
X4 0,0001 0,0000 1,152 0,2493
61
Lampiran 15. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5 dan X3
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,6598 0,7446 0,886 0,3755
X1 0,1550 0,0896 1,730 0,0836
X2 0,0168 0,0056 3,006 0,0026
X4 0,0001 0,0000 1,277 0,2015
62
Lampiran 16. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5, X3, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,3605 0,4921 2,765 0,0057
X1 0,1021 0,0793 1,288 0,1979
X2 0,0167 0,0058 2,842 0,0045
63
Lampiran 17. Hasil Analisis Regresi Lagrange poisson tanpa
Variabel X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,4334 0,9465 0,4579 0,6470
X1 0,0922 0,1103 0,8358 0,4033
X2 0,0187 0,0075 2,4982 0,0125
X3 0,0000 0,0000 0,9962 0,3192
X4 0,0001 0,0001 1,0855 0,2777
64
Lampiran 18. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5 dan X1
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,7440 0,8406 0,8850 0,3761
X2 0,0205 0,0070 2,9260 0,0034
X3 0,0000 0,0000 1,4581 0,1448
X4 0,0000 0,0000 0,8069 0,4197
65
Lampiran 19. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5, X1, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,1248 0,6697 1,6795 0,0031
X2 0,0196 0,0067 2,9384 0,0033
X3 0,0000 0,0000 1,4103 0,1584
37
DAFTAR PUSTAKA
Agresti, A. 2002. Categorical Data Analysis Second Edition. Wiley-
Interscience, Canada
Agresti, A. 2007. An Introduction to Categorical Data Analysis
Second Edition. Wiley-Interscience, Canada
Berk, R. dan J. M. MacDonald, 2008. Overdispersion and Poisson
Regression. Springer, Philadelphia.
Cameron, A. C. Dan P. K. Trivedi, 1998. Regression Analysis of
Count Data. Cambridge University Press, Cambridge.
Hosmer, D.W. dan S. Lemeshow. 2000. Applied Logistic
Reegression, Second Edition. Jon Wiley and Sons. New York.
Ismail, N. dan A.A. Jemain. 2007. Handling Overdispersion with
Negative Binomial and Generalized Poisson Regression
Models. Casuality Actuarial Society Forum.
Kismiantini. 2008. Perbandingan Model Regresi Poisson dan Model
Regresi Binomial Negatif. Jurnal FMIPA Universitas Negeri
Yogyakarta, Yogyakarta.
Kutner, M. H., Nachtshelm, C. J., Neter, J., and Li, W. 2005. Applied
Linear Statistical Models, Fifth Edition. McGraw-Hill
Companies Inc, New York.
Simarmata, R.T dan D. Ispriyanti. 2011. Penanganan Overdispersi
pada Model Regresi Poisson menggunakan Model Regresi
Binomial Negatif. Jurnal Media Statistika Universitas
Diponegoro, Semarang.
Walpole, R. E. 1995. Pengantar Statistika. Gramedia Pustaka
Utama, Jakarta
38
Widoyono. 2008. Penyakit Tropis: Epidemiologi, Penularan,
Pencegahan, dan Pemberantasannya. Penerbit Erlangga,
Jakarta
39
Lampiran 1. Data Kasus Demam Berdarah Kota Malang tahun
2015
No. Puskesmas Y X1 X2 X3 X4 X5
1 Kedungkandang 10 4 68.18 15438 3624 79.57
2 Gribig 20 4 68.51 6138 5739 82.52
3 Arjowinangun 14 6 47.17 10811 4776 86.84
4 Janti 22 5 45.52 16742 10019 79.53
5 Ciptomulyo 7 3 37.63 7220 7281 74.91
6 Mulyorejo 18 6 100.00 5771 5368 81.86
7 Arjuno 13 3 60.08 6325 11534 81.21
8 Bareng 25 4 81.67 7058 12658 80.37
9 Rampal Celaket 10 3 83.78 4333 7819 78.23
10 Cisadea 11 1 56.39 5306 12164 87.71
11 Kendalkerep 5 2 52.45 12733 11864 95.1
12 Pandanwangi 14 5 36.05 11610 8252 78.95
13 Dinoyo 42 5 87.82 12479 9155 90.36
14 Mojolangu 33 3 80.00 6574 6634 80.44
15 Kendalsari 29 2 84.50 8686 11274 77.01
Keterangan:
Y = Jumlah Kasus DBD
X1 = Jumlah Sarana Kesehatan
X2 = Presentase Rumah Tangga Ber-PHBS (%)
X3 = Jumlah Rumah Tangga Miskin
X4 = Kepadatan Penduduk
X5 = Angka Bebas Jentik (%)
40
Lampiran 2. Hasil Pengujian Sebaran Variabel Respon
Y=c(3.66, 7.33, 5.13, 8.06, 2.56, 6.59, 4.76, 9.16, 3.66, 4.03, 1.83,
5.13, 15.38, 12.09, 10.62)
KS=function(Y){
m=sort(unique(unlist(Y)),decreasing=FALSE)
FS=ppois(m,mean(Y),lower.tail=TRUE)
frek=as.matrix(table(Y))
FT=cumsum(frek)/length(Y)
D=max(abs(FT-FS))
D
}
KS(Y) [1] 0.1943029
41
Lampiran 3. Hasil Pengujian Asumsi Non Multikolinearitas
library(car)
model=lm(Y~X1+X2+X3+X4+X5)
VIF=vif(model)
VIF X1 X2 X3 X4 X5 1.700134 1.225789 1.473269 1.537637 1.132469
42
Lampiran 4. Hasil Pendugaan Parameter Regresi Poisson
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.7042 -1.3236 0.0691 0.6717 3.4714
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.215e+00 1.024e+00 1.187 0.2353
X1 9.545e-02 5.428e-02 1.758 0.0787 .
X2 1.909e-02 3.706e-03 5.151 2.59e-07 ***
X3 4.284e-05 1.955e-05 2.191 0.0285 *
X4 5.924e-05 2.516e-05 2.355 0.0185 *
X5 -1.092e-02 1.272e-02 -0.858 0.3908
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 79.363 on 14 degrees of freedom
Residual deviance: 40.935 on 9 degrees of freedom
AIC: 121.89
Number of Fisher Scoring iterations: 4
P
41.16417
overdispersi
4.573797
43
Lampiran 5. Hasil Pendugaan Parameter Regresi Generalized
Poisson
Call: gpois_glm(formula = form, type = "generalized", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.7741 1.7753 0.9993 0.3176 x1 0.1375 0.0948 1.4498 0.1471 x2 0.0193 0.0061 3.1554 0.0016 ** x3 0.0000 0.0000 0.7745 0.4386 x4 0.0001 0.0000 1.2298 0.2188 x5 -0.0175 0.0217 -0.8063 0.4200 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 0.03798141 Likelihood ratio test: G: 10.0019 Sig.: 0.1246 Chi squared pearson: Chi: 13.7778 Sig.: 0.1305 log-likelihood: -49.1248 Iterations: 13
44
Lampiran 6. Hasil Pendugaan Parameter Regresi Binomial
Negatif
Call: glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5, init.theta = 10.08347863, link = log) Deviance Residuals: Min 1Q Median 3Q Max -1.5823 -0.8768 0.2207 0.4288 1.8922 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.660e+00 1.746e+00 0.951 0.34159 X1 1.242e-01 9.270e-02 1.340 0.18024 X2 1.907e-02 6.030e-03 3.163 0.00156 ** X3 3.087e-05 3.309e-05 0.933 0.35084 X4 5.517e-05 4.367e-05 1.263 0.20642 X5 -1.588e-02 2.140e-02 -0.742 0.45806 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for Negative Binomial(10.0835) family taken to be 1) Null deviance: 28.645 on 14 degrees of freedom Residual deviance: 14.714 on 9 degrees of freedom AIC: 112.4 Number of Fisher Scoring iterations: 1
Theta: 10.08
Std. Err.: 5.73
2 x log-likelihood: -98.404
Chi_Squared_Pearson :0.2223828 Sig :0.9999999
45
Lampiran 7. Hasil Pendugaan Parameter Regresi Lagrange
poisson
Call: gpois_glm(formula = form, type = "lagrange", data = data_db) Coefficients: Estimate Std. Error Wald (z) Sig. (Intercept) 1.2148 2.1890 0.5550 0.5789 x1 0.0954 0.1161 0.8222 0.4110 x2 0.0191 0.0079 2.4085 0.0160 * x3 0.0000 0.0000 1.0244 0.3056 x4 0.0001 0.0001 1.1009 0.2709 x5 -0.0109 0.0272 -0.4013 0.6882 ----- Sig. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dispersion parameter (phi): 2.138644 Likelihood ratio test: G: 7.7622 Sig.: 0.256 Chi squared pearson: Chi: 9 Sig.: 0.4373 log-likelihood: -50.2542 Iterations: 1
46
Lampiran 8.Algoritma RStudio untuk Model Regresi Poisson
n=15 p=5 Y=data[,1] X0=cbind(rep(1,n)) X1=data[,2] X2=data[,3] X3=data[,4] X4=data[,5] X5=data[,6] regpois=glm(formula=Y~X1+X2+X3+X4+X5,family=poisson) summary(regpois) b0=summary(regpois)$coef[1,1] b1=summary(regpois)$coef[2,1] b2=summary(regpois)$coef[3,1] b3=summary(regpois)$coef[4,1] b4=summary(regpois)$coef[5,1] b5=summary(regpois)$coef[6,1] mu=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5) psi=10.0835 vary=mu+(psi*(U^2)) Chi_Squared_Pearson=sum((Y-mu)^2/vary) Sig <- pchisq(Chi_Squared_Pearson, df=n-p, lower.tail=FALSE)
47
Lampiran 9. Algoritma RStudio untuk Model Regresi Binomial
Negatif
local({pkg <- select.list(sort(.packages(all.available =
TRUE)),graphics=TRUE)
if(nchar(pkg)) library(pkg, character.only=TRUE)})
n=15
p=5
Y=data[,1]
X0=cbind(rep(1,n))
X1=data[,2]
X2=data[,3]
X3=data[,4]
X4=data[,5]
X5=data[,6]
regnb=glm.nb(formula=Y~X1+X2+X3+X4+X5)
summary(regnb)
b0=summary(regnb)$coef[1,1]
b1=summary(regnb)$coef[2,1]
b2=summary(regnb)$coef[3,1]
b3=summary(regnb)$coef[4,1]
b4=summary(regnb)$coef[5,1]
b5=summary(regnb)$coef[6,1]
U=exp(b0*X0+b1*X1+b2*X2+b3*X3+b4*X4+b5*X5)
db=n-(p+1)
Pearson=sum((Y-U)^2/U)
overdispersi=Pearson/db
48
Lampiran 10. Algoritma RStudio untuk Model Regresi
Generalized Poisson dan Lagrange poisson
dgpois <- function(y, mu, phi){
den <- (mu/(1+phi*mu))^y*(1+phi*y)^(y-1)/factorial(y)*
exp(-mu*(1+phi*y)/(1+phi*mu))
return(den)
}
gpr_fit <- function(formula, data){
#preparation
n <- nrow(data)
mf <- model.frame(formula,data)
Xmat <- model.matrix(formula,mf)
p <- ncol(Xmat)
yresp <- model.extract(mf,'response')
#initial
modinit <- glm(formula=formula, family='poisson',
data=data)
beta <- coef(modinit)
phi <- 1e-03
iter <- 0
error <- 1
tol <- 1e-05
#log likelihood function
llh_gpois <- function(param,y,X){
p <- length(param)
beta <- param[-p]
phi <- param[p]
mu <- exp(Xmat%*%beta)
den <- 0
for(i in seq_along(y)){
den[i] <- dgpois(y=y[i], mu=mu[i], phi=phi)
49
}
llh <- sum(log(den))
return(llh)
}
#log likelihood gradient to phi
grad_phi <- function(phi,y,mu){
comp <- -(y*mu/(1+phi*mu))+
y*(y-1)/(1+phi*y)-mu*(y-
mu)/(1+phi*mu)^2
return(sum(comp))
}
#Estimation
repeat{
iter <- iter+1
#Beta via IWLS
mu <- exp(Xmat%*%beta)
W <- matrix(0,nrow=n, ncol=n)
diag(W) <- mu/(1+phi*mu)^2
k <- as.vector(yresp-mu)/mu
beta_new <-
beta+solve(t(Xmat)%*%W%*%Xmat)%*%t(Xmat)%*%W%*%k
#phi via root of log likelihood gradient to phi
findphi <- pracma::fzero(f=grad_phi, x=phi,
y=yresp, mu=mu)
phi <- findphi[['x']]
#restriction to avoid zero
if(phi<0 && phi<=-1/max(yresp)){
phi <- -1/(max(yresp)+1)
}else if(phi<0 && phi<=-1/max(mu)){
phi <- -1/(max(mu)+1)
50
}else if(phi<0 && phi<=-1/max(yresp) && phi<=-
1/max(mu)){
phi <- min(-1/(max(yresp)+1), -
1/(max(mu)+1))
}else{
phi <- phi
}
#convergence check
error <- sqrt(sum((beta_new-beta)^2))
beta <- beta_new
if(error<tol){break}
}
#var beta
var_beta <- solve(t(Xmat)%*%W%*%Xmat)
se_beta <- sqrt(diag(var_beta))
#wald statistic
wald <- beta/se_beta
p_val <- 2*pnorm(abs(wald), mean=0, sd=1,
lower.tail=FALSE)
#chisq pearson
vary <- mu*(1+phi*mu)^2
chi_pearson <- sum((yresp-mu)^2/vary)
pval_chip <- pchisq(chi_pearson, df=n-p,
lower.tail=FALSE)
out <- list(beta=beta, phi=phi, se=se_beta, wald=wald,
sig=p_val,
chi_pear=chi_pearson,
pval_chipear=pval_chip, dimX=c(n,p),
51
varcov=var_beta,
loglik=llh_gpois(param=c(beta,phi),
y=yresp, X=Xmat), iter=iter,
error=error)
return(out)
}
dlgrpois <- function(y, mu, phi){
den <- mu*(mu+(phi-1)*y)^(y-1)*phi^(-y)*
exp(-(mu+(phi-1)*y)/phi)/factorial(y)
return(den)
}
lgrpr_fit <- function(formula,data){
#preparation
n <- nrow(data)
mf <- model.frame(formula,data)
Xmat <- model.matrix(formula,mf)
p <- ncol(Xmat)
yresp <- model.extract(mf,'response')
#initial
modinit <- glm(formula=formula, family='poisson',
data=data)
beta <- coef(modinit)
phi <- 0.9999
iter <- 0
error <- 1
tol <- 1e-05
#log likelihood function
llh_lgrpois <- function(param,y,X){
p <- length(param)
beta <- param[-p]
52
phi <- param[p]
mu <- exp(Xmat%*%beta)
den <- 0
for(i in seq_along(y)){
den[i] <- dlgrpois(y=y[i], mu=mu[i],
phi=phi)
}
llh <- sum(log(den))
return(llh)
}
#mom function for phi
mom_phi <- function(y, mu){
calc <- sqrt(sum((y-mu)^2/mu)/(n-p))
return(calc)
}
#Estimation
repeat{
iter <- iter+1
#Beta via IWLS
mu <- exp(Xmat%*%beta)
W <- matrix(0,nrow=n, ncol=n)
diag(W) <- mu
k <- as.vector(yresp-mu)/mu
beta_new <-
beta+solve(t(Xmat)%*%W%*%Xmat)%*%t(Xmat)%*%W%*%k
#phi via mom
phi <- mom_phi(y=yresp, mu=mu)
#convergence check
error <- sqrt(sum((beta_new-beta)^2))
53
beta <- beta_new
if(error<tol){break}
}
#var beta
var_beta <- phi^2*solve(t(Xmat)%*%W%*%Xmat)
se_beta <- sqrt(diag(var_beta))
#wald statistic
wald <- beta/se_beta
p_val <- 2*pnorm(abs(wald), mean=0, sd=1,
lower.tail=FALSE)
#chisq pearson
vary <- phi^2*mu
chi_pearson <- sum((yresp-mu)^2/vary)
pval_chip <- pchisq(chi_pearson, df=n-p,
lower.tail=FALSE)
out <- list(beta=beta, phi=phi, se=se_beta, wald=wald,
sig=p_val,
chi_pear=chi_pearson,
pval_chipear=pval_chip, dimX=c(n,p),
varcov=var_beta,
loglik=llh_lgrpois(param=c(beta,phi),
y=yresp, X=Xmat), iter=iter,
error=error)
return(out)
}
gpois_glm <- function(formula, type, data){
call <- match.call()
#define saturated formula (intercept only)
54
fL0 <- paste(formula)
fL0 <- as.formula(paste(fL0[2],'~',1))
#modeling
if(type=='generalized'){
fullmdl <- gpr_fit(formula=formula, data=data)
satmdl <- gpr_fit(formula=fL0, data=data)
}else if(type=='lagrange'){
fullmdl <- lgrpr_fit(formula=formula, data=data)
satmdl <- lgrpr_fit(formula=fL0, data=data)
}else{
stop('type not supported')
}
#likelihood ratio test
out <- fullmdl
l0 <- satmdl[['loglik']]
lp <- out[['loglik']]
n <- out[['dimX']][1]
p <- out[['dimX']][2]
q <- length(satmdl[['beta']])
G <- -2*(l0-lp)
pval_G <- pchisq(G, df=p, lower.tail=FALSE)
out[['G_stat']] <- G
out[['pval_G']] <- pval_G
out[['call']] <- call
class(out) <- 'gpois'
return(out)
}
print.gpois <- function(object){
#coefficient output
est <- round(object[['beta']],4)
55
se <- round(object[['se']],4)
wald <- round(object[['wald']],4)
pval <- round(object[['sig']],4)
#notation
code <- c()
for(j in pval){
if(j<=.001){code <- c(code, '***')
}else if(j<=.01){code <- c(code, '**')
}else if(j<=.05){code <- c(code, '*')
}else if(j<=.1){code <- c(code, '.')
}else{code <- c(code, ' ')}
}
coeff <- data.frame(est,se,wald,pval,code)
colnames(coeff) <- c('Estimate', 'Std. Error',
'Wald (z)', 'Sig.', ' ')
rownames(coeff) <- labels(est)[[1]]
#print output
cat('Call:\n')
print(object[['call']])
cat('\n')
cat('Coefficients:\n')
print(coeff)
cat('\n')
cat('-----\n')
cat('Sig. codes: 0 †˜ ***†™ 0.001 †˜ **†™ 0.01
†˜ *†™ 0.05 †˜ .†™ 0.1 †˜ †™ 1\n')
cat('\nDispersion parameter (phi):', object[['phi']], '\n')
cat('\nLikelihood ratio test:\n')
cat('G: ', round(object[['G_stat']],4), '\n')
cat('Sig.: ', round(object[['pval_G']],4), '\n')
cat('\nChi squared pearson:\n')
cat('Chi: ', round(object[['chi_pear']],4), '\n')
56
cat('Sig.: ', round(object[['pval_chipear']],4), '\n')
cat('\nlog-likelihood: ', round(object[['loglik']],4), '\n')
cat('Iterations: ', object[['iter']], '\n')
}
57
Lampiran 11. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,7368 1,8426 0,9426 0,3459
X1 0,1773 0,0920 1,9285 0,0538
X2 0,0180 0,0057 3,1490 0,0016
X4 0,0001 0,0000 1,3311 0,1832
X5 -0,0156 0,0219 -0,7105 0,4774
58
Lampiran 12. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3 dan X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,5876 0,7641 0,7690 0,4419
X1 0,1649 0,0912 1,8078 0,0706
X2 0,0176 0,0057 3,0699 0,0022
X4 0,0001 0,0000 1,2211 0,2221
59
Lampiran 13. Hasil Analisis Regresi Generalized Poisson tanpa
Variabel X3, X5, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,2478 0,5082 2,4552 0,0141
X1 0,1173 0,0807 1,4525 0,1464
X2 0,0176 0,0060 2,9144 0,0036
60
Lampiran 14. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,5003 0,7869 0,636 0,5249
X1 0,1189 0,0936 1,270 0,2042
X2 0,0185 0,0061 3,039 0,0024
X3 0,0000 0,0000 0,802 0,4223
X4 0,0001 0,0000 1,152 0,2493
61
Lampiran 15. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5 dan X3
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,6598 0,7446 0,886 0,3755
X1 0,1550 0,0896 1,730 0,0836
X2 0,0168 0,0056 3,006 0,0026
X4 0,0001 0,0000 1,277 0,2015
62
Lampiran 16. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5, X3, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,3605 0,4921 2,765 0,0057
X1 0,1021 0,0793 1,288 0,1979
X2 0,0167 0,0058 2,842 0,0045
63
Lampiran 17. Hasil Analisis Regresi Lagrange poisson tanpa
Variabel X5
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,4334 0,9465 0,4579 0,6470
X1 0,0922 0,1103 0,8358 0,4033
X2 0,0187 0,0075 2,4982 0,0125
X3 0,0000 0,0000 0,9962 0,3192
X4 0,0001 0,0001 1,0855 0,2777
64
Lampiran 18. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5 dan X1
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 0,7440 0,8406 0,8850 0,3761
X2 0,0205 0,0070 2,9260 0,0034
X3 0,0000 0,0000 1,4581 0,1448
X4 0,0000 0,0000 0,8069 0,4197
65
Lampiran 19. Hasil Analisis Regresi Binomial Negatif tanpa
Variabel X5, X1, dan X4
Variabel Koefisien Standard
Error
Wald P-
Value
Konstanta 1,1248 0,6697 1,6795 0,0031
X2 0,0196 0,0067 2,9384 0,0033
X3 0,0000 0,0000 1,4103 0,1584