Upload
umi
View
222
Download
7
Embed Size (px)
DESCRIPTION
dhfhgf
Citation preview
BAB 1 PENDAHULUAN
1.1 Latar Belakang Masalah
Analisis regresi merupakan analisis statistik yang digunakan untuk
memodelkan hubungan antara variabel independen (x) dengan variabel
dependen (y) untuk n pengamatan berpasangan (x yi, i )in1, maka hubungan
linier antara variabel dependen dan variabel independen tersebut dapat
dinyatakan sebagai berikut :
yi f x( )i i , i 1,2....,n
Dengan yi : variabel respon; xi : variabel prediktor; f (xi ) : fungsi regresi; i :
galat (error) yang berdistribusi normal, independen dengan mean nol dan
variansi 2.
Tujuan dari analisis regresi adalah menentukan hampiran atau estimasi
untuk fungsi f x( )i . Bentuk kurva regresi f x( )i yang di peroleh dari sample,
pada aplikasi terhadap sekumpulan data (x y1 1, ),......( ,x yi i ) yang berisi
informasi tentang f x( )i , dari data – data ini diduga ataupun di estimasi fungsi
f x( )i . pendekatan yang digunakan untuk mengestimasi f x( )i ada dua yaitu
pendekatan regresi parametrik dan regresi nonparametrik. Pendekatan regresi
parametrik digunakan apabila fungsi dari f x( )i diketahui dari informasi
sebelumnya, berdasarkan teori ataupun pengalaman masa lalu. Sedangkan
dalam beberapa penelitian, sering di jumpai permasalahan pada hubungan
fungsional antara dua variabel x dan y dimana bentuk – bentuk hubungan
secara parametrik tidak dapat digunakan yang di akibatkan dari sedikitnya
1
pengetahuan yang di peroleh dari f x( )i . Untuk membuat asumsi tentang
bentuk kurva f tidak mudah dilakukan, sehingga pendekatan model regresi
nonparametrik merupakan solusi yang dapat dilakukan, karena tidak terkait
dengan asumsi bentuk kurva regresi tertentu yang memberikan fleksibilitas
yang lebih besar dalam bentuk yang mungkin dari kurva regresi atau fungsi f
x( )i . Umumnya fungsi regresi hanya diasumsikan termuat dalam suatu ruang
fungsi yang berdimensi tak hingga. Untuk mengkontruksi model regresinya
dipilih fungsi yang sesuai dimana fungsi regresinya diyakini termasuk
didalamnya. Pemilihan ruang fungsi ini biasanya dimotivasi oleh sifat
kelicinan atau kemulusan yang di asumsikan dimiliki oleh fungsi regresi.
Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data
pengamatan dengan menggunakan teknik smoothing. Ada beberapa teknik
smoothing dalam regresi nonparametrik antara lain histogram, estimator
spline, regresi spline terpenalti (penalized spline regresion), estimator kernel,
deret fourier dan estimator wavelet. Pendekatan spline merupakan pendektan
yang paling sering digunakan karena spline dapat menyesuaikan diri secara
efektif terhadap data.
Regresi spline adalah suatu pendekatan kearah kecocokan data dengan
tetap memperhitungkan kemulusan kurva. Karena spline merupakan model
polynomial yang tersegmen. Sifat tersegmen inilah yang memberikan
fleksibilitas yang lebih baik dari pada model polynomial biasa. Sifat ini juga
memungkinkan model regresi spline menyesuaikan diri secara efektif
terhadap karakteristik lokal dari data. Penggunaan spline difokuskan kepada
adanya prilaku atau pola data, yang pada daerah tertentu mempunyai
karakteristik yang berbeda dengan daerah lain.
2
Regresi spline linier biasanya di aplikasikan pada data dengan pola
masih sederhana sedangkan spline kuadrat dan kubik bisanya di aplikasikan
pada data dengan pola data yang lebih kompleks. Bentuk estimator spline
sangat dipengaruhi oleh nilai parameter penghalus λ (Budihantara, 2000).
Bentuk estimator juga dipengaruhi oleh lokasi dan banyaknya titik – titik
knot. Eubank (1988) menyimpulkan bahwa pemilihan λ optimal dalam
regresi spline pada hakekatnya merupakan pemilihan lokasi titik knot.
Penentuan titik knot yang optimal dalam pemilihan model regresi spline
terbaik didasarkan pada nilai GCV (Generalized Cross Validation).
1.2 Pembatasan Masalah
Pembatasan mengenai regresi spline memiliki cakupan yang luas. Oleh
karena itu, untuk memfokuskan penyelesaian masalah dan menjaga agar tidak
terjadi penyimpangan dari tujuan awal dalam skripsi ini maka dalam skripsi
ini hanya akan di bahas mengenai regresi spline kuadaratik dan pemilihan
modelnya dengan menggunakan metode GCV (Generalized Cross Validation),
serta menguji nilai residual dari model dan sedikit membandikan dengan
model regresi parametrik kuadratik biasa.
1.3 Tujuan penulisan
Tujuan penulisan skripsi ini adalah sebagai berikut :
1) Mempelajari mengenai regresi spline dengan pola data kuadratik.
2) Menentukan banyaknya titik knot dan lokasi titik knot yang optimal pada
regresi spline kuadratik dengan metode GCV (Generalized Cross-
Validation).
3) Mengestimasi model regresi spline kuadratik yang terbaik.
4) Melakukan perbandingan hasil estimasi dengan menggunakan regresi
kuadratik biasa.
3
1.4 Tinjauan Pustaka
Pembahasan mengenai regresi spline telah dilakukan oleh beberapa
peneliti sebelumnya yang berupa artikel dan jurnal- jurnal ;
Eubank R. (1998) membahas mengenai spline smoothing and nonparametrik
regression.
I Nyoman Budiantara (2000),Dursun Aydin (2007) membahas tentang
perbandingan model regresi nonparametrik yaitu regresi spline dan kernel,
dimana dalam penelitian ini hanya di bandingkan bentuk spline untuk data
linier atau sederhana dengan pemilihan titik knot terbatas pada 2 titik knot.
Yunia Kurnia Purnamasari (2013), membahas mengenai perbandingan
Regresi Spline dengan Regresi Kernel, dalam penelitian ini di jelaskan
mengenai regresi spline untuk pola data sederhana, dan melakukan
perbandingan dua data dengan menggunakan metode regresi spline dan
regresi kernel, dengan menggunakan paket program SAS.
Estri Purwani (2013), membahas mengenai Regresi Spline Bentuk Terbatas
Monoton, dalam penelitian ini dilakukan penelitian untuk menangani pola
data yang naik monoton dan turun monoton, dan pemilihan titik knot yang
dilakukan terbatas untuk 2 titik knot.
Adapun Yang membedakan penelitian skripsi ini dengan penelitian –
penelitian sebelumnya yaitu Dalam penelitian ini di kembangkan model
pemerogaman menggunakan software R dengan pemilihan nila knot sampai
N titik knot. Serta penggunaan data yang lebih kompleks, dengan melakukan
perbandingan dengan model regresi parametrik kuadratik.
1.5 Metode Penulisan
Metode yang digunakan dalam penulisan skripsi ini yaitu studi pustaka
atau studi literatur , karena bahan tulisan ini bersumber dari jurnal – jurnal,
4
buku – buku di perpustakaan dan referensi lain yang diperoleh dari situs –
situs penunjang internet. Ada pun penyelesaian studi kasus dalam penelitian
skripsi ini menggunakan software R dan MINITAB.
1.6 Sistematika Penulisan
Adapun sistematika penulisan dalam skripsi ini adalah sebagai berikut :
BAB I PENDAHULUAN
Bab ini berisi latar belakang masalah,pembatasan masalah, tujuan penulisan, tinjauan pustaka, metode penulisan, dan sistematika penulisan.
BAB II DASAR TEORI
Bab ini membahas tentang dasar teori yang mendukung pembahasan analisis regresi spline kuadratik.
BAB III ANALISIS REGRESI SPLINE KUADRATIK
Bab ini membahas estimasi regresi spline kuadratik dengan metode penentuan nilai GCV ( Generelized Cross Validation ) optimal.
BAB IV STUDI KASUS
Bab ini membahas aplikasi regresi spline kuadratik dengan metode
penentuan nilai GCV optimal dalam menganalisis hubungan
Persentase Pertumbuhan Penduduk dengan Persentase Penerimaan Tenaga Kerja Baru.
BAB V PENUTUP Bab ini berisi kesimpulan dari pembahasan pada bab sebelumnya dan
saran atas kekurangan dari hasil penelitian yang telah dilakukan.
5