bahan 1

BAB 1 PENDAHULUAN

1.1 Latar Belakang Masalah

Analisis regresi merupakan analisis statistik yang digunakan untuk

memodelkan hubungan antara variabel independen (x) dengan variabel

dependen (y) untuk n pengamatan berpasangan (x yi, i )in1, maka hubungan

linier antara variabel dependen dan variabel independen tersebut dapat

dinyatakan sebagai berikut :

yi f x( )i i , i 1,2....,n

Dengan yi : variabel respon; xi : variabel prediktor; f (xi ) : fungsi regresi; i :

galat (error) yang berdistribusi normal, independen dengan mean nol dan

variansi 2.

Tujuan dari analisis regresi adalah menentukan hampiran atau estimasi

untuk fungsi f x( )i . Bentuk kurva regresi f x( )i yang di peroleh dari sample,

pada aplikasi terhadap sekumpulan data (x y1 1, ),......( ,x yi i ) yang berisi

informasi tentang f x( )i , dari data – data ini diduga ataupun di estimasi fungsi

f x( )i . pendekatan yang digunakan untuk mengestimasi f x( )i ada dua yaitu

pendekatan regresi parametrik dan regresi nonparametrik. Pendekatan regresi

parametrik digunakan apabila fungsi dari f x( )i diketahui dari informasi

sebelumnya, berdasarkan teori ataupun pengalaman masa lalu. Sedangkan

dalam beberapa penelitian, sering di jumpai permasalahan pada hubungan

fungsional antara dua variabel x dan y dimana bentuk – bentuk hubungan

secara parametrik tidak dapat digunakan yang di akibatkan dari sedikitnya

1

pengetahuan yang di peroleh dari f x( )i . Untuk membuat asumsi tentang

bentuk kurva f tidak mudah dilakukan, sehingga pendekatan model regresi

nonparametrik merupakan solusi yang dapat dilakukan, karena tidak terkait

dengan asumsi bentuk kurva regresi tertentu yang memberikan fleksibilitas

yang lebih besar dalam bentuk yang mungkin dari kurva regresi atau fungsi f

x( )i . Umumnya fungsi regresi hanya diasumsikan termuat dalam suatu ruang

fungsi yang berdimensi tak hingga. Untuk mengkontruksi model regresinya

dipilih fungsi yang sesuai dimana fungsi regresinya diyakini termasuk

didalamnya. Pemilihan ruang fungsi ini biasanya dimotivasi oleh sifat

kelicinan atau kemulusan yang di asumsikan dimiliki oleh fungsi regresi.

Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data

pengamatan dengan menggunakan teknik smoothing. Ada beberapa teknik

smoothing dalam regresi nonparametrik antara lain histogram, estimator

spline, regresi spline terpenalti (penalized spline regresion), estimator kernel,

deret fourier dan estimator wavelet. Pendekatan spline merupakan pendektan

yang paling sering digunakan karena spline dapat menyesuaikan diri secara

efektif terhadap data.

Regresi spline adalah suatu pendekatan kearah kecocokan data dengan

tetap memperhitungkan kemulusan kurva. Karena spline merupakan model

polynomial yang tersegmen. Sifat tersegmen inilah yang memberikan

fleksibilitas yang lebih baik dari pada model polynomial biasa. Sifat ini juga

memungkinkan model regresi spline menyesuaikan diri secara efektif

terhadap karakteristik lokal dari data. Penggunaan spline difokuskan kepada

adanya prilaku atau pola data, yang pada daerah tertentu mempunyai

karakteristik yang berbeda dengan daerah lain.

2

Regresi spline linier biasanya di aplikasikan pada data dengan pola

masih sederhana sedangkan spline kuadrat dan kubik bisanya di aplikasikan

pada data dengan pola data yang lebih kompleks. Bentuk estimator spline

sangat dipengaruhi oleh nilai parameter penghalus λ (Budihantara, 2000).

Bentuk estimator juga dipengaruhi oleh lokasi dan banyaknya titik – titik

knot. Eubank (1988) menyimpulkan bahwa pemilihan λ optimal dalam

regresi spline pada hakekatnya merupakan pemilihan lokasi titik knot.

Penentuan titik knot yang optimal dalam pemilihan model regresi spline

terbaik didasarkan pada nilai GCV (Generalized Cross Validation).

1.2 Pembatasan Masalah

Pembatasan mengenai regresi spline memiliki cakupan yang luas. Oleh

karena itu, untuk memfokuskan penyelesaian masalah dan menjaga agar tidak

terjadi penyimpangan dari tujuan awal dalam skripsi ini maka dalam skripsi

ini hanya akan di bahas mengenai regresi spline kuadaratik dan pemilihan

modelnya dengan menggunakan metode GCV (Generalized Cross Validation),

serta menguji nilai residual dari model dan sedikit membandikan dengan

model regresi parametrik kuadratik biasa.

1.3 Tujuan penulisan

Tujuan penulisan skripsi ini adalah sebagai berikut :

1) Mempelajari mengenai regresi spline dengan pola data kuadratik.

2) Menentukan banyaknya titik knot dan lokasi titik knot yang optimal pada

regresi spline kuadratik dengan metode GCV (Generalized Cross-

Validation).

3) Mengestimasi model regresi spline kuadratik yang terbaik.

4) Melakukan perbandingan hasil estimasi dengan menggunakan regresi

kuadratik biasa.

3

1.4 Tinjauan Pustaka

Pembahasan mengenai regresi spline telah dilakukan oleh beberapa

peneliti sebelumnya yang berupa artikel dan jurnal- jurnal ;

Eubank R. (1998) membahas mengenai spline smoothing and nonparametrik

regression.

I Nyoman Budiantara (2000),Dursun Aydin (2007) membahas tentang

perbandingan model regresi nonparametrik yaitu regresi spline dan kernel,

dimana dalam penelitian ini hanya di bandingkan bentuk spline untuk data

linier atau sederhana dengan pemilihan titik knot terbatas pada 2 titik knot.

Yunia Kurnia Purnamasari (2013), membahas mengenai perbandingan

Regresi Spline dengan Regresi Kernel, dalam penelitian ini di jelaskan

mengenai regresi spline untuk pola data sederhana, dan melakukan

perbandingan dua data dengan menggunakan metode regresi spline dan

regresi kernel, dengan menggunakan paket program SAS.

Estri Purwani (2013), membahas mengenai Regresi Spline Bentuk Terbatas

Monoton, dalam penelitian ini dilakukan penelitian untuk menangani pola

data yang naik monoton dan turun monoton, dan pemilihan titik knot yang

dilakukan terbatas untuk 2 titik knot.

Adapun Yang membedakan penelitian skripsi ini dengan penelitian –

penelitian sebelumnya yaitu Dalam penelitian ini di kembangkan model

pemerogaman menggunakan software R dengan pemilihan nila knot sampai

N titik knot. Serta penggunaan data yang lebih kompleks, dengan melakukan

perbandingan dengan model regresi parametrik kuadratik.

1.5 Metode Penulisan

Metode yang digunakan dalam penulisan skripsi ini yaitu studi pustaka

atau studi literatur , karena bahan tulisan ini bersumber dari jurnal – jurnal,

4

buku – buku di perpustakaan dan referensi lain yang diperoleh dari situs –

situs penunjang internet. Ada pun penyelesaian studi kasus dalam penelitian

skripsi ini menggunakan software R dan MINITAB.

1.6 Sistematika Penulisan

Adapun sistematika penulisan dalam skripsi ini adalah sebagai berikut :

BAB I PENDAHULUAN

Bab ini berisi latar belakang masalah,pembatasan masalah, tujuan penulisan, tinjauan pustaka, metode penulisan, dan sistematika penulisan.

BAB II DASAR TEORI

Bab ini membahas tentang dasar teori yang mendukung pembahasan analisis regresi spline kuadratik.

BAB III ANALISIS REGRESI SPLINE KUADRATIK

Bab ini membahas estimasi regresi spline kuadratik dengan metode penentuan nilai GCV ( Generelized Cross Validation ) optimal.

BAB IV STUDI KASUS

Bab ini membahas aplikasi regresi spline kuadratik dengan metode

penentuan nilai GCV optimal dalam menganalisis hubungan

Persentase Pertumbuhan Penduduk dengan Persentase Penerimaan Tenaga Kerja Baru.

BAB V PENUTUP Bab ini berisi kesimpulan dari pembahasan pada bab sebelumnya dan

saran atas kekurangan dari hasil penelitian yang telah dilakukan.

5

Documents

bahan 1