Jurnal Naive Bayes

DETEKSI RESIKO PEMBERIAN KREDIT TERHADAP CALON NASABAH PADA BANK SWASTA

Isyar Andika Harun -Mail: *[email protected]”

Abstrak

Dalam membantu perekonomian Negara, Bank berfungsi sebagai sumber dana bagi masyarakat yang membutuhkan dengan memberikan pinjaman kepada nasabahnya yang disebut dengan kredit. Ketika memberikan kredit kepada seseorang, Bank memiliki dua kemungkinan pengembalian dana yaitu baik dan buruk. Penentuan ini bisa dilihat dari data nasabah terdahulu tapi dengan data yang sangat banyak tentu tidak efektif untuk dilakukan pengecekan data secara manual. Maka dibutuhkanlah sebuah sistem yang dapat membantu untuk mengklasifikasikan resiko kredit kepada calon nasabah. Dengan melihat data – data dan informasi lainnya dari calon nasabah serta data historis dari nasabah terdahulu maka sistem ini diharapkan mampu mengklasikasian nasabah tersebut ke dalam kelas baik atau buruk. Proses pengklasifikasian menggunakan metode naïve bayes yang menggunakan perbandingan statistik dianggap mampu menyelesaikan permasalahan ini.

Kata kunci: Bank, Klasifikasi, Kredit, Naive Bayes, Nasabah, Resiko.

Abstract

In helping nation’s economy, Bank serves as a source of funds for the people by providing loans to its customer. This called credit. While giving credit to someone, Bank has two chances of a refund which is good and bad. To determine what is good and bad customer Banks can see from the previous customer data history. But the data is very much of course not effective to do checking of the data manually. So bank need a system that can help to classify the credit risk from a customers. By looking the previous data this system is expected to classify the customer in tho good or bad grade. The process of classification using Naive Byes Method that uses a statistical comparison are considered to be able to resolve this issue

Keywords: Bank, Classification, Credit, Naive Bayes, Customer, Risk.

PENDAHULUAN

Perbankan merupakan salah satu lembaga yang berkewajiban untuk meperlancar arus kegiatan di bidang ekonomi dan pengembangan perekonomian. Aktivitas Bank tidak hanya menghimpun dana dari masyarakat tetapi berfungsi sebagai sumber dana bagi masyarakat yang membutuhkan dengan memberikan pinjaman bagi nasabahnya. Aktivitas ini disebut dengan kredit. Menurut Suyatno (2003) [1], kredit adalah penyediaan uang atau tagihan-tagihan yang dapat disamakan dengan itu berdasarkan persetujuan pinjam meminjam antara bank dengan pihak lain dalam hal mana pihak meminjam berkewajiban melunasi utangnya setelah jangka waktu tertentu dengan jumlah bunga yang telah ditetapkan. Dalam memberikan kredit, Bank harus mempunyai kepercayaan terhadap calon penerima kredit bahwa dana yang diberikan akan digunakan sesuai dengan tujuan yang diajukan oleh calon penerima kredit dan pada akhirnya akan dikembalikan lagi kepada Bank sesuai dengan perjanjian yang disepakati bersama. Namun kredit yang diberikan kepada para peminjam selalu ada resiko berupa kredit tidak dapat kembali tepat pada waktunya yang dinamakan kredit bermasalah. Kredit bermasalah selalu ada dalam kegiatan perkreditan Bank karena Bank tidak mungkin menghindari adanya kredit bermasalah [2]. Tindakan Bank dalam usaha menyelamatkan dan menyelesaikan kredit bermasalah ada beraneka ragam. Salah satunya dengan memperhatikan historis dari nasabah calon penerima kredit [3].

Permasalahannya adalah data historis Bank begitu banyak sehingga menyebabkan analisa data secara manual menjadi tidak praktis. Sehingga dibutuhkan suatu sistem komputer yang dapat mempelajari data historis dari peminjaman kredit di Bank. Banyak metode yang dapat digunakan untuk mempelajari data historis tersebut dan mengenali pola-pola yang ada. Salah satunya adalah Naive Bayes. Naive Bayes merupakan salah satu metode pengklasifikasian yang disusun dari sudut pandang statistik. Jika X melambangkan set atribut data dan Y melambangkan kelas variabel. Jika variabel kelas memiliki hubungan dengan atribut maka dapat diperkakukan X dan Y sebagai variabel acak

dan menangkap hubungan peluang menggunakan P(X|Y). Selama fase training, perlu mepelajari peluang psoterior untuk seluruh kombinasi X dan Y berdasar informasi yang diperoleh dari training data. Dengan mengetahui peluang ini maka akan diketahui P(X1,X2,...Xn|Y1) dan P(X1,X2,...Xn|Y1) jika yang satu lebih besar dari yang lain maka pilihan atribut tersebut masuk ke kelas yang ada.

NAIVE BAYES

Menurut Rachli (2007) [4], sebelum mendeskripsikan bagaimana Naive Bayes digunakan untuk klasifikasi, disusun masalah klasifikasi dari sudut pandang statistika. Jika X melambangkan set atribut data dan Y . jika variabel kelas memiliki hubungan non deterministic dengan atirbut, maka diperlukan X dan Y sebagai variabel acak dan menangkap hubungan peluang menggunakan P(X|Y). Peluang bersyarat ini juga dikenal dengan posterior peluang untuk Y, dan sebaliknya prior P(Y). Selama fase training, perlu mempelajari peluang posterior untuk seluruh kombinasi X dan Y berdasar informasi yang diperoleh dari training data. Dengan mengetahui peluang ini, test record X’ dapat diklasifikasikan dengan menemukan kelas Y’ yang memaksimalkan peluang psoterior P(X|Y).

Untuk mengilustrasikan pendekatan ini diberikan contoh memprediksi apakah seseorang gagal mengembalikan pinjamannya.[5]. Tabel 1 memperlihatkan data training dengan atribut Home Owner, Marital Status, dan Annual Income. Peminjam yang gagal membayar diklasifikasikan sebagai Yes, seseorang yang membayar kembali sebagai No.

No Home Owner

Marital Status

Annual Income

Defaulted Borrower

1 Yes Single 120K No2 No Married 100K No3 No Single 70K No4 Yes Married 120K No5 No Divorce 95K Yes6 No Married 60K No7 Yes Divorce 220K No8 No Single 85K Yes9 No Married 75K No

10 No Single 90K YesTabel 1. Contoh Data Training

Jika diberkan test record dengan atribut berikut X = (Home Owner = No, Marital Status = Married, Annual Income = $120K). Maka untuk mengklasfikasi data tersebut masuk klasifikasi apa ,maka cara yang dilakukan adalah sebagai berikut :

P(Yes) = 3/10, P(No) = 7/10

P(Home Owner=No|Y=Yes) = 3/3 = 1P(Home Owner=No|Y=No) = 4/7P(Marital Status=Married|Y=Yes) = 0/3P(Marital Status=Married|Y=No) = 4/7P(Income=120|Y=Yes) = 0/3P(Income=120|Y=No) = 1/7

P (No, Married, 120|Y=Yes) :=P(P(No|Y=Yes).P(Married|Y=Yes).P(120|

Y=Yes).P(Yes)}={(1).(0/3).(0/3).(3/10)}= 0

P (No,Married,120|Y=No) :=P(P(No|Y=No).P(Married|Y=No).P(120|

Y=No).P(Y=No)}={(4/7).(4/7).(1/7).(7/10)}= 0,032

Karena P (No,Married,120|Y=No) > P (No, Married, 120|Y=Yes) maka keputusannya adalah No.

METODOLOGI

Alur proses penelitian secara keseluruhan dapat dilihat pada gambar berikut :

Gambar 1. Alur Penelitian

Langkah-langkah yang dilakukan dalam melakukan penelitian adalah pertama mengumpulkan data historis yang bersumber dari dari http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.dataDataset tersebut berjumlah 1000 data. Ke-1000 data ini harus dikonfirmasi untuk menetukan data training dan data testing. Untuk menentukan data testing dan data training adalah data tersebut diurutkan terlebih dahulu berdasarkan kelasnya. Setelah terurut lalu diambil 100 data untuk dijadikan data testing. Cara pengambilannya dengan mengambil tiap data ke-10 dari 1000 data hingga berjumlah 100 buah. 900 data sisa menjadi data training.Tahap berikutnya adalah tahap training. Tahapan ini terdiri dari beberapa langkah :

1. Mencari nilai peluang bersyaratPada atribut kategori xi, peluang bersyarat P(X = xi | Y = y) dicari menurut pecahan data trainingPada atribut kontinyu dicari dengan menggunakan rumus

2. Mencari nilai peluang priorUntuk mencari nilai peluang prior P(Y) tiap kelas, dapat dicari dengan

http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data

http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data

menghitung pecahan tiap training record yang dimiliki tiap kelas.

Tahap training dapat dilihat pada flowchart berikut

Gambar 2 Tahap Training

Tahap terakhir adalah menentukan klasifikasi

Klasifikasi merupakan proses penentuan kelas dari instance yang belum diketahui kelas sebelumnya. Dalam naive bayes classifier akan dihasilkan kelas resiko kredit baik dan buruk. Kelas resiko kredit yang digunakan adalah yang terbesar, yaitu baik didapatkan jika P(Baik|X) > P(Buruk|X) dimana X adalah atribut yang sudah dikethui. Sebaliknya buruk didapat jika P(Baik|X) < P(Buruk|X).

Langkah-langkah pada tahap ini adalah :1. User menginputkan data2. Penentuan peluang bersyarat P(Xi = xi |

Y= y) sesuai dengan hasil training dimana Xi, sesuai dengan inputan user.

3. Mencari hasil kali dari tiap peluang yang didapat dari nomor 1

4. Mencari peluang posterior P(Y|X)5. Untuk mengklasifikasi record, jika

P(Y1|X) > P(Y2|X), maka record diklasifikasikan sebagai Y1, sebaliknya diklasifikasikan sebagai Y2

6. Jika record tidak dapat diklasifikasikan karena peluang posterior P(Y|X) =0

maka dilakukan pendekatan m-estimasi untuk mengestimasi peluang

Gambar 3 Tahap Klasifikasi

HASIL DAN PEMBAHASAN

Eksperimen dilakukan untuk menguji kinerja sistem prediksi resiko kredit calon nasabah. Data testing yang digunakan adalah data testing yang telah disebutkan sebelumnya. 1000 data yang telah diurutkan berdasarkan kelasnya, diambil satu data setiap 10 kelas. Hingga berjumlah 100. 100 data yang telah diambil ini akan ditesting pada program untuk melihat persentasi keakuratan dari program yang telah dibuat.

Langkah yang dilakukan adalah memasukkan data satu persatu ke dalam sistem untuk menguji keakuratannya. Gambar berikut adalah contoh form penginputan data ke dalam sistem.

Gambar 4 Tampilan Program

Setelah data dimasukkan semua maka pencet tombol “Hitung Prediksi” untuk melihat hasil prediksinya berdasarkan teori Naive Bayes. Jika perhitungan menghasilkan resiko baik akan muncul Kotak Pesan : “Nasabah Ini Diprediksi Baik” Jika perhitungan menghasilkan resiko buruk akan muncul kotak pesan : “Nasabah Ini Diprediksi Buruk”. Contoh gambar hasil prediksi yang dimunculkan adalah sebagai berikut

Gambar 5 Prediksi Hasil Baik

Gambar 6 Prediksi Hasil Buruk

Tabel berikut menggambarkan hasil perhitungan 100 data yang telah diinputkan berdasarkan sensitifitas dan spesifisitas. Sensitifitas adalah peluang mendeteksi hasil positif (baik) yang dimana nasabah tersebut memang terbukti baik. Sedangkan spesitifitas adalah peluang mendeteksi hasil negatif (buruk) yang dimana nasabah tersebut memang terbukti buruk.

Tabel 2 Hasil Tes

Sensitifitas = TP / (TP + FN)= 62 / (62 + 7)= 0.8985= 90 %

Spesifisitas = TN / (FP + TN)= 8 / (23 + 8)= 0.2580= 26 %

False Positive Rate = FP / (FP + TN)= 23 / (23 + 8)= 0.7419= 74 %

False Negative Rate = FN / (FN + TP)= 7 / (7 + 62)= 0.1014= 10 %

Berdasarkan pada hasil uji coba terlihat bahwa sensitfitasnya yang tinggi yaitu sebesar 90 %. Serta false positive rate yang tinggi pula yaitu 74 %. Hal ini menunjukkan bahwa sisitem akan cenderung menunjukkan hasil positif (prediksi baik) dikarenakan tingginya false positive rate. Hal ini dikarenakan perbandingan jumlah hasil baik dan buruk pada data uji yang tidak sebanding. Jumlah hasil baik yaitu 70 sedangkan hasil buruk 30. Hal lain yang berpengaruh adalah jumlah hasil baik pada data latih yaitu 630 hasil baik, sedangkan untuk hasil buruk adalah 270 hasil

Hasil Aplikasi

Status NasabahKondisi

BaikKondisi Buruk

Hasil Tes Baik

True Positive =

62

False Positive =

23Hasil Tes

BurukFalse

Negative = 7

True Negative

= 8

buruk. Serta yang paling berpengaruh adalah sifat dari naive bayes itu sendiri, yang menganggap hubungan antara satu atribut dengan atribut yang lain adalah saling lepas.

KESIMPULAN

Penelitian ini telah menerapkan teori Naive Bayes untuk menentukan prediksi resiko kredit bagi calon nasabah suatu bank. Sebelum data testing dimasukkan, terlebih dahulu dilakukan perhitungan data training untuk menentukan peluang tiap atribut terhadap suatu kelas. Berdasarkan informasi dari data training inilah dapat dicari prediksi resiko selanjutnya. Hasil eksperimen menunjukkan bahwa sistem yang dibangun bekerja efektif. Hal ini ditunjukkan dengan keakuratan sistem dalam memprediksi hasil positif (nasabah baik) yang tinggi mencapai 90 %. Sedangkan untuk mendeteksi hasil negatif (nasabah buruk) adalah 26 %. Kecerendungan sistem untuk menampilkan hasil false positive termasuk tinggi, hal ini dikarenakan false positive rate sebesar 74 %. Sedangkan kecerendungan sistem untuk menampilkan hasil false negative sedikit yaitu 10 %. Hal ini disebabkan karena teori naive bayes yang menganggap lepas hubungan antar atiribut padahal dalam kenyataannya ada beberapa atribut yang saling berhubungan satu sama lain. Penelitian selanjutnya diharapkan untuk menggunakan metode lain dalam memprediksi resiko.

DAFTAR PUSTAKA

[1] Suyatno. 2003. Dasar-Dasar Kredit (http://www.scribd.com/doc/17579545/Kredit-Macet-Perbankan-Merangkan-Naik, diakses 15 Desember 2012)

[2] Christianata. 2008. Tindakan Hukum Penyelamatan Kredit Macet Restrukturisasi Berdasarkan Undag-Undang Perbankan. Ebook

[3] Wiyoto, 2009, Kredit Macet Perbankan Merangkak Naik. Ebook

[4] Rachli, Muhammad. 2007. Email Filtering Menggunakan Naive Bayesian. Ebook

[5] Haryanto, Toto. 2012. Naive Bayes. (http://totoharyanto.staff.ipb.ac.id/2012/03/27/

naive-bayes/, diakses tanggal 15 Desember 2012)

http://totoharyanto.staff.ipb.ac.id/2012/03/27/naive-bayes/

http://totoharyanto.staff.ipb.ac.id/2012/03/27/naive-bayes/

http://www.scribd.com/doc/17579545/Kredit-Macet-Perbankan-Merangkan-Naik

http://www.scribd.com/doc/17579545/Kredit-Macet-Perbankan-Merangkan-Naik

Documents

Jurnal Naive Bayes