21
5.1 FUNGSI MAYOR PERTAMA DATA MINING , KLASIFIKASI Sebagai gambaran, anda diberi data mengenai 8 orang nasabah yang pernah memperoleh kredit dari Bankk Bhantara Putra. Data tersebut meliputi besarnya tabungan (yang berjenis kategorial: rendah, sedang atau tinggi), besarnya pendapatan pertahun (dalam ribuan dolar, yg berjenis numeric dan berskalarasio). Data lengkap ada ditabel bawah ini : Nasabah Tabungan Aset Pendapatan Resiko Kredit A Sedang Tinggi 75 Baik B Rendah Rendah 50 Buruk C Tinggi Sedang 25 Buruk D Sedang Sedang 50 Baik E Rendah Sedang 100 Baik F Tinggi Tinggi 25 Baik G Rendah Rendah 25 Buruk H Sedang Sedang 75 Baik Data latihan akan diolah dengan menggunakan algoriteme klasifikasi Masalah klasifikasi berakhir dengan dihasilakannya sebuah pengetahuan yang direpsesentasikan dalam bentuk diagram yang disebut pohon keputusan (discision tree). 5.3 PROTOTIPE MASALAH KLASIFIKASI DAN PENGETAHUAN YANG DIHASILKAN Gambar 5.1 adalah contoh gambar contoh pohon keputusan, sebagai jawaban bagi masalah klasifikasi dengan data latihan seperti yang tertera pada table 5.1 yang dalam hal ini variable prediktornya adalah asset, tabungan, dan pendapatan sedangkan variable tujuanya adalah resiko kredit

DATAMINING (1)

Embed Size (px)

DESCRIPTION

data miningg

Citation preview

Page 1: DATAMINING (1)

5.1 FUNGSI MAYOR PERTAMA DATA MINING , KLASIFIKASI

Sebagai gambaran, anda diberi data mengenai 8 orang nasabah yang pernah memperoleh kredit dari Bankk Bhantara Putra. Data tersebut meliputi besarnya tabungan (yang berjenis kategorial: rendah, sedang atau tinggi), besarnya pendapatan pertahun (dalam ribuan dolar, yg berjenis numeric dan berskalarasio). Data lengkap ada ditabel bawah ini :

Nasabah Tabungan Aset Pendapatan Resiko Kredit

A Sedang Tinggi 75 Baik

B Rendah Rendah 50 Buruk

C Tinggi Sedang 25 Buruk

D Sedang Sedang 50 Baik

E Rendah Sedang 100 Baik

F Tinggi Tinggi 25 Baik

G Rendah Rendah 25 Buruk

H Sedang Sedang 75 Baik

Data latihan akan diolah dengan menggunakan algoriteme klasifikasi

Masalah klasifikasi berakhir dengan dihasilakannya sebuah pengetahuan yang direpsesentasikan dalam bentuk diagram yang disebut pohon keputusan (discision tree).

5.3 PROTOTIPE MASALAH KLASIFIKASI DAN PENGETAHUAN YANG DIHASILKAN

Gambar 5.1 adalah contoh gambar contoh pohon keputusan, sebagai jawaban bagi masalah klasifikasi dengan data latihan seperti yang tertera pada table 5.1 yang dalam hal ini variable prediktornya adalah asset, tabungan, dan pendapatan sedangkan variable tujuanya adalah resiko kredit

Pada gambar tersebut terdiri darai dua notkah . pertama notkah berbentuk elips yang disebut juga notkah keputusan notkah yang masih akan bercabang karena pada notkah ini suatu catatan 9misalnya nasabah) blm dapat ditentukan klasifikasinya (apakah nasabah ini punya resiko kredit bank yang baik atau buruk) notkah keputusan pertama disebut notkah dasar. Kedua notkah yang berbentuk persegi panjang yang disebut juga notkah terminasi adalah notkah yang tidak akan bercabang lagi karena pada notkah ini suatu catatan( misalnya nasabah) sudah dapat ditentukan klasifikasinya.

Page 2: DATAMINING (1)

Tabungan = Tinggi Tabungan =

{Rendah, sedang}

Aset = Tinggi Aset = Sedang

Notkah dasar Asset = rendah VS Asset = (sedang,tinggi)

Notkah terminasi Resiko buruk (catatan B, G

Notkah keputusan A (catatan A C D E F H)

Noktah terminasi Resiko Baik (catatan A

Noktah keputusan B Resiko Baik (catatan C,F)

Noktah terminasi Resiko baik (catatan

C)

Naskah terminasi Resiko Buruk (catatan

F)

Page 3: DATAMINING (1)

Pertama tama pada notkah dasar semua cacatan nasabah (A B C D E F G H ) sama sekali belum mendapat klasifikasi. Terhadap seluruh catatan ini pertama-tama tanyakan seberapa besar asetnya bila asset sebuah catatan termasuk rendah catatan ini langsung diklasifikasikan sebagai nasabah dengan resiko kredit yang buruk, dan notkah bagi catatanyang termasuk dalam klasifikasinya ini berjenis notkah terminasi.

Selanjutnya terhjadap notkah keputusan A dilakukan percabangngan dengan menanyakan besarnya tabungan.

Terakhir terhadap notkah B dilakukan percabangan dengan kembali menanyakan besarnya asset.

5.4 ALGORITME KLASIFIKATI CART (CLASIFICATION AND REGRESSION TREES)

Pembahasan sebelumnya dapat kita ringkas dalam 3 pemjelasan berikut :

1. Pertama, kita memiliki data dari 8 nasabah seperti yang tertera pada table 5.1 dan ingin memperoleh pengetahuan yang dapat diaplikasikan kepada mereka yang berpotensi menjadi nasabah kesembilan kesepuluh kesebelas dan selanjutnya sehingga dengan mengetahui asset, tabungan, dan pendapatan kita dapat menentukan resiko kredit mereka.

2. Kedua data itu kelak akan kita jadikan input bagi suatu algoritme yang saat inibelum diketahui jenis algoritmanya

3. Ketiga sebagai keluaran dari algoritme yang saat ini belum diketahui jenisnya kita akan memperoleh pengetahuan yang secara sederhana dapat direpseptasikan dalam bentuk pohon keputusan.

Subbab ini akan membahas detail salah satu algoritme yang dapat menghasilkan pohon keputusan. Algoritme inii disebut classification and regression trees atau CART. Cirri khas algoritme CART ini adalah notkah keputusan yang selalu bercabang dua atau bercabang biner.

Langkah-langkah pada lagoritme CART adalah sebagai berikut :

1. Langkah pertama, susunlah calon cabang (candidate split).2. Langkah kedua adalah menilai kinerja seluruhan calon cabang yang ada pada daftar

cabang mutakhir dengan jalan hitung nilai besaran kesesuaian 0(s|t), yang akan diterangkan.

3. Langkah ketiga adalah menentukan calon cabang manakah yang akan benar-benar dijadikan cabang dengan pilihan calon cabang yang memiliki nilai kesesuain 0(s|t) terbesar. Setelah itu gambarkan lah percabangan.

Langkah pertama algoritme CART

Langkah pertama algoritme CART adalah menyusun calon cabang. Penyusunan ini dilakukan terhadap seluruh variable predator secacra lengkap. Pada kasus ini yang terjadi variable predator

Page 4: DATAMINING (1)

seluruhnya adalah tabungan, asset dan pendapatan. Mari kita nyusun calon cabang yang lengkap untuk masing-masing variable predator ini.

Calon cabang untuk predator tabungan adalah sebagai berikut :

1. Tabungan = Rendah, dan tabungan = (sedang, Tinggi),2. Tabungan = Sedang, dan tabungan = (Rendah, Tinggi), dan3. Tabungan = Tinggi, dan tabungan = (Rendah Tinggi),

Calon cabang untuk variable predictor asset adalah sebagai berikut :

1. Asset = Rendah, dan asset = ( Sedang, Tinggi),2. Asset = Sedang, dan asset = ( Rendah, Tinggi),3. Asset = Tinggi, dan asset = ( Rendah, Tinggi),

Pada variable predictor pendapatan yang sifatnya numeric, calon cabang yang dapat diusulkan adalah sebagai berikut :

1. Pendapatan < 25.000 dan pendapatan > 25.000,2. Pendapatan < 50.000 dan pendapatan > 50.000,3. Pendapatan < 75.000 dan pendapatan > 75.000,

Mengingat cirri khas algoritme CART yang setiap notkah keputusanya bercabang biner, maka calon cabang kiri dan calon cabang kanan selengkapnya keseluruhan calon cabang disajikan dalam table 5.2.

Nomor calon cabang Calon cabang kiri Calon cabang kanan

1 Tabungan = Rendah Tabungan = (Sedang, Tinggi)2 Tabungan = Sedang Tabungan = (Rendah,Tinggi)3 Tabungan = Tinggi Tabungan = (Rendah,Tinggi)4 Asset = Rendah Asset = (Rendah,Sedang)5 Asset = Sedang Asset = (Rendah,Tinggi)6 Asset = Tinggi Asset = (Rendah,Sedang)7 Pendapatan = < 25.000 Pendapatan = < 25.0008 Pendapatan = < 50.000 Pendapatan = < 50.0009 Pendapatan = < 75.000 Pendapatan = < 75.000

Penggunaan kata calon cabang pada table 5.2 memang diperlukan karena kesembilan calon cabang pada notkah keputusan . lalu bagaimana kita menentukan

1. Calon cabang manakah yang akan benar-benar menjadi cabang notkah keputusan dan2. Calon cabang manakah yang tidak atau belum akan menjadi cabang notkah keputusan

Pertanyaan itu akan dijawab pada langkah ke dua

Page 5: DATAMINING (1)

Langkah kedua algoritme CART (iterasi I)

Kinerja dari setiapcalon cabang akan diukur melalui ukuran yang disebut Kesesuaian (goodness). Kesesuaian dari calon cabang s pada notkah keputusan t dilambangkan dengan 0 (s|t) dan di defenisikan sebagai

Persamaan 5.1

0 (s|t) = 2 P l P r ∑ |P(j|t l) –P (|t r)|

Dalam hal ini

Persamaan 5.2

t L = calon cabang kiri dari notkah keputusan t

Persamaan 5.3

t R = calon cabang kiri dari notkah keputusan t

Persamaan 5.4

P L = Jumlah cattaan pada calon cabang kiri t L

Jumlah cattatan pada data latihan

Persamaan 5.5

P R = Jumlah cattaan pada calon cabang kanan t R

Jumlah cattatan pada data latihan

Persamaan 5.6

P (p|tL) = Jumlah catataan berkategori j pada calon cabang kiri t i

Jumlah catatan pada data notkah keputusan t

Persamaan 5.7

P (p|tR) = Jumlah catataan berkategori j pada calon cabang kanan t R

Jumlah catatan pada data notkah keputusan t

Persamaan 5.8

Q (s|t) = Jumlah kategori

∑ |P (j|tL) - P (j|tr)|

Page 6: DATAMINING (1)

J=1

Maka berdasarkan persamaaan 5.1 akan didapatkan persamaan berikut :

Persamaan 5.9

Q (s|t) = 2 PlPr) (s|t)

NomorCalonCabang

PL PRResikoKredit

P (j|tL) P (j|tR) 2PLPR Q(s|t) Ө (s|t)

1 3/8 = 0.375 5/8 = 0.625 Baik :Buruk :

1/3 = 0.3332/3 = 0.667

4/5 = 0.81/5 = 0.2

0.46875 0.933 0.4375

2 3/8 = 0.375 5/8 = 0.625 Baik :Buruk :

3/3 = 10/3 = 0

2/5 = 0.43/5 = 0.6

0.46875 1.2 0.5625

3 2/8 = 0.250 6/8 = 0.75 Baik :Buruk :

½ = 0.5½ = 0.5

4/6 = 0.6672/6 = 0.333

0.375 0.333 0.125

4 2/8 = 0.250 6/8 = 0.75 Baik :Buruk :

0/2 = 02/2 = 0

5/6 = 0.8331/6 = 0.167

0.375 1.667 0.625

5 4/8 = 0.500 4/8 = 0.5 Baik :Buruk :

¾ = 075¼ = 0.25

2/4 = 0.52/4 = 0.5

0.5 0.5 0.25

6 2/8 = 0.250 6/8 = 0.75 Baik :Buruk :

2/2 = 10/2 = 0

3/6 = 0.53/6 = 0.5

0.375 1 0.375

7 3/8 = 0.375 5/8 = 0.625 Baik :Buruk :

1/3 = 0.3332/3 = 0.667

4/5 = 0.81/5 = 0.2

0.46875 0.933 0.4375

8 5/8 = 0.625 3/8 = 0.375 Baik :Buruk :

2/5 = 0.43/5 = 0.6

3/3 = 10/3 = 0

0.46875 1.2 0.5625

9 7/8 = 0.875 1/8 = 0.125 Baik :Buruk :

4/7 = 0.5713/7 = 0.429

1/1 = 10/1 = 0

0.21875 0.857 0.1875

Hasil hitungan nilai kesesuaian bagi tiap calon cabang yang masih terdapat dalam daftar calon cabang mutakhir yaitu table 5.2, disajikan dalam table 5.3

Untuk mendapatkan gambaran mengenai cara untuk mendapatkan table 5.3 berikut adalah penjelasan mengenai perhitungan nilai kesesuaian misalnya bagi calon cabang no 4, yaitu calon cabang yang terdiri atas calon cabang kiri, yaityu asset = rendah dan calon cabang kanan yaitu asset (sedang,Tinggi).

Ada 2 buah catatan yang memenuhi syarat asset = Rendah, yaitu catatan B dan G litaht table 5.1. adapun jumlah catatan poada data latihan yang dipertimbangkan saat ini 8 buah yaitu catatan A B C D E F G dan H sehingga persamaan 5.4 didapatkan :

Page 7: DATAMINING (1)

Ada 6 buah catatan yang memenuhi syarat asset = (sedang, tinggi ), yau catatan A,C,D,E,F dan H . (lihat table 5.1)

Selanjutnya yang didapatkan :

1. Nilai dari besaran 2PLPR = 2(0,25)(0,75)=0,375

2. Nilai dari besaran , lihat persamaan 5.8 adalah

Q(s|t) JUMLAH ∑KATEGORI |P(J|tL) –P(J|tR) | = |0-0,833| + |1-0,167| = 1.667

J=L

Dan akhirnya didapatkan pula (dsri persamaan 5.9 ):Q(s|t) = 2 PLPR Q(s|t) = 2(0,25)(0,75)(1,667) = 0.625

Perhitungan nilai kesesuian terhadap calon cabang nomor 4 dapat diambil analoginya sehingga pembaca dapat memeriksa perhitungan sejenis terhadap calon cabang yang lain selengkapnya, hasil perhitungan itu tersaji pada TABEL 5.3

Langkah ketiga algoritma CART (itersi -1)

Langkah ketiga algoritme ini adalah mementukan calon cabang manakah yang akan benar- benar yang di jadikan cabang . hal ini dilakukan dengan memilih calon cabang yang memiliki nilai kesesuian Q (s|t) terbesar .

Setelah itu gambarkanlan percabangangan sesuai hasil menjalankan algoritme . jika tidak ada lagi notkah keputusan , pelaksanaan algoritme CART akan di hentikan . namun jiak masih terdapat notkah keputusan , pelaksanaan algoritme di lanjutkan dengan kembali ke langkah kedua , dengan terlebih dahulu membuang cabang yang berhasil telah menjadi cabang .

Dari TABEL 5.3 tampak bahwa calon cabang nomor 4 adalah calon cabang dengan nilai besaran kesesuian terbesar daripada calon cabang yang lain , maka cabang inilah yang akan kita pilih sebagai cabang pada tahap ini sehingga kita memperoleh gambar 5.2 dari iterasi -1 ini.

Notkah dasar Asset = rendah VSAsset = (sedang,tinggi)

Notkah terminasi Resiko buruk

Notkah keputusan A (catatan A C D E F H)

Page 8: DATAMINING (1)

Dari gambar 5.2 tampak

1. Pada notkah dasar , kita masih berhadapan dengan seluruh catatan yaitu catatan A,B,C,D,E,F,G dan H .

2. Calon cabang nomor 4 kini telah benar-benar menjadi cabang yang memenuhi syarat asset = rendah dipenuhi oleh catatan =B dan G , dan karena nilai variabel predictor bagi kedua catatan ini seluruhnya , adalah resiko kredit = buruk , maka notkah terminasi akan dihasilkan .

3. cafungsi mayor pertama data mining, klasifikasibang kananya , yaitu cabang yaitu cabang yang memenuhi syarat asset = (sedang, tinggi) dipenihin oleh catatan A,B,C,D,E,F dan H, dan kerena nilai variabel predictor bagi catatan –catatan ini ada memeiliki resiko KREDIT = Buruk , maka dihasilkanlah notkah keputusan

ini adalah haSIL ITERASI- 1dalam menjalankan algoritme CART .dari gambar 5.2 tampak jelas bahwa notkah keputusan masih ada sehingga kita harus kembali kelangkah kedua dan kali ini kita tel;ah memasuki ITERASI -2.

Langkah kedua algoritme CART (iterasi -2)

Langkah kedua algoritme ini akan menilai kinerja dari keseluruhan calon cabang yang ada pada daftar calon cabang mutakhir . untuk saat ini , daftar calon cabang mutakhir berasal dari daftar sejenis sebelumnya ( yaitu TABEL 5.2) dengan membuang calon cabang yang telah berhasil menjadi cabang pada langkah –langkah sebelumnya , seperti yang vterlihat pada TABEL 5.4.

Nomor calon

cabang

Calon cabang kiri Calon cabang kanan

1 Tabungan = rendah Tabungan = (sedang ,tinggi)2 Tabungan = sedang Tabungan = (rendah ,tinggi)3 Tabungan = tinggi Tabungan = (rendah, sedang)4 Asset = sedang Asset = (rendah, tinggi )5 Asset = tinggi Asset = (rendah,sedang) 6 Pendapatan = ≤ 25.000 Pendapatan = ≤ 25.0007 Pendapatan = ≤ 50.000 Pendapatan = ≤ 50.0008 Pendapatan = ≤75.000 Pendapatan = ≤75.000

Tampak bahwa tabel 5.4 sebenernya berasal dari tabel 5.2 dengan membuang calon cabang 4 yang pada langkah ketiga iterasi -1 telas berhasil menjadi cabang .

Page 9: DATAMINING (1)

Hasil perhitunagan nilai kesesuaian bagi tipa calon cabang yang masih terdapat dalam daftar calon cabang mutakhir yaitu tabel 5.4 disajikan dalam tabel 5.5

Untuk mendapatakan gambaran mengenai cara mendapatkan tabel 5.5 berikut ini adalah penjelasan terhadap perhitungan nilai kesesuaian , misalnya saja Bagi calon cabang nomor 3 yaitu calon cabang nomor 3 , yaitu calon cabang yang terdiri atas calon cabang kiri (tabungan = tinggi) dan calon cabang kanan (tabungan = [rendah , sedang]).

NomorCalonCabang

PL PRResikoKredit

P (j|tL) P (j|tR) 2PLPR Q(s|t) Ө (s|t)

1 3/8 = 0.375

5/8 = 0.625

Baik :Buruk :

1/3 = 0.3332/3 = 0.667

4/5 = 0.81/5 = 0.2

0.46875 0.933 0.4375

2 3/8 = 0.375

5/8 = 0.625

Baik :Buruk :

3/3 = 10/3 = 0

2/5 = 0.43/5 = 0.6

0.46875 1.2 0.5625

3 2/8 = 0.250

6/8 = 0.75

Baik :Buruk :

½ = 0.5½ = 0.5

4/6 = 0.6672/6 = 0.333

0.375 0.333 0.125

4 2/8 = 0.250

6/8 = 0.75

Baik :Buruk :

0/2 = 02/2 = 0

5/6 = 0.8331/6 = 0.167

0.375 1.667 0.625

5 4/8 = 0.500

4/8 = 0.5 Baik :Buruk :

¾ = 075¼ = 0.25

2/4 = 0.52/4 = 0.5

0.5 0.5 0.25

6 2/8 = 0.250

6/8 = 0.75

Baik :Buruk :

2/2 = 10/2 = 0

3/6 = 0.53/6 = 0.5

0.375 1 0.375

7 3/8 = 0.375

5/8 = 0.625

Baik :Buruk :

1/3 = 0.3332/3 = 0.667

4/5 = 0.81/5 = 0.2

0.46875 0.933 0.4375

8 5/8 = 0.625

3/8 = 0.375

Baik :Buruk :

2/5 = 0.43/5 = 0.6

3/3 = 10/3 = 0

0.46875 1.2 0.5625

9 7/8 = 0.875

1/8 = 0.125

Baik :Buruk :

4/7 = 0.5713/7 = 0.429

1/1 = 10/1 = 0

0.21875 0.857 0.1875

Page 10: DATAMINING (1)

Hendaknya kita tidak lupa bahwa noktah yang tengah kita kerjakan percabanganya catatan 1,3,4,5,6, dan 8 . dari catatan – catatan pada noktah keputusan A , terdapat 2 buah catatan yang memenuhi syarat tabungan = tinggi , yaitu catatan C dan F ( LIHAT TABEL 5.1) . adapun jumlah catatan pada data latihan yang di pertimbangkan saat ini 6 buah , yaitu catatan A ,C ,D ,E ,F dan H persamaan :

P L = Jumlah cattaan pada calon cabang = Tinggi pd cabang kiri-3

Jumlah cattatan pada data latihan pada noktah keputusan yg tengah di bahas

= 26

=0,333

Selain itu terdapat 4 buah catatan memenuhi syarat tabungan (rendah , sedang) , yaitu catatan A,D, E dan H (LIHAT TABEL 5.1) adapun jumlah catatan pada data latihan dipertimbngkan saat ini 6 BUAH , yaitu catatan A, C,D,F, dan H . sehingga dari persamaan 5.5 didapatkan

P R = Jumlah cattaan dengan tabungan =(rendah ,sedang) pd calon cabang knan

Jumlah cattatan pada data latihan pada noktah keputusan yg ditengah di bahas

= 46

=0,667

Dari dua buah catatan yang memenuhi syarat calon cabang kiri tabunagan = tinngi yaitu catatan C dan F .

Langkah ketiga algoritma CART (iterasi- 2)

Langkah ketiga algoritme ini adalah menentukan calon cabang manakah yang akan benar-benar dijadiakan cabang . hal ini ditempuh dengan memeilih calon cabang yang memiliki nilai kesesuaian Q(s|t) terbesar .

Setelah itu gambarkanlan percabangangan sesuai hasil menjalankan algoritme . jika tidak ada lagi notkah keputusan , pelaksanaan algoritme CART akan di hentikan . namun jiak masih terdapat notkah keputusan , pelaksanaan algoritme di lanjutkan dengan kembali ke langkah kedua , dengan terlebih dahulu membuang cabang yang berhasil telah menjadi cabang .

Page 11: DATAMINING (1)

Dari TABEL 5.5 tampak bahwa calon cabang nomor 3 DAN 7 adalah calon cabang dengan nilai besaran kesesuian terbesar daripada calon cabang yang lain , maka cabang inilah yang akan kita pilih sebagai cabang pada tahap ini sehingga kita memperoleh gambar 5.3 dari iterasi -2 ini.

Dari gambar 5.3 tampak

Notkah dasar Asset = rendah VSAsset = (sedang,tinggi)

Notkah terminasi Resiko buruk

Notkah keputusan A (catatan A C D E F H)

Naskah keputusan B Resiko Baik (catatan C,F) Naskah terminasi

Resiko Baik (catatan A

Naskah terminasi Resiko baik (catatan

F)

Naskah terminasi Resiko Buruk (catatan

C)

Page 12: DATAMINING (1)

1. Pada notkah keputusan A , kita masih berhadapan dengan seluruh catatan yaitu catatan A,B,C,D,E,F,G dan H .

2. Calon cabang nomor 3 kini telah benar-benar menjadi cabang yang memenuhi syarat Tabungan = tinggi dipenuhi oleh catatan =C dan F , dan karena kedua catatan tersebut memiliki nilai variabel predictor berbeda ,dihasilakan noktah keputusan . karena merupakan notkah keputusan kedua . kita dapat menyebutkan noktah keputusan B, dan sesuai dengan namanya noktah ini akan bercabang lagi

3. Cabang kanan , yaitu cabang yaitu cabang yang memenuhi syarat tabungan= (rendah , sedang) dipenihin oleh catatan A,D,E dan H, dan kerena nilai variabel predictor bagi catatan –catatan ini semuanya sama yaitu resiko KREDIT = Baik , maka dihasilkanlah notkah terminasi. Sesuai dengan namanya noktah tersebut tidak akan bercabang lagi .

ini adalah haSIL ITERASI- 2dalam menjalankan algoritme CART .dari gambar 5.3 tampak jelas bahwa notkah keputusan masih ada sehingga kita harus kembali kelangkah kedua dan kali ini kita tel;ah memasuki ITERASI -3.

Langkah ketiga algoritma CART (iterasi- 2)

Langkah ketiga algoritme ini akan menilai kinerja dari keseluruhan calon cabang yang ada daftar calon cabang mutakhir . untuk saat ini , datar calon cabang mutahir berasal dari daftar sejenis sebelumnya (tabel 5.2 ). Dengan membuang calon cabang yang telah berhasil menjadi cabang pada langkah-langkah sebelumya .

Tabel 5.6. Daftar calon cabang mutakhir Masalah nasabah bank bhatara patra (itersai-3)

Nomor calon cabang

Calon cabang kiri Calon cabang kanan

1 Tabungan = rendah Tabungan = (sedang,tinggi)2 Tabungan = sedang Tabungan =( rendah,tinggi)5 Asset = sedang Asset =(rendah,tinggi)6 Asset=tinggi Asset=(rendah.sedang)7 Pendapatan ≤ 25000 Pendapatan ≤ 250008 Pendapatan ≤ 50000 Pendapatan ≤ 500009 Pendapatan ≤ 75000 Pendapatan ≤ 75000

Tampak pada Tabel 5.6 sebenarnya berasal dari tabel 4.4 yang telah membuang calon cabang 3 yang pada langkah ketiga iterasi-2 telah berhasil menjadi cabang. Selanjutnya, hasil perhitungan nilai kesesuaian bagi tiap calon cabang yang masih terdapat dalam dafatr calon cabang mutakhir (Tabel 5.6) disajikan dalam Tabel 5.7.

Page 13: DATAMINING (1)

Tabel 5.7 Perhitungan nilai kesesuaian untuk calon cabang 1.2.5.6.7.8.9

No Calon Cabang

Pʟ Pʀ Risiko Kredit

P(j|tʟ) P(j|tʀ) 2PʟPʀ Q(s|t) ᶲ(s|t)

1 0/2= 0 2/2=1 Baik :Buruk :

00

½= 0,5 0 1,000 0

2 0/2= 0 2/2=1 Baik :Buruk :

00

½= 0,5 0 1,000 0

345 1/2= 0,5 1/2=0,5 Baik :

Buruk :0/1= 01/1= 1

1/1= 0,10/1= 0

0,5 2,000 1

6 1/2= 0,5 1/2=0,5 Baik :Buruk :

1/1= 10/1= 0

0/1= 00/1= 0

0,5 2,000 1

7 2/2= 1 0/2=0 Baik :Buruk :

½= 0,5½= 0,5

0/2= 00/2= 0

0 1,000 0

8 2/2= 1 0/2=0 Baik :Buruk :

½= 0,5½= 0,5

0 0

0 1,000 0

9 2/2= 1 0/2=0 Baik :Buruk :

½= 0,5½= 0,5

0 0

0 1,000 0

6. Langkah ketiga Algoritme CART (Iterasi-3)

Langkah ini adalah menentukan calon cabang manakah yang akan benar-benar dijadikan cabang. Hal ini ditempuh denagn memilih calon cabang yang memiliki nilai kesesuaian ᶲ(s|t) terbesar. Setelah itu, gambarkan percabangan sesuai hasil menjalankan algoritme. Jika tidak ada lagi noktah keputusan, pelaksanaan algoritme CART akan dihentikan. Namun jika masih ada noktah keputusan, pelaksanan algoritme dilanjutkan dengan kembali ke langkah ke-2, dengan terlebih dahulu membuang calon cabang yang telah berhasil menjadi cabang.

Dari Tabel 5.7, tampak bahwa calon cabang nomor 5 dan 6 adalah calon cabang dengan nilai besaran kesesuaian terbesar daripada calon cabang lainnya. Oleh karena itu, salah satu dari calon cabang itulah yang akan kita pilih pada tahap ini sehingga kita memperoleh gambar 5.4 (yang identik dengan gambar 5.1) pada iterasi-3 ini.

Page 14: DATAMINING (1)

Gambar 5.4 Pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara Putra (iterasi-3)

Dari gambar 5.4, terlihat bahwa

1. Pada noktah keputusan B, kita masih berhadapan dengan 2 catan, yaitu catatn C dan F.2. Calon cabgang nomor 5 kini telah be(aset = Medium)hanya diisi oleh sebuah catatan saja

(catatan C), noktah terminasi akan dihasilkan sehingga noktah ini tidak akan bercabang lagi.

3. Cabang kanannya, yaitu cabang yang memenuhi syarat tabungan = (Rendah, Tinggi) dipenuhi oleh catatan F. Karena menjadi satu-satunya catatan pada cabang ini, noktah terminasi akan dihasilkan. Sesuai dengan namanya, noktah tersebut tidak akan bercabang lagi.

Karena pada langkah terakhir ini tidak ada lagi noktah keputusan, iterasi akan dihentikan dan gambar 5.5 adalah pengetahuan yang dihasilkan dari fungsi klasifikasi pada data mining.

Page 15: DATAMINING (1)

5.5 KLASIFIKASI: PENGEMBANGN SELANJUTNYA

Pembaca yang menaruh minat untuk mendalami algoritme klasifikasi lain dapat mempelajari algoritme berikut (Berry dan Brown, 2006):

1. Algoritme mean vector,2. Algoritme k-nearest neighbor,3. Algoritme ID3,4. Algoritme C4.5,5. Algoritme C5.0.