Transcript

Romauli Manullang - 5108100501IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITSLatar Belakang Pembuatan jadwal pada J urusan Tekniklnformatika ITSharusdilakukanpadasetiappergantiansemester. Pembuatanjadwal ini membutuhkanwaktu, tenagadanketelitian. Adanyakesulitanuntuk menentukanjumlahmahasiswayangmengambil matakuliahtertentupadatiapsemester.2/18/20113PerumusanMasalah Bagaimana melakukan prediksi jumlah mahasiswa, yang mengambil matakuliahtertentumenggunakanpendekatanmetodeklasifikasi dalamdecisiontree? Bagaimana menentukan metode decision tree yang tepat berdasarkan karakteristikdata? Bagaimana membangun rule pengklasifikasian prediksi jumlah mahasiswapengambil matakuliah? Bagaimanamngimplementasikanmetodeklasifikasi decisiontree? Bagaimanamelakukanuji cobadecisiontreetersebut kedalamMatlab.2/18/20114TujuanMembuat implementasi decisiontreeuntukmemprediksijumlah mahasiswa pengambil matakuliah denganmenggunakanstudi kasusdi J urusanTeknikInformatikaITS.2/18/20115BatasanMasalah Data yang diambil dari SistemInformasi AkademikITS telahbenar. Studi kasusyang digunakanadalahJ urusanTeknikInformatikaITS Surabaya. Membatasi nilai mahasiswayang mengulangmatakuliahyang memiliki nilai sebelumnyaBC danC. Metodedecision tree yang digunakanadalahC4.5 Implementasi dibuat denganmenggunakanMatlab7.1.2/18/20116Algoritma C4.5SecaraumumAlgoritmaC4.5 membangunpohonkeputusan:a.Pilihatribut sebagai root. b.Buat cabanguntukmasing-masingnilai. c.Bagi kasusdalamcabang. d.Ulangi prosesuntukmasing-masingcabangsampaisemuakasuspadacabangmemiliki kelasyang sama. 2/18/20119Information Gain AtributA (Gain(a))Untukmemilihatributsebagai akar, didasarkanpadanilai gain tertinggi dari atribut-atributyang ada.Dengan:S : HimpunanKasusA : Atributn : J umlahpartisi atributA| Si |: J umlahKasuspadapartisi kei| S| : J umlahkasusdalamS2/18/201110Entropy (Teori Informasi) Kebutuhanbit untukmenyatakansuatukelas. Semakinkecil nilai Entropy makasemakinbaikuntukdigunakandalammengekstraksi suatukelas. Dengan:S : HimpunanKasusn : J umlahpartisi Sp : Proporsi dari Si terhadapS2/18/201111AlgoritmaAlpha Beta Alpha-beta pruning adalah algoritma pencarianyangmengurangi secara drastis jumlah simpul yangdibangkitkan untukdievaluasi pada pohon pencarianyangdieksplorasi dalamalgoritmaMinimax. Simpul MINakandianggapsebagai simpul denganurutannilai dari rendahketinggi, dansimpul MAX daritinggi kerendah.2/18/201112Perancangan2/18/201113Blok Diagram SistemInformasi Akademik Pengambil MatakuliahDiagram Alir DesainSistemSecaraUmumMulaiData Analisa Pengambil MatakuliahDecision Tree dengan Prioritas pengambil MatakuliahDecision Tree dengan Pengambil Matakuliah Decision Tree dengan Pengambil Matakuliah Solusi Prediksi Pengambil MatakuliahSelesaiT Y2/18/201114Data Rule Decision Tree2/18/201116No. NamaData Keterangan1. Id ID untuk tiapkondisi.2. ParentID ID yang mewarisi kondisi.3. Level Level tiapkondisi dalamtree.4. Atribut Atribut yang ditunjuk olehlevel.5. Kondisi Nilai atribut yang ditunjuk olehatribut.Implementasi Membacafile xls(read file xls). Inisialisasi kolomfile xls. Filter, digunakanuntukmengklasifikasi data makasesuaidenganatribut.Get data entropy, menghitungnilaientropy dari data xlspadasetiapkategori. Get total entropy, menghitungnilai entropy total setiapatribut. Calculate max gain, menghitungnilai gain dari setiapatributberdasarkannilai entropy dari kategori danmencari nilaimaksimal dari nilai gain. Get child node, samatapimemanggil eliminate_categoryyang berfungsi membuangkategori parent (parent sebelumnyatidakanggap).2/18/201118Pruning1. Memeriksanode tiaplevel, dimulai level terdalam.2. Padatiaplevel mengelompokkannode sesuai parent nodenya.3. Padasetiapkelompok, diperiksaapakahmemiliki value ygsama(mengulang/tidak mengulang)4. Bilasamamakaparent kelompoktersebut diubahnode nyamenjadi value, lalunode kelompoktersebutdipotong(pruning)5. Bilaberbedamakadilanjut kekelompokselanjutnya.2/18/201119Uji CobadanEvaluasi Data Uji CobaData hasil analisa dari faktor-faktor yang mendukungmahasiswa pengambil matakuliah setiap semester yangdiperolehdari SistemInformasi Akademik jurusanTeknikInformatikaITS Surabaya.2/18/201120UJI COBA SKENARIO 1BerdasarkanpemilihanatributNilai, J enisKelamin, Angkatan, TahunLahir, Semester danUmur darimahasiswapengambil matakuliah2/18/201123ALJABAR LINEAR TAHUN 2007 Berdasarkanpemilihanatribut Nilai, J enisKelamin, TahunLahir, Angkatan,IPK, danSemester .2/18/201124Node Parent Label Level Type Atribut1 NULL 'NILAI' 0 1'NULL'2 1'TDK MENGULANG' 1 0'A-B'3 1'KELAMIN' 1 1'BC-C'4 3'IPK' 2 1'L'5 4'LAHIR' 3 1'2-2.9'6 5'MENGULANG' 4 0'1984-1985'7 5'MENGULANG' 4 0'1986-1987'8 5'ANGKATAN' 4 1'1988-1989'9 8'SEMESTER' 5 1'2007'10 9'TDK MENGULANG' 6 0'Ganjil'11 9'MENGULANG' 6 0'Genap'12 9'MENGULANG' 5 0'2008'13 9'MENGULANG' 5 0'2009'14 4'TDK MENGULANG' 3 0'3-4'15 3'LAHIR' 2 1'P'16 15'MENGULANG' 3 0'1984-1985'17 15'MENGULANG' 3 0'1986-1987'18 15'ANGKATAN' 3 1'1988-1989'19 18'SEMESTER' 4 1'2007'20 19'IPK' 5 1'Ganjil'21 20'MENGULANG' 6 0'2-2.9'22 20'TDK MENGULANG' 6 0'3-4'23 20'MENGULANG' 5 0'Genap'24 18'MENGULANG' 4 0'2008'25 18'MENGULANG' 4 0'2009'26 1'MENGULANG' 1 0'D-E'Bentuk Tree Uji Aljabar Linear 20072/18/201125PENGENALAN POLA TAHUN 2007 Node Parent Label Level Type Atribut1NULL 'ANGKATAN' 0 1'NULL'2 1'NILAI' 1 1'2007'3 2'MENGULANG' 2 0'A-B'4 2'IPK' 2 1'BC-C'5 4'KELAMIN' 3 1'2-2.9'6 5'LAHIR' 4 1'L'7 6'MENGULANG' 5 0'1984-1985'8 6'MENGULANG' 5 0'1986-1987'9 6'SEMESTER' 5 1'1988-1989'10 9'MENGULANG' 6 0'Ganjil'11 9'TDK MENGULANG' 6 0'Genap'12 5'MENGULANG' 4 0'P'13 4'TDK MENGULANG' 3 0'3-4'14 2'MENGULANG' 2 0'D-E'15 1'LAHIR' 1 1'2008'16 15'MENGULANG' 2 0'1984-1985'17 15'MENGULANG' 2 0'1986-1987'18 15'IPK' 2 1'1988-1989'19 18'MENGULANG' 3 0'2-2.9'20 18'KELAMIN' 3 1'3-4'21 20'SEMESTER' 4 1'L'22 21'MENGULANG' 5 0'Ganjil'23 21'NILAI' 5 1'Genap'24 23'TDK MENGULANG' 6 0'A-B'25 23'TDK MENGULANG' 6 0'BC-C'26 23'MENGULANG' 6 0'D-E'27 20'MENGULANG' 4 0'P'28 1'MENGULANG' 1 0'2009'2/18/201126Bentuk Tree Uji Pengenalan Pola 20072/18/201127A n g k a ta nN i la i M2 0 0 72 0 0 82 0 0 9S e m es te rN il a iG a n ji lG e n a pL a h i rMM1 9 8 4 - 1 9 8 51 9 8 6 - 1 9 8 71 9 8 8 - 1 9 8 9I P KMK e la m in2 - 2 . 9 3 - 4L a h i rMM1 9 8 4 - 1 9 8 51 9 8 6 - 1 9 8 7 1 9 8 8 - 1 9 8 9MT M2 - 2 . 93 - 4MMI P KA - B B C - C D - EK e la m inT MT MLPS e m es te rM T MG a n j il G e n a pA n g k ata nLPT M MA - BD - EB C - CUJI COBA SKENARIO 2Berdasarkanpemilihanatribut Nilai, Angkatan, SelisihtahunPrediksi, Penghasilanorangtua, IPS danUmur darimahasiswapengambil matakuliah2/18/201128ALJABAR LINEAR TAHUN 2007Node Parent Label Level Type Atribut1 'NULL' 'NILAI' 0 1 'NULL'2 1 'UMUR' 1 1 'BC'3 2 'TDKMENGULANG' 2 0 '18-19'4 2 'IPS' 2 1 '20-21'5 4 'TDKMENGULANG' 3 0 '0-2.00'6 4 'PENGHASILAN' 3 1 '2.01-3.0'7 6 'MENGULANG' 4 0 '>=5.000.000'8 6 'ANGKATAN' 4 1 '1.000.000-5.000.000'9 8 'TDKMENGULANG' 5 0 '2004'10 8 'SELISIH' 5 1 '2005'11 10 'MENGULANG' 6 0 '2007-2005'12 10 'TDKMENGULANG' 6 0 '2007-2006'13 8 'MENGULANG' 5 0 '2006'14 8 'MENGULANG' 5 0 '2007'15 6 'TDKMENGULANG' 4 0 '=5.000.000'19 17 'TDKMENGULANG' 5 0 '1.000.000-5.000.000'20 17 'ANGKATAN' 5 1 '=5.000.000'29 28 'MENGULANG' 3 0 '18-19'30 28 'MENGULANG' 3 0 '20-21'31 28 'TDKMENGULANG' 3 0 '22-23'32 27 'UMUR' 2 1 '1.000.000-5.000.000'33 32 'TDKMENGULANG' 3 0 '18-19'34 32 'IPS' 3 1 '20-21'35 34 'MENGULANG' 4 0 '0-2.00'36 34 'TDKMENGULANG' 4 0 '2.01-3.0'37 34 'ANGKATAN' 4 1 '3.01-4.0'38 37 'TDKMENGULANG' 5 0 '2004'39 37 'SELISIH' 5 1 '2005'40 39 'MENGULANG' 6 0 '2007-2005'41 39 'TDKMENGULANG' 6 0 '2007-2006'42 37 'MENGULANG' 5 0 '2006'43 37 'MENGULANG' 5 0 '2007'44 32 'SELISIH' 3 1 '22-23'45 44 'ANGKATAN' 4 1 '2007-2005'46 45 'IPS' 5 1 '2004'47 46 'MENGULANG' 6 0 '0-2.00'48 46 'TDKMENGULANG' 6 0 '2.01-3.0'49 46 'MENGULANG' 6 0 '3.01-4.0'50 45 'MENGULANG' 5 0 '2005'51 45 'MENGULANG' 5 0 '2006'52 45 'MENGULANG' 5 0 '2007'53 44 'TDKMENGULANG' 4 0 '2007-2006'54 27 'TDKMENGULANG' 2 0 '=5.000.000'3 2 'MENGULANG' 2 0 '18-19'4 2 'MENGULANG' 2 0 '20-21'5 2 'MENGULANG' 2 0 '22-23'6 2'TDK MENGULANG' 2 0 '24-25'7 1'TDK MENGULANG' 1 0'1.000.000-5.000.000'8 1'TDK MENGULANG' 1 0 '=5.000.000'7 1'TDK MENGULANG'1 0'1.000.000-5.000.000'8 1'TDK MENGULANG'1 0 '