15
 Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering Pada Uni ver sit as Bina Darma (Kikie Riesky Andini) 1 PENERAPAN DATA MINING UNTUK MENGOLAH INFORMASI KONSENTRASI KEAHLIAN DENGAN METODE CLUSTERING PADA UNIVERSITAS BINA DARMA Kikie Riesky Andini 1 , M. Akbar 2 , Helda Yud iastu ti 3 Mahasiswa Universitas Bina Darma 1 , Dosen Universitas Bina Darma 2 Jalan Jenderal Ahmad Yani No.12 Palembang [email protected] 1 , [email protected] 2 , [email protected] 3  Abstract : The development of computer technology is growing rapidly along with the development of software and hardware used. One in the field of education, a lot of computers play an important role in it. Adv ances in technology and information can be s een with the use of computers as a tool in learning, with the aim to facilitate the teaching and learning activities so that time is used more quickly, easily, efficiently. Practice of assembling a computer activities are now using equipment such as computer hardwar e components, but there ar e still obstacles in the  practice because of the limitations of the equipment. Therefore, the author seeks to facilitate the user in practice by designing and building tools that directly show on the computer. In this rese arch made a stou t devi ce si mulatio n tools for v ocation al sub jects Bina Darma ICT-bas ed multimedia in hopes to as sist and facilitate the students to learn.  Keywords: multimedia, ICT, teaching tools, simulation tools Abstrak : Clustering merupakan pengelompokkan data tanpa berdasarkan kelas data tertentu. Klasterisasi dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Prinsip dari klasterisasi adalah memaksimalkan kesamaan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/klaster. Dalam penerapan data mining dengan metode clustering ini pada Universitas Bina Darma yang merupakan organisasi yang memanfaatkan teknologi informasi, khususnya basis data, akan mengalami akumulasi data mahasiswa dalam  jumlah besar sehingga untuk mengolah informasi konsentrasi keahlian berdasarkan nilai, sistem yang dibangun dengan menggunakan teknik data mining bertujuan untuk menggali dan menemukan pola-pola yang tersembunyi dalam pengolahan data konsentrasi keahlian mahasiswa tiap per tahunnya agar memperoleh data y ang real. Berdasarkan uraian di atas, mak a penulis berkeinginan membangun aplikasi data mining untuk mengolah informasi konsentrasi keahlian pada Universitas Bina Darma Program Studi Teknik Informatika, sehingga mahasiswa mendapatkan alternatif informasi untuk menentukan konsentrasi keahlian yang lebih mudah dan cepat. Kata Kunci: teknologi informasi, data mining, clustering 1. PENDAHULUAN 1.1.Latar Belakang Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga informasi akan menjadi suatu elemen penting dalam perkembangan masyarakat saat ini dan waktu mendatang.

Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi

Embed Size (px)

DESCRIPTION

Clustering merupakan pengelompokkan data tanpa berdasarkan kelas data tertentu.Klasterisasi dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Prinsipdari klasterisasi adalah memaksimalkan kesamaan kesamaan antar anggota satu kelas danmeminimumkan kesamaan antar kelas/klaster. Dalam penerapan data mining dengan metodeclustering ini pada Universitas Bina Darma yang merupakan organisasi yang memanfaatkanteknologi informasi, khususnya basis data, akan mengalami akumulasi data mahasiswa dalamjumlah besar sehingga untuk mengolah informasi konsentrasi keahlian berdasarkan nilai, sistemyang dibangun dengan menggunakan teknik data mining bertujuan untuk menggali danmenemukan pola-pola yang tersembunyi dalam pengolahan data konsentrasi keahlian mahasiswatiap per tahunnya agar memperoleh data yang real.

Citation preview

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 1

    PENERAPAN DATA MINING UNTUK MENGOLAH INFORMASI KONSENTRASIKEAHLIAN DENGAN METODE CLUSTERING PADA

    UNIVERSITAS BINA DARMA

    Kikie Riesky Andini1, M. Akbar2, Helda Yudiastuti3

    Mahasiswa Universitas Bina Darma1, Dosen Universitas Bina Darma2

    Jalan Jenderal Ahmad Yani No.12 [email protected], [email protected],

    [email protected]

    Abstract : The development of computer technology is growing rapidly along with thedevelopment of software and hardware used. One in the field of education, a lot of computers playan important role in it. Advances in technology and information can be seen with the use ofcomputers as a tool in learning, with the aim to facilitate the teaching and learning activities sothat time is used more quickly, easily, efficiently. Practice of assembling a computer activities arenow using equipment such as computer hardware components, but there are still obstacles in thepractice because of the limitations of the equipment. Therefore, the author seeks to facilitate theuser in practice by designing and building tools that directly show on the computer. In thisresearch made a stout device simulation tools for vocational subjects Bina Darma ICT-basedmultimedia in hopes to assist and facilitate the students to learn.

    Keywords: multimedia, ICT, teaching tools, simulation tools

    Abstrak : Clustering merupakan pengelompokkan data tanpa berdasarkan kelas data tertentu.Klasterisasi dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Prinsipdari klasterisasi adalah memaksimalkan kesamaan kesamaan antar anggota satu kelas danmeminimumkan kesamaan antar kelas/klaster. Dalam penerapan data mining dengan metodeclustering ini pada Universitas Bina Darma yang merupakan organisasi yang memanfaatkanteknologi informasi, khususnya basis data, akan mengalami akumulasi data mahasiswa dalamjumlah besar sehingga untuk mengolah informasi konsentrasi keahlian berdasarkan nilai, sistemyang dibangun dengan menggunakan teknik data mining bertujuan untuk menggali danmenemukan pola-pola yang tersembunyi dalam pengolahan data konsentrasi keahlian mahasiswatiap per tahunnya agar memperoleh data yang real. Berdasarkan uraian di atas, maka penulisberkeinginan membangun aplikasi data mining untuk mengolah informasi konsentrasi keahlianpada Universitas Bina Darma Program Studi Teknik Informatika, sehingga mahasiswamendapatkan alternatif informasi untuk menentukan konsentrasi keahlian yang lebih mudah dancepat.

    Kata Kunci: teknologi informasi, data mining, clustering

    1. PENDAHULUAN1.1.Latar Belakang

    Dengan kemajuan teknologi informasidewasa ini, kebutuhan akan informasi yang

    akurat sangat dibutuhkan dalam kehidupansehari-hari, sehingga informasi akan menjadisuatu elemen penting dalam perkembanganmasyarakat saat ini dan waktu mendatang.

  • 2 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Namun kebutuhan informasi yang tinggi kadangtidak diimbangi dengan penyajian informasiyang memadai, sering kali informasi tersebutmasih harus di gali ulang dari data yangjumlahnya sangat besar. Kemampuan teknologiinformasi untuk mengumpulkan dan menyimpanberbagai tipe data jauh meninggalkankemampuan untuk menganalisis, meringkas danmengekstrak pengetahuan dari data. Metodetradisional untuk menganalisis data yang ada,tidak dapat menangani data dalam jumlah besar.

    Pemanfaatan data yang ada di dalam sisteminformasi untuk menunjang kegiatanpengambilan keputusan, tidak cukup hanyamengandalkan data operasional saja, diperlukansuatu analisis data untuk menggali potensi-potensi informasi yang ada. Para pengambilkeputusan berusaha untuk memanfaatkangudang data yang sudah dimiliki untuk menggaliinformasi yang berguna membantu mengambilkeputusan, hal ini mendorong munculnyacabang ilmu baru untuk mengatasi masalahpenggalian informasi atau pola yang penting

    atau menarik dari data dalam jumlah besar, yangdisebut dengan data mining. Penggunaan teknikdata mining diharapkan dapat memberikanpengetahuan-pengetahuan yang sebelumnyatersembunyi di dalam gudang data sehinggamenjadi informasi yang berharga.

    Banyaknya data mahasiswa Universitas BinaDarma di dalam database, sehingga mengalamipenumpukan data yang sangat besar, disiniterdapat bermacam fakultas yang terdapat diuniversitas bina darama dan dilihat dari para

    mahasiswa banyak mendapatkan nilai di bawahrata-rata maka dari itu para mahasiswa harusmengikuti semester pendek untuk memperbaikinilai. Di setiap tahunnya semester pendek inidilakukan maka dari itu perlu adanya suatusolusi untuk melihat statistik dalam pengambilanmata kuliah semester pendek ini dan agar bisamengelompokan mana yang paling banyak paramahasiswa mengambil mata kuliah semesterpendek. Oleh karena itu, dengan melakukanprediksi pemilihan mata kuliah semester pendekdapat diketahui tingkat per mata kuliahansemester pendek melalui teknik data mining.

    Program studi teknik informatikamempunyai konsentrasi keahlian seperti IT

    infrastructure, software engineering, dandatabase management system yang sesuaidengan kurikulum program studi teknikinformatika di Universitas Bina Darma.Sistem pemilihan konsentrasi keahlian dapatditentukan berdasarkan minat mahasiswayaitu, mahasiswa dapat menentukan matakuliah konsentrasi berdasarkan konsentrasikeahlian yang dipilih, setelah itu mahasiswadapat melakukan entry mata kuliahkonsentrasi keahlian yang terdapat padaprogram studi teknik informatika dan dapatdilihat Kartu Rencana Studi (KRS) diwebsite Universitas Bina Darma.

    Hasil dari Kartu Rencana Studi (KRS)mahasiswa yang mengambil konsentrasikeahlian dapat dikelompokkan sesuai

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 3

    dengan mata kuliah konsentrasi keahlian,sehingga dapat diketahui konsentrasikeahlian yang paling banyak dimintai olehmahasiswa, dengan itu dapat ditemukansuatu solusi untuk mengetahui struktur

    dalam data yang dapat dipakai lebih lanjutdalam berbagai aplikasi secara luas sepertiklasifikasi, pengolahan gambar, danpengolahan pola.

    Berdasarkan uraian di atas, maka penulismelakukan penelitian untuk mengolah

    informasi konsentrasi keahlian padaUniversitas Bina Darma Program StudiTeknik Informatika, sehingga mahasiswa

    mendapatkan solusi alternatif informasiuntuk mengajukan konsentrasi keahliandengan efektif dan efisien. Maka di dalampenulisan skripsi ini digunakan sebuah judulyaitu Penerapan Data Mining Untuk

    Mengolah Informasi Konsentrasi

    Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma.

    1.2.Batasan MasalahAgar penelitian ini lebih terarah dan

    tidak menyimpang, maka permasalahanyang ada pada penelitian dibatasi pada :1. Data yang digunakan data program

    studi teknik informatika tahun angkatan2009 dan 2010.

    2. Menampilkan informasi calon

    mahasiswa yang mengambil konsentrasikeahlian pada Universitas Bina DarmaProgram Studi Teknik Informatikadengan metode clustering.

    1.3.Tujuan PenelitianAdapun tujuan dalam penelitian ini

    adalah antara lain :1. Memberikan informasi dari data

    mahasiswa yang diolah dalam bentukgrafik yang informatif dan mudahdianalisis.

    2. Memudahkan mahasiswa dalammenentukan pemilihan konsentrasi

    keahlian berdasarkan nilai dan minatmahasiswa.

    1.4.Manfaat PenelitianAdapun manfaat adanya penelitian ini

    adalah sebagai berikut :

    1. Bagi Universitas Bina Darma

    Untuk mengetahui tingkat statistik mahasiswa

    dalam pemilihan konsentrasi keahlian programstudi teknik informatika di Universitas BinaDarma dan dapat menjadi bahan pertimbanganguna perkembangan sistem yang lebih lanjutsehingga dapat membantu kinerja karyawan.2. Bagi Penulis

    Diharapkan dapat memberikan pengetahuan-pengetahuan yang sebelumnya tersembunyi di

  • 4 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    dalam gudang data sehingga menjadi informasiberharga khususnya dalam penerapan datamining yang dapat digunakan dalam kegiatanmasyarakat nantinya.

    3. Bagi PembacaDiharapkan dengan adanya penulisan ini dapatbermanfaat sebagai sumber pembelajaran untukpenelitian selanjutnya serta untuk menambahwawasan.

    2. METODOLOGI PENELITIAN2.1.Metode Penelitian

    Metode pada penelitian ini menggambarkanmetode deskriptif yaitu penelitian yang berusahamenggambarkan dan menginterprestasikan objeksesuai dengan apa adanya berdasarkan fakta-fakta mengenai data Mahasiswa di UniversitasBina Darma Palembang. Penelitian deskriptifbertujuan untuk menggambarkan secarasistematis fakta dan karakteristik objek atausubjek yang diteliti secara tepat.

    2.2.Metode Pengumpulan DataMetode pengumpulan data yang tepat yaitu

    dengan mempertimbangkan penggunaan-nyaberdasarkan jenis data beserta sumbernya. Datayang dinilai objektif dan relevan dengan intipermasalahan penelitian merupakan indikatorkeberhasilan dari penelitian. Metodepengumpulan data dalam penelitian inidilakukan dengan cara sebagai berikut :

    1. Metode Observasi, metode observasi iniyang dibahas tentang mengelolah informasi

    konsentrasi keahlian di program studi teknikinformatika Universitas Bina Darma

    Palembang, hasil dari obeservasi inimendapatkan data mahasiswa, data matakuliah, dan data Kartu Rencana Studi (KRS)yang akan mengambil konsentrasi keahlian.

    2. Wawancara, Merupakan teknikpengumpulan data dengan cara mengadakantanya jawab atau wawancara kepada bagianpengolahan data dan bagian IT UniversitasBina Darma Palembang.

    3. Metode Studi Pustaka, metode yangdilakukan dengan mencari danmengumpulkan materi-materi yang

    berkaitan dengan penyusunan skripsi,seperti informasi dari buku-buku,dokumentasi, internet dan skripsi yangtelah selesai dikerjakan. Materi-materi yangtersedia dapat digunakan sebagai bahanpembelajaran dan referensi pembuatanaplikasi.

    2.3. Metode Analisis DataAdapun untuk menganalisis data dalam

    penerapan data mining ini menggunakan tahapanKnowledge Discovery in Databases (KDD) yangterdiri dari beberapa tahapan, yaitu dataselection, preprocessing, transformation, datamining, dan evaluation.

    3. PROSES DATA MINING3.1. Data Selection

    Data yang digunakan dalam penelitianberasal dari Universitas Bina Darma Palembang

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 5

    yaitu data Mahasiswa Teknik InformatikaUniversitas Bina Darma Palembang tahun 2009dan 2010, terdiri dari beberapa tabel antara laintabel Mahasiswa, Tabel Khs, Tabel Matkul. Daridata Mahasiswa mempunyai data 697 record,Tabel Khs mempunyai 20,646 record sedangkanuntuk tabel Matkul mempunyai 365 recordselama 2 tahun. Dari semua atribut yang adapada tabel Matkul dan tabel Khs terdapat 4atribut yang akan digunakan dalam prosesknowledge discovery in databases (kdd). Atributtersebut yaitu :1. kd_matkul merupakan atribut yang terdapat

    pada tabel khs yang berperan sebagaiprimary key dalam menghubungkan tabelkhs dan tabel matkul.

    2. nilai merupakan atribut yang terdapat padatabel khs yang berisi mengenai nilaimahasiswa.

    3. kd matkul merupakan atribut yang terdapatpada tabel matkul yang akan dihubungkandengan tabel khs.

    4. matkul merupakan atribut yang terdapatpada tabel matkul yang berisikanmatakuliah yang diambil oleh paramahasiswa.

    3.2. PreprocessingPada tahapan preprocessing ini akan

    dilakukan proses integrasi data untukmenghubungkan tabel khs dan tabel matkul,selanjutnya dilakukan proses data cleaninguntuk menghasilkan dataset yang bersih

    sehingga dapat digunakan dalam tahapberikutnya yaitu mining dengan tujuan untukmelihat prediksi pemilihan konsentrasi jurusanterhadap mahasiswa teknik informatika BinaDarma Palembang. Berikut merupakanpenjelasan dari kedua proses di atas, Berikutlangkah-langkah yang dimaksud diatas :

    3.2.1. Data CleaningData Cleaning, tahap pembersihan

    data merupakan tahap awal dari prosesKDD. Seluruh atribut yang ada pada datasetdi atas selanjutnya akan diseleksi untukmendapatkan atribut-atribut yang berisi nilaiyang relavan. Tidak redundant dan tidakmissing value, dimana syarat tersebutmerupakan syarat awal yang harus

    dikerjakan dalam data mining sehingga akandiperoleh dataset yang bersih untukdigunakan pada tahap mining data. Datadikatakan missing value bila atribut-atributdalam dataset tidak berisi nilai atau kosong,sedangkan data dikatakan redundant jikadalam satu dataset yang sama terdapat lebihdari satu record yang berisi nilai yang sama.

    Dataset Mahasiswa Universitas Bina

    Darma Palembang, pada tahap ini akandiseleksi dari data yang mengandungmissing value dan data dengan nilai yangredundant. Databases MahasiswaUniversitas Bina Darma Palembang

  • 6 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Palembang terdapat 697 record dengan itemsebanyak 4 item, dan tidak ditemukan datadengan missing value dan tidak terdapatnilai yang sama dalam satu record. Sehinggadataset mahasiswa dapat digunakan untuktahap selanjutnya.

    Tahap selanjutnya adalah tahap seleksidata yang berasal dari atribut yang relavan.Tahapan ini sangat penting dilakukansebelum proses data mining, karena seleksidata yang berarti atribut-atributnya relavanyang ditentukan oleh output / keluaran yangdihasilkan. Dalam tugas akhir ini hasil yangingin dicapai adalah mengetahui indikatoryang dilihat adalah nama_mahasiswa,mata_kuliah, khs. Berikut ini disajikancontoh data hasil proses seleksi data.

    Tabel 3.1. Data Yang Relavan dan TidakRedundant

    3.2.2. Integrasi DataIntegrasi data, tahap integrasi data adalah

    tahap penggabungan data dari berbagai sumber.Dataset mahasiswa teknik informatika

    Universitas Bina Darma Palembang ini berasaldari satu sumber, dan dari data yang sudah dapatdigunakan untuk teknik clustering, yaitu tabelMahasiswa Teknik Informatika Universitas Bina

    Darma Palembang.

    3.3.3. TransformationTahap transformation data yaitu ini dapat

    diubah menjadi bentuk yang sesuai untuk dimining. Karena pada penelitian ini hanyadilakukan uji coba secara teoritis. Maka datayang telah di-cleaning akan di transformasimenjadi data yang siap diminingkan.

    Pada tahapan penelitian ini maka penulismenambahkan atribut baru yaitu atribut skoruntuk menentukan banyaknya mahasiswa yangmengambil konsentrasi keahlian sebagai dataset.

    Tabel 3.2. Sebagian Dataset Hasil Transformasi

    Dataset pada tabel 3.3 di atas telahmemiliki bentuk yang sesuai untuk tahap data

    6 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Palembang terdapat 697 record dengan itemsebanyak 4 item, dan tidak ditemukan datadengan missing value dan tidak terdapatnilai yang sama dalam satu record. Sehinggadataset mahasiswa dapat digunakan untuktahap selanjutnya.

    Tahap selanjutnya adalah tahap seleksidata yang berasal dari atribut yang relavan.Tahapan ini sangat penting dilakukansebelum proses data mining, karena seleksidata yang berarti atribut-atributnya relavanyang ditentukan oleh output / keluaran yangdihasilkan. Dalam tugas akhir ini hasil yangingin dicapai adalah mengetahui indikatoryang dilihat adalah nama_mahasiswa,mata_kuliah, khs. Berikut ini disajikancontoh data hasil proses seleksi data.

    Tabel 3.1. Data Yang Relavan dan TidakRedundant

    3.2.2. Integrasi DataIntegrasi data, tahap integrasi data adalah

    tahap penggabungan data dari berbagai sumber.Dataset mahasiswa teknik informatika

    Universitas Bina Darma Palembang ini berasaldari satu sumber, dan dari data yang sudah dapatdigunakan untuk teknik clustering, yaitu tabelMahasiswa Teknik Informatika Universitas Bina

    Darma Palembang.

    3.3.3. TransformationTahap transformation data yaitu ini dapat

    diubah menjadi bentuk yang sesuai untuk dimining. Karena pada penelitian ini hanyadilakukan uji coba secara teoritis. Maka datayang telah di-cleaning akan di transformasimenjadi data yang siap diminingkan.

    Pada tahapan penelitian ini maka penulismenambahkan atribut baru yaitu atribut skoruntuk menentukan banyaknya mahasiswa yangmengambil konsentrasi keahlian sebagai dataset.

    Tabel 3.2. Sebagian Dataset Hasil Transformasi

    Dataset pada tabel 3.3 di atas telahmemiliki bentuk yang sesuai untuk tahap data

    6 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Palembang terdapat 697 record dengan itemsebanyak 4 item, dan tidak ditemukan datadengan missing value dan tidak terdapatnilai yang sama dalam satu record. Sehinggadataset mahasiswa dapat digunakan untuktahap selanjutnya.

    Tahap selanjutnya adalah tahap seleksidata yang berasal dari atribut yang relavan.Tahapan ini sangat penting dilakukansebelum proses data mining, karena seleksidata yang berarti atribut-atributnya relavanyang ditentukan oleh output / keluaran yangdihasilkan. Dalam tugas akhir ini hasil yangingin dicapai adalah mengetahui indikatoryang dilihat adalah nama_mahasiswa,mata_kuliah, khs. Berikut ini disajikancontoh data hasil proses seleksi data.

    Tabel 3.1. Data Yang Relavan dan TidakRedundant

    3.2.2. Integrasi DataIntegrasi data, tahap integrasi data adalah

    tahap penggabungan data dari berbagai sumber.Dataset mahasiswa teknik informatika

    Universitas Bina Darma Palembang ini berasaldari satu sumber, dan dari data yang sudah dapatdigunakan untuk teknik clustering, yaitu tabelMahasiswa Teknik Informatika Universitas Bina

    Darma Palembang.

    3.3.3. TransformationTahap transformation data yaitu ini dapat

    diubah menjadi bentuk yang sesuai untuk dimining. Karena pada penelitian ini hanyadilakukan uji coba secara teoritis. Maka datayang telah di-cleaning akan di transformasimenjadi data yang siap diminingkan.

    Pada tahapan penelitian ini maka penulismenambahkan atribut baru yaitu atribut skoruntuk menentukan banyaknya mahasiswa yangmengambil konsentrasi keahlian sebagai dataset.

    Tabel 3.2. Sebagian Dataset Hasil Transformasi

    Dataset pada tabel 3.3 di atas telahmemiliki bentuk yang sesuai untuk tahap data

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 7

    mining dengan menggunakan teknik Clustering,data mahasiswa yang telah dilakukan prosestransformasi di atas siap untuk dilakukan prosesselanjutnya.

    4. HASIL4.1. Hasil Data Mining

    Data mining merupakan tahapan untuk

    menemukan pola atau informasi dalamsekumpulan data dengan menggunakan teknikdan algoritma tertentu. Pemilihan teknik danalgoritma yang tepat sangat bergantung padaproses KDD secara keseluruhan. Pada penelitianini penerapan data mining menggunakan teknikClustering dan algoritma K-Means untukmenemukan informasi mengenai datamahasiswa.

    4.2. Penerapan Metode Clustering denganAlgoritma K-meansSetelah melakukan proses transformasi data

    ke dalam bentuk data yang sesuai untukpenerapan data mining dengan teknik Clusteringmaka tahapan ini dapat dilakukan. Clusteringmerupakan proses membagi data dalam suatuhimpunan ke dalam beberapa kelompok yangkesamaan datanya dalam suatu kelompok lebihbesar dari pada kesamaan tersebut dengan datakelompok lainnya.

    Dalam tahapan penemuan aturan clusteringini, langkah yang dilakukan adalahmengembangkan aturan yang mungkin akanmenjadi informasi data mahasiswa. Dalam

    tahapan awal untuk menghasilkan informasi

    aturan clustering dari setiap data mahasiswadihitung dengan dataset. Dalam terminologipengolahan pola, kolom dalam matriks disebutpatterns atau objects, baris disebut fatures atauattribute, dan Z disebut patterns atau datamatrix. Arti kolom dan baris dalam Zbergantung pada konteks. Cluster secara umummerupakan wujud himpunan bagian dari suatuhimpunan data dan metode clustering dapatdiklasifikasikan berdasarkan himpunan bagianyang dihasilkan : apakah fuzzy atau crisp (hard).Metode hard clustering merupakan model yangberdasarkan pada teori himpunan klasik, yangmana suatu objek menjadi anggota atau tidakmenjadi anggota secara penuh ke dalam suatukelompok. Hard clustering membagi data kedalam sejumlah himpunan bersamaan denganperbedaan level keanggotaan.

    Berikut merupakan proses mining untuk

    menentukan informasi mengenai datamahasiswa berdasarkan data yang sudah adayang telah dipilih. Untuk proses yang dilakukanclustering mempunyai 6 langkah proses dalammenentukan nilai yang telah dipilih. Berikutlangkah-langkah dari clustering :

    Algoritma FCM didasarkan pada minimasifungsi objektif yang diformulasikan dalampersamaan :

    = U Z CDengan :

  • 8 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Uij merupakan level keanggotaan dari Zidalam Cluster j 2

    Zi merupakan nilai data ke-I dari d-dimensidataCj merupakan nilai ke-j dari d-dimensicluster centerm merupakan sembarang bilangan reallebih besar dari 1

    Selanjutnya algoritma FCM disusundengan langkah sebagai berikut :Langkah 1 : Tentukan himpuanan data

    Z. Tentukan jumlah clusteryang diharapkan 1 < c < N,nilai pembobot m > 1,toleransi penghentian > 0.

    Langkah 2 : Inisialisasi matriks partisi

    secara acak, U(0)Mfc.Ulangi untuk 1=3,4,5

    Langkah 3 : Hitung cluster center(means).( )= ( ) ( ) , 1

    Langkah 4 : Hitung jarak

    ( ) ( ) , ,Langkah 5 : Perbaharui matriks partisi.

    Untuk 1 K N

    Jika > 0 untuk i =1,2, . , C

    ( ) = / /( ) ,

    Atau dengan kata lain :( ) = 0 > 0 ( ) [0,1] ( ) = 1Ulangi sampai ( ) ( ) < .

    Untuk proses awal maka algoritma k-

    means yang ada akan dilakukan sebagai berikut :Diberikan data sebagai data awal.

    Z = ( 40 50 60 70 80 90 10040 50 60 70 80 90 100 )Akan dilaksanakan clustering dengan FCM.Langkah 1 :

    - Jumlah cluster yang di harapkan c = 5- Nilai pembobot m = 3- Tolerasi penghentian = 1.10-6

    - Maksimum iterasi = 100

    Langkah 2 : inisialisasi matriks partisi awal

    secara acak.

    V=

    0,5 0,5 0,5 0,5 0,5 0,5 0,50,5 0,5 0,5 0,5 0,5 0,5 0,50,5 0,5 0,5 0,5 0,5 0,5 0,50,5 0,5 0,5 0,5 0,5 0,5 0,50,5 0,5 0,5 0,5 0,5 0,5 0,5

    0,5x40 + 0,5x50 + 0,5x60 + 0,5x70 + 0,5x80 + 0,5x90 + 0,5x1006 ,1

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 9

    = 0,5x40 + 0,5x50 + 0,5x60 + 0,5x70 + 0,5x80 + 0,5x90 + 0,5x1006 ,1 V= 3,33 4,16 5,00 5,83 6,66 7,5 8,333,33 4,16 5,00 5,83 6,66 7,5 8,334.3. Proses Data Mining Menggunakan

    XLMinerSetelah dijelaskan proses penerapan data

    mining dengan teknik clustering secara teoritispada penjelasan di atas, maka kali ini akan dijelaskan proses data mining secara aplikatifdimana proses data mining yang akan dilakukanmenggunakan software data mining XLMinerV4.0.2. Seperti yang telah dijelaskan pada babsebelumnya XLMiner merupakan add in yangbekerja pada Microsoft Excel. Berikutmerupakan tampilan awal Microsoft Excel 2007yang telah ditambahkan add in XLMiner.

    Gambar 4.1. Microsoft Excel 2007 denganXLMiner

    Pada gambar 4.1 terlihat bahwa tampilanMicrosoft Excel 2007 yang telah ditambahkanadd in XLMiner sama saja dengan tampilanMicrosoft Excel 2007 pada umumnya, hanyasaja terdapat menu tambahan yaitu menuXLMiner seperti pada gambar 4.1.

    Gambar 4.2. Menu XLMiner

    Setelah memilih menu clustering seperti

    pada gambar 4.2, maka langkah yang dilakukanselanjutnya yaitu mengatur proses dan hasilyang diinginkan seperti pada gambar 4.3

    Gambar 4.3 Setting Missing Data Handling

    Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 9

    = 0,5x40 + 0,5x50 + 0,5x60 + 0,5x70 + 0,5x80 + 0,5x90 + 0,5x1006 ,1 V= 3,33 4,16 5,00 5,83 6,66 7,5 8,333,33 4,16 5,00 5,83 6,66 7,5 8,334.3. Proses Data Mining Menggunakan

    XLMinerSetelah dijelaskan proses penerapan data

    mining dengan teknik clustering secara teoritispada penjelasan di atas, maka kali ini akan dijelaskan proses data mining secara aplikatifdimana proses data mining yang akan dilakukanmenggunakan software data mining XLMinerV4.0.2. Seperti yang telah dijelaskan pada babsebelumnya XLMiner merupakan add in yangbekerja pada Microsoft Excel. Berikutmerupakan tampilan awal Microsoft Excel 2007yang telah ditambahkan add in XLMiner.

    Gambar 4.1. Microsoft Excel 2007 denganXLMiner

    Pada gambar 4.1 terlihat bahwa tampilanMicrosoft Excel 2007 yang telah ditambahkanadd in XLMiner sama saja dengan tampilanMicrosoft Excel 2007 pada umumnya, hanyasaja terdapat menu tambahan yaitu menuXLMiner seperti pada gambar 4.1.

    Gambar 4.2. Menu XLMiner

    Setelah memilih menu clustering seperti

    pada gambar 4.2, maka langkah yang dilakukanselanjutnya yaitu mengatur proses dan hasilyang diinginkan seperti pada gambar 4.3

    Gambar 4.3 Setting Missing Data Handling

    Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 9

    = 0,5x40 + 0,5x50 + 0,5x60 + 0,5x70 + 0,5x80 + 0,5x90 + 0,5x1006 ,1 V= 3,33 4,16 5,00 5,83 6,66 7,5 8,333,33 4,16 5,00 5,83 6,66 7,5 8,334.3. Proses Data Mining Menggunakan

    XLMinerSetelah dijelaskan proses penerapan data

    mining dengan teknik clustering secara teoritispada penjelasan di atas, maka kali ini akan dijelaskan proses data mining secara aplikatifdimana proses data mining yang akan dilakukanmenggunakan software data mining XLMinerV4.0.2. Seperti yang telah dijelaskan pada babsebelumnya XLMiner merupakan add in yangbekerja pada Microsoft Excel. Berikutmerupakan tampilan awal Microsoft Excel 2007yang telah ditambahkan add in XLMiner.

    Gambar 4.1. Microsoft Excel 2007 denganXLMiner

    Pada gambar 4.1 terlihat bahwa tampilanMicrosoft Excel 2007 yang telah ditambahkanadd in XLMiner sama saja dengan tampilanMicrosoft Excel 2007 pada umumnya, hanyasaja terdapat menu tambahan yaitu menuXLMiner seperti pada gambar 4.1.

    Gambar 4.2. Menu XLMiner

    Setelah memilih menu clustering seperti

    pada gambar 4.2, maka langkah yang dilakukanselanjutnya yaitu mengatur proses dan hasilyang diinginkan seperti pada gambar 4.3

    Gambar 4.3 Setting Missing Data Handling

  • 10 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Dari pengaturan yang dilakukan padagambar 4.3 dimana dari 106 item namamahasiswa dimana ditentukan missing datahandling (merupakan batas transformasi padaXLMiner), penggunaan missing data handlingdengan batasan pada XLMiner bertujuan untukmendapatkan data yang telah di transformasikanke dalam XlMiner. Dari pengaturan yangdilakukan pada gambar 4.3 didapatkan hasilseperti pada tabel 4.1.

    Tabel 4.1. Hasil Missing Data HandlingMenggunakan XLMiner

    Hasil dari proses data miningmenggunakan XLMiner ditampilkan worksheetbaru dengan nama Missing mahasiswa sepertigambar 4.3. informasi yang dihasilkan ditampilkan dalam 1 tabel dimana tabel tersebutmemberikan infomasi mengenai data yangdigunakan. Untuk menentukan missing datahandling selanjutnya sama seperti proses yangtelah dilakukan seperti langkah-langkah yang diatas karena data yang sudah di missing datahandling sama hasilnya.

    1. Data mahasiswa yang telah ditransformasikan dan siap untuk menentukanalgoritma K-Means, lihat pada gambar 4.4.

    Gambar 4.4. Proses Untuk Menentukan K-Means

    2. Langkah yang selanjutnya penulismenetukan K-Means Clustering, inputvariables dengan memilih jumlah dari datamahasiswa, lalu klik next seperti gambar4.5.

    Gambar 4.5. K-Means Clustering

    3. Untuk menentukan jumlah cluster yangdiinginkan, di sini penulis menentukan 5

    10 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Dari pengaturan yang dilakukan padagambar 4.3 dimana dari 106 item namamahasiswa dimana ditentukan missing datahandling (merupakan batas transformasi padaXLMiner), penggunaan missing data handlingdengan batasan pada XLMiner bertujuan untukmendapatkan data yang telah di transformasikanke dalam XlMiner. Dari pengaturan yangdilakukan pada gambar 4.3 didapatkan hasilseperti pada tabel 4.1.

    Tabel 4.1. Hasil Missing Data HandlingMenggunakan XLMiner

    Hasil dari proses data miningmenggunakan XLMiner ditampilkan worksheetbaru dengan nama Missing mahasiswa sepertigambar 4.3. informasi yang dihasilkan ditampilkan dalam 1 tabel dimana tabel tersebutmemberikan infomasi mengenai data yangdigunakan. Untuk menentukan missing datahandling selanjutnya sama seperti proses yangtelah dilakukan seperti langkah-langkah yang diatas karena data yang sudah di missing datahandling sama hasilnya.

    1. Data mahasiswa yang telah ditransformasikan dan siap untuk menentukanalgoritma K-Means, lihat pada gambar 4.4.

    Gambar 4.4. Proses Untuk Menentukan K-Means

    2. Langkah yang selanjutnya penulismenetukan K-Means Clustering, inputvariables dengan memilih jumlah dari datamahasiswa, lalu klik next seperti gambar4.5.

    Gambar 4.5. K-Means Clustering

    3. Untuk menentukan jumlah cluster yangdiinginkan, di sini penulis menentukan 5

    10 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    Dari pengaturan yang dilakukan padagambar 4.3 dimana dari 106 item namamahasiswa dimana ditentukan missing datahandling (merupakan batas transformasi padaXLMiner), penggunaan missing data handlingdengan batasan pada XLMiner bertujuan untukmendapatkan data yang telah di transformasikanke dalam XlMiner. Dari pengaturan yangdilakukan pada gambar 4.3 didapatkan hasilseperti pada tabel 4.1.

    Tabel 4.1. Hasil Missing Data HandlingMenggunakan XLMiner

    Hasil dari proses data miningmenggunakan XLMiner ditampilkan worksheetbaru dengan nama Missing mahasiswa sepertigambar 4.3. informasi yang dihasilkan ditampilkan dalam 1 tabel dimana tabel tersebutmemberikan infomasi mengenai data yangdigunakan. Untuk menentukan missing datahandling selanjutnya sama seperti proses yangtelah dilakukan seperti langkah-langkah yang diatas karena data yang sudah di missing datahandling sama hasilnya.

    1. Data mahasiswa yang telah ditransformasikan dan siap untuk menentukanalgoritma K-Means, lihat pada gambar 4.4.

    Gambar 4.4. Proses Untuk Menentukan K-Means

    2. Langkah yang selanjutnya penulismenetukan K-Means Clustering, inputvariables dengan memilih jumlah dari datamahasiswa, lalu klik next seperti gambar4.5.

    Gambar 4.5. K-Means Clustering

    3. Untuk menentukan jumlah cluster yangdiinginkan, di sini penulis menentukan 5

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 11

    jumlah cluster karena jumlah clustermenentukan hasil dari nilai data mahasiswa,iterations nya 10, lalu klik finish lihatgambar 4.6.

    Gambar 4.6. Menentukan Jumlah Cluster

    4. Apabila semua step clustering dilakukanmaka pilih finish untuk menampilkan K-

    Means input. Di K-Means output

    menampilkan beberapa tabel yang berisikan,

    tabel input, tabel cluster centers, tabeldata summary, tabel elapsed time, tabelpredicted.

    Tabel 4.2. XLMiner : K-Means Clustering

    5. Input yang dihasilkan dari proses XlMiner :K-Means Clustering

    Tabel 4.3. Tabel Input

    6. Dari proses yang telah ditentukan maka

    didapat jumlah cluster seperti tabel 4.4.

    Tabel 4.4. Jumlah Cluster 1-5 dan ClusterCenters

    Tabel cluster center di atas menjelaskanbahwa cluster yang diperoleh atau yang telahditentukan ada 5 cluster banyak cluster, untukcluster 2 yang jumlahnya 43.9333 yang didapatdari banyak di setiap cluster yang didapat dari

    Predicted Clusters.

    Penjelasan tabel diatas adalah dari cluster1 ini diberikan warna merah pada jumlah yang

  • 12 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    untuk mencari jumlah cluster yang didapat ditabel cluster center.

    Dari proses yang dilakukan dalamXLMiner maka seluruh dari algoritma K-MeansClustering, maka informasi yang didapatkan darijumlah Cluster yang ditentukan dapat dilihatpada tabel 4.6.

    Tabel 4.5. Tabel Cluster 2, Cluster 3, Cluster 4,Cluster 5

    Penjelasan dari beberapa tabel yaitu cluster 2,cluster 3, cluster 4, cluster 5 diberikan warnayang berbeda seperti cluster 2 di beri warnahijau, cluster 3 warna biru, cluster 4 biru tua,cluster 5 kuning. Dari tabe-tabel cluster inidiberikan warna yang berbeda agar dapatmempermudah pada saat mencari jumlahcluster center dan dapat membedakan manacluster1 sampai cluster 5.

    7. Selanjutnya ke tabel data summary dari tabelini terdapat beberapa atribut yaitu atributcluster di mana terdapat cluster-cluster yangtelah dibuat sebelumnya, atribut #Obsatribut ini menjelaskan banyak cluster darisetiap record dan yang terakhir atributAverage distance in cluster maksud dari

    atribut ini adalah mencari nilai rata-rata didalam cluster.

    Tabel 4.6. Summary

    8. Waktu dalam proses K-Means Clustering

    Tabel 4.7. Elapsed Time

    Exponential untuk melakukan proses datamembentuk grafik dari hasil data mahasiswa,lihat perintah yang telah dilakukan pada gambar4.7.

    Gambar 4.7. Proses Untuk Menampilkan Grafik

    Dari proses Exponetial Smoothing makaaplikasi XLMiner akan menampilkan perintah

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 13

    untuk menentukan grafik yang akan dihasilkandari data mahasiswa.

    Gambar 4.8. Exponetial Smoothing

    Setelah menjelaskan tabel PredictedClusters yang terakhir tabel Fitted Model.

    Tabel 4.8. Tabel Fitted Mode

    Dari penjelasan tabel di atas bahwa tabelini hasil akhir yang telah diproses dalam datamining. Di dalam tabel mempunyai beberapaatribut yaitu atribut nama mahasiswa, atributactual, atribut forecast, atribut residuals. Untukatribut nama mahasiswa ini berisi seluruhjumlah data nama-nama mahasiswa seluruhangkatan 2009 dan 2010 jurusan teknikinformatika, atribut actual suatu nilai yangbenar-benar fakta yang telah diprosessebelumnya, atribut residuals atribut ini hasil

    sisa dari atribut actual dikurang forecast makadapatlah hasil nilai residuals nya.

    4.4. Interpretation /EvaluationPola informasi yang dihasilkan dari proses

    data mining yang diterapkan berupa grafikseperti gambar 4.9.

    Gambar 4.9. Grafik Dari Data MahasiswaTahun 2009

    Hasil akhir dari tabel Fitted Mode yangdihasilkan berupa grafik. Di grafik Time Plot ofActual Vs Forecast (Training Data) inimemberikan informasi tingkat banyaknyamahasiswa yang mengambil konsentrasikeahlian di bidangnya masing-masing , di grafikini mempunyai beberapa proses yaitu actualdiberikan warna biru di mana proses yang dapatmemberikan informasi mahasiswa yangmengambil konsentrasi keahlian. Dari grafik diatas dapat disimpulkan bahwa mahasiswa yangmengambil konsentrasi jurusan dapatberdasarkan nilai dan minat mahasiswa,berdasarkan nilai yaitu nilai diantara 60-70 dapatmengambil konsentrasi jurusan database

  • 14 Jurnal Ilmiah xxxxxxxxxxxx Vol.x No.x, November 2013:1-15

    management system , nilai diantara 70-80 dapatmengambil konsentrasi jurusan softwareengineering sedangkan nilai diantara 80-90dapat mengambil konsentrasi jurusan ITinfrastructure. Dari grafik ini menunjukkanbahwa informasi prediksi konsentrasi keahlianyang paling banyak diambil mahasiswa adalahkonsentrasi jurusan database managementsystem sebanyak 80%.

    Dari seluruh penjelasan yang telahdipaparkan baik teoritis maupun menggunakanaplikasi XLMiner merupakan informasi hasil

    prediksi, keputusan yang diambil olehmahasiswa akan menentukan peningkatan

    mahasiswa yang mengambil konsentrasikeahlian yang telah dirancang agar berjalandengan baik berdasarkan minat di bidangnyamasing-masing sehingga dapat menciptakansumber daya manusia yang berkualitas nantinya.

    5. SIMPULANBerdasarkan dari penelitian yang telah

    dilaksanakan dan sudah diuraikan dalampenerapan data mining dari data mahasiswateknik informatika di Universitas Bina DarmaPalembang , maka penulis dapat menarikkesimpulan sebagai berikut :1. Penerapan data mining dengan teknik

    clustering dan algoritma K-Means yangdilakukan menghasilkan sebuah informasimengenai data mahasiswa dalammengambil keputusan untuk menentukankonsentrasi keahlian.

    2. Dalam penerapan data mining ini dapatmemberikan informasi konsentrasi keahlianmana yang paling banyak yang diambil olehmahasiswa, dan dapat menjadi suatukeputusan atau pertimbangan agarUniversitas Bina Darma lebih baik lagiuntuk ke depannya.

    3. Semakin kecil batasan nilai dari datamahasiswa yang mengambil keputusandalam menentukan konsentrasi keahlianyang ditentukan maka semakin sedikit pulapola/aturan yang dapat dihasilkan danwaktu yang diperlukan lebih sedikit.

    4. Perhitungan yang dilakukan secara teoritisdan aplikatif menghasilkan nilai dari datamahasiswa yang mengambil keputusandalam menentukan konsentrasi keahlianyang ditentukan.

    5. Waktu yang diperlukan untuk pemprosesantergantung pada spesifikasi komputer,jumlah mahasiswa yang diolah dan jumlahitem yang terlibat sehingga perumusan yangtepat untuk perhitungan waktu belum dapatditentukan

    DAFTAR RUJUKAN

    Azevedo, A. Santos & Manuel F. (2008),KDD, SEMMA AND CRIPS-DM: APARALLEL OVERVIEW, IADIS.ISBN: 978-972-8924-63-8.

    Frontline Solvers.(2012), XLMiner Data Miningadd-in for Excel. Diakses 10 Mei 2013,darihttp://www.solver.com/xlminer datamining.

  • Penerapan Data Mining Untuk Mengolah Informasi Konsentrasi Keahlian Dengan Metode Clustering PadaUniversitas Bina Darma

    (Kikie Riesky Andini) 15

    Kusrini & Luthfi, E. Taufiq.(2009), AlgorimaData Mining,Penerbit Andi, Yogyakarta.

    Larose, Daniel T . (2005), DiscoveringKnowledge in Data: An Introduction toData Mining , John Willey & Sons, Inc.

    Pramudiono, I.(2003), Pengantar Data Mining.Diakses 10 Mei 2013, darihttp://ikc.depsos.go.id /umum/iko-datamining.php.

    Santoso, Budi.(2007), Data Mining TeknikPemanfaatan Data Untuk KeperluanBisnis, Graha Ilmu, Yogyakarta.