Upload
others
View
18
Download
0
Embed Size (px)
Citation preview
i
PENERAPAN METODE ALGORITMA C4.5 UNTUK MEMPREDIKSI
LOYALITAS KARYAWAN PADA PT.XYZ BERBASIS WEB
Laporan Skripsi
Diajukan sebagai salah satu syarat untuk kelengkapan studi pada Program Studi
Teknik Informatika
Jenjang Pendidikan Strata 1
Disusun oleh:
NAMA : Ryanwar
NIM : 20141000036
TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS BUDDHI DHARMA
TANGERANG
2020
ii
PERSEMBAHAN
You never fail until you stop trying
(Albert Einstein)
Dengan mengucap puji dan syukur kepada Tuhan Yang Maha Esa, Skripsi ini
kupersembahkan untuk :
1. Bapak Wandro Soetiono dan ibu Su Lan, yang telah membesarkanku,
membimbingku, mendidikku, mendukungku selalu, memberikanku segala yang
terbaik dalam kehidupanku, serta doa yang tak pernah habis kalian panjatkan
untuk diriku.
2. Adikku Yolanda, yang telah membantu memberikan dukungan dan semangat.
3. Kakekku Alm. Thio Tjun Kiat dan nenekku Almh. Lim Sin Nio yang telah
membesarkanku, membimbingku, mendidikku, mendukungku selalu,
memberikanku segala yang terbaik dalam kehidupanku, serta doa yang tak
pernah habis kalian panjatkan untuk diriku.
Tanpa mereka,
Aku dan karya ini tak akan pernah ada
iii
iv
v
vi
vii
viii
KATA PENGANTAR
Dengan mengucapkan Puji syukur kepada Tuhan Yang Maha Esa, yang telah memberikan
Rahmat dan Karunia-Nya kepada penulis sehingga dapat menyusun dan menyelesaikan
Skripsi yang berjudul “PENERAPAN METODE ALGORITMA C4.5 UNTUK
MEMPREDIKSI LOYALITAS KARYAWAN PADA PT.XYZ BERBASIS WEB”
tepat pada waktunya. Tujuan disusunnya Skripsi ini adalah untuk memenuhi syarat
menyelesaikan program pendidikan Strata 1 (S1) pada program Studi Teknik Infomatika
Universitas Buddhi Dhama. Dalam penyusunan kerja praktek ini, penulis banyak
menerima bantuan dan dorongan baik moril maupun materiil dari berbagai pihak, maka
pada kesempatan ini penulis menyampaikan rasa terima kasih yang sebesar-besarnya
kepada:
1. Bapak Dr. Sofian Sugioko, MM, CPMA, sebagai Rektor Univcrsitas Buddhi
Dharma
2. Bapak Dr.Eng, Ir. Amin Suyitno, M.Eng, sebagai Dekan Fakultas Sains dan
Teknologi
3. Bapak Rino, M.Kom, sebagai Ketua Program Studi Teknik Informatika
sekaligus
4. Bapak Dram Renaldi, M.Kom, sebagai Pembimbing Skripsi yang telah
membantu memberikan dukungan serta harapan untuk menyelesaikan
penulisan Skripsi ini.
5. Bapak dan Ibu Dosen UBD.
ix
x
Penerapan Metode Algoritma C4.5 Untuk Memprediksi Loyalitas Karyawan Pada PT.XYZ
Berbasis Web 99 + xix halaman/ 18 tabel/ 35 gambar/ 2 Lampiran
ABSTRAK
Kemajuan teknologi pengetahuan dan teknologi beserta aplikasinya disegala bidang tidak
bisa lepas dari perangkat komputer. Penggunaan komputer sudah menjangkau hampir
segala bidang dalam aktivitas kehidupan manusia, baik dalam lingkungan pendidikan,
organisasi, perusahaan maupun masyarakat umum. Penggunaan komputer terbukti banyak
membantu kita dalam melakukan pekerjaan dengan lebih baik. Data Mining atau
menambang data didefinisikan sebagai metode yang digunakan untuk mengekstraksi
informasi prediktif tersembunyi pada database, ini adalah teknologi yang sangat potensial
bagi perusahaan dalam memberdayakan data warehouse-nya. Algoritma C4.5 merupakan
algoritma klasifikasi dengan teknik pohon keputusan yang terkenal dan disukai karena
memiliki kelebihan-kelebihan. Kelebihan ini misalnya dapat mengolah data numerik
(kontinyu) dan diskret, dapat menangani nilai atribut yang hilang, menghasilkan aturan-
aturan yang mudah diintrepetasikan dan tercepat diantara algoritma-algoritma yang lain.
Penerapan Algoritma C4.5 pada prediksi loyalitas karyawan dapat menghasilkan accuracy
yang mencapai 92,80% dengan menggunakan aplikasi RapidMiner.
Kata Kunci: Datamining, algoritma C4.5, data , rapidminer
xi
Application of C4.5 Algorithm Method to Predict Employee Loyalty at Web-Based PT. XYZ
99+ xix pages/ 18 tables/ 35 images/ 2 libraries
ABSTRACT
The advancement of knowledge and technology along with its applications in all fields
cannot be separated from computer devices. The use of computers has reached almost all
fields in the activities of human life, both in the educational environment, the organization,
companies and the general public. The use of computers has proven to help us in doing our
jobs better. Data Mining or mining data is defined as the method used to extract hidden
predictive information on databases, this is a very potential technology for companies to
empower their data warehouses. C4.5 algorithm is a classification algorithm with decision
tree technique that is well-known and preferred because it has advantages. This
advantage, for example, can process numerical (continuous) and discrete data, can handle
missing attribute values, generate easily interpreted rules and fastest among other
algorithms. The application of C4.5 Algorithm on the prediction of employee loyalty can
produce an accuracy of 92.80% by using the RapidMiner application.
Keywords: Data Mining, C4.5 algorithm, data, rapidminer
xii
DAFTAR ISI
LEMBAR JUDUL LUAR
LEMBAR JUDUL DALAM
LEMBAR PERSEMBAHAN
LEMBAR PERNYATAAN KEASLIAN
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH
LEMBAR PENGESAHAN
LEMBAR PERSETUJUAN PEMBIMBING
LEMBAR PENGESAHAN DEWAN PENGUJI
Hal
PERSEMBAHAN ................................................................................................................ ii
LEMBAR PERNYATAAN KEASLIAN SKRIPSI ............ Error! Bookmark not defined.
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH ........ Error! Bookmark not
defined.
LEMBAR PENGESAHAN DEKAN DAN KAPRODI ...... Error! Bookmark not defined.
LEMBAR PENGESAHAN PEMBIMBING ....................... Error! Bookmark not defined.
LEMBAR PENGESAHAN TIM PENGUJI ....................... Error! Bookmark not defined.
KATA PENGANTAR ........................................................................................................ viii
ABSTRAK ............................................................................................................................ x
ABSTRACT ........................................................................................................................... xi
DAFTAR ISI ....................................................................................................................... xii
DAFTAR GAMBAR .......................................................................................................... xvi
DAFTAR TABEL ............................................................................................................ xviii
DAFTAR LAMPIRAN ...................................................................................................... xix
BAB I PENDAHULUAN .................................................................................................... 1
1.1. Latar Belakang ........................................................................................................ 1
1.2. Identifikasi Masalah ................................................................................................ 3
1.3. Rumusan Masalah ................................................................................................... 3
1.4. Ruang Lingkup ....................................................................................................... 4
xiii
1.5. Tujuan dan Manfaat ................................................................................................ 4
1.5.1. Tujuan .............................................................................................................. 4
1.5.2. Manfaat ............................................................................................................ 4
1.6. Metode Penelitian ................................................................................................... 5
1.6.1. Analisa Penelitian ............................................................................................ 5
1.6.2. Metode Pengumpulan Data ............................................................................. 6
1.7. Sistematika Penulisan ............................................................................................. 7
BAB II LANDASAN TEORI .............................................................................................. 8
2.1. Teori Umum ............................................................................................................ 8
2.1.1. Aplikasi ............................................................................................................ 8
2.1.2. Informasi ........................................................................................................ 10
2.1.3. Komputer ....................................................................................................... 11
2.1.4. Data ................................................................................................................ 13
2.1.5. Database ........................................................................................................ 14
2.1.6. Website .......................................................................................................... 15
2.1.7. Internet .......................................................................................................... 16
2.2. Teori Khusus ......................................................................................................... 18
2.2.1. Prediksi .......................................................................................................... 18
2.2.2. Data mining ................................................................................................... 19
2.2.3. Pohon Keputusan ( Decision Tree) ................................................................ 27
2.2.4. Kaggle ............................................................................................................ 28
2.2.5. Algoritma ....................................................................................................... 29
2.2.6. Algoritma C4.5 .............................................................................................. 30
2.2.7. Entropy dan Information gain ....................................................................... 34
2.3. Teori Rancangan ................................................................................................... 34
2.3.1. PHP ................................................................................................................ 34
2.3.2. HTML ( Hyper Text Markup Language ) ...................................................... 35
2.3.3. XAMPP ......................................................................................................... 35
2.3.4. PHPMyAdmin ................................................................................................ 37
2.3.5. MySQL ........................................................................................................... 37
2.3.6. Bootstrap ....................................................................................................... 38
2.3.7. Rapid Miner ................................................................................................... 39
2.3.8. Notepad++ ..................................................................................................... 40
xiv
2.3.9. CSS ................................................................................................................ 40
2.3.10. Entity Relationship Diagram(ERD)............................................................... 41
2.4. Tinjauan Jurnal ..................................................................................................... 42
2.4.1. Penelitian Tosy Caesar Kurniawan................................................................ 42
2.4.2. Rangkuman Model Penelitian ....................................................................... 44
2.5. Kerangka Pemikiran ............................................................................................. 48
BAB III ANALISA MASALAH DAN PERANCANGAN SISTEM ............................. 49
3.1. Analisa Kebutuhan ................................................................................................ 49
3.2. Kontruksi Algoritma atau Metode ........................................................................ 52
3.3. Perancangan Layar ................................................................................................ 58
3.3.1. Perancangan Halaman Login ......................................................................... 59
3.3.2. Perancangan Layar Home .............................................................................. 59
3.3.3. Perancangan Layar Prediksi Loyalitas Karyawan ......................................... 61
3.3.4. Perancangan Layar Sign Up .......................................................................... 62
3.3.5. Perancangan Layar Laporan .......................................................................... 63
3.3.6. Perancangan Layar Laporan Hasil Perhitungan ............................................ 64
3.3.7. Perancangan Layar Input Laporan Karyawan ............................................... 65
3.3.8. Perancangan Layar Manage Account ............................................................ 66
3.4. Desain Database .................................................................................................... 67
BAB IV PENGUJIAN DAN IMPLEMENTASI ............................................................. 72
4.1. Algoritma C4.5 ..................................................................................................... 72
4.2. Pohon Keputusan (Decision Tree) ........................................................................ 74
4.3. Spesifikasi Hardware dan Software ...................................................................... 76
4.3.1. Spesifikasi Hardware .................................................................................... 76
4.3.2. Spesifikasi Software ...................................................................................... 77
4.4. Tampilan Layar Program ...................................................................................... 78
Tampilan Halaman Login .............................................................................. 78
Tampilan Layar Home ................................................................................... 79
Tampilan Layar Prediksi Loyalitas Karyawan .............................................. 80
Tampilan Layar Sign Up................................................................................ 81
Tampilan Layar Laporan ............................................................................... 82
Tampilan Layar Laporan Hasil Perhitungan ................................................. 83
Tampilan Layar Input Laporan Karyawan .................................................... 84
xv
Tampilan Layar Manage Account ................................................................. 85
4.5. Hasil Pengujian Confusion Matrix ....................................................................... 86
4.6. Hasil Pengolahan Data Kuesioner ........................................................................ 86
BAB V SIMPULAN DAN SARAN .................................................................................. 98
5.1. Simpulan ............................................................................................................... 98
5.2. Saran ..................................................................................................................... 99
DAFTAR PUSTAKA ........................................................................................................ 100
DAFTAR RIWAYAT HIDUP .......................................................................................... 103
LAMPIRAN-LAMPIRAN……………….…………...………………...………………………..L1
xvi
DAFTAR GAMBAR Hal
Gambar 2. 1 Kerangka Pemikiran ....................................................................................... 48
Gambar 3. 1 Pohon Keputusan ............................................................................................ 57
Gambar 3. 2 Hierarki Aplikasi ............................................................................................ 58
Gambar 3. 3 Perancangan Layar Login ............................................................................... 59
Gambar 3. 4 Perancangan Halaman Utama ......................................................................... 60
Gambar 3. 5 Perancangan Layar Prediksi Loyalitas Karyawan .......................................... 61
Gambar 3. 6 Perancagan Layar Sign Up.............................................................................. 62
Gambar 3. 7 Perancangan Layar Laporan ........................................................................... 63
Gambar 3. 8 Perancangan Layar Laporan Hasil Perhitungan ............................................. 64
Gambar 3. 9 Perancangan Layar Input Laporan Karyawan ............................................... 65
Gambar 3. 10 Perancangan Layar Manage Account ........................................................... 66
Gambar 3. 11 Entity Relationship Diagram ........................................................................ 67
Gambar 4. 1 Gambar Pohon Keputusan .............................................................................. 74
Gambar 4. 2 Gambar Laporan Hasil Perhitungan ............................................................... 75
Gambar 4. 3 Gambar Pohon Keputusan Dengan Mengikuti Hasil Penilaian ...................... 76
Gambar 4. 4 Tampilan Layar Login .................................................................................... 78
Gambar 4. 5 Tampilan Layar Home .................................................................................... 79
Gambar 4. 6 Tampilan Layar Prediksi Loyalitas Karyawan ............................................... 80
Gambar 4. 7 Tampilan Layar Sign up ................................................................................. 81
Gambar 4. 8 Tampilan Layar Laporan ................................................................................ 82
Gambar 4. 9 Tampilan Layar Laporan Hasil Perhitungan ................................................... 83
Gambar 4. 10 Tampilan Layar Input Laporan Karyawan ................................................... 84
Gambar 4. 11 Tampilan Layar Manage Account ................................................................ 85
Gambar 4. 12 Hasil Pengujian Confusion Matrix ............................................................... 86
Gambar 4. 13 Diagram jawaban pertanyaan 1 .................................................................... 87
Gambar 4.14 Diagram jawaban pertanyaan 2 ..................................................................... 88
Gambar 4.15 Diagram jawaban pertanyaan 3 ..................................................................... 89
Gambar 4.16 Diagram jawaban pertanyaan 4 ..................................................................... 90
Gambar 4.17 Diagram jawaban pertanyaan 5 ..................................................................... 91
Gambar 4.18 Diagram jawaban pertanyaan 6 ..................................................................... 92
xvii
Gambar 4.19 Diagram jawaban pertanyaan 7 ..................................................................... 93
Gambar 4.20 Diagram jawaban pertanyaan 8 ..................................................................... 94
Gambar 4.21 Diagram jawaban pertanyaan 9 ..................................................................... 95
Gambar 4.22 Diagram jawaban pertanyaan 10 ................................................................... 96
Gambar 4.23 Grafik analisa kuesioner keseluruhan ............................................................ 97
xviii
DAFTAR TABEL Hal
Tabel 2. 1 Tabel Penelitian Tosy Caesar Kurnianwan ........................................................ 42
Tabel 2. 2 Tabel Rangkuman Model Penelitian .................................................................. 44
Tabel 3. 1 Tabel Keterangan Atribut ................................................................................... 49
Tabel 3. 2 Tabel Data set ..................................................................................................... 51
Tabel 3. 3Tabel Hitung Manual ........................................................................................... 55
Tabel 3.4 Tabel users........................................................................................................... 68
Tabel 3.5 Tabel Report ........................................................................................................ 68
Tabel 3.6 Tabel Karyawan................................................................................................... 70
Tabel 4.1 Jawaban Pertanyaan 1.......................................................................................... 86
Tabel 4.2 Jawaban Pertanyaan 2.......................................................................................... 87
Tabel 4.3 Jawaban Pertanyaan 3.......................................................................................... 88
Tabel 4.4 Jawaban Pertanyaan 4.......................................................................................... 90
Tabel 4.5 Jawaban Pertanyaan 5.......................................................................................... 91
Tabel 4.6 Jawaban Pertanyaan 6.......................................................................................... 92
Tabel 4.7 Jawaban Pertanyaan 7.......................................................................................... 93
Tabel 4.8 Jawaban Pertanyaan 8.......................................................................................... 94
Tabel 4.9 Jawaban Pertanyaan 9.......................................................................................... 95
Tabel 4.10 Jawaban Pertanyaan 10...................................................................................... 96
xix
DAFTAR LAMPIRAN Hal
Lampiran 1 Coding Program……………………………………….……………………………..L1
Lampiran 2 Kuisioner……………….……………………………………………………………..L2
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Kemajuan teknologi pengetahuan dan teknologi beserta aplikasinya disegala
bidang tidak bisa lepas dari perangkat komputer. Penggunaan komputer sudah
menjangkau hampir segala bidang dalam aktivitas kehidupan manusia, baik dalam
lingkungan pendidikan, organisasi, perusahaan maupun masyarakat umum.
Penggunaan komputer terbukti banyak membantu kita dalam melakukan pekerjaan
dengan lebih baik.
Kebutuhan akan layanan informasi sangatlah penting, dalam memprediksi
loyalitas karyawan masih dapat dilakukan secara manual namun waktu pengerjakaan
yang cukup lama, melalui aplikasi yang menggunakan data mining dapat
mempermudah dalam proses prediksi pegawai yang memiliki loyalitas pada
perusahaan.
Data Mining atau menambang data didefinisikan sebagai metode yang
digunakan untuk mengekstraksi informasi prediktif tersembunyi pada database, ini
adalah teknologi yang sangat potensial bagi perusahaan dalam memberdayakan data
warehouse-nya. Data Mining disebut sebagai proses ekstraksi pengertahuan dari data
yang besar, sesuai fungsinya Data Mining adalah proses pengambilan keputusan dari
volume data yang besar yang disimpan dalam basis data, data warehouse, atau
informasi yang disimpan dalam repositori. (Dhika, p. 2015).
2
Menurut kamus besar bahasa Indonesia, karyawan adalah orang yang bekerja
pada suatu lembaga (kantor, perusahaan dan sebagainya) dengan mendapatkan gaji
(upah). Menurut Hasibuan, karyawan adalah orang penjual jasa (pikiran dan tenaga)
dan dapat kompensasi yang besarnya telah ditetapkan terlebih dahulu (Anggriawan,
p. 266).
Saat ini perusahaan sedang menghadapi tantangan dalam mempertahankan
loyalitas karyawan, hal ini ditunjukkan dari kecenderungan karyawan meninggalkan
perusahaan tempatnya bekerja dalam masa kerja yang cukup singkat (Valentino dan
Haryadi, p. 328). Rangkayo mengatakan bahwa sepertiga atau lebih profit sebuah
perusahaan dihasilkan oleh karyawan yang loyal sedangkan apabila perusahaan
memiliki karyawan yang tidak loyal dalam artian bekerja setengah hati maka
perusahaan akan mengalami kerugian sebesar 50% dari biaya gaji yang dikeluarkan.
(Valentino dan Haryadi, p. 328).
Algoritma C4.5 dapat digunakan untuk meneliti berbagai macam hal diantara
nya adalah prediksi penerimaan calon pegawai baru,loyalitas pelanggan dan lain lain,
algoritma C4.5 adalah salah satu dari algoritma yang memiliki decision tree (Haryati,
Sudarsono dan Suryana, p.130). Algoritma C4.5 merupakan algoritma klasifikasi
dengan teknik pohon keputusan yang terkenal dan disukai karena memiliki
kelebihan-kelebihan. Kelebihan ini misalnya dapat mengolah data numerik
(kontinyu) dan diskret, dapat menangani nilai atribut yang hilang, menghasilkan
aturan-aturan yang mudah diintrepetasikan dan tercepat diantara algoritma-algoritma
yang lain. (Dhika, p. 2015). Berdasarkan permasalahan tersebut, maka diperlukan
sebuah sistem untuk memprediksi loyalitas karyawan yaitu : “Penerapan Metode
Algoritma C4.5 Untuk Memprediksi Loyalitas Karyawan Pada PT.XYZ
3
Berbasis Web ”. Diharapkan dengan sistem ini, dapat terbantu dalam memprediksi
karyawan yang memiliki loyalitas terhadap perusahaan.
1.2. Identifikasi Masalah
Penerapan prediksi algoritma C4.5 ini dimaksud untuk memudahkan user
dalam memprediksi karyawan yang memiliki loyalitas terhadap perusahaan melalui
penilaian beberapa kriteria tanpa harus menghitung secara manual dari beberapa
kriteria yang prosesnya begitu lama dan tidak.
1.3. Rumusan Masalah
Masalah yang dirumuskan dalam penelitian ini adalah
a. Bagaimana mengimplementasikan algoritma C.45 pada prediksi
loyalitas karyawan pada perusahaan sehingga tingkat akurasi yang
hasilkan dapat digunakan?
b. Berapakah tingkat keakuratan yang dihasilkan dalam implentasi data
mining untuk memprediksi loyalitas karyawan?
c. Apakah loyalitas karyawan mempengaruhi profit pada perusahaan?
4
1.4. Ruang Lingkup
Ruang lingkup menjadi batasan masalah pada penelitian kerja praktek ini di
antara lain:
a. Algoritma yang di gunakan untuk prediksi karyawan yang loyal pada
perusahaan adalah C.45 dan tidak membandingkan dengan algoritma lain
nya.
b. Aplikasi ini berbasis web.
c. Menggunakan data sekunder dari www.kaggle.com
1.5. Tujuan dan Manfaat
1.5.1. Tujuan
a. Penerapan metode Algoritma C4.5 untuk memprediksi karyawan
yang loyal pada perusahaan.
b. Mengetahui karyawan yang memiliki loyalitas pada perusahaan.
1.5.2. Manfaat
a. Perusahaan dapat memberikan kenaikan gaji (upah) pada karyawan
yang memiliki loyalitas pada perusahaan.
b. Memudahkan pengguna dalam menentukan karyawan yang loyal
pada perusahaan.
5
1.6. Metode Penelitian
1.6.1. Analisa Penelitian
a. Perencanaan
Pada tahap ini bertujuan untuk mengidentifikasi dan memahami
permasalahan yang muncul, kemudian kemudian menentukan
tujuan pembuatan sistem dan mengidentifikasi apakah masalah-
masalah yang ada bisa diselesaikan.
b. Analisis
Analisa sistem adalah tahap di mana dilakukan beberapa aktivitas
berikut:
1) Melakukan studi literatur untuk menemukan suatu
kasus yang bisa ditangani oleh sistem.
2) Menentukan kasus mana yang paling tepat dimodelkan
dengan sistem.
3) Mengklasifikasikan masalah, peluang, dan solusi yang
mungkin diterapkan untuk kasus tersebut.
4) Analisa kebutuhan pada sistem dan membuat batasan
sistem.
5) Mendefinisikan kebutuhan sistem.
6
c. Desain
Pada tahap ini, melakukan perancangan komponen-komponen
sistem terkait.. Langkah-langkah tahap rancangan sistem
mencakup:
1) Menyiapkan rancangan sistem secara detil.
2) Mengidentifikasi alternatif konfigurasi sistem.
3) Mengevaluasi alternatif konfigurasi sistem.
4) Merancang user interface.
1.6.2. Metode Pengumpulan Data
Metode yang digunakan dalam proses pengumpulan data sebagai bahan
pembuatan sistem adalah studi pustaka. Pada tahap ini dilakukan pengumpulan
bahan terkait dengan data pegawai dan algoritma C.45 untuk memprediksi
pegawai yang akan memiliki loyalitas pada perusahaan yang di peroleh dari
jurnal ilmiah, artikel terkait,serta penelitian yang mendukung penelitian ini.
7
1.7. Sistematika Penulisan
BAB I PENDAHULUAN
Bab ini berisikan tentang latar belakang, identifikasi masalah, rumusan masalah,
ruang lingkup, tujuan dan manfaat, metode penelitian dan sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini berisikan tentang teori-teori yang diambil dari jurnal-jurnal yang berkaitan
dengan penyusunan laporan skripsi serta beberapa literature yang berhubungan
dengan penelitian ini.
BAB III PERANCANGAN SISTEM
Bab ini berisikan analisa kebutuhan, kontruksi algoritma atau metode dan
perancangan layar, menu dan database.
BAB IV PENGUJIAN DAN IMPELEMENTASI
Bab ini berisikan pembahasan metode dan algoritma, spesifikasi hardware dan
software, tampilan program dan pengujian aplikasi.
BAB V SIMPULAN DAN SARAN
Berisikan kesimpulan dan saran yang berkaitan dengan hasil penelitian yang sudah
dilakukan berdasarkan yang telah diuraikan pada bab-bab sebelumnya.
8
BAB II
LANDASAN TEORI
2.1. Teori Umum
2.1.1. Aplikasi
Menurut Juansyah (2015, p. 10) Aplikasi adalah suatu program yang siap
untuk digunakan yang dibuat untuk melaksanankan suatu fungsi bagi pengguna
jasa aplikasi serta penggunaan aplikasi lain yang dapat digunakan oleh suatu
sasaran yang akan dituju.
Aplikasi adalah perintah program yang dibuat untuk melakukan
pekerjaan-pekerjaan tertentu (khusus). Banyaknya jumlah aplikasi saat ini juga
memicu banyaknya bermunculan bahasa pemrograman baik mulai dari
pemrograman untuk desktop maupun untuk pemrograman mobile, baik untuk
kebutuhan kerja ataupun hanya untuk hiburan semata. Dan pada dasarnya
aplikasi berfungsi untuk melakukan pekerjaan–pekerjaan sesuai dengan
kebutuhan user.
Jenis – jenis dari aplikasi komputer sendiri antara lain adalah sebagai
berikut:
a. Aplikasi Grafik
Merupakan suatu program komputer yang di gunakan dengan
menarik sebuah gambar yang memberikan dimensi baru pada
bidang komputer tersebut.
9
b. Aplikasi Komputer untuk Animasi
Merupakan bentuk seni yang tampak secara spontan menimbulkan
gerakan kehidupan pada suatu objek yang di dukung dengan
rangkaian frame.
c. Aplikasi Komputer untuk WEB
Merupakan bagian dari internet sebagai komunitas jaringan
komputer yang memberikan pelayanan HTTP (Hypertext transfer
protocol).
d. Aplikasi Komputer untuk Pendidikan.
Merupakan program komputer yang di gunakan untuk mendukung
proses pembelajaran.
e. Aplikasi untuk Bisnis / Perkantoran.
Merupakan program komputer yang di gunakan untuk mendukung
keperluan perkantoran guna pengambilan keputusan selanjutnya.
Pengertian Aplikasi Secara Umum adalah alat terapan yang difungsikan
secara khusus dan terpadu sesuai kemampuan yang dimilikinya aplikasi
merupakan suatu perangkat komputer yang siap pakai bagi user.
Pengertian aplikasi menurut para ahli:
a. Pengertian aplikasi menurut Kamus Besar Bahasa Indonesia,
“Aplikasi adalah penerapan dari rancang sistem untuk
mengolah data yang menggunakan aturan atau ketentuan
bahasa pemrograman tertentu.
10
b. Menurut Rachmad Hakim S Aplikasi Aplikasi adalah
perangkat lunak yang digunakan untuk tujuan tertentu, seperti
mengolah dokumen, mengatur Windows &, permainan
(game) dan sebagainya.
c. Menurut Harip Santoso Aplikasi adalah suatu kelompok file
(form, class, report) yang bertujuan untuk melakukan
aktivitas tertentu yang saling terkait, misalnya aplikasi
payroll, aplikasi fixed asset, dll.
d. Menurut Ali Zaki dan Smitdey Comunity aplikasi adalah
komponen yang bermanfaat sebagai media untuk
menjalankan pengolahan data ataupun berbagai kegiatan
lainnya seperti pembuatan atau pengolahan dokumen atau
file.
2.1.2. Informasi
Menurut Hastanti, Purnama dan Wardati (2015, p. 2) Didefinisikan oleh
John dan Gary Grudnitski sebagai berikut informasi adalah data yang telah
diletakkan dalam konteks yang lebihberarti dan berguna yang dikomunikasikan
kepada penerima untuk digunakan di dalam pembuatan keputusan.
Menurut Destiningrum dan Adrian (2017, p. 31) informasi adalah data
yang telah diproses dengan suatu cara untuk memberikan arti dan memperbaiki
pengambilan keputusan.
11
Menurut Romney dan Steinbart (2015) Informasi adalah data yang telah
dikelola dan diproses untuk memberika arti dan memperbaiki proses
pengambilan keputusan.
Menurut Asmara (2016) Informasi adalah data yang diolah menjadi
bentuk yang lebih berguna dan lebih berarti bagi penerimanya. Sumber
informasi adalah data. Data kenyataannya yang menggambarkan suatu kejadian
– kejadian dan kesatuan nyata. Kejadian – kejadian (event) adalah kejadian
yang terjadi pada saat tertentu.
Dari pengertian di atas, informasi adalah kumpulan data yang dapat
diolah untuk menjadi sebuah bentuk yang berguna untuk penerimanya.
2.1.3. Komputer
Menurut Ikhsan dan Kurniawan (2015, p.13) Komputer adalah sebuah
mesin hitung elektronik yang secara cepat menerima informasi masukan digital
dan mengolah informasi tersebut menurut seperangkat instruksi yang tersimpan
dalam komputer tersebut dan menghasilkan keluaran informasi yang dihasilkan
setelah diolah.
Pengertian Komputer menurut para ahli:
a. Menurut Robert H. Blissmer Komputer adalah suatu alat
elektronik yang mampu melakukan beberapa tugas sebagai
berikut:
1) Menerima input.
2) Memproses input sesuai dengan programnya.
12
3) Menyimpan perintah-perintah dan hasil dan
pengolahan.
4) Menyediakan output dalam bentuk informasi.
b. Menurut (William M. Fours), computer Adolph suite
permutes data (data processor) yang data melakukan
perhitungan besar dan cepat, termasuk perhitungan
aritmatika yang besar atau operasi logika, tanpa campur
tangan manusia, mengoperasikan selama pemrosesan.
c. Menurut Gordon B. Davis komputer Adalah tips khusus alat
penghitung yang mempunyai sifat tertentu yang pas. Dari
beberapa definisi yang didapat dari berbagai buku, data
disimpulkan bahwa, komputer adalah:
1) Alat Elektronik.
2) Dapat menerima input data.
3) Dapat mengolah data.
4) Dapat memberikan informasi.
5) Menggunakan suite program yang tersimpan
dimemori computer (stored program).
6) Dapat menyimpan program dan hasil pengolahan.
7) Bekerja secara otomatis.
d. Menurut buku (Donald H. Sanders), komputer adalah sistem
elektronik untuk manipulasi data yang cepat dan tepat
sertadirancang dengan diorganisasikan supaya secara
otomatis menerima dan menyimpan data input,
13
memprosesnya dan menghasilkan output dibawah
pengawasan suatu langkah-langkah instruksi-instruksi
program yang tersimpan di memori (stored program).
e. Menurut (V. C. Hamacher, Z. G. Vranesic. S. G. Zaky),
komputer adalah mesin penghitung elektronik yang cepat
dan menerima informasi input digital, memprosesnya sesuai
dengan suatu program yang tersimpan dimemorinya (stored
program) dan menghasilkan output informasi.
Dari pengertian diatas, komputer adalah suatu alat/mesin yang
dapat mengolah informasi dengan cara yang berurutan dengan instruksi
yang ada.
2.1.4. Data
Menurut Iswandy (2015, p. 72) Data merupakan kumpulan objek-objek
beserta atributnya yang menunjukan karakteristik dari objek tersebut.
Data adalah fakta kasar atau gambaran yang dikumpulkan dari keadaan
tertentu. Data adalah hal yang merujuk pada fakta-fakta baik berupa angka,
teks, dokumen, gambar, bagan, suara yang mewakili deskriptif verbal atau
kode tertentu. Jadi data merupakan bentuk yang masih mentah sehingga perlu
diolah lebih lanjut.
Dari pengertian diatas, data adalah suatu file yang berupa karakter atau
tulisan, angka-angka dan gambar atau fakta yang dapat diolah menjadi
informasi.
14
2.1.5. Database
Database menurut Winarno dan Utomo (2010, p. 142) “Database atau
biasa disebut basis data merupakan kumpulan data yang saling berhubungan.
Data tersebut biasanya terdapat dalam tabel-tabel yang saling berhubungan satu
sama lain, dengan menggunakan field/kolom pada tiap tabel yang ada.
Menurut Pebriadi (2016, p. 31) Sebuah sistem basis data dapat memiliki
beberapa basis data. Setipa basis data dapat berisi. Memiliki sejumlah objek
basis data (seperti file / tabel, indeks dan lain-lain). Selain menyimpan data,
setiap basis data juga mengandung / menyimpan definisi struktur (baik untuk
basis data maupun objek-objeknya secara detail).
Hierarki adalah urutan atau urutan dari tingkatan abstraksi menjadi
seperti dtruktur pohon. Hierarki membentuk sesuatu pada beberapa aturan yang
khusus atau berdasarkan peringkat (misalnya kompleksitas dan tanggung
jawabnya). Hierarki data dalam data base mulai dari yang terbesar ke yang
terkecil yaitu :
a. Database suatu database menggabarkan data yang
saling berhubungan antara satu dengan yang lainnya.
b. File Merupakan kumpulan dari record-record.
c. Record Suatu record menggambarkan suatu atribut dari
record, dimana kumpulan field mementuk suatu record.
d. Field Suatu field menggambarkan suatu atribut dari
record, dimana kumpulan field membentuk suatu
record.
15
e. Byte Atribut dari field berupa huruf yang membentuk
nilai dari sebuah field.
f. Bit Merupakan bagian terkecil dari data secara
keseluruhan yaitu berupa karakter ASCII (American
Standar Code Form Information Intercharge). Nol
adalah suatu yang merupakan komponen pembentukan
byte.
2.1.6. Website
Menurut Prayitno dan Safitri (2015, p. 2) pengertian website adalah
keseluruhan halaman-halaman web yang terdapat dari sebuah domain yang
mengandung informasi.
Menurut Hastanti, Purnama, dan Wardati (2015, p. 1) Website merupakan
kumpulan halaman-halaman yang berisi informasi yang disimpan diinternet
yang bisa diakses atau dilihat melalui jaringan internet pada
perangkatperangkat yang bisa mengakses internet itu sendiri seperti computer.
Menurut Romadhon (2019, p. 23) Secara umum ada beberapa bahasa
pemrograman yang digunakan untuk membuat aplikasi website. Adapun
bahasa program yang di pakai sebagai berikut: HTML (Hyper Text Markup
Language), PHP (PHP Hypertext Preprocessor), CSS (Cascading Style Sheet),
Javascript, Mysql, Jquery.
16
2.1.7. Internet
Menurut Khairil, Kanedi dan Aspriyono (2012, p. 20) Internet adalah
singkatan dari Interconnected Network. Secara umum, Internet adalah sebuah
sistem komunikasi global yang menghubungkan berbagai mesin komputer dan
jaringan-jaringan komputer di seluruh dunia melalui kabel maupun tanpa kabel
(wireless). Mesin komputer tersebut dapat berupa server, komputer pribadi
(PC), telepon selular (handphone), PDA, dan lainlain.
Sejarah Internet Pada awalnya Internet merupakan jaringan komputer
yang dibentuk oleh Departemen Pertahanan Amerika Serikat pada tahun 1969,
melalui proyek ARPA yang disebut ARPANET (Advanced Research Project
Agency Network), di mana mereka mendemonstrasikan bagaimana dengan
hardware dan software komputer yang berbasis UNIX, Anda bisa melakukan
komunikasi dalam jarak yang tak terhingga melalui saluran telepon.
Menurut Hastanti, Purnama dan Wardati (2015, p. 2) Internet adalah
sebagai jaringan komputer yang sangat luas dan besar dan mendunia,
menghubungkan pemakai komputer dari satu negara ke negara lain di seluruh
dunia, dimana di dalamnya terdapat berbagai sumber informasi dan fasilitas–
fasilitas layanan internet yaitu diantaranya:
a. Browsing atau surfing yaitu kegiatan “berselancar” di
internet, kegiatan ini seperti layaknya berjalan-jalan di
mal sambil melihat-lihat ke toko-toko tanpa membeli
apapun.
17
b. Elektronik mail (E-mail) fasilitas ini digunakan untuk
berkirim surat dengan orang lain, tanpa mengenal batas,
waktu, ruang bahkan birokrasi. searching yaitu
kegiatan mencari data atau informasi tertentu di
internet.
c. Chatting fasilitas ini digunakan untuk berkomunikasi
secara langsung dengan orang lain di Internet. Pada
umumnya fasilitas ini sering digunakan untuk
bercakap-cakap atau mengobrol di internet World Wide
Web (WWW).
d. Newsgroup fasilitas ini digunakan untuk berkoferensi
jarak jauh, sehingga anda dapat menyampaikan
pendapat dan tanggapan dalam internet.
e. Download adalah proses mengambil file dari computer
lain melalui internet ke computer kita.
f. Upload adalah proses meletakkan file dari computer
kita ke computer lain melalui internet.
g. Transfer protocol (FTP) fasilitas ini digunakan untuk
melakukan pengambilan arsip atau file secara
elektronik atau transfer file dari satu computer ke
computer lain di internet.
h. Telnet fasilitas ini digunakan untuk masuk ke system
computer tertentu dan bekerja pada system computer
lain.
18
i. Ghoper fasilitas ini digunakan untuk menempatkan
informasi yang disimpan pada internet server dengan
menggunakan hirarki. Selain yang diatas masih banyak
lagi fasilitas-fasilitas yang terdapat di internet.
2.2. Teori Khusus
2.2.1. Prediksi
Menurut Budiastawa, Santiyasa dan Pramartha (2019, p. 311) Prediksi
merupakan suatu tindakan meramal dalam artian prakiraan yang dilakukan
untuk mengetahui kejadian di masa mendatang (KBBI). Fungsi prediksi atau
forecasting terlihat pada saat pengambilan keputusan. Keputusan yang baik
adalah keputusan yang didasarkan atas pertimbangan apa yang akan terjadi
pada waktu keputusan itu dilaksanakan.
Prediksi adalah suatu proses memperkirakan secara sistematis
tentang sesuatu yang paling mungkin terjadi di masa depan berdasarkan
informasi masa lalu dan sekarang yang dimiliki, agar kesalahannya (selisih
antara sesuatu yang terjadi dengan hasil perkiraan) dapat diperkecil. Prediksi
tidak harus memberikan jawaban secara pasti kejadian yang akan terjadi,
melainkan berusaha untuk mencari jawaban sedekat mungkin yang akan
terjadi.
Pengertian Prediksi sama dengan ramalan atau perkiraan. Menurut
kamus besar bahasa Indonesia, prediksi adalah hasil dari kegiatan
memprediksi atau meramal atau memperkirakan nilai pada masa yang
19
akan datang dengan menggunakan data masa lalu. Prediksi menunjukkan
apa yang akan terjadi pada suatu keadaan tertentu dan merupakan input
bagi proses perencanaan dan pengambilan keputusan.
Prediksi bisa berdasarkan metode ilmiah ataupun subjektif belaka.
Ambil contoh prediksi cuaca selalu berdasarkan data dan informasi terbaru
yang didasarkan pengamatan termasuk oleh satelit. Begitupun prediksi gempa,
gunung meletus ataupun bencana secara umum, Namun prediksi seperti
pertandingan sepakbola, olahraga, dll umumnya berdasarkan pandangan
subjektif dengan sudut pandang sendiri yang memprediksinya.
2.2.2. Data mining
Menurut Mardi (2016, p. 214), Data mining adalah proses yang
menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat
dan pengetahuan yang terkait dari berbagai database besar. Data mining
merupakan serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual.
Menurut Gartner Group, data mining adalah proses menemukan
hubungan baru yang mempunyai arti, pola dan kebiasaan dengan memilah-
milah sebagian besardata yang disimpan dalam media penyimpanan dengan
menggunakan teknologi pengenalan pola seperti teknik statistic dan
matematika. Data mining merupakan gabungan dari beberapa disiplin ilmu
20
yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik,
database, dan visualisasi untuk penanganan permasalahan pengambilan
informasi dari database yang besar.
Menurut Pramadhani dan Setiadi (2014) Secara sederhana, data mining
atau penambangan data dapat didefinisikan sebagai proses seleksi, eksplorasi,
dan pemodelan dari sejumlah besar data untuk menemukan pola atau
kecenderungan yang biasanya tidak disadari keberadaannya. Data mining dapat
dikatakan sebagai proses mengekstrak pengetahuan dari sejumlah besar data
yang tersedia. Pengetahuan yang dihasilkan dari proses data mining harus baru,
mudah dimengerti, dan bermanfaat. Dalam data mining, data disimpan secara
elektronik dan diproses secara otomatis oleh komputer menggunakan teknik
dan perhitungan tertentu
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu:
1. Description (Deskripsi)
Terkadang peneliti dan analis secara sederhana ingin
mencoba mencari cara untuk menggambarkan pola dan
kecenderungan yang terdapat dalam data. Sebagai contoh,
petugas pengumpulan suara mungkin tidak dapat menemukan
keterangan atau fakta bahwa siapa yang tidak cukup
profesional akan sedikit didukung dalam pemilihan presiden.
Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau
kecenderungan.
21
2. Estimation (Estimasi)
Estimasi hampir sama dengan klasifikasi, kecuali variabel
target estimasi lebih ke arah numeric daripada ke arah
kategori. Model dibangun menggunakan record lengkap yang
menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari
variabel target dibuat berdasarkan nilai variabel prediksi.
Sebagai contoh yaitu estimasi nilai indeks prestasi kumulatif
mahasiswa program pasca sarjana dengan melihat nilai
indeks prestasi mahasiswa tersebut pada saat mengikuti
program sarjana.
3. Prediction (Prediksi)
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali
bahwa dalam prediksi nilai dari hasil akan ada dimasa
mendatang.Contoh prediksi dalam bisnis dan penelitian
adalah :
a. Prediksi harga beras dalam tiga bulan yang akan
datang.
b. Prediksi tingkat penganguran lima tahun akan datang.
c. Predisksi persentase kanaikan kecelakaan lalu lintas
tahun depan jika batas bawah kecepatan dinaikan.
4. Classification (Klasifikasi)
Dalam klasifikasi, terdapat target variabel kategori. Sebagai
contoh, penggolongan pendapatan dapat dipisahkan dalam
22
tiga kategori, yaitu pendapatan tinggi, pendapatan sedang,
dan pendapatan rendah.Contoh lain klasifikasi dalam bisnis
dan penelitian adalah :
a. Menentukan apakah suatu transaksi kartu kredit
merupakan transaksi yang curang atau bukan.
b. Memperkirakan apakah suatu pengajuan hipotek oleh
nasabah merupakan suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk
mendapatkan termasuk penyakit apa.
5. Clustering (Pengklusteran)
Pengklusteran merupakan pengelompokan record,
pengamatan, atau memperhatikan dan membentuk kelas
objek-objek yang memiliki kemiripan. Kluster adalah
kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan dengan record-record
dalam kluster lain. Pengklusteran berbeda dengan klasifikasi
yaitu tidak adanya variabel target dalam pengklusteran.
Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target.
Akan tetapi, algoritma pengklusteran mencoba untuk
melakukan pembagian terhadap keseluruhan data menjadi
kelompok-kelompok yang memiliki kemiripan (homogen),
yang mana kemiripan record dalam satu kelompok akan
bernilai maksimal, sedangkan kemiripan dengan record
23
dalam kelompok lain akan bernilai minimal.Contoh
pengklusteran dalam bisnis dan penelitian adalah :
a. Mendapatkan kelompok-kelompok konsumen untuk
target pemasaran dari suatu produk bagi perusahaan
yang tidak memiliki dana pemasaran yang besar.
b. Untuk tujuan audit akuntansi, yaitu melakukan
pemisahan terhadap perilaku finansial dalam baik dan
mencurigakan.
c. Melakukan pengklusteran terhadap ekspresi dari gen,
untuk mendapatkan kemiripan perilaku dari gen dalam
jumlah besar.
6. Association (Asosiasi)
Tugas asosiasi dalam data mining adalah menemukan atribut
yang muncul dalam satu waktu. Dalam dunia bisnis lebih
umum disebut analisis keranjang belanja.Contoh asosiasi
dalam bisnis dan penelitian adalah :
a. Meneliti jumlah pelanggan dari perusahaan
telekomunikasi seluler yang diharapkan untuk
memberikan respons positif terhadap penawaran
upgrade layanan yang diberikan.
b. Menemukan barang dalam supermarket yang dibeli
secara bersamaan dan barang yang tidak pernah dibeli
secara bersamaan.
24
Menurut Eska (2016, p. 10), Tahapan data mining dibagi menjadi
tujuh bagian yaitu :
1. Pembersihan data (data cleaning)
Sebelum proses data mining dapat dilaksanakan,
perlu dilakukan proses cleaning pada data yang
menjadi focus KDD. Proses cleaning mencakup
antara lain membuang 4 duplikasi data, memeriksa
data yang inkonsisten, dan memperbaiki kesalahan
pada data, seperti kesalahan cetak (tipografi). Juga
dilakukan proses enrichment, yaitu proses
“memperkaya” data yang sudah ada dengan data atau
informasi lain yang relevan dan diperlukan untuk
KDD, seperti data atau informasi eksternal.
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari
berbagai database ke dalam satu database baru.
Tidak jarang data yang diperlukan untuk data mining
tidak hanya berasal dari satu database tetapi juga
berasal dari beberapa database atau file teks. Integrasi
data dilakukan pada atribut-aribut yang
mengidentifikasikan entitas-entitas yang unik seperti
atribut nama, jenis produk, nomor pelanggandan
lainnya. Integrasi data perlu dilakukan secara cermat
karena kesalahan pada integrasi data bisa
25
menghasilkan hasil yang menyimpang dan bahkan
menyesatkan pengambilan aksi nantinya. Sebagai
contoh bila integrasi databerdasarkan jenis produk
ternyata menggabungkan produk dari kategori yang
berbeda maka akan didapatkan korelasi antar produk
yang sebenarnya tidak ada.
3. Seleksi Data (Data Selection)
Data yang ada pada database sering kali tidak
semuanya dipakai, oleh karena ituhanya data yang
sesuai untuk dianalisis yang akan diambil dari
database. Sebagai contoh, sebuah kasus yang
meneliti factor kecenderungan orang membeli dalam
kasus market basket analysis, tidak perlu mengambil
nama pelanggan, cukup dengan id pelanggan saja.
4. Transformasi data (Data Transformation)
Data diubah atau digabung ke dalam format yang
sesuai untuk diproses dalam data mining. Beberapa
metode data mining membutuhkan format data yang
khusus sebelum bisa diaplikasikan. Sebagai contoh
beberapa metode standarseperti analisis asosiasi dan
clustering hanya bisa menerima input data
kategorikal. Karenanya data berupa angka numerik
yang berlanjut perlu dibagi – bagi menjadi beberapa
interval. Proses Ini sering disebut transformasi data.
26
5. Proses mining
adalah sebuah proses yang paling utama pada saat
metode diterapkan untuk mencari pengetahuan
tersembunyi dan berharga dari data.
6. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik kedalam
knowledge based yang ditemukan. Dalam tahap ini
hasil dari teknik data mining berupa pola-pola yang
khas maupun model prediksi dievaluasi untuk menilai
apakah hipotesa yang ada memang tercapai.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan penyajian dan visualisasi pengetahuan
mengenai metode yang digunakan untuk memperoleh
pengetahuan yang diperoleh pengguna. Tahap
terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau 5 aksi dari hasil
analisis yang didapat. Ada kalanya hal ini harus
melibatkan orang - orang yang tidak memahami data
mining. Karenanya presentasi hasil data mining
dalam bentuk pengetahuan yang bisa dipahami semua
orang adalah satu tahapan yang diperlukan dalam
proses data mining. Dalam presentasi ini, visualisasi
juga bisa membantu mengkomunikasikan hasil data
mining.
27
2.2.3. Pohon Keputusan ( Decision Tree)
Menurut Haryati, Sudarsono dan Suryana (2015, p. 132) Pohon
keputusan adalah salah satu metode klasifikasi yang paling populer karena
mudah di interperensi manusia. Pohon keputusan adalah model prediksi
menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon
keputusan adalah mengubah data menjadi pohon keputusan dan aturan- aturan
keputusan. Data dalam pohon keputusan biasanya dinyatakan dalam bentuk
tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang
dibuat sebagai kriteria dalam pembentukan tree. Misalkan untuk menentukan
main tenis, kriteria yang digunakan adalah cuaca, angin, iklim dan temperatur.
Manfaat utama menggunakan pohon keputusan adalah kemampuannya untuk
membreak down proses pengambilan keputusan yang kompleks menjadi lebih
simpel sehingga pengambilan keputusan akan menjadi lebih
menginterprestasikan solusi permasalahan. Pohon keputusan juga berguna
untuk mengeksplorasi data, menemukan hubungan tersembunyi antara
sejumlah calon variabel input dengan sebuat variabel target. Pohon keputusan
memadukan antara eksplorasi data dan pemodelan sehingga sangat bagus
sebagai langkah awal pemodelan bahkan ketika dijadikan sebagai model akhir
dari beberapa teknik lain.
28
Menurut Ardi Ramadhan Sukma,Riqadri Halfis dan Ady Hermawan
(2019, p. 23) Pohon keputusan adalah sebuah struktur yang dapat digunakan
untuk mengubah data menjadi pohon keputusan yang akan menghasilkan
aturan-aturan keputusan besar menjadi himpunan-himpunan record yang lebih
kecil dengan menerapkan serangkaian aturan keputusan. Pohon keputusan yang
dihasilkan oleh algoritma C4.5 dapat digunakan untuk klasifikasi. Pohon
keputusan adalah salah satu teknik penambangan data yang paling populer
untuk penemuan pengetahuan. Secara sistematis menganalisis dan mengekstrak
aturan untuk tujuan Klasifikasi / prediksi.
2.2.4. Kaggle
Menurut Prijono (2017) Kaggle adalah situs dan platform untuk
berlomba membuat model terbaik untuk menganalisa dan memprediksi suatu
dataset. Dataset ini diberikan oleh suatu perusahaan, dengan suatu deskripsi
masalah tertentu. Misalnya, diberikan data rumah beserta fitur-fiturnya dan
harga jualnya, dan deskripsi masalahnya adalah buatlah model untuk
memprediksi harga jual berdasarkan fitur-fitur tersebut.
Kaggle sangat bermanfaat untuk semua yang berkecimpung di dunia data
science. Banyak perusahaan yang mempunyai permasalahan analisa/pemodelan
data, namun mereka tidak punya sumber daya data scientist yang mumpuni
untuk memecahkannya. Dengan Kaggle, mereka bisa meminta bantuan data
scientist seluruh dunia untuk memecahkan masalah tersebut dengan membuat
29
model terbaik. Istilah kerennya crowd sourcing. Biasanya dengan dengan
imbalan hadiah.
Kaggle juga dapat dimanfaatkan oleh perusahaan untuk merekrut data
scientist atau ML engineer, dengan cara menyelenggarakan kompetisi untuk
tujuan rekrutmen. Bagi kita praktisi atau pelajar data science, Kaggle sangat
berguna untuk belajar, berlatih, dan mempertajam skill dan insting data science
kita. Dengan mempelajari write up atau ulasan orang lain dalam memecahkan
suatu masalah, kita bisa mendapat banyak ide dan ilmu tentang bagaimana
proses dan jalan berpikir dia memecahkan masalah data science. Lalu dengan
ikut dalam kompetisi, kita akan diberi feedback tentang akurasi model kita, dan
dari situ kita berlatih bagaimana membuat model yang lebih baik. Selama
kompetisi, sering orang berbagi tips atau ide yang dia pakai, sehingga dari situ
tidak hanya kita bisa memperbaiki model kita, tapi kita juga bisa belajar,
menjadi lebih kreatif, sekaligus melatih insting pemecahan masalah kita.
2.2.5. Algoritma
Menurut Maulana (2017, p. 70) Algoritma adalah sistem kerja komputer
memiliki brainware, hardware, dan software. Tanpa salah satu dari ketiga
sistim tersebut, komputer tidak akan berguna. Kita akan lebih fokus pada
software komputer. Software terbangun atas susunan program) dan syntax (cara
penulisan/pembuatan program). Untuk menyusun program atau syntax,
diperlukannya langkahlangkah yang sistematis dan logis untuk dapat
menyelesaikan masalah atau tujuan dalam proses pembuatan suatu software.
30
Maka, algoritma berperan penting dalam penyusunan program atau syntax
tersebut.
Pengertian algoritma adalah susunan yang logis dan sistematis untuk
memecahkan suatu masalah atau untuk mencapai tujuan tertentu. Dalam dunia
komputer, algoritma sangat berperan penting dalam pembangunan suatu
software. Dalam dunia sehari-hari, mungkin tanpa kita sadari algoritma telah
masuk dalam kehidupan kita.
2.2.6. Algoritma C4.5
Menurut Sukma, Halfis dan Hermawan (2019, p. 23) Algoritma C4.5
adalah algoritma yang digunakan untuk menghasilkan sebuah pohon keputusan
yang dikembangkan oleh Ross qiunlan.Ide dasar dari algoritma ini adalah
pembuatan pohon keputusan berdasarkan pemilihan atribut yang memiliki
prioritas tertinggi atau dapat disebut memiliki nilai gain tertinggi berdasarkan
nilai entropy atribut tersebut sebagai poros atribut klasifikasi. Pada tahapannya
algoritma C4.5 memiliki 2 prinsip kerja, yaitu: Membuat pohon keputusan, dan
membuat aturan-aturan (rule model). Aturan aturan yang terbentuk dari pohon
keputusan akan membentuk suatu kondisi dalam bentuk if then.
Terdapat empat langkah dalam proses pembuatan pohon keputusan pada
algoritma C4.5, yaitu:
a. Memilih atribut sebagai akar, didasarkan pada nilai gain
tertinggi dari atribut-atribut yang ada.
31
b. Membuat cabang untuk masing-masing nilai, artinya
membuat cabang sesuai dengan jumlah nilai variabel gain
tertinggi.
c. Membagi setiap kasus dalam cabang, berdasarkan
perhitungan nilai gain tertinggi dan perhitungan dilakukan
setelah perhitungan nilai gain tertinggi awal dan kemudian
dilakukan proses perhitungan gain tertinggi kembali tanpa
meyertakan nilai variabel gain awal.
d. Mengulangi proses dalam setiap cabang sehingga semua
kasus dalam cabang memiliki kelas yang sama, mengulangi
semua proses perhitungan gain tertinggi untuk masing-
masing cabang kasus sampai tidak bisa lagi dilakukan proses
perhitungan.
Algoritma C4.5 secara rekursif mengunjungi setiap simpul keputusan,
memilih pembagian yang optimal, sampai tidak bisa dibagi lagi. Dari ketiga
peneliti yang telah dilakukan tersebut, klasifikasi dengan Algoritma C4.5
digunakan oleh para peneliti sebagai solusi untuk mengambil keputusan yang
diharapkan mampu membantu dalam pengambilan keputusan dengan lebih
mudah dan cepat.
Menurut Haryati, Sudarsono dan Suryana (2015, p. 132) Pohon
keputusan mirip sebuah struktur pohon dimna terdapat node internal (bukan
daun) yang mendeskripsikan atribut-atribut, setiap cabang menggambarkan
hasil dari atribut yang diuji, dan setiap daun menggambarkan kelas. Pohon
32
keputusan bekerja mulai dari akar paling atas, jika diberikan sejumlah data uji,
misalnya X dimana kelas dari data X belum diketahui, maka pohon keputusan
akan menelusuri mulai dari akar sampai node dan setiap nilai dari atribut sesuai
data X diuji apakah sesuai dengan aturan pohon keputusan, kemudian pohon
keputusan akan memprediksi kelas dari tupel X. Algoritma C4.5 dan pohon
keputusan merupakan dua model yang tak terpisahkan, karena untuk
membangun sebuah pohon keputusan, dibutuhkan algoritma C4.5.Di akhir
tahun 1970 hingga di awal tahun 1980-an, J.Ross Quinlann seorang peniliti di
bidang mesin pembelajaran mengembangkan sebuah model pohon keputusan
yang dinamakan ID3 (Iterative Dichotomiser), walaupun sebenarnya proyek ini
telah dibuat sebelumnya oleh E.B.Hunt, J. Marin, dan P.T.Stone. Kemudian
Quinlan membuat algoritma dari pengembangan ID3 yang dinamakan C4.5
yang berbasis supervised learning. Ada beberapa tahap dalam membuat sebuah
pohon keputusan dengan algoritma C4.5, yaitu:
1) Menyiapkan data training. Data training biasnya dari data
histori yang pernah terjadi sebelumnya dan sudah
dikelompokkan ke dalam kelas-kelas tertentu.
2) Menentukan akar dari pohon . akar akan diambil dari atibut
yang terpilih dengan cara menghitung nilai Gain dari masing-
masing atribut, nilai Gain yang paling tinggi yang akan
menjadi akar pertama. Sebelum menghitung nilai Gain dari
atribut, hitung dahulu nilai entropy yaitu :
33
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ − 𝜋 ∗ log2 𝜋
𝑛
𝑖=1
Keterangan:
S : himpunan kasus.
n : jumlah partisi S.
π: proporsi dari Si terhadap S.
3) Kemudian hitung nilai Gain dengan metode information
gain:
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑|𝑠𝑖|
|𝑠|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦
𝑛
𝑖=1
Keterangan :
S = Himpunan Kasus.
A = Atribut.
n = Jumlah Partisi Atribut.
A | Si | = Jumlah Kasus pada partisi ke-i.
| S | = Jumlah Kasus dalam S.
4) Ulangi langkah ke-2 hingga semua semua tupel terpartisi.
5) Proses partisi pohon keputusan akan berhenti saat:
a. Semua tupel dalam node N mendapat kelas yang
sama.
34
b. Tidak ada atribut di dalam tupel yang dipartisi
lagi.
c. Tidak ada tupel di dalam cabang yang kosong.
2.2.7. Entropy dan Information gain
Menurut Sukma, Halfis dan Hermawan (2019, p. 23) Entropy adalah
ukuran dari teori informasi yang dapat mengetahui karakteristik dari impurty
dan homogenity dari kumpulan data. Dari nilai Entropy tersebut kemudian
dihitung nilai information gain masing-masing atribut.
Information Gain adalah informasi yang didapatkan dari perubahan
entropy pada suatu kumpulan data, baik melalui observasi atau bisa juga
disimpulkan dengan cara melakukan partisipasi terhadap suatu set data.
2.3. Teori Rancangan
2.3.1. PHP
Menurut Palit (2015, p. 2), PHP adalah bahasa pemrograman yang
digunakan secara luas untuk penanganan pembuatan dan pengembangan
sebuah web dan bias digunakan pada HTML. PHP merupakan singkatan dari
“PHP : Hypertext Preprocessor”, dan merupakan bahasa yang disertakan
dalam dokumen HTML, sekaligus bekerja di sisi server (server-side HTML-
embedded scripting). Artinya sintaks dan perintah yang diberikan akan
sepenuhnya dijalankan di server tetapi disertakan pada halaman HTML biasa,
sehingga script-nya tak tampak disisi client. PHP dirancangan untuk dapat
35
bekerja sama dengan database server dan dibuat sedemikian rupa sehingga
pembuatan dokumen HTML yang dapat mengakses database menjadi begitu
mudah. Tujuan dari bahasa scripting ini adalah untuk membuat aplikasi di
mana aplikasi tersebut yang dibangun oleh PHP pada umumnya akan
memberikan hasil pada web browser, tetapi prosesnya secara keseluruhan
dijalankan di server.
PHP diciptakan oleh Rasmus Lerdorf, seorang pemrogram C yang
handal. Semula PHP hanya digunakan untuk mencatat jumlah pengunjung pada
homepagenya. Rasmus adalah seorang pendukung open source. Karena
itulah ia mengeluarkan Personal Home Page Tools versi 1.0 secara gratis.
Setelah mempelajari YACC dan GNU Bison, Rasmus menambah kemampuan
PHP 1.0 dan menerbitkan PHP 2.0. PHP mudah dibuat dan cepat dijalankan,
PHP dapat berjalan dalam web server yang berbeda dan dalam sistem operasi
yang berbeda pula. PHP dapat berjalan di sistem operasi UNIX, Windows
98, Windows XP, Windows NT, dan Macintosh.
2.3.2. HTML ( Hyper Text Markup Language )
Menurut Khairil, Indra Kanedi dan Harry Aspriyono (2012, p. 20) HTML
merupakan kepanjangan dari Hyper Text Markup Language adalah suatu
bahasa yang digunakan untuk membuat halaman-halaman hypertext
(hypertext page) pada internet. Dengan konsep hypertext ini, untuk
membaca suatu dokumen anda tidak harus melakukannya secara urut,
baris demi baris, atau halaman demi halaman. Tetapi anda tidak dapat dengan
mudah melompat dari satu topik ke topik lainnya yang anda sukai, seperti
36
halnya jika anda melakukan pada online Help dari suatu aplikasi Windows.
HTML dirancang untuk digunakan tanpa tergantung pada suatu platform
tertentu (platform independent).
2.3.3. XAMPP
Menurut Palit (2015, p. 2), XAMPP adalah perangkat lunak bebas, yang
mendukung banyak sistem operasi, merupakan kompilasi dari beberapa
program. Fungsinya adalah sebagai server yang berdiri sendiri (localhost),
yang terdiri atas program Apache HTTP Server, MySQL database, dan
penerjemah bahasa yang ditulis dengan bahasa pemrograman PHP dan Perl.
Nama XAMPP merupakan singkatan dari X (empat sistem operasi apapun),
Apache, MySQL, PHP dan Perl. Program ini tersedia dalam GNU General
Public License dan bebas, merupakan web server yang mudah digunakan yang
dapat melayani tampilan halaman web yang dinamis. Untuk mendapatkanya
dapat men - download langsung dari web resminya.
XAMPP adalah salah satu paket instalasi apache, PHP, dan MySQL
secara instant yang dapatdigunakan untuk membantu proses instalasi ketiga
produk tersebut.
37
2.3.4. PHPMyAdmin
Menurut Barri, Lumenta dan Wowor (2015, p. 25), PHPMyadmin adalah
perangkat lunak bebas yang ditulis dalam bahasa pemrograman PHP yang
digunakan untuk menangani administrasi MySQL melalui Jejaring Jagat Jembar
(World Wide Web). phpMyAdmin mendukung berbagai operasi MySQL,
diantaranya (mengelola basis data, tabeltabel, bidang (fields), relasi (relations),
indeks, pengguna (users), perijinan (permissions), dan lain-lain). Pada
dasarnya, mengelola basis data dengan MySQL harus dilakukan dengan cara
mengetikkan baris-baris perintah yang sesuai (command line) untuk setiap
maksud tertentu. Jika seseorang ingin membuat basis data (database), ketikkan
baris perintah yang sesuai untuk membuat basis data. Hal tersebut tentu saja
sangat menyulitkan karena seseorang harus hafal dan mengetikkan perintahnya
satu per satu. Saat ini banyak sekali perangkat lunak yang dapat dimanfaatkan
untuk mengelola basis data dalam MySQL, salah satunya adalah phpMyAdmin.
Dengan phpMyAdmin, seseorang dapat membuat database, membuat tabel,
mengisi data, dan lain-lain dengan mudah, tanpa harus menghafal baris
perintahnya. PhpMyAdmin merupakan bagian untuk mengelola basis data
MySQL yang ada di komputer.
2.3.5. MySQL
Menurut Khairil, Kanedi dan Aspriyono (2012, p. 21) MySQL adalah
sebuah perangkat lunak sistem manajemen basis data SQL (bahasa Inggris:
database management system) atau DBMS yang multithread, multi-user,
38
dengan sekitar 6 juta instalasi di seluruh dunia. MySQL AB membuat
MySQL tersedia sebagai perangkat lunak gratis dibawah lisensi GNU
General Public License (GPL), tetapi mereka juga menjual dibawah lisensi
komersial untuk kasus-kasus dimana penggunaannya tidak cocok dengan
penggunaan GPL. MySQL adalah Relational Database Management System
(RDBMS) yang didistribusikan secara gratis dibawah lisensi GPL (General
Public License). Dimana setiap orang bebas untuk menggunakan MySQL,
namun tidak boleh dijadikan produk turunan yang bersifat closed
source atau komersial. MySQL sebenarnya merupakan turunan salah satu
konsep utama dalam database sejak lama, yaitu SQL (Structured Query
Language). SQL adalah sebuah konsep pengoperasian database, terutama
untuk pemilihan atau seleksi dan pemasukan data, yang memungkinkan
pengoperasian data dikerjakan dengan mudah secara otomatis.
2.3.6. Bootstrap
Menurut Masuara (2015, p. 44), Bootstrap merupakan Framework
ataupun Tools untuk membuat aplikasi web ataupun situs web responsive
secara cepat, mudah dan gratis. Bootstrap terdiri dari CSS dan HTML untuk
menghasilkan Grid, Layout, Typography, Table, Form, Navigation, dan lain-
lain. Di dalam bootstrap juga sudah terdapat jQuery plugins untuk
menghasilkan komponen UI yang cantik seperti Transitions, Model,
Dropdown, Scrollspy, Tooltip, Tap, Popover, Alert, Button, Carousel dan lain-
lain. Dengan bantuan Bootstrap, kita bisa membuat responsive website dengan
39
cepat dan mudah dan dapat berjalan sempurna pada browser-browser populer
seperti Chrome, Firefox, Safari, Opera dan Internet Explorer.
2.3.7. Rapid Miner
Menurut Haryati, Sudarsono dan Suryana (2015, p. 133), Rapid Miner
merupakan perangkat lunak yang dibuat oleh Dr. Markus Hofmann dari
Institute of Technology Blanchardstown dan Ralf Klinkenberg dari rapid-i.com
dengan tampilan GUI (Graphical User Interface) sehingga memudahkan
pengguna dalam menggunakan perangkat lunak ini. Perangkat lunak ini
bersifat open source dan dibuat dengan menggunakan program Java di bawah
lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem
operasi manapun. Dengan menggunakan Rapid Miner, tidak dibutuhkan
kemampuan koding khusus, karena semua fasilits sudah disediakan. Rapid
Miner dikhususkan untuk penggunaan data mining. Model yang disediakan
juga cukup banyak dan lengkap, seperti Model Bayesian, Modelling, Tree
Induction, Neural Network dan lain-lain. Banyak metode yang disediakan oleh
Rapid Miner mulai dari kllasifikasi, klustering, asosiassi dan lainlain. Jika tidak
ada model atau model alogoritma yang tidak ada dalam Weka, pengguna boleh
menambahkan modul lain, karena weka bersifat open source, jadi siapapun
dapat ikut mengembangkan perangkat lunak ini.
40
2.3.8. Notepad++
Menurut Ayu dan Permatasari (2018, p. 19) Notepad++ adalah sebuah
text editor yang sangat berguna dalam membuat program. Notepad++
menggunakan komponen Scintilla untuk menampilkan teks dan berkas kode
sumber berbagai bahasa pemrograman tang berjalan diatas sistem operasi M.
Windows.
2.3.9. CSS
Menurut Binarso, Sarwoko, dan Bacthiar (2012, p. 76) CSS (Cascading
Style Sheet) adalah stylesheet language yang digunakan untuk mendeskripsikan
penyajian dari dokumen yang di buat dalam mark up language.
Menurut Hidayatullah dan Kawistara (2015) ada empat (4) cara
memasang kode CSS ke dalam kode HTML/ halaman web yaitu:
a. Inline style sheet (memasukkan kode CSS langsung pada tag
HTML).
b. Internal style sheet (Embed atau memasang kode CSS ke
dalam bagian <head>).
c. Me-link ke external CSS.
41
2.3.10. Entity Relationship Diagram (ERD)
Menurut Romadhon (2019, P. 22) mengemukakan bahwa “Entity
Relationship Diagram (ERD) adalah gambar atau diagram yang menunjukan
informasi dibuat, disimpan, dan digunakan dalam sistem bisnis.
Entitas diberi nama dengan kata benda dan dapat dikelompokan sebagai
berikut: nama orang, nama benda, nama lokasi, nama kejadian.
42
2.4. Tinjauan Jurnal
2.4.1. Penelitian Tosy Caesar Kurniawan
Tabel 2. 1 Tabel Penelitian Tosy Caesar Kurnianwan
No. Data Jurnal / Makalah Keterangan
1 Judul Penerapan Algoritma C4.5 Dalam Penerimaan Calon
Karyawan PT.TELKOM Akses Area Lampung
Berbasis Website
2 Jurnal Jurnal SEMNAS IIB DARMAJAYA
3 Volume dan Halaman Vol. 1 (2017)
4 Tanggal & Tahun 25 Oktober 2017
5 Penulis Tosy Caesar Kurniawan
6 Penerbit https://jurnal.darmajaya.ac.id
7 Tujuan Penelitian Mengatasi masalah dalam proses klasifikasi
penerimaan karyawan baru pada PT.TELKOM
AKSES (PTTA) yang masih dilakukan secara manual
sehingga membutuhkan waktu pengerjaan yang
cukup lama.
8 Lokasi dan Subjek
Penelitian
PT.TELKOM AKSES (Lampung)
9 Perancangan Sistem a. Menggunakan Bahasa Pemrograman PHP
b. Database MYSQL
10 Hasil Penelitian Melalui tahap pengumpulan kebutuhan dan
perancangan sistem maka dihasilkan Sisitem
Klasifikasi Penerimaan Calon Karyawan PT. Telkom
Akses Lampung Menggunakan Algoritma C4.5.
11 Kekuatan Penelitian a. Dapat memberikan hasil keputusan sesuai dengan
data yang sudah diinputkan dengan ketepatan dan
keakuratan yang maksimal.
b. Sistem ini menghasilkan keputusan seleksi secara
43
objektif sesuai dengan data-data yang mengikuti
tes seleksi.
c. Mengurangi berkas dengan bentuk hardcopy atau
menggunakan kertas karena bisa menyimpan
didalam database yang bisa sewaktu-waktu
dibutuhkan bisa dibuka kembali
12 Kelemahan Penelitian a. Pemberian informasi kepada calon karyawan
masih menggunakan sms/telepon secara manual.
b. Tingkat keamanan data dan file masih rendah
sehingga rentan untuk diserang Hacker.
c. Perhitungan algoritma C4.5 untuk mendapatkan
pohon keputusan masih dilakukan secara manual
menggunakan Ms. Excell
13 Kesimpulan a. Sistem ini sudah bisa membantu dalam
menentukan klasifikasi calon karyawan sesuai
dengan kriteria yang telah ditentukan.
b. Sistem ini dapat membantu SDM dalam
mengelola data calon karyawan sehingga waktu
yang dibutuhkan lebih efisien.
44
2.4.2. Rangkuman Model Penelitian
Tabel 2. 2 Tabel Rangkuman Model Penelitian
Peneliti Nama Jurnal Tahun Insitusi Judul dan
Metode yang
digunakan
Kesimpulan
Ardi
Ramadhan
Sukma
, Riqadri
Halfis
, Ady
Hermawan
Jurnal Teknik
Komputer, Vol V
No.1 Februari 2019
P-ISSN 2442-2436,
E-ISSN: 2550-
0120
2019 STMIK
Nusa
Mandiri
Klasifikasi
Channel
Youtube
Indonesia
Menggunakan
Algoritma C4.5
1.Penerapan
Algoritma C4.5 akan
dapat
diimplementasikan
pada ratio Channel
Youtube
Indonesia, dilihat dari
akurasi yang
mencapai
92.73%, bahwa
perhitungan yang
dilakukan dapat
memprediksi dan
meklasifikasi ratio
pada
Youtube Channel
Indonesia.
2.Terbentuk beberapa
aturan atau rule
model yang
dapat digunakan
sebagai acuan dalama
membuat
aplikasi GUI.0.820
dan 0.549.
Aldi Zein INFORMATION 2019 STMIK Algoritma C4.5 Berdasarkan
45
Pratama SYSTEM FOR
EDUCATORS
AND
PROFESSIONALS
Vol.3, No. 2, Juni
2019, 121-130E-
ISSN: 2548-3587
Nusa
Mandiri
Untuk
Klasifikasi
Nasabah Dalam
Memprediksi
Kredit Macet
pengujian yang telah
dilakukan oleh
peneliti, dapat
disimpulkan bahwa
Algoritma C4.5
dengan melakukan
perhitungan entropy
dan gain pada setiap
atribut dan subset
atribut dapat
mengidentifikasi
kelayakan kredit
dengan baik, selain
itu Algoritma C4.5
merupakan salah satu
algoritma dalam
teknik klasifikasi
data mining yang
sangat membantu
dalam melakukan
klasifikasi data
karena karakteristik
data yang
diklasifikasikan
sangat jelas, baik
dalam bentuk struktur
pohon keputusan
(decision tree)
maupun dalam bentuk
aturan atau rule If –
Then,serta
46
memudahkan
pengguna dalam
melakukan
penggalian informasi
terhadap data yang
dibutuhkan.
Pemilihan variabel
yang digunakan
(atribut kondisi dan
atribut keputusan)
dalam penelitian yang
peneliti lakukan dan
digunakan dalam
menentukan sebuah
klasifikasi juga sangat
mempengaruhi rule
atau knowledge yang
akan dihasilkan.
Sistem yang dibangun
berdasarkan hasil
penelitian yang
telah dilakukan
dapat membantu
dalam
mengklasifikasikan
kriteria karyawan
yang berpeluang
melakukan
pembayaran kredit
dengan Lancar atau
Macet.
47
Berdasarkan 3 jurnal diatas dirasa penggunaan Algoritma C4.5 sangat cocok
untuk memprediksi loyalitas karyawan karena Algoritma C4.5 merupakan metode
yang sering di gunakan untuk klasifikasi dengan menghasilkan pohon keputusan dan
tingkat keakuratan yang cukup baik yang bisa digunakan untuk mendapatkan hasil
yang maksimal.
48
2.5. Kerangka Pemikiran
Berikut gambaran keseluruhan penelitian dalam bentuk gambar kerangka
pemikiran
Gambar 2. 1 Kerangka Pemikiran
49
BAB III
ANALISA MASALAH DAN PERANCANGAN SISTEM
3.1. Analisa Kebutuhan
Proses pengumpulan data sebagai bahan pembuatan sistem adalah studi
pustaka. Pada tahap ini dilakuka pengumpulan bahan terkait dengan data pegawai
dan algoritma C.45 untuk memprediksi pegawai yang akan memiliki loyalitas pada
perusahaan yang di peroleh dari https://www.kaggle.com/colara/hr-analytics Dataset
Mengenai Human Resources untuk memprediksi Loyalitas Seorang Karyawan
Tabel 3. 1 Tabel Keterangan Atribut
Atribut Keterangan Variabel
Satisfaction_level tingkat kepuasan
karyawan
Integer
Last_evaluation evaluasi akhir Integer
Number_project total proyek yang
di kerjakan
Integer
Average_monthly_hours rata-rata jam kerja
perbulan
Integer
Time_spend_company berapa tahun
sudah berada
diperusahaan
Integer
Work_accident berapa kali
mengalami
Integer
50
kecelakaan saat
bekerja
Promotion _last_5years kenaikan jabatan
selama 5 tahun
terakhir
Integer
Job Jabatan yang di
jabat saat ini
Polinominal
Salary Gaji Polinominal
Tabel 3. 2 Tabel Data set
satisfactio_
level
last_
evaluation
number_
project
average_montly
_hours
time_spend_
company
Work_
accident
promotion_last
_5years Job salary left
1 4 5 275 4 0 1 product_mng medium YA
1 4 7 295 4 1 0 product_mng low YA
1 4 6 244 5 0 1 IT medium YA
1 4 6 247 4 0 1 sales low YA
1 4 6 286 4 0 0 IT medium YA
1 4 6 305 4 1 0 sales low YA
1 3 4 158 4 1 0 technical low YA
4 2 6 232 2 1 0 product_mng low TIDAK
52
Keterangan data :
1. Satifaction_level : Kepuasan karyawan, dibobotkan menjadi 4
point. 1 = Low, 2 = Medium, 3 = High, 4 =
Very High.
2. Last_evaluation : Evaluasi akhir karyawan, dibobotkan
menjadi 4 point. 1 = Low, 2 = Medium, 3 =
High, 4 = Very High.
3. Number_project : jumlah proyek yang dikerjakan.
4. Average_monthy_hours : rata-rata jam kerja perbulan.
5. Time_spend_company : berapa lama berada di perusahaan per tahun.
6. Work_accident : kecelakaan dalam bekerja.
7. Promotion_last_5years : kenaikan jabatan dalam 5 tahun terakhir.
8. Job : jabatan di perusahaan.
9. Salary : gaji perbulan, menjadi 3 point : low,
medium, high.
3.2. Kontruksi Algoritma atau Metode
Mencari Entropy pertama:
1. Pertama adalah mencari entropy dari total data yang ada, jumlah
data yang digunakan adalah 30 data terbagi menjadi 15 “TIDAK”
dan 15 “YA”, berikut contoh perhitungan nya :
Entropy(total)= − (15
30∗ log2
15
30) − (
15
30∗ log2
15
30) = 1
53
2. Selanjutnya mencari gain dari satisfaction_level dimana sudah
dicari terlebih dahulu nilai entropy dari satisfaction value
<=0,45=0,5916728 dan >0,45=0,6962123 , lalu dari data tersebut
diperoleh 14 data <=2.5 dengan hasil “TIDAK” dan 16 data >2.5
dengan hasil “YA”, berikut contoh perhitungannya :
Gain(total,satisfaction_level)= 1 − (14
30∗ 0,5916728) +
(16
30∗ 0,6962123)=0,352573
3. Selanjutnya mencari gain dari last_evaluation dimana sudah dicari
terlebih dahulu nilai entropy dari last_evaluation <=2.5=0 dan
>2.5= 0,9910761, lalu dari data tersebut diperoleh 4 data <=2.5 dan
26 data >2.5, berikut contoh perhitungannya :
Gain(total,last_evaluation)= 1 − (3
30∗ 0) + (
27
30∗
0,0.9957275) =0.137036
4. Selanjutnya mencari gain dari number_project dimana sudah dicari
terlebih dahulu nilai entropy dari number_project <=5 =
0.976020648 dan >5 = 0.811278124, lalu dari data tersebut
diperoleh 22 data <=5 dan 8 data >5, berikut contoh
perhitungannya :
Gain(total,number_project)= 1 − (22
30∗ 0.976020648) +
(8
30∗ 0.811278124) = 0.067910691
5. Selanjutnya mencari gain dari average_monthly_hours dimana
sudah dicari terlebih dahulu nilai entropy dari
54
average_monthly_hours <=272 = 0.98285869 dan >272 = 0, lalu
dari data tersebut diperoleh 26 data <=5 dan 4 data >5, berikut
contoh perhitungannya :
Gain(total,average_monthly_hours)= 1 − (26
30∗ 0.98285869) +
(4
30∗ 0) = 0.148189136
6. Selanjutnya mencari gain dari time_spend_company dimana sudah
dicari terlebih dahulu nilai entropy dari time_spend_company <=3
=0.873981048 dan >3 =0.779349837, lalu dari data tersebut
diperoleh 17 data <=3 dan 13 data >3, berikut contoh
perhitungannya :
Gain(total,time_spend_company)= 1 − (17
30∗ 0.873981048) +
(13
30∗ 0.779349837) = 0.16702581
7. Selanjutnya mencari gain dari work_accident dimana sudah dicari
terlebih dahulu nilai entropy dari work_accident pernah = 1dan
tidak pernah = 1, lalu dari data tersebut diperoleh 10 data pernah
dan 20 data tidak pernah, berikut contoh perhitungannya :
Gain(total,work_accident)= 1 − (10
30∗ 1) + (
20
30∗ 1) = 0
8. Selanjutnya mencari gain dari promotion_last_5years dimana
sudah dicari terlebih dahulu nilai entropy dari
promotion_last_5years terima = 0.985228136 dan tidak terima =
0.918295834, lalu dari data tersebut diperoleh 21 data terima dan 9
data tidak terima, berikut contoh perhitungannya :
55
Gain(total,promotion_last_5years)= 1 − (21
30∗ 0.985228136) +
(9
30∗ 0.918295834) = 0.034851555)
9. Selanjutnya mencari gain dari Job dimana sudah dicari terlebih
dahulu nilai entropy dari job IT = 0.954434003, product_mng = 1,
sales = 0.918295834 ,dan technical = 0.591672779, lalu dari data
tersebut diperoleh 8 data IT, 6 data product_mng, 9 data sales dan 7
data technical, berikut contoh perhitungannya :
Gain(total,sales)= 1 − (8
30∗ 0.954434003) + (
6
30∗ 1) +
(9
30∗ 0.918295834) + (
7
30∗ 0.591672779) = 0.131938534
10. Selanjutnya mencari gain dari salary dimana sudah dicari terlebih
dahulu nilai entropy dari salary low = 0.988699408, medium=
0.979868757, dan high = 1, lalu dari data tersebut diperoleh 16 data
low, 12 data medium, 2 data high, berikut contoh perhitungannya:
Gain(total,salary)= 1 − (16
30∗ 0.988699408) + (
12
30∗
0.979868757) + (2
30∗ 1) = 0.01407948
Tabel 3. 3Tabel Hitung Manual
Atribut
Jumlah
kasus TIDAK
Y
A Entropy Gain
Total 30 15 15 1
satisfaction_level 0.352573
<=2.5 14 2 12 0.5916728
>2.5 16 13 3 0.6962123
last_evaluation 0.137036
56
<=2.5 4 3 1 0
>2.5 26 12 14 0.9957275
number_project 0.067911
<=5 22 13 9 0.9760206
>5 8 2 6 0.8112781
average_montly_h
ours 0.148189
<=272 26 15 11 0.9828587
>272 4 0 4 0
time_spend_comp
any 0.167026
<=3 17 12 5 0.873981
>3 13 3 10 0.7793498
Work_accident 0
1 10 5 5 1
0 20 10 10 1
promotion_last_5
years 0.034852
0 21 12 9 0.9852281
1 9 3 6 0.9182958
job 0.131939
IT 8 3 5 0.954434
produ
ct_mn
g 6 3 3 1
sales 9 3 6 0.9182958
57
techni
cal 7 6 1 0.5916728
salary 0.014079
low 16 7 9 0.9886994
mediu
m 12 7 5 0.9798688
high 2 1 1 1
Dari hasil perhitungan entropy dan information gain yang didapat kemudian
diolah kedalam decision tree, berikut hasil pohon keputusan (Decision Tree).
Gambar 3. 1 Pohon Keputusan
Dari pohon keputusan (Decision Tree ) yang terbentuk pada Gambar 2 di atas
didapat aturan-aturan/rule model dalam penentuan loyalitas karyawan , dapat dilihat
sebagai berikut :
1. satisfaction_level > 2.500
2. | time_spend_company > 3.500
58
3. | | satisfaction_level > 3.500: YA {TIDAK=0, YA=3}
4. | | satisfaction_level ≤ 3.500: TIDAK {TIDAK=2, YA=0}
5. | time_spend_company ≤ 3.500: TIDAK {TIDAK=11, YA=0}
satisfaction_level ≤ 2.500: YA {TIDAK=2, YA=12}
3.3. Perancangan Layar
Perancangan aplikasi prediksi loyalitas karyawan mempunyai sebuah layar
utama, berikut hierarki yang ada di dalam aplikasi prediksi loyalitas karyawan pada
Gambar 3.2.
Gambar 3. 2 Hierarki Aplikasi
59
3.3.1. Perancangan Halaman Login
Pada layar Sign in user harus memasukkan username dan password
dengan benar dan menekan tombol sign in di bawah kolom username (email)
dan password untuk menggunakan aplikasi ini, rancangan layar sign in dapat di
lihat pada Gambar 3.3.
Gambar 3. 3 Perancangan Layar Login
60
3.3.2. Perancangan Layar Home
Pada layar home ini user dapat melihat halaman utama dari aplikasi ini,
rancangan layar home dapat di lihat pada Gambar 3.4.
Gambar 3. 4 Perancangan Halaman Utama
61
3.3.3. Perancangan Layar Prediksi Loyalitas Karyawan
Pada layar prediksi loyalitas karyawan adalah layar utama pada aplikasi
ini, pada layar ini terdapat form untuk user input data yang ingin di prediksi
loyalitas nya terhadap perusahaan, rancangan layar prediksi loyalitas karyawan
dapat di lihat pada Gambar 3.5.
Gambar 3. 5 Perancangan Layar Prediksi Loyalitas Karyawan
62
3.3.4. Perancangan Layar Sign Up
Pada layar sign up ini user dapat membuat user id baru dengan mengisi
username, password dan re-enter password, rancangan layar sign up ini dapat
di lihat pada Gambar 3.6.
Gambar 3. 6 Perancagan Layar Sign Up
63
3.3.5. Perancangan Layar Laporan
Pada layar laporan (Report) ini user dapat melihat hasil laporan hasil
kinerja karyawan yang di dapat dari setiap kepala bagian dari setiap masing –
masing job, rancangan layar laporan ini dapat di lihat pada Gambar 3.7.
Gambar 3. 7 Perancangan Layar Laporan
64
3.3.6. Perancangan Layar Laporan Hasil Perhitungan
Pada layar laporan hasil perhitungan (Report) ini user dapat melihat
laporan hasil perhitungan dari program aplikasi , rancangan layar laporan
hasil perhitungan ini dapat di lihat pada Gambar 3.8.
Gambar 3. 8 Perancangan Layar Laporan Hasil Perhitungan
65
3.3.7. Perancangan Layar Input Laporan Karyawan
Pada layar Input Laporan Karyawan ini user dapat memasukkan
penilaian tingkat kepuasaan kerja dan nilai evaluasi akhir terhadap karyawan
tersebut dan menyimpannya , rancangan layar input report karyawan ini dapat
di lihat pada Gambar 3.9.
Gambar 3. 9 Perancangan Layar Input Laporan Karyawan
66
3.3.8. Perancangan Layar Manage Account
Pada layar manage account ini user dapat mengubah password account
user yang di miliki, rancangan layar manage account ini dapat di lihat pada
Gambar 3.10.
Gambar 3. 10 Perancangan Layar Manage Account
67
3.4. Desain Database
a. Entity Relationship Diagram (ERD)
Gambar 3. 11 Entity Relationship Diagram
68
b. Spesifikasi Tabel
1) Tabel users
Tabel 3.4 Tabel users
Nama Field Tipe Field Tindakan
username Varchar(20) -
password Varchar(15) -
user_id Varchar(20) Primary Key
role Varchar(20) -
job Varchar(15) -
Keterangan :
Username : id user sebagai id untuk sign in
Password : Password untuk sign in
Role : Jabatan
Job : Bagian Pekerjaan
2) Tabel report
Tabel 3.5 Tabel Report
Nama Field Tipe Field Tindakan
id_report Int(11) Primary Key
Satisfaction Int(3) -
Evaluation Int(3) -
Number_project Int(3) -
69
Average_monthly_hours Int(3) -
Time_spend_company Int(3) -
Accident Int(3) -
Promotion Int(3) -
Job Varchar(15) -
Salary Varchar(8) -
Result
Varchar(5) -
id_karyawan
Int(11) Foreign Key
Tanggal
Date -
Approved
Varchar(12) -
Keterangan :
id_report : id setiap report
satisfaction : kepuasan kerja
evaluation : nilai akhir
Number_project : jumlah proyek
Average_monthly_hours: rata-rata jam kerja per - bulan
Time_spend_company : lama kerja di perusahaan (tahun)
accident : kecelakaan dalam bekerja
promotion : kenaikan jabatan
job : bidang pekerjaan
salary : gaji yang di terima
result : hasil perhitungan aplikasi ini
70
id_karyawan : id setiap karyawan
tanggal : tanggal saat melakukan perhitungan
approved : untuk melakukan approval terhadap karyawan yang
memiliki kinerka yang baik
3) Tabel Karyawan
Tabel 3.6 Tabel Karyawan
Nama Field Tipe Field Tindakan
Id int(11) Primary Key
Nama Varchar(20) -
Job Varchar(15) -
Kepuasan Int(3) -
evaluasi_akhir Int(3) -
Number_project Int(3) -
Average_monthly_hours Int(4) -
Tanggal date -
Join_year Int(4) -
71
Keterangan :
Id : id setiap activity log
nama : nama dari karyawan
job : bidang pekerjaan
kepuasan : tingkat kepuasaan kepala bagian
evaluasi_akhir : evaluasi akhir dari kepala bagian
number_project : total proyek yang di selesaikan
average_monthly_hours: rata – rata jam kerja per bulan
tanggal :tanggal kepala bagian memasukan laporan
join_year : tahun bergabung di perusahaan
72
BAB IV
PENGUJIAN DAN IMPLEMENTASI
4.1. Algoritma C4.5
Menurut Haryati, Sudarsono dan Suryana (2015, p. 132) Pohon keputusan
mirip sebuah struktur pohon dimna terdapat node internal (bukan daun) yang
mendeskripsikan atribut-atribut, setiap cabang menggambarkan hasil dari atribut
yang diuji, dan setiap daun menggambarkan kelas. Pohon keputusan bekerja mulai
dari akar paling atas, jika diberikan sejumlah data uji, misalnya X dimana kelas dari
data X belum diketahui, maka pohon keputusan akan menelusuri mulai dari akar
sampai node dan setiap nilai dari atribut sesuai data X diuji apakah sesuai dengan
aturan pohon keputusan, kemudian pohon keputusan akan memprediksi kelas dari
tupel X. Algoritma C4.5 dan pohon keputusan merupakan dua model yang tak
terpisahkan, karena untuk membangun sebuah pohon keputusan, dibutuhkan
algoritma C4.5.Di akhir tahun 1970 hingga di awal tahun 1980-an, J.Ross Quinlann
seorang peniliti di bidang mesin pembelajaran mengembangkan sebuah model pohon
keputusan yang dinamakan ID3 (Iterative Dichotomiser), walaupun sebenarnya
proyek ini telah dibuat sebelumnya oleh E.B.Hunt, J. Marin, dan P.T.Stone.
Kemudian Quinlan membuat algoritma dari pengembangan ID3 yang dinamakan
C4.5 yang berbasis supervised learning. Ada beberapa tahap dalam membuat sebuah
pohon keputusan dengan algoritma C4.5, yaitu:
73
1) Menyiapkan data training. Data training biasnya dari data
histori yang pernah terjadi sebelumnya dan sudah
dikelompokkan ke dalam kelas-kelas tertentu.
2) Menentukan akar dari pohon . akar akan diambil dari atibut
yang terpilih dengan cara menghitung nilai Gain dari
masing-masing atribut, nilai Gain yang paling tinggi yang
akan menjadi akar pertama. Sebelum menghitung nilai Gain
dari atribut, hitung dahulu nilai entropy yaitu :
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ − 𝜋 ∗ log2 𝜋
𝑛
𝑖=1
Keterangan:
S : himpunan kasus.
n : jumlah partisi S.
π: proporsi dari Si terhadap S.
3) Kemudian hitung nilai Gain dengan metode information
gain:
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑|𝑠𝑖|
|𝑠|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦
𝑛
𝑖=1
Keterangan :
S = Himpunan Kasus.
A = Atribut.
n = Jumlah Partisi Atribut.
A | Si | = Jumlah Kasus pada partisi ke-i.
74
| S | = Jumlah Kasus dalam S.
4) Ulangi langkah ke-2 hingga semua semua tupel terpartisi.
5) Proses partisi pohon keputusan akan berhenti saat:
a. Semua tupel dalma node N mendapat kelas
yang sama.
b. Tidak ada atribut di dalam tupel yang dipartisi
lagi.
c. Tidak ada tupel di dalam cabang yang kosong.
d.
4.2. Pohon Keputusan (Decision Tree)
Pohon keputusan adalah model prediksi menggunakan struktur pohon atau
struktur berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi
pohon keputusan dan aturan- aturan keputusan. Berikut adalah hasil pohon keputusan
dengan 1000 data testing, dan hasil dari aplikasi prediksi ini :
Gambar 4. 1 Gambar Pohon Keputusan
75
Kemudian di bawah ini adalah gambar laporan hasil perhitungan aplikasi
prediksi loyalitas karyawan, dapat di lihat pada gambar di bawah ini.
Gambar 4. 2 Gambar Laporan Hasil Perhitungan
Dari gambar di atas setelah di cocokkan dengan pohon keputusan di bawah ini
dengan data dari laporan hasil perhitungan dengan menggunakan data Roni dengan
hasil penilaian sebagai berikut :
a. Tingkat Kepuasan :3
b. Nilai Evaluasi Akhir :3
c. Jumlah Proyek : 12
d. Jam kerja perbulan : 210
e. Lama bekerja :3
f. Kecelakaan kerja : 0
g. Promosi 5 tahun terakhir : 0
h. Pekerjaan : IT
i. Gaji :Medium
j. Result : YA
Dan di bawah ini adalah jalur pohon keputusan berdasarkan dengan mengikuti
hasil penilaian dengan time_spend_company >2.500 lalu di lakukan pengecekkan
number_project >2.500 lalu time_spend_company <= 3.500 lalu number_project >
6.500 dan hasil nya YA
76
Gambar 4. 3 Gambar Pohon Keputusan Dengan Mengikuti Hasil Penilaian
4.3. Spesifikasi Hardware dan Software
4.3.1. Spesifikasi Hardware
Spesifikasi Hardware yang digunakan dalam pembuatan aplikasi ini
adalah sebagai berikut:
1. Processor 2.20GHz
2. RAM 2048MB
3. VGA Card 778MB
4. Harddisk 500GB
77
4.3.2. Spesifikasi Software
Spesifikasi Software yang digunakan dalam pembuatan aplikasi ini agar
aplikasi berjalan dengan baik adalah sebagai berikut:
1. Sistem operasi Windows 10 Ultimate 64-bit
2. Notepad++ 7.8.1
3. RapidMiner 5
4. PHPMyAdmin 4.2.11
5. Xampp v3.2.1
6. Google Chrome
78
4.4. Tampilan Layar Program
Tampilan Halaman Login
Menu ini berfungsi untuk menampilkan halaman login dari program,
untuk menuju ke halaman utama maka user diminta menginput username dan
password terlebih dahulu.
Gambar 4. 4 Tampilan Layar Login
79
Tampilan Layar Home
Menu ini adalah halaman utama aplikasi ini dan dapat menuju halaman
berikut nya .
Gambar 4. 5 Tampilan Layar Home
80
Tampilan Layar Prediksi Loyalitas Karyawan
Halaman ini dapat digunakan user untuk mencari prediksi Loyalitas
seorang karyawan.
Gambar 4. 6 Tampilan Layar Prediksi Loyalitas Karyawan
81
Tampilan Layar Sign Up
Pada halaman ini user dapat membuat account baru untuk login di
aplikasi ini.
Gambar 4. 7 Tampilan Layar Sign up
82
Tampilan Layar Laporan
Pada halaman ini menampilkan hasil laporan yang di masukkan oleh
setiap kepala bagian yang ada di perusahaan.
Gambar 4. 8 Tampilan Layar Laporan
83
Tampilan Layar Laporan Hasil Perhitungan
Pada halaman ini user dapat melihat hasil perhitungan yang telah di
hitung dan memberikan approval kepada karyawan yang dinyatakan memiliki
loyalitas terhadap perusahaan
Gambar 4. 9 Tampilan Layar Laporan Hasil Perhitungan
84
Tampilan Layar Input Laporan Karyawan
Pada halaman ini user dapat memasukkan penilaian terhadap karyawan.
Gambar 4. 10 Tampilan Layar Input Laporan Karyawan
85
Tampilan Layar Manage Account
Pada halaman ini user dapat merubah password lama dengan password
baru yang user inginkan.
Gambar 4. 11 Tampilan Layar Manage Account
86
4.5.Hasil Pengujian Confusion Matrix
Evaluasi Model dengan Confusion Matrix, model confusion matrix akan
membentuk matrix yang terdiri dari true positif atau tupel positif dan true negatif
atau tupel negatif, kemudian masukan data testing yang sudah disiapkan kedalam
confusion matrix sehingga hasil pada Gambar 4.12 seperti dibawah ini:
Gambar 4. 12 Hasil Pengujian Confusion Matrix
Berdasarkan gambar di atas hasil pengujian confusion matrix mendapatkan
tingkat accuracy sebesar 92,80 % yang di dapat dari :
(459 + 469
459 + 40 + 32 + 469)𝑥100%
4.6. Hasil Pengolahan Data Kuesioner
Untuk mengetahui tanggapan responden terhadap aplikasi yang sudah di buat
dengan memberikan 1 lembar kuesioner yang berisikan 10 pertanyaan dan dibagikan
kepada 20 responden. Berikut adalah uraian dari pertanyaan yang diajukan :
1. Apakah anda mengetahui tentang loyalitas karyawan?
Tabel 4.1 Jawaban Pertanyaan 1
Jawaban Responden Persentase
Ya 19 95%
Tidak 1 5%
Total 20 100%
87
Gambar 4. 13 Diagram jawaban pertanyaan 1
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 95%
responden mengetahui tentang loyalitas karyawan, dan 5% responden tidak
mengetahui tentang loyalitas karyawan.
2. Apakah anda mengetahui faktor apa saja yang mempengaruhi loyalitas seorang
karyawan?
Tabel 4.2 Jawaban Pertanyaan 2
Jawaban Responden Persentase
Ya 15 75%
Tidak 5 25%
Total 20 100%
95%
5%
Ya Tidak
88
Gambar 4.14 Diagram jawaban pertanyaan 2
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 75%
responden mengetahui faktor apa saja yang mempengaruhi loyalitas seorang
karyawan. Sedangkan 25% responden tidak mengetahui faktor apa saja yang
mempengaruhi loyalitas seorang karyawan.
3. Apakah Anda pernah menggunakan aplikasi prediksi sebelumnya?
Tabel 4.3 Jawaban Pertanyaan 3
Jawaban Responden Persentase
Ya 13 65%
Tidak 7 35%
Total 20 100%
75%
25%
Ya Tidak
89
Gambar 4.15 Diagram jawaban pertanyaan 3
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 65%
responden pernah menggunakan aplikasi prediksi. Sedangkan 35% responden
tidak pernah menggunakan aplikasi prediksi.
65%
35%
Ya Tidak
90
4. Apakah Anda mengetahui tentang apa itu data mining?
Tabel 4.4 Jawaban Pertanyaan 4
Jawaban Responden Persentase
Ya 8 40%
Tidak 12 60%
Total 20 100%
Gambar 4.16 Diagram jawaban pertanyaan 4
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 40%
responden mengetahui tentang apa itu data mining. Sedangkan 60% responden
tidak mengetahui tentang apa itu data mining.
40%
60%
Ya Tidak
91
5. Apakah aplikasi ini mudah digunakan?
Tabel 4.5 Jawaban Pertanyaan 5
Jawaban Responden Persentase
Ya 18 90%
Tidak 2 10%
Total 20 100%
Gambar 4.17 Diagram jawaban pertanyaan 5
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 90%
responden aplikasi ini mudah digunakan. Sedangkan 10% responden aplikasi
ini tidak mudah digunakan.
90%
10%
Ya Tidak
92
6. Apakah aplikasi ini membantu dalam memprediksi loyalitas karyawan?
Tabel 4.6 Jawaban Pertanyaan 6
Jawaban Responden Persentase
Ya 20 100%
Tidak 0 0%
Total 20 100%
Gambar 4.18 Diagram jawaban pertanyaan 6
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 100%
responden berpendapat aplikasi ini membantu dalam memprediksi loyalitas
karyawan.
100%
0%
Ya Tidak
93
7. Apakah aplikasi ini dapat membantu perusahaan dalam memberikan reward
kepada karyawan yang loyal terhadap perusahaan dan menghasilkan hasil yang
akurat?
Tabel 4.7 Jawaban Pertanyaan 7
Jawaban Responden Persentase
Ya 19 95%
Tidak 1 5%
Total 20 100%
Gambar 4.19 Diagram jawaban pertanyaan 7
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 95%
responden aplikasi ini dapat membantu perusahaan dalam memberikan reward
kepada karyawan yang loyal terhadap perusahaan dan menghasilkan hasil yang
akurat. Sedangkan 5% berpendapat aplikasi ini tidak dapat membantu
perusahaan. dalam memberikan reward kepada karyawan yang loyal terhadap
perusahaan dan menghasilkan hasil yang akurat.
95%
5%
Ya Tidak
94
8. Apakah aplikasi ini memiliki tampilan yang bagus dan tidak menganggu
penglihatan anda?
Tabel 4.8 Jawaban Pertanyaan 8
Jawaban Responden Persentase
Ya 11 55%
Tidak 9 45%
Total 20 100%
Gambar 4.20 Diagram jawaban pertanyaan 8
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 55%
responden berpendapat aplikasi ini memiliki tampilan yang bagus dan tidak
menganggu penglihatan. Sedangkan 45% responden berpendapat aplikasi ini
tidak memiliki tampilan yang bagus dan menganggu penglihatan.
55%
45%
Ya Tidak
95
9. Apakah aplikasi ini perlu dikembangkan kembali?
Tabel 4.9 Jawaban Pertanyaan 9
Jawaban Responden Persentase
Ya 18 90%
Tidak 2 10%
Total 20 100%
Gambar 4.21 Diagram jawaban pertanyaan 9
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 90%
responden berpendapat aplikasi ini perlu dikembangkan kembali. Sedangkan
10% responden berpendapat aplikasi ini tidak perlu dikembangkan kembali.
90%
10%
Ya Tidak
96
10. Apakah Anda berminat menggunakan aplikasi ini?
Tabel 4.10 Jawaban Pertanyaan 10
Jawaban Responden Persentase
Ya 15 75%
Tidak 5 25%
Total 20 100%
Gambar 4.22 Diagram jawaban pertanyaan 10
Berdasarkan hasil diatas dapat diambil kesimpulan bahwa 75%
responden berminat menggunakan aplikasi ini. Sedangkan 25% responden
tidak berminat menggunakan aplikasi ini.
75%
25%
Ya Tidak
97
Berikut adalah grafik analisa kuesioner keseluruhan
Gambar 4.23 Grafik analisa kuesioner keseluruhan
Dari seluruh hasil kuesioner yang telah dibagikan dan dijawab oleh
responden, kemudian jawaban tersebut dianalisis berdasarkan pilihan pengguna.
Dapat disimpulkan bahwa aplikasi ini dapat diterima dengan baik dimana statistik
menunjukan aplikasi ini mudah untuk digunakan, dapat membantu dalam
memprediksi loyalitas karyawan. Ditambah 75% responden berminat menggunakan
aplikasi ini.
19
15
13
8
18
2019
11
18
15
1
5
7
12
2
01
9
2
5
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10
Ya Tidak
98
BAB V
SIMPULAN DAN SARAN
5.1. Simpulan
Berdasarkan uji coba dan evaluasi yang telah dilakukan maka dapat diambil
kesimpulan sebagai berikut:
1. Diketahui bahwa bidang ilmu data mining dengan algoritma C4.5 dapat
diimplmentasikan pada prediksi loyalitas karyawan, setelah menguji data set
dengan rapid miner, lalu menghitung kembali data set dengan perhitungan
manual maka didapat kan hasil accuracy sebagai nilai ketentuan seberapa besar
keakuratan aplikasi dalam menentukan baik buruknya kinerja karyawan untuk
menentukan loyalitas karyawan.
2. Penerapan Algoritma C4.5 pada prediksi loyalitas karyawan dapat
menghasilkan accuracy yang mencapai 92,80% dengan menggunakan aplikasi
RapidMiner.
3. Berdasarkan penelitian ini, dapat dikatakan bahwa loyal atau tidak loyal nya
karyawan dapat di lihat dari berapa lama karyawan tersebut berada di
perusahaan, jumlah proyek yang di kerjakan dan rata – rata jam kerja setiap
bulan.
99
5.2. Saran
Berdasarkan analisa yang telah dilakukan maka dapat diusulkan beberapa saran
agar aplikasi pembelajaran ini lebih baik lagi, yaitu:
1. Menggembangkan aplikasi ini dengan menggunakan data primer (asli).
2. Mengembangkan aplikasi prediksi ini dengan berbasis mobile.
3. Menggunakan algoritma klasifikasi data mining yang lain seperti algoritma
ID3, Naïve Bayes, Neural Network, untuk dapat membandingkan tingkat
akurasi hasil yang diperoleh.
100
DAFTAR PUSTAKA
Anggriawan. (2017). Gaya Komunikasi Pimpinan Terhadap Motivasi Kerja Karyawan
Pada PT. Perusahaan Listrik Negara (PLN) Persero Area Pelayanan Di
Samarinda, eJournal Ilmu Komunikasi, Volume 5, Nomor 4, 2017, ISSN 2502-
5961
Asmara. (2016). Sistem Informasi Pengolahan Data Penanggulangan Bencana Pada
Kantor Badan Penanggulangan Bencana Daerah (BPBD) Kabupaten Padang
Pariaman, Jurnal J-Click Vol 3 No 2 Desember 2016, ISSN : 2355-7958 e-ISSN :
2541-2469S
Ayu, dan Permatasari.(2018). Perancangan Sistem Informasi Pengolahan Data Praktek
Kerja Lapangan (PKL) Pada Devisi Humas PT. Pegadaian, Jurnal Intra-Tech
Volume 2, No.2 Oktober 2018 ISSN. 2549-0222
Barri, Lumenta, dan Wowor. (2015). Perancangan Aplikasi SMS GATEWAY Untuk
Pembuatan Kartu Perpustakaan di Fakultas Teknik Unsrat, E-journal Teknik
Elektro dan Komputer (2015), ISSN : 2301-8402
Binarso, Sarwoko, dan Bahtiar. (2012). Pembangunan Sistem Informasi Berbasis Web
Pada Program Studi Teknik Informatika Universitas Diponegoro,
https://ejournal3.undip.ac.id/index.php/joint
Budiastawa, Santiyasa, dan Pramartha. (2019). Prediksi Dan Akurasi Nilai Tukar Mata
Uang Rupiah Terhadap US Dolar Menggunakan Radial Basis Function Neural
Network, Jurnal Elektronik Ilmu Komputer Udayana, Volume 7, No 4. Mei 2019 p-
ISSN: 2301-5373 e-ISSN: 2654-5101
Destiningrum, dan Adrian. (2017). Sistem Informasi Penjadwalan Dokter Berbasis Web
Dengan Menggunakan Framework Codeigniter (Studi Kasus: Rumah Sakit Yukum
Medical Centre), Jurnal TEKNOINFO, Vol. 11, No. 2, 2017, 30-37. ISSN 1693
0010
Dhika. (2015). Kajian Perancangan Rule Kenaikan Jabatan Pada PT. ABC, Jurnal
SIMETRIS, Vol 6 No 2 November 2015, ISSN: 2252-4983.
Eska. (2016). Penerapan Data Mining Untuk Prediksi Penjualan Wallpaper Menggunakan
Algoritma C4.5, JURTEKSI (Jurnal Teknologi dan Sistem Informasi), Vol 2,
Nomor 2, Maret 2016, ISSN 2407 - 1811
Haryati, Sudarsono, dan Suryana. (2015). Implementasi Data Mining Untuk Memprediksi
Masa Strudi Mahasiswa Menggunakan Algoritma C4.5 (Studi Kasus: Univversitas
Dehasen Bengkulu), Jurnal Media Infotama Vol. 11 No. 2, September 2015, ISSN
1858 – 2680.
101
Hastanti, Purnama, dan Wardati. (2015). Sistem Penjualan Berbasis Web (E-Commerce)
Pada Tata Distro Kabupaten Pacitan, Jurnal Bianglala Informatika Vol 3 No 2
September 2015, ISSN : 2338-8145.
Ikhsan, dan Kurniawan. (2015). Implementasi Sistem Kendali Cahaya Dan Sirkulasi
Udara Ruangan Dengan Memanfaatkan PC Dan Mikrokontroler Atmega8, Jurnal
TEKNOIF, Vol. 3 No. 1 April 2015 ISSN: 2338-2724.
Iswandy. (2015). Sistem Penunjang Keputusan Untuk Menentukan Penerimaan Dana
Santunan Sosial Anak Nagari dan Penyaluran Bagi Mahasiswa dan Pelajar
Kurang Mampu Di Kenagarian Barung – Barung Balantai Timur, Jurnal
TEKNOIF, Vol. 3 No. 2 Oktober 2015, ISSN: 2338-2724.
Juansyah. (2015). Pembangunan Aplikasi Child Tracker Berbasi Asisited-Global
Positioning System (A-GPS) Dengan Platform Android, Jurnal Ilmiah Komputer
dan Informatika (KOMPUTA), Edisi. 1 Volume. 1 Agustus 2015 ISSN: 2089-9033.
Julianto, Yunitarini, dan Sophan. (2014). Algoritma C4.5 Untuk Penilaian Kinerja
Karyawan, Universitas Trunojoyo Madura, VOL. IX NOMOR 2 JUNI 2014 ISSN:
1978-0087.
Khairil, Kanedi, dan Aspriyono. (2014). Permainan Dalam Perhitungan Perkalian Berbasis
Online Menggunakan Flash, Jurnal Media Infotama Vol.8 No.2 September 2012,
ISSN : 1858 – 2680.
Kurniawan. (2017). Penerapan Algoritma C4.5 Dalam Penerimaan Calon Karyawan
PT.TELKOM Akses Area Lampung Berbasis Website, Jurnal SEMNAS IIB
DARMAJAYA, ISSN: 2598 – 0246 | E-ISSN: 2598-0238
Mardi. (2016). Data Mining Klasifikasi Menggunakan Algoritma C4.5, Jurnal Edik
Informatika, ISSN: 2407-0491.
Masuara. (2015). Rancang Bangun E-Ticketing Bioskop Studio 21 Manado Berbasis
Multiplatform, E-Journal Teknik Elektro dan Komputer (2015), ISSN :2301-8402.
Maulana. (2017). Pembelajaran Dasar Algortima Dan Pemrograman Menggunakan El-
goritma Berbasis Web, Jurnal Teknik Mesin (JTM): Vol. 06, Edisi Spesial 2017,
ISSN 2549 – 2888.
Naufal, Wahono, dan Syukur. (2015). Penerapan Bootstrapping untuk Ketidakseimbangan
Kelas dan Weighted Information Gain untuk Feature Selection pada Algoritma
Support Vector Machine untuk Prediksi Loyalitas Pelanggan, Universitas Dian
Nuswantoro, Vol. 1, No. 2, December 2015 ISSN 2356-3982.
Palit, (2015), Rancangan Sistem Informasi Keuangan GerejaBerbasis Web Di Jemaat
GMIM Bukit Moria Malalayang, E-Journal Teknik Elektro dan Komputer vol. 4 no.
7 (2015), ISSN : 2301-8402
102
Pebriadi. (2016). Rekayasa Perangkat Lunak Pemesanan Tiket Bioskop Berbasis Web,
Jurnal TEKNOIF Vol. 4 No. 2 Oktober 2016 ISSN: 2338-2724
Pramadhani dan Setiadi. (2014). Penerapan Data Mining Untuk Klasifikasi Prediksi
Penyakit ISPA (Infeksi Saluran Pernapasan Akut) Dengan Algoritma Decision Tree
(ID3), Jurnal Sarjana Teknik Informatika Volume 2 Nomor 1, Februari 2014, e-
ISSN: 2338-5197
Pratama, (2019). Algoritma C4.5 Untuk Klasifikasi Nasabah Dalam Memprediksi Kredit
Macet, INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS
Vol.3, No. 2, Juni 2019, 121 – 130 E-ISSN: 2548-3587
Prayitno, dan Safitri. (2015). Pemanfaatan Sistem Informasi Perpustakaan Digital
Berbasis Website Untuk Para Penulis, Volume 1 No 1 – 2015, ISSN :
24610690.volume 1 No 1 – 2015
Prijono, B. (2017, Agustus 22). Penggunaan kaggle untuk pemula. Retrieved November
27, 2018, from indoml: https://indoml.com
Romadhon. (2019). Perancangan Website Sistem Informasi Simpan Pinjam Menggunakan
Framework Codeigniter Pada Koperasi Bumi Sejahtera Jakarta, Vol.3 No.1
Februari 2019 ISSN : 2597-3673 (Online) ISSN : 2579-5201 (Printed)
Sukma, Halfis, dan Hermawan. (2019). Klasifikasi Channel Youtube Indonesia
Menggunakan Algoritma C4.5, Volume V No. 1 Februari 2019 P-ISSN 2442-2436,
E-ISSN: 2550-0120
Valentino, dan Haryadi.(2016). Loyalitas Karyawan Pada CV Trijaya Manunggal,
AGORA Vol. 4, No. 2, (2016) ISSN 2251-4783
Winarno, dan Utomo. (2014). Pemrograman Web Berbasis HTML5, PHP & JavaScript.
Jakarta:Elex Media Komputindo, Jurnal Sistem Informasi (JSI). Vol 4. No. 2,
ISSN:3071-4671.
103
DAFTAR RIWAYAT HIDUP
Data Pribadi
Nama Lengkap : Ryanwar
Tempat, Tanggal Lahir : Jakarta, 12 September 1994
Jenis Kelamin : Laki-laki
Alamat Lengkap : Perumahan Taman Royal 3 Cluster Edelweiss 5 no. 6,
Poris Plawad, Tangerang
Agama : Buddha
No. Telp : 0812 8051 3087
E-mail : [email protected]
Pendidikan Formal
2000 – 2006 Sekolah Dasar Negeri Ketapang, Tanjung Kait
2006 – 2009 Sekolah Menengah Pertama Negeri 1 Mauk, Mauk
2009 – 2011 Sekolah Menengah Kejuruan Bonavita, Tangerang
2012 – 2013 PKBM PANCAKARYA, Tangerang
2014 - sekarang Program Studi Teknik Informatika, Peminatan Database, Universitas
Buddhi Dharma, Tangerang
Tangerang, 13 Januari 2020
Ryanwar