Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali:
Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli.
Copyright and reuse:
This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.
RANCANG BANGUN SISTEM PERINGKAS BERITA
OTOMATIS BERBASIS TEXT MINING DENGAN
MENGGUNAKAN NAIVE BAYES CLASSIFIER
SKRIPSI
Diajukan sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer (S.Kom.)
Nicholas Adi Suryatama
12110110104
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INFORMASI DAN KOMUNIKASI
UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2016
ii
LEMBAR PENGESAHAN SKRIPSI
RANCANG BANGUN SISTEM PERINGKAS BERITA OTOMATIS
BERBASIS TEXT MINING DENGAN MENGGUNAKAN
NAIVE BAYES CLASSIFIER
Oleh
Nama : Nicholas Adi Suryatama
NIM : 12110110104
Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi dan Komunikasi
Tangerang, 15 Agustus 2016
Menyetujui,
Ketua Sidang Dosen Penguji
Ir. Andrey Andoko, M.Sc. Ni Made Satvika Iswari, S.T., M.T.
Dosen Pembimbing
Ranny, S.Kom., M.Kom.
Ketua Program Studi
Maria Irmina Prasetiyowati, S.Kom., M.T.
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
iii
PERNYATAAN TIDAK MELAKUKAN PLAGIAT
Dengan ini saya,
Nama : Nicholas Adi Suryatama
NIM : 12110110104
Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi dan Komunikasi
Menyatakan bahwa skripsi yang berjudul “Rancang Bangun Sistem Peringkas
Berita Otomatis Berbasis Text Mining dengan Menggunakan Naive Bayes
Classifier” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah
yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah orang lain
atau lembaga lain yang dirujuk dalam skripsi ini telah disebutkan sumber
kutipannya serta dicantumkan di Daftar Pustaka.
Jika di kemudian hari terbukti ditemukan kecurangan / penyimpangan, baik dalam
pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia
menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah skripsi
yang telah saya tempuh.
Tangerang, 25 Juli 2016
Nicholas Adi Suryatama
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
iv
KATA PENGANTAR
Puji syukur kepada Tuhan Yang Maha Esa karena berkat rahmat-Nya penulis
dapat menyelesaikan penelitian ini. Laporan skripsi yang berjudul “Rancang
Bangun Sistem Peringkas Berita Otomatis Berbasis Text Mining dengan
Menggunakan Naive Bayes Classifier” diajukan kepada Program Studi Teknik
Informatika, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara.
Selama penulis melakukan penelitian, tentunya tidak terlepas daripada semua
orang yang memberi dukungan dan bantuan kepada penulis. Dengan ini, penulis
mengucapkan terima kasih kepada :
1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara, yang
memberi inspirasi bagi penulis untuk berprestasi,
2. Kanisius Karyono, S.T., M.T., selaku Dekan Fakultas Teknologi Informasi
dan Komunikasi Universitas Multimedia Nusantara,
3. Maria Irmina Prasetiyowati, S.Kom., M.T., selaku Ketua Program Studi
Teknik Informatika Universitas Multimedia Nusantara, yang menerima
penulis dengan baik untuk berkonsultasi,
4. Ranny, S.Kom., M.Kom. selaku dosen pembimbing yang telah membimbing
dengan sabar selama proses pembuatan skripsi dan yang telah mengajar
penulis tata cara menulis karya ilmiah dengan benar,
5. Niknik M.K., S.Pd., M.Hum, selaku pakar Bahasa Indonesia yang telah
membantu dalam pengumpulan data.
6. Orang tua dan keluarga penulis yang senantiasa mendukung penulis dalam
menyelesaikan rangkaian proses skripsi,
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
v
7. Teman-teman penulis yang membantu memberikan dukungan moral dan
saran agar penelitian menjadi lebih baik.
Semoga skripsi ini dapat bermanfaat, baik sebagai sumber informasi maupun
sumber inspirasi, bagi para pembaca.
Tangerang, 25 Juli 2016
Nicholas Adi Suryatama
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
vi
RANCANG BANGUN SISTEM PERINGKAS BERITA OTOMATIS
BERBASIS TEXT MINING DENGAN MENGGUNAKAN
NAIVE BAYES CLASSIFIER
ABSTRAK
Naive Bayes Classifier merupakan salah satu teknik klasifikasi data yang
paling sering digunakan. Text summarization adalah proses untuk mendapatkan
informasi paling penting dari satu atau lebih sumber informasi dan menghasilkan
versi yang lebih singkat dari informasi tersebut. Terdapat dua jenis ringkasan
yaitu ekstraktif dan abstraktif. Ringkasan yang akan diperoleh dari sistem
merupakan ringkasan ekstraktif. Ringkasan ekstraktif merupakan ringkasan yang
didapatkan dari kalimat-kalimat yang dianggap penting dari suatu sumber
informasi. Dalam penelitian ini, Naive Bayes Classifier digunakan untuk
melakukan text summarization pada berita. Berita yang digunakan adalah berita
dengan kategori ekonomi, nasional, dan olahraga. Berita yang digunakan
bersumber dari www.kompas.com. Dari berita yang ada, akan dicari tahu
ringkasan manualnya melalui seorang ahli Bahasa Indonesia. Ringkasan tersebut
akan dibandingkan dengan ringkasan yang dihasilkan oleh sistem. Parameter yang
digunakan adalah posisi kalimat, panjang kalimat, nama entitas, data numerik, dan
kemiripan kalimat dengan judul. Setelah melakukan beberapa pengujian,
diketahui bahwa dengan menggunakan Naive Bayes Classifier ringkasan terbaik
didapatkan pada berita dengan kategori olahraga dengan rata-rata nilai f-measure
sebesar 0,77.
Kata kunci : Automatic Summarization, Naive Bayes Classifier, ringkasan
ekstraktif, Text Mining, Text Summarization
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
vii
DESIGN AND DEVELOPMENT OF AUTOMATIC NEWS
SUMMARIZER BASED ON TEXT MINING USING
NAIVE BAYES CLASSIFIER
ABSTRACT
Naive Bayes Classifier is one of the data classification techniques that
often used. Text summarization is a process to find the most important
information from one or more information source and produce a shorter version of
that information. There are two kinds of summary, an abstract and an extract. The
summary generated by the system is an extract. Extractive summary is a
summary that consist of the important sentences from information source. In this
research, Naive Bayes Classifier will be used to do the news text summarization.
The news that will be used are economic news, national news, and sport news.
The source of the news is from www.kompas.com. From the original news, the
manual summary will be found from Indonesian language expert. The manual
summary will be compared to the system’s summary. The parameters are sentence
position, sentence length, entity name, numeric data, and sentence similarity to
title. After doing some experiments on system, the best summary generated by
using Naive Bayes Classifier is for sport news, the average f-measure is 0,77.
Key words : Automatic Summarization, Extractive Summary, Naive Bayes
Classifier, Text Mining, Text Summarization
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
viii
DAFTAR ISI
LEMBAR PENGESAHAN SKRIPSI .................................................................... ii
PERNYATAAN TIDAK MELAKUKAN PLAGIAT .......................................... iii
KATA PENGANTAR ........................................................................................... iv
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Rumusan Masalah ......................................................................................... 2
1.3 Batasan Masalah ............................................................................................ 2
1.4 Tujuan Penelitian ........................................................................................... 3
1.5 Manfaat Penelitian ......................................................................................... 3
1.6 Sistematika Penulisan .................................................................................... 3
BAB II LANDASAN TEORI ................................................................................. 5
2.1 Natural Language Processing ........................................................................ 5
2.2 Data Mining ................................................................................................... 5
2.3 Text Summarization ...................................................................................... 6
2.4 Text Mining ................................................................................................... 6
2.5 Naive Bayes Classifier .................................................................................. 8
2.6 Teknik Uji Coba dan Evaluasi ..................................................................... 14
BAB III METODE DAN PERANCANGAN SISTEM ........................................ 16
3.1 Metode Penelitian ........................................................................................ 16
3.2 Spesifikasi Sistem ........................................................................................ 17
3.3 Perancangan Sistem ..................................................................................... 17
3.3.1 Data Flow Diagram (DFD) ................................................................... 18
3.3.2 Flowchart .............................................................................................. 20
3.3.3 Struktur Tabel ....................................................................................... 25
3.4 Perancangan Antarmuka .............................................................................. 26
3.4.1 Mockup Halaman Utama ...................................................................... 26
3.4.2 Mockup Halaman Login ....................................................................... 27
BAB IV IMPLEMENTASI DAN UJI COBA SISTEM ....................................... 28
4.1 Implementasi Data Training ........................................................................ 28
4.2 Implementasi Algoritma .............................................................................. 29
4.3 Implementasi Sistem ................................................................................... 32
4.3.1 Halaman Utama .................................................................................... 32
4.3.2 Halaman Login ..................................................................................... 33
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
ix
4.3.3 Halaman Admin .................................................................................... 34
4.4 Pengujian Sistem ......................................................................................... 35
BAB V KESIMPULAN DAN SARAN ................................................................ 50
KESIMPULAN DAN SARAN ............................................................................. 50
5.1 Kesimpulan .................................................................................................. 50
5.2 Saran ............................................................................................................ 51
DAFTAR PUSTAKA ........................................................................................... 52
DAFTAR LAMPIRAN ......................................................................................... 54
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
x
DAFTAR GAMBAR
Gambar 3.1 Context Diagram ............................................................................... 18
Gambar 3.2 DFD Level 1 ...................................................................................... 18
Gambar 3.3 DFD Level 2 ...................................................................................... 19
Gambar 3.4 Flowchart Sistem .............................................................................. 20
Gambar 3.5 Flowchart Tokenizing ........................................................................ 21
Gambar 3.6 Flowchart Filtering ........................................................................... 22
Gambar 3.7 Flowchart Bayes ................................................................................ 23
Gambar 3.8 Flowchart Login ................................................................................ 24
Gambar 3.9 Flowchart Tambah Berita Training .................................................. 24
Gambar 3.10 Rancangan Halaman Utama ............................................................ 26
Gambar 3.11 Rancangan Halaman Login ............................................................. 27
Gambar 4.1 Halaman Utama Sistem ..................................................................... 32
Gambar 4.2 Halaman Login .................................................................................. 33
Gambar 4.3 Tampilan Pesan Error ....................................................................... 34
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016
xi
DAFTAR TABEL
Tabel 2.1 Contoh Data Set (Lestari, 2015) ............................................................. 9
Tabel 2.2 Contoh Data Prediksi (Lestari, 2015) ................................................... 10
Tabel 3.1 Struktur Tabel Admin ........................................................................... 25
Tabel 3.2 Struktur Tabel Kategori ........................................................................ 25
Tabel 3.3 Struktur Tabel Parameter ...................................................................... 25
Tabel 3.3 Struktur Tabel Parameter (Lanjutan) .................................................... 26
Tabel 4.1 Hasil Uji Berita Ekonomi (8 data training, batas kata = 5) .................. 35
Tabel 4.1 Hasil Uji Berita Ekonomi (8 data training, batas kata = 5)
(Lanjutan) ............................................................................................. 36
Tabel 4.2 Hasil Uji Berita Ekonomi (10 data training, batas kata = 5) ................ 36
Tabel 4.3 Hasil Uji Berita Ekonomi (8 data training, batas kata = 7) .................. 37
Tabel 4.4 Hasil Uji Berita Ekonomi (10 data training, batas kata = 7) ................ 38
Tabel 4.5 Hasil Uji Berita Ekonomi (8 data training, batas kata = 15) ................ 39
Tabel 4.6 Hasil Uji Berita Ekonomi (10 data training, batas kata = 15) .............. 39
Tabel 4.7 Hasil Uji Berita Nasional (8 data training, batas kata = 5) ................... 40
Tabel 4.7 Hasil Uji Berita Nasional (8 data training, batas kata = 5)
(Lanjutan) ............................................................................................. 41
Tabel 4.8 Hasil Uji Berita Nasional (10 data training, batas kata = 5) ................. 41
Tabel 4.9 Hasil Uji Berita Nasional (8 data training, batas kata = 6) ................... 42
Tabel 4.9 Hasil Uji Berita Nasional (8 data training, batas kata = 6)
(Lanjutan) ............................................................................................. 43
Tabel 4.10 Hasil Uji Berita Nasional (10 data training, batas kata = 6) ............... 43
Tabel 4.11 Hasil Uji Berita Nasional (8 data training, batas kata = 15) ............... 44
Tabel 4.12 Hasil Uji Berita Nasional (10 data training, batas kata = 15) ............. 44
Tabel 4.13 Hasil Uji Berita Olahraga (8 data training, batas kata = 5) ................ 45
Tabel 4.14 Hasil Uji Berita Olahraga (10 data training, batas kata = 5) .............. 46
Tabel 4.15 Hasil Uji Berita Olahraga (8 data training, batas kata = 15) .............. 46
Tabel 4.15 Hasil Uji Berita Olahraga (8 data training, batas kata = 15)
(Lanjutan) ............................................................................................. 47
Tabel 4.16 Hasil Uji Berita Olahraga (10 data training, batas kata = 15) ............ 47
Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016