View
284
Download
0
Category
Preview:
Citation preview
PENERAPAN STEMMING DENGAN ALGORITMA PORTER
PADA QUERY PENCARIAN JUDUL BUKU
SKRIPSI
Disusun Sebagai Salah Satu Syarat
Untuk Memperoleh Gelar Sarjana Komputer
Pada Departemen Ilmu Komputer/Informatika
Disusun oleh:
Maulana Arsyad Asaadi
24010310120047
DEPARTEMEN ILMU KOMPUTER / INFORMATIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
2017
ii
HALAMAN PERNYATAAN KEASLIAN SKRIPSI
Saya yang bertanda tangan di bawah ini :
Nama : Maulana Arsyad Asaadi
NIM : 24010310120047
Judul : Penerapan Stemming dengan Algoritma Porter pada Query Pencarian Judul Buku
Dengan ini saya menyatakan bahwa dalam tugas akhir atau skripsi ini tidak terdapat karya
yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan
sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau
diterbitkan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan
disebutkan di dalam daftar pustaka.
Semarang, 4 Juli 2017
Maulana Arsyad Asaadi
NIM. 24010310120047
iii
HALAMAN PENGESAHAN
Judul : Penerapan Stemming dengan Algoritma Porter pada Query Pencarian Judul Buku
Nama : Maulana Arsyad Asaadi
NIM : 24010310120047
Telah diujikan pada sidang tugas akhir pada tanggal 20 Juni 2017 dan dinyatakan lulus
pada tanggal 20 Juni 2017.
Semarang, 4 Juli 2017
Mengetahui,
Ketua Departemen Ilmu Komputer/
Informatika FSM Undip
Panitia Penguji Tugas Akhir
Ketua,
Ragil Saputra, S.Si., M.Cs.
NIP. 19801021 200501 1 003
Sukmawati Nur Endah, S.Si., M.Kom.
NIP. 19780502 200501 2 002
iv
HALAMAN PENGESAHAN
Judul : Penerapan Stemming dengan Algoritma Porter pada Query Pencarian Judul Buku
Nama : Maulana Arsyad Asaadi
NIM : 24010310120047
Telah diujikan pada sidang tugas akhir pada tanggal 20 Juni 2017.
Semarang, 4 Juli 2017
Pembimbing,
Indra Waspada, S.T., M.T.I.
NIP. 19790212 200812 1 002
v
ABSTRAK
Perkembangan teknologi yang semakin pesat menyebabkan semua kalangan bergantung
pada teknologi informasi, khususnya internet. Penggunaan internet berhubungan erat
dengan pencarian informasi, yang menuntut hasil pencarian yang relevan. Hasil pencarian
dalam web penjualan buku Edusarana masih dilakukan secara apa adanya, sesuai dengan
inputan pengguna. Jika hasil pencarian juga menyertakan buku yang judulnya sesuai atau
hampir sama dengan apa yang dimasukkan oleh pengguna web ditampilkan, maka
memungkinkan penjualan buku yang meningkat. Berdasarkan masalah tersebut, fungsi
pencarian web memerlukan sebuah algoritma Information Retrieval pada fungsi
pencariannya yang dapat memunculkan hasil pencarian yang relevan dengan apa yang
diinginkan oleh pengguna web. Salah satu algoritma yang dapat digunakan adalah algoritma
stemming porter. Pada tugas akhir ini dibahas tentang pembuatan sistem yang menggunakan
algoritma stemming porter, yang menghilangkan imbuhan dan menghasilkan kata dasar pada
kata yang diinputkan ke dalam fungsi pencarian judul buku dengan tingkat rata-rata akurasi
word stemmed factor sebesar 89.48% dan correctly stemmed words factor sebesar 93,40%.
Kata kunci : Information Retrieval, web, stemming, algoritma porter
vi
ABSTRACT
The advancement of technology led us to rely on information and technology, especially the
internet. Internet usage is closely related to information retrieval, which demands more
relevant search result. Edusarana’s website search result still done traditionally, resulting in
literal search result. If any relevant and similar books result also included, their book’s sale
might have increased. Based on those problems, Edusarana’s website needs an Information
Retrieval algorithm on their book search function to generate more relevant search results.
One of the commonly used algorithm is porter stemming algorithm. In this thesis will be
discussed how to make a stemming system using porter algorithm, which will subtract any
affixes affiliated with a word, and produces a root word which later used as keywords for
searching function on the website, with word stemmed factor average accuracy of 89.48%
and correctly stemmed words factor average accuracy of 93,40%.
Keywords: Information Retrieval, website, stemming, porter algorithm
vii
KATA PENGANTAR
Puji Syukur penulis panjatkan kepada Allah SWT karena atas rahmat dan karunia-Nya
penulis dapat menyelesaikan laporan tugas akhir yang berjudul “Penerapan Stemming
dengan Algoritma Porter pada Query Pencarian Judul Buku”. Tak lupa shalawat dan salam
selalu tercurahkan kepada Nabi Muhammad SAW semoga di akhirat kelak penulis dan
pembaca mendapatkan syafaatnya.
Penyusunan laporan ini melibatkan banyak pihak yang selalu memberikan bimbingan,
motivasi dan semangat. Untuk itu, pada kesempatan kali ini penulis ingin menyampaikan
rasa terimakasih dan rasa hormat kepada :
1. Prof. Dr. Widowati, S.Si., M.Si., selaku Dekan Fakultas Sains dan Matematika (FSM)
Universitas Diponegoro.
2. Ragil Saputra, S.Si., M.Cs., selaku Ketua Departemen Ilmu Komputer/Informatika FSM
Universitas Diponegoro.
3. Helmie Arif Wibawa, S.Si., M.Cs., selaku Dosen Koordinator Tugas Akhir Departemen
Ilmu Komputer/Informatika FSM Universitas Diponegoro.
4. Indra Waspada, S.T., MTI., selaku dosen pembimbing yang telah memberikan bimbingan
dan arahan dalam pembuatan laporan tugas akhir.
5. Keluarga beserta teman-teman yang selalu mendukung dan mendoakan agar tugas akhir
berjalan dengan lancar.
Penulis menyadari bahwa dalam penulisan laporan tugas akhir ini masih terdapat
banyak kesalahan baik dari segi materi maupun struktur penulisan karena terbatasnya ilmu
yang dimiliki oleh penulis, oleh karena itu kritik dan saran yang membangun akan sangat
bermanfaat bagi penulis.
Semarang, 4 Juli 2017
Penulis
viii
DAFTAR ISI
HALAMAN PERNYATAAN KEASLIAN SKRIPSI .......................................................... ii
HALAMAN PENGESAHAN .............................................................................................. iii
HALAMAN PENGESAHAN .............................................................................................. iv
ABSTRAK ............................................................................................................................ v
ABSTRACT ......................................................................................................................... vi
KATA PENGANTAR ......................................................................................................... vii
DAFTAR ISI ...................................................................................................................... viii
DAFTAR TABEL ................................................................................................................. x
DAFTAR GAMBAR ............................................................................................................ xi
BAB I PENDAHULUAN .................................................................................................. 1
1.1 Latar Belakang ........................................................................................................ 1
1.2 Rumusan Masalah ................................................................................................... 2
1.3 Tujusan dan Manfaat .............................................................................................. 2
1.4 Ruang Lingkup ....................................................................................................... 3
1.5 Sistematika Penulisan ............................................................................................. 3
BAB II LANDASAN TEORI .......................................................................................... 5
2.1 Website ................................................................................................................... 5
2.2 Information Retrieval (Temu Balik Informasi) ...................................................... 5
2.2.1 Cara Kerja Information Retrieval .................................................................... 6
2.3 Algoritma Stemming Porter .................................................................................... 7
2.4 Model Proses Waterfall ........................................................................................ 10
2.5 Pengujian Blackbox .............................................................................................. 12
2.6 Data Flow Diagram (DFD) ................................................................................... 12
2.7 Entity Relationship Diagram (ERD) ..................................................................... 13
2.8 Diagram Alur (Flowchart) .................................................................................... 14
2.9 Pengujian Akurasi ................................................................................................. 15
2.10 PHP (Hypertext Preprocessor) .......................................................................... 16
2.11 MySQL (My Structured Query Language) ....................................................... 17
BAB III METODOLOGI PENELITIAN DAN PERANCANGAN SISTEM ................ 18
3.1 Tahapan Penelitian ................................................................................................ 18
ix
3.2 Analisis dan Perancangan Sistem ......................................................................... 22
3.2.1 Arsitektur Sistem ........................................................................................... 22
3.2.2 Analisis Data ................................................................................................. 23
3.2.3 Analisis Kebutuhan ....................................................................................... 23
3.2.4 Pemodelan Data ............................................................................................. 23
3.2.5 Pemodelan Fungsional ................................................................................... 25
3.3 Perancangan Sistem .............................................................................................. 30
3.3.1 Perancangan Data .......................................................................................... 30
3.3.2 Perancangan Antarmuka ................................................................................ 33
BAB IV IMPLEMENTASI DAN PENGUJIAN ............................................................ 37
4.1 Implementasi ......................................................................................................... 37
4.1.1 Implementasi perangkat keras dan perangkat lunak ...................................... 37
4.1.2 Implementasi Data ......................................................................................... 37
4.1.3 Implementasi Algoritma Porter ..................................................................... 40
4.1.4 Implementasi Antarmuka .............................................................................. 44
4.2 Pengujian .............................................................................................................. 49
4.2.1 Pengujian Fungsional .................................................................................... 49
4.2.2 Pengujian Akurasi Algoritma Porter ............................................................. 52
BAB V PENUTUP ......................................................................................................... 53
5.1 Kesimpulan ........................................................................................................... 53
5.2 Saran ..................................................................................................................... 53
DAFTAR PUSTAKA .......................................................................................................... 54
Lampiran 1 Surat Keterangan Penelitian ............................................................................. 55
x
DAFTAR TABEL
Tabel 2.1 Tabel Untuk Inflectional Particle. .................................................................. 8
Tabel 2.2 Tabel untuk Inflectional Possessive Pronoun. ............................................... 8
Tabel 2.3 Aturan Untuk First Order Derivational Prefix. ............................................. 8
Tabel 2.4 Aturan untuk Second Order Derivation Prefix .............................................. 9
Tabel 2.5 Aturan untuk Derivational Suffix ................................................................... 9
Tabel 2.6 Simbol Data Flow Diagram ........................................................................... 13
Tabel 2.7 Tabel notasi ERD ........................................................................................... 14
Tabel 2.8 Simbol Diagram Alur ..................................................................................... 15
Tabel 3.1 Kebutuhan Fungsional Sistem ........................................................................ 23
Tabel 3.2 Kebutuhan Non-Fungsional Sistem ................................................................ 23
Tabel 3.3 Entitas web pencarian buku ............................................................................ 24
Tabel 3.4 Perancangan tabel user ................................................................................... 30
Tabel 3.5 Perancangan tabel kata dasar .......................................................................... 31
Tabel 3.6 Perancangan tabel buku .................................................................................. 31
Tabel 3.7 Perancangan tabel penulis .............................................................................. 32
Tabel 3.8 Perancangan tabel penerbit ............................................................................. 33
Tabel 4.1 Implementasi Data .......................................................................................... 38
Tabel 4.2 Rencana Pengujian Fungsional....................................................................... 49
Tabel 4.3 Pengujian Fungsional terhadap SRS-Query-F-001 ........................................ 50
Tabel 4.4 Pengujian Fungsional terhadap SRS-Query-F-002 ........................................ 50
Tabel 4.5 Pengujian Fungsional terhadap SRS-Query-F-003 ........................................ 51
Tabel 4.6 Pengujian Fungsional terhadap SRS-Query-F-004 ........................................ 51
Tabel 4.7 Pengujian Akurasi .......................................................................................... 52
xi
DAFTAR GAMBAR
Gambar 2.1 Proses Temu Balik Informasi ..................................................................... 6
Gambar 2.2 Proses Algoritma Porter .............................................................................. 9
Gambar 2.3 Proses Model Waterfall .............................................................................. 11
Gambar 3.1 Flowchart tahapan penelitian ..................................................................... 18
Gambar 3.2 Proses stemming dengan algoritma porter ................................................. 20
Gambar 3.3 Arsitektur Sistem ........................................................................................ 22
Gambar 3.4 Entity Relationship Diagram ...................................................................... 25
Gambar 3.5 DFD Level 0 ............................................................................................... 26
Gambar 3.6 DFD Level 1 ............................................................................................... 27
Gambar 3.7 DFD Level 2 Proses login .......................................................................... 28
Gambar 3.8 DFD Level 2 Proses mengelola password Admin ...................................... 28
Gambar 3.9 DFD Level 2 Proses mengelola buku ......................................................... 29
Gambar 3.10 DFD Level 2 Proses mencari buku ........................................................... 30
Gambar 3.11 Perancangan antarmuka halaman utama Guest ........................................ 34
Gambar 3.12 Perancangan antarmuka list hasil pencarian buku .................................... 34
Gambar 3.13 Perancangan antarmuka halaman utama ................................................... 35
Gambar 3.14 Perancangan antarmuka login ................................................................... 36
Gambar 3.15 Perancangan antarmuka halaman utama Admin ....................................... 36
Gambar 4.1 Implementasi tabel data user ...................................................................... 38
Gambar 4.2 Implementasi tabel data kata_dasar ............................................................ 39
Gambar 4.3 Implementasi tabel data buku ..................................................................... 39
Gambar 4.4 Implementasi tabel data penulis ................................................................. 39
Gambar 4.5 Implementasi tabel data penerbit ............................................................... 40
Gambar 4.6 Implementasi antarmuka halaman utama ................................................... 45
Gambar 4.7 Implementasi antarmuka list hasil pencarian buku ..................................... 45
Gambar 4.8 Implementasi antarmuka login ................................................................... 46
Gambar 4.9 Implementasi antarmuka halaman Admin ................................................... 46
Gambar 4.10 Form tambah buku .................................................................................... 47
Gambar 4.11 Halaman implementasi edit buku ............................................................. 47
Gambar 4.12 Peringatan form field kosong .................................................................... 48
xii
Gambar 4.13 Peringatan hapus buku .............................................................................. 48
Gambar 4.14 Implementasi ganti password Admin ........................................................ 48
1
BAB I
PENDAHULUAN
Bab ini menyajikan latar belakang masalah, rumusan masalah, tujuan dan manfaat,
ruang lingkup, dan sistematika tugas akhir mengenai Penerapan Stemming dengan Algoritma
Porter pada Query Pencarian Judul Buku.
1.1 Latar Belakang
Teknologi Informasi pada masa sekarang ini telah berkembang begitu cepat.
Semua orang dari berbagai kalangan sudah begitu lekat dengan teknologi informasi
komunikasi, terutama teknologi yang berhubungan dengan internet. Internet pada
umumnya digunakan untuk mendapat dan bertukar informasi dengan orang lain
dengan lebih cepat dan mudah.
Permasalahan yang biasanya mencuat dalam proses pencarian informasi ini
adalah seberapa akurat atau relevankah hasil pencarian dengan apa yang diinginkan
pengguna. Dalam pencarian suatu barang di sebuah website penjualan buku Edusarana
misalnya, yang masih menggunakan sistem pencarian buku yang tradisional, dimana
hasil kata kunci yang diketikkan pada form pencarian sesuai dengan barang yang ada.
Jika buku yang dicari tidak ada, maka hasil pencarian lain yang relevan atau hampir
sama juga dibutuhkan. Judul buku yang hampir serupa pada hasil pencarian,
memungkinkan user untuk melihat buku tersebut dan memungkinkan user untuk
membeli buku tersebut karena buku yang dicari tidak tersedia. Secara langsung hal ini
juga menguntungkan pemilik website, dikarenakan bukunya lebih memungkinkan
untuk terjual. Untuk mengatasi hal tersebut, diciptakanlah sebuah sistem yaitu sistem
temu balik informasi (STBI), atau sering disebut dengan Information Retrieval.
Information Retrieval memungkinkan pengguna untuk mencari informasi yang
tersimpan didalam dokumen secara efektif dan efisien. Efektif berarti User
mendapatkan dokumen yang relevan dengan query yang diinputkan. Efisien berarti
waktu pencarian yang sesingkat-singkatnya (Agusta, 2009).
Salah satu teknologi yang diajukan penulis yang berkaitan dengan Information
Retrieval adalah dengan melakukan stemming dengan Algoritma Porter pada query
yang dimasukkan dalam kolom pencarian yang ada dalam web pencarian judul buku.
2
Stemming merupakan suatu proses yang terdapat dalam sistem Information Retrieval
yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata
akarnya (root word) dengan menggunakan aturan-aturan tertentu. Aturan-aturan dalam
proses stemming tentu saja berbeda antara bahasa satu dengan bahasa lainnya. Sebagai
contoh, Bahasa Indonesia merupakan salah satu bahasa yang cukup rumit jika
dilakukan proses stemming dikarenakan banyaknya prefix dan suffix yang
memungkinkan mengiringi suatu kata.
Beberapa penelitian mengenai stemming menggunakan algoritma porter yang
pernah dilakukan antara lain oleh Lasmedi Afuan, seorang mahasiswa Fakultas Sains
dan Teknik Universitas Jendral Soedirman, tentang stemming dokumen teks bahasa
Indonesia menggunakan algoritma porter (Afuan, 2013). Ada juga Ledy Agusta,
mahasiswi Fakultas Teknologi Informasi Universitas Kristen Satya Wacana yang
membandingkan perbedaan hasil algoritma porter dan algoritma Nazief & Adriani
dalam melakukan stemming dalam Bahasa Indonesia (Agusta, 2009), penelitian
tersebut menyimpulkan bahwa algoritma porter mempunyai waktu proses stemming
30 buah dokumen dengan rata-rata 490 kata yang relatif lebih singkat, yaitu 0,37 detik
namun memiliki tingkat presisi yang lebih rendah, yaitu 70,56%. Hasil penelitian ini
juga menyimpulkan bahwa kamus kata dasar yang digunakan sangat mempengaruhi
waktu dan presisi proses stemming.
Oleh Karena itu, penulis melakukan penelitian untuk mengaplikasikan stemming
dengan Algoritma Porter pada fungsi pencarian judul buku, sehingga mampu
memberikan hasil pencarian yang relevan terhadap kata kunci yang diinputkan oleh
user.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, dapat dirumuskan permasalahan yang ada
adalah bagaimana membuat sistem pencarian dengan menggunakan algoritma
stemming porter pada query yang dimasukkan.
1.3 Tujusan dan Manfaat
Tujuan yang ingin dicapai dari penelitian ini adalah dihasilkannya sebuah sistem
pencarian judul buku pada web pencarian buku dengan metode stemming dengan
menggunakan Algoritma Porter.
3
Sedangkan manfaat dari penelitian ini adalah :
1. Mengimplementasikan ilmu yang telah di dapat selama duduk di bangku
perkuliahan.
2. Memudahkan User dengan pencarian yang lebih efektif dan efisien.
1.4 Ruang Lingkup
Dalam penyusunan tugas akhir ini, diberikan ruang lingkup yang jelas agar
pembahasan lebih terarah dan tidak menyimpang dari tujuan penelitian. Beberapa
ruang lingkup tersebut diantaranya ialah sebagai berikut:
1. Aplikasi dibuat menggunakan bahasa PHP (Hypertext Preprocessor) dan DBMS
(Database Management Sistem) MySQL (My Structured Query Language).
2. Penerapan algoritma porter hanya pada form pencarian pada halaman utama.
3. Untuk pemeriksaan kata dasar, tersedia database kata dasar yang dibuat oleh situs
bahtera.org, yang merupakan kamus kata dasar dari Bahasa Indonesia yang baku.
4. Database yang digunakan merupakan data buku yang terdapat pada web Edusarana,
dan tampilan buku tidak mengikutsertakan fungsi web yang lebih kompleks seperti
pembelian buku dan pembayaran buku. Tampilan web merupakan web yang
terpisah dan tidak berhubungan dengan web Edusarana.
5. Sistem ini dirancang dengan menggunakan metode waterfall dan pengujian
dilakukan dengan metode black box.
6. Penelitian ini akan dilakukan hanya sampai pada operation.
1.5 Sistematika Penulisan
Untuk memberikan suatu gambaran yang urut dan jelas mengenai pembahasan
maka penyusunan Penerapan Stemming dengan Algoritma Porter pada Query
Pencarian Judul Buku ini disesuaikan dengan sistematika penulisan, yaitu :
BAB I PENDAHULUAN
Bab ini membahas latar belakang, rumusan masalah, tujuan dan manfaat, ruang
lingkup, serta sistematika penulisan laporan yang dibuat.
4
BAB II LANDASAN TEORI
Bab ini menjelaskan tentang teori-teori yang digunakan untuk merancang
penyusunan Penerapan Stemming dengan Algoritma Porter pada Query
Pencarian Judul Buku dan teori lain yang mendukung pengembangannya.
BAB III ANALISIS KEBUTUHAN DAN PERANCANGAN SISTEM
Bab ini menjelaskan tentang analisis kebutuhan dan perancangan dari Penerapan
Stemming dengan Algoritma Porter pada Query Pencarian Judul Buku.
BAB IV IMPLEMENTASI DAN PENGUJIAN
Bab ini membahas tentang implementasi dan pengujian dari Penerapan
Algoritma Porter pada Query Pencarian Judul Buku.
BAB V PENUTUP
Bab ini membahas tentang kesimpulan dari bab – bab yang dibahas sebelumnya
serta saran bagi pembaca sebagai bahan masukan, dan penelitian yang
selanjutnya.
Recommended