Upload
dangtruc
View
225
Download
0
Embed Size (px)
Citation preview
PERBANDINGAN UNJUK KERJA STRUKTUR DATA
LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX
UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI
JUDUL BUKU KOLEKSI PERPUSTAKAAN
Studi Kasus Perpustakaan Universitas Sanata Dharma
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Diajukan Oleh:
Gabriel Indra Widi Tamtama 135314075
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
i
PERBANDINGAN UNJUK KERJA STRUKTUR DATA
LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX
UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI
JUDUL BUKU KOLEKSI PERPUSTAKAAN
Studi Kasus Perpustakaan Universitas Sanata Dharma
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Diajukan Oleh:
Gabriel Indra Widi Tamtama 135314075
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
COMPARISON OF THE PERFORMANCE OF LINKEDLIST AND
ARRAYLIST DATA STRUCTURE USING INVERTED INDEX TO SUPPORT
INFORMATION RETRIEVAL OF TITLE LIBRARY COLLECTION
Case Study: Sanata Dharma University Library
THESIS
Presented as Partial Fullfilment of the Requirements
To Obtain the Sarjana Komputer Degree
In Informatics Engineering
By:
Gabriel Indra Widi Tamtama 135314075
INFORMATICS ENGINEERING STUDY PROGRAM
DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
ABSTRAKSI
Perpustakaan merupakan tempat koleksi berbagai macam buku dan
memungkinkan setiap pengunjung untuk membaca dan meminjam buku di
perpustakaan. Tidak dipungkiri bahwa koleksi perpustakaan setiap tahun mengalamai
penambahan koleksi baik jenis buku maupun kategori. Begitu juga dengan
Perpustakaan Universitas Sanata Dharma. Sebelum adanya sistem pencarian judul
buku koleksi perpustakaan, pengunjung sering mengalami kesulitan ketika akan
mencari buku yang diinginkan. Maka untuk memudahkan pencarian buku dibuatlah
sistem pencarian yang mampu mencari judul buku sesuai dengan kebutuhan
pengunjung. Sistem pemerolehan informasi yang dibangun menggunakan struktur
data inverted index dengan arraylist dan linkedlist menawarkan kelebihan dalam
membantu pengunjung untuk mencari judul buku yang diinginkan.
Struktur data inverted index yang dibangun dengan arraylist dan linkedlist
diuji performanya dalam melakukan pencarian judul buku perpustakaan kemudian
dibandingkan hasilnya dengan sistem pencarian yang dimiliki oleh Perpustakaan
Universitas Sanata Dharma. Perbandingan dilakukan dengan membandingkan nilai
relevansi antara sistem pemerolehan informasi dan sistem pencarian yang dimiliki
perpustakaan. Hasil yang didapat yaitu kedua sistem pencarian mampu mencari judul
buku yang diinginkan sesuai dengan kebutuhan pengunjung. Selain itu, ditemukan
perbedaan antara sistem pemerolehan informasi dengan sistem pencarian yang
dimiliki perpustakaan Sanata Dharma.
Kata kunci: inverted index, arraylist, linkedlist, sistem pencarian, perpustakaan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRACT
Library is a book collection place where people can read and borrow book.
There is no doubt of the fact that books collection is increasing, whether it is from the
kinds of the book or the categories. It also happens with Sanata Dharma University
Library. Prior to the existence of the search system to find the collection of the book
from the library, many visitors have difficulties to find the desired book. From that
fact, the researcher designed a system which will help the visitor to find the collection
of the book that suit the needs of the visitor. Information retrieval system which is
made from inverted index data structure with arraylist and linkendlist offers some
advantages to help the visitor to find the desired collection of the book.
Inverted Index data structure which is built from the arraylist and the
linkedlist is tested by the performance and the result is compared with search system
of Sanata Dharma University Library. The comparison is done by comparing the
value of relevance between information acquisition system and search system which
the library has. The result is both of the systems can find the title of the desired book
according to the needs of visitors. Furthermore, the researcher found differences
between the information acquisition system and search system which Sanata Dharma
University Library has.
Keyword: inverted index, arraylist, linkedlist, search engine, library.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
KATA PENGANTAR
Puji dan syukur saya panjatkan kepada Tuhan Yang Maha Kuasa, karena
berkat kuasa dan rahmat-Nya saya dapat menyelesaikan Tugas Akhir ini dengan
lancar. Tugas akhir merupakan syarat dalam memperoleh gelar sarjana bagi
mahasiswa dan untuk Teknik Informatika untuk memperoleh gelar Sarjana Komputer
(S. Kom).
Tugas akhir ini selesai tak lepas dari bantuan dosen pembimbing, orang tua,
teman seperguruan, dan pihak-pihak lain yang turut membantu. Oleh karena itu,
perkenankan saya selaku penulis mengucapkan terima kasih kepada:
1. Bapak JB. Budi Darmawan, S.T., M.Sc., selaku dosen pembimbing yang
dengan sabar senantiasa memberi masukan dan bimbingan dalam
penyusunan tugas akhir ini.
2. Segenap dosen jurusan Teknik Informatika Universitas Sanata Dharma.
3. Keluarga, Agustinus Sukaryadi (Bapak), Maria Wahyuni (Ibu), dan
Monica Warih Widi Kristanti (Adik) yang selalu memberi dukungan
dalam penyusunan tugas akhir ini.
4. Responden yang membantu dalam pengujian sistem.
5. Teman-teman seperjuangan Teknik Informatika khususnya Arka, Kris,
Kasih, Medi, Windi, Valen, Baptista, Awan, Kris Hendra, Andre, Advent,
Joseph, Adit, Adhi, Ekky, Bagus, Lukas, Rusydi dan teman-teman yang
tidak dapat saya sebutkan satu persatu.
6. Seluruh pihak yang sudah membantu dalam pengerjaan tugas akhir saya
secara langsung maupun tidak langsung.
Saya selaku penulis menyadari bahwa tugas akhir ini masih banyak
kekurangan. Oleh karena itu, besar harapan saya untuk memberikan kritik dan saran
sehingga bisa saya gunakan di masa yang mendatang. Akhir kata semoga karya saya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
ini dapat digunakan dan bermanfaat bagi civitas akademika Universitas Sanata
Dharma maupun bagi pembaca yang lain.
Yogyakarta, 2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
DAFTAR ISI
HALAMAN PERSETUJUAN ..................................................................................... iii
PERNYATAAN KEASLIAN KARYA ...................................................................... iv
ABSTRAKSI ............................................................................................................... vi
ABSTRACT ................................................................................................................ vii
KATA PENGANTAR ............................................................................................... viii
DAFTAR ISI ................................................................................................................ xi
Daftar Tabel ............................................................................................................... xiv
Daftar Gambar ............................................................................................................. xv
BAB I
PENDAHULUAN ........................................................................................................ 1
1.1 Latar Belakang ............................................................................................... 1
1.2 Rumusan Masalah .......................................................................................... 4
1.3 Tujuan ............................................................................................................. 4
1.4 Batasan Masalah ............................................................................................. 5
1.5 Sistematika Penulisan ..................................................................................... 5
BAB II
TINJAUAN PUSTAKA ............................................................................................... 7
2.1 Pemerolehan Informasi ................................................................................... 7
2.2 Logical View Pada Document ........................................................................ 8
2.2.1 Stopwords ................................................................................................ 9
2.2.2 Stemming ................................................................................................. 9
2.3 Inverted Index ............................................................................................... 11
2.4 Pembobotan TF-IDF ..................................................................................... 15
2.5 Struktur Data ................................................................................................ 16
2.5 Precision dan Recall ..................................................................................... 17
BAB III METODOLOGI PENELITIAN.................................................................... 18
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
3.1 Gambaran Umum Penelitian ........................................................................ 18
3.2 Sumber Data ................................................................................................. 18
3.3 Spesifikasi Alat ............................................................................................. 18
3.4 Perbandingan Struktur Data ......................................................................... 19
3.5 Tahap-Tahap Penelitian .................................................................................... 20
BAB IV
ANALISA DAN PERANCANGAN SISTEM ........................................................... 23
4.1 Analisa Sistem .............................................................................................. 23
4.2 Analisis Kebutuhan Pengguna ...................................................................... 25
4.3 Perancangan Sistem ...................................................................................... 27
4.4 Rancangan Struktur Data Inverted Index ..................................................... 33
4.5 Algoritma pencarian dengan operator AND................................................. 34
4.6 Rancangan Basis Data .................................................................................. 34
4.7 Rancangan Desain Antarmuka ..................................................................... 37
BAB V
IMPLEMENTASI DAN ANALISIS HASIL ............................................................. 39
5.1 Spesifikasi Software dan Hardware ............................................................. 39
5.2 Implementasi Antar Muka (Interface) .......................................................... 40
5.3 Implementasi Stemming ............................................................................... 41
5.4 Implementasi inverted index ........................................................................ 41
5.5 Pengujian dan Analisa Hasil ....................................................................... 42
5.6 Perbandingan Relevansi Hasil Pencarian Judul Buku ................................. 42
5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi dengan
Sistem Pencarian Perpustakaan Sanata Dharma ..................................................... 48
5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List ................. 50
BAB VI
KESIMPULAN DAN SARAN ................................................................................... 52
DAFTAR PUSTAKA ................................................................................................. 54
Lampiran ..................................................................................................................... 56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
Lampiran I ............................................................................................................... 56
Lampiran II.............................................................................................................. 59
Lampiran III ............................................................................................................ 71
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
Daftar Tabel
Tabel 4. 1 Tabel buku_perpus ..................................................................................... 34
Tabel 4. 2 Table Terms ............................................................................................... 35
Tabel 4. 3 Tabel Sourceterm ....................................................................................... 35
Tabel 4. 4 Tabel Posting.............................................................................................. 36
Tabel 4. 5 Tabel posting_stopword ............................................................................. 36
Tabel 4. 6 Tabel stopwords ......................................................................................... 37
Tabel 5. 7 recall and precision ................................................................................... 46
Tabel 5. 8 precision dalam 11 titik recall ................................................................... 47
Tabel 5. 10 Perbedaan waktu pencarian ArrayList dan Linkedlist ............................. 50
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
Daftar Gambar
Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999) ............................... 7
Gambar 2. 2 Logical view ............................................................................................. 8
Gambar 2. 3 Inverted index (Manning, 2008) ............................................................. 12
Gambar 2. 4 Membangun inverted index (Manning, 2008) ........................................ 13
Gambar 2. 5 Intersection posting list (Manning, 2008) .............................................. 14
Gambar 2. 7 Linked list (Robert, 2003) ...................................................................... 17
Gambar 3. 1 Linked List .............................................................................................. 19
Gambar 3. 2 Array List ............................................................................................... 19
Gambar 3. 3 Metode waterfall (Pressman & Roger(2001)) ........................................ 21
Gambar 4. 1 LinkedList ............................................................................................... 23
Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996) ................. 24
Gambar 4. 3 Use Case Diagram ................................................................................. 25
Gambar 4. 4 Desain Kelas Analisis ............................................................................ 28
Gambar 4. 5 Entity Relationship Diagram .................................................................. 30
Gambar 4. 6 Logical design ........................................................................................ 32
Gambar 4. 7 Representasi Inverted Index ................................................................... 33
Gambar 4. 8 Halaman awal ......................................................................................... 37
Gambar 4. 9 Halaman hasil ......................................................................................... 38
Gambar 5. 1 Tampilan Awal ....................................................................................... 40
Gambar 5. 2 Halaman Hasil Pencarian ....................................................................... 40
Gambar 5. 4 Inverted index ......................................................................................... 41
Gambar 5. 5 Grafik precision dalam 11 titik recall .................................................... 73
Gambar 5. 6 Grafik precision dalam 11 titik recall ................................................... 44
Gambar 5. 7 Grafik precision dalam 11 titik recall .................................................... 46
Gambar 5. 8 Grafik precision dalam 11 titik recall .................................................... 48
Gambar 5. 9 Grafik relevansi sistem pencarian dan pemerolehan informasi ............. 49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Perpustakaan merupakan tempat koleksi buku-buku dan
memungkinkan orang untuk bisa membaca maupun meminjam buku di
perpustakaan. Buku-buku yang dikoleksi pun beraneka ragam jenis dan
kategori seperti pendidikan, kuliner, artikel, teknologi, agama dan jurnal.
Buku-buku yang dikoleksi ditempatkan sesuai dengan pengkategorian dan
jenis buku tersebut sehingga tidak jarang orang mengalami kesulitan ketika
mencari buku tersebut.
Secara konkrit, perpustakaan didefinisikan sebagai unit kesatuan dari
sebuah lembaga pendidikan yang berupa tempat penyimpanan koleksi buku-
buku pustaka. Ada beberapa jenis perpustakaan berdasarkan fungsi dan
tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan
umum, perpustakaan perguruan tinggi, perpustakaan sekolah, perpustakaan
khusus, perpustakaan keagamaan, perpustakaan internasional, perpustakaan
pribadi dan perpustakaan digital.
Seiring dengan kemajuan dan perkembangan teknologi informasi dan
komunikasi, maka keinginan orang untuk mendapat pengetahuan harus
semakin cepat dan ringkas. Namun, seringkali pengunjung perpustakaan
sering kehabisan waktu untuk mencari buku yang akan dibaca sehingga di
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
perpustakaan dibutuhkan suatu layanan yang dapat memberikan
kemudahan dalam menelusuri informasi tentang suatu buku dengan cepat,
ringkas, mudah dan efisien. Perpustakaan dituntut untuk bisa menyesuaikan
diri dengan perkembangan dan kemajuan teknologi dan mampu
menerapkannya untuk mendukung proses pencarian judul buku.
Perpustakaan perlu mengorganisasikan kembali koleksi dan informasi
yang ada dengan cara menciptakan katalog dan indeks dalam format web
sehingga bisa ditelusuri informasi yang ada dengan mudah.
Pemerolehan informasi (information retrieval) menjadi alternatif dan
memberikan kemudahan dalam mencari judul buku dalam web perpustakaan
karena mampu mencari dan mencocokkan kata kunci yang dimasukkan oleh
pengguna. Pemerolehan informasi merupakan salah satu bidang ilmu
komputer yang berhubungan dengan pengambilan informasi dari dokumen-
dokumen yang disimpan dalam basis data. Informasi atau data yang dicari
dapat berupa berupa teks, gambar, audio, video dan lain-lain. Koleksi data
teks yang dapat dijadikan sumber pencarian juga dapat berupa pesan teks,
seperti e-mail, fax, dan dokumen berita, bahkan dokumen yang beredar di
internet. Dengan jumlah dokumen koleksi yang besar sebagai sumber
pencarian, maka dibutuhkan suatu sistem yang dapat membantu user
menemukan buku yang sesuai dalam waktu yang efisien.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
Inverted index terbukti efisien dalam menjawab query dan diterapkan
pada kebanyakan sistem pemerolehan informasi berbasis web (Baeza-Yates,
2009).
Penelitian yang berkaitan dengan pemerolehan informasi sudah pernah
dilakukan oleh Puspitaningrum (2011) tentang pemerolehan informasi pada
undang-undang dengan menerapkan struktur data inverted index yang
bertujuan untuk mencari pasal-pasal dalam perundang-undangan.
Struktur data yang menjadi perhatian penulis adalah struktur data
array list dan linkedlist. Kedua struktur data tersebut sama-sama dapat
digunakan untuk membuat inverted index berdasarkan indexing dokumen.
Tujuan dari membandingkan kedua struktur data tersebut adalah mencari
keefisien pencarian yang diukur dengan kecepatan pencarian dalam mencari
judul buku koleksi perpustakaan Universitas Sanata Dharma. Alasan lain
penulis membandingkan dengan website perpustakaan Universitas Sanata
Dharma karena penulis ingin mengetahui bila pencarian judul buku
perpustakaan menggunakan model pemerolehan informasi jauh lebih baik
atau tidak dari sistem yang ada sekarang.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
1.2 Rumusan Masalah
- Bagaimana hasil unjuk kerja kecepatan sistem pemerolehan informasi
yang dibangun menggunakan struktur data arraylist dan linkedlist
dalam inverted index untuk pencarian judul buku perpustakaan
Universitas Sanata Dharma menggunakan operator AND?
1.3 Tujuan
Tujuan dari tugas akhir ini adalah:
- Mengetahui hasil unjuk kerja kecepatan sistem pemerolehan informasi
yang dibangun menggunakan struktur data arraylist dan linkedlist
dalam inverted index untuk pencarian judul buku perpustakaan
Universitas Sanata Dharma menggunakan operator AND.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
1.4 Batasan Masalah
Batasan-batasan masalah yang dijadikan dalam penulisan tugas akhir
adalah sebagai berikut :
- Pencarian berdasarkan judul buku dan kata kunci (query).
- Judul buku disimpan dalam basis data yang sama.
- Jumlah data yang disimpan sama.
- Perbedaan terletak pada penerapan struktur data array list dan
linkedlist.
1.5 Sistematika Penulisan
Untuk memudahkan penulisan tugas akhir, maka sistematika penulisan
dibagi menjadi lima bagian yaitu:
Bab I Pendahuluan
Bab ini berisi latar belakang, rumusan masalah, tujuan, batasan
masalah dan sistematika penulisan.
Bab II Tinjauan Pustaka
Bab ini berisi mengenai landasan teori berupa konsep dasar
pemerolehan informasi, struktur data, algoritma dan pengertian TF-
IDF.
Bab III Metodologi Penelitian
Bab ini berisi tentang metode penelitian yang akan digunakan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
Bab IV Perancangan dan Analisis Kebutuhan Sistem
Bab ini berisi penelitian yang dilakukan disertai dengan
pembahasan yang didapat setelah melakukan penelitian.
Bab V Implementasi dan Analisa Hasil
Bab ini berisi implementasi sistem yang telah dibuat beserta
analisis hasil yang diperoleh dari pengujian sistem.
Bab VI Kesimpulan dan Saran
Bab ini berisi mengenai kesimpulan dan saran yang didapat
setelah menyelesaikan tugas akhir.
DAFTAR PUSTAKA
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB II
TINJAUAN PUSTAKA
2.1 Pemerolehan Informasi
Pemerolehan informasi merupakan sistem untuk menemukan kembali
informasi-informasi yang berguna dan relevan terhadap kebutuhan pengguna
dari suatu kumpulan informasi secara otomatis. Mesin pencari atau search
engine merupakan salah satu contoh penerapan pemerolehan informasi
(Hasibuan & Andri, 2001).
Ingwersen (1992) mengartikan bahwa pemerolehan informasi
merupakan proses yang terlibat dalam representation, storage, pencarian, dan
mendapatkan informasi yang relevan untuk kebutuhan yang diperlukan
pengguna. Tipe dari informasi tersebut bisa berupa dokumen, halaman web,
katalog online, dan objek multimedia. Seiring dengan perkembangan
teknologi, pemerolehan informasi sudah melibatkan pemodelan, pencarian
web, visualisasi data, penyaringan dan bahasa dalam memperoleh informasi
yang relevan (Baeza-Yates, 1999).
Tahap-tahap pemerolehan informasi menurut Baeza-Yates (1999)
disajikan dalam Gambar 2.1 berikut ini:
Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
Terdapat lima (5) langkah dalam proses pemerolehan informasi yang
dijelaskan melalui Gambar 2.1. Tahap pertama yaitu text operation yakni
menghilangkan kata umum (stop words removal), pencarian kata dasar
(stemming), dan sebagainya. Sebagai contoh kata umum dalam bahasa
Indonesia adalah dan, di, ini, itu, yang, dan lain-lain.
Tahap kedua adalah query operations seperti penggunaan operator
AND, OR, dan NOT pada query. Tahap ketiga yaitu pengindeksan yang
bertujuan untuk mempercepat proses pencarian. Tahap keempat yaitu
pencarian yang dilakukan pada inverted file yang sudah dibangun. Tahap
kelima adalah pembobotan (ranking) terhadap dokumen yang diperoleh dari
proses pencarian.
2.2 Logical View Pada Document
Dokumen-dokumen pada koleksi tertentu sering digambarkan secara
langsung melalui keyword (kata kunci). Kata kunci tersebut diekstraksi
langsung dari teks pada dokumen atau dibuat secara manual oleh manusia.
Kata kunci atau index term ini menyediakan logical view dari dokumen.
Logical view dokumen merupakan gambaran proses dalam
membangun suatu rangkaian teks dalam dokumen. Untuk lebih jelas dalam
memahami logical view pada dokumen dari bentuk full text menjadi indexing
dapat dilihat pada Gambar 2.2 berikut ini:
Gambar 2. 2 Logical view
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
2.2.1 Stopwords
Merupakan kata umum yang biasanya muncul dalam jumlah
besar dan dianggap tidak memiliki makna. Stopwords perlu dieliminasi
dengan tujuan mengurangi waktu eksekusi query. Cara mengeliminasi
stopwords yaitu menghindari proses list yang panjang (Büttcher-
Clarke-Cormark, 2010), sehingga pengolahan teks (text processing)
akan berhenti ketika menemukan stopwords dan langsung
mengeliminasinya. Tujuan dari eliminasi stopwords adalah
mengurangi ukuran indeks, meningkatkan efisiensi dan keefektifan
dari pemerolehan informasi (Croft-Metzler-Strohman, 2010).
Beberapa kata yang termasuk dalam stopwords yaitu “the”, “a”,
“an”, “that”, “those”. Sedangkan dalam bahasa Indonesia, contoh kata
yang termasuk stopwords yaitu kata ganti orang (“dia”, “mereka”,
“beliau”, “kami”), kata penghubung (“lalu”, “namun”, “padahal”)
(Oktaviani, 2011).
2.2.2 Stemming
Stemming merupakan proses untuk menghilangkan prefik dan
sufik suatu kata bentukan menjadi kata dasar (Nazief & Adriani,
1996). Dalam pemerolehan informasi, stemming sangat diperlukan
untuk meningkatkan performa pemerolehan informasi dengan cara
mentranformasi kata-kata dalam sebuah dokumen teks menjadi kata
dasar.
Nazief & Adriani (1996) menggambarkan kata dasar Bahasa
Indonesia terdiri dari kombinasi berikut:
Prefiks 1+Prefiks 2+ kata dasar + Sufiks 3+Sufiks 2+Sufiks 1 ….(2.1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Algoritma stemming yang dibuat oleh Bobby Nazief dan Mirna
Adriani adalah sebagai berikut:
1. Cari kata yang akan di-stem dalam kamus kata dasar. Bila ditemukan
maka kata tersebut adalah kata dasar, maka algoritma berhenti.
2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”)
dibuang. Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”)
maka langkah ini diulangi lagi untuk menghapus possesive pronouns
(“-ku”, “-mu”, atau “-nya”).
3. Hapus Derivation Suffix (“-i”, “-an”, atau “-kan”). Jika kata
ditemukan dalam kamus maka algoritma berhenti, jika tidak maka
diteruskan ke langkah 3a.
a. Jika “-an” telah dihapus dan huruf terakhir adalah “-k” maka “-
k” juga dihapus. Jika ditemukan dalam kamus maka algoritma
berhenti. Jika tidak ditemukan maka menuju langkah 3b.
b. Akhiran yang dihapus (“-i”, “-an”, atau “-kan”) akan
dikembalikan dan selanjutnya masuk langkah 4.
4. Hilangkan Derivation Prefix (“di-“, “ke-“, “se-”,“me-”, “be-”,“pe”,
“te-”). Jika pada langkah 3 ada sufiks yang dihapus maka masuk
langkah 4a, jika tidak, lanjut ke langkah 4b.
a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan.
Jika ditemukan maka algoritma berhenti, jika tidak lanjut ke
langkah 4b.
b. For i = 1 to 3, tentukan tipe awalan kemudian hapus awalan.
Jika kata dasar belum juga ditemukan lakukan langkah 5, jika
sudah maka algoritma berhenti.
Catatan: jika awalan kedua sama dengan awalan pertama maka
algoritma berhenti.
5. Melakukan recording. Recording dilakukan dengan menambahkan
karakter recording di awal kata yang dipenggal.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
6. Jika langkah 1-5 sudah dilalui namun tidak membuahkan hasil, maka
kata awal diasumsikan sebagai kata dasar.
Terdapat juga beberapa aturan sebagai berikut:
1. Aturan reduplikasi
a. Jika kedua kata yang dihubungkan oleh kata penghubung
adalah kata yang sama maka kata dasarnya adalah bentuk
tunggalnya. Contoh “mata-mata” maka kata dasarnya adalah
“mata”.
b. Misalkan ada kata “bolak-balik”, “berbalas-balasan” maka
untuk mendapatkan kata dasarnya harus mengartikan kedua
kata secara terpisah. Jika kedua kata memiliki kata dasar yang
sama maka diubah menjadi bentuk tunggal. Contoh kata
“berbalas-balasan” terdiri dari kata “berbalas” dan “balasan”
yang memiliki kata dasar sama yaitu “balas”. Sedangkan pada
kata “bolak-balik” memiliki kata dasar yang berbeda maka
“bolak-balik” adalah kata dasar.
2. Tambahan bentuk awalan dan akhiran serta aturannya:
a. Setiap tipe awalan “mem-“, kata yang diawali dengan
awalan “memp-” memiliki tipe awalan “mem-”.
b. Tipe awalan “meng-“, kata yang diawali dengan awalan
“mengk-” memiliki tipe awalan “meng-”.
2.3 Inverted Index
Inverted index atau inverted file merupakan struktur data pokok yang
terdapat dalam sistem pemerolehan informasi (Büttcher-Clarke-Cormark,
2010). Tujuan adanya inverted index adalah untuk mempercepat proses
pencarian terms pada koleksi dokumen (Grossman-Frieder, 2004).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Inverted index memiliki dua komponen pokok yaitu dictionary dan
posting lists. Dictionary menyimpan daftar kata, sedangkan posting list
menyimpan identitas dokumen yang mengandung kata bersangkutan.
Contoh melakukan pengindeksan terhadap dokumen-dokumen yang
mengandung istilah tertentu dengan membuat inverted index yang terdiri dari
dictionary dan postings digambarkan pada gambar 2.3 berikut:
Gambar 2. 3 Inverted index (Manning, 2008)
Pada gambar 2.4 berikut merupakan gambaran secara keseluruhan dari
proses membangun inverted index (Manning, 2008):
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Gambar 2. 4 Membangun inverted index (Manning, 2008)
Di sebelah kiri pada gambar 2.4, terdapat beberapa istilah yang
disimpan
dalam kolom term dan diurutkan sesuai abjad. Di sebelah kolom term terdapat
kolom docID yang menunjukkan dokumen yang mengandung term tersebut.
Sebelah kanan pada gambar 2.4 menjelaskan bahwa istilah yang terdapat pada
kolom term dan docID dipisah ke dalam kolom term beserta doc. freq
(document frequency) dan disimpan dalam dictionary.
Dictionary berfungsi untuk menyimpan istilah-istilah dan mempunyai
pointer untuk menuju ke posting list pada setiap istilah. Sedangkan posting
list berfungsi untuk menyimpan list dari dokumen yang mengandung istilah
tertentu (Manning, 2008).
Misalkan mencari query AND dengan contoh “Brutus AND
Calpurnia”, maka langkah-langkahnya adalah sebagai berikut:
1. Temukan lokasi Brutus dalam Dictionary.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
2. Dapatkan posting list milik Brutus.
3. Temukan lokasi Calpurnia dalam Dictionary.
4. Dapatkan posting list milik Calpurnia.
5. Lakukan interseksi kedua dokumen yang hanya
mengandung kedua posting list tersebut.
Interseksi atau operasi pemotongan sangat penting untuk bisa
mendapatkan dokumen yang mengandung istilah dari kedua posting list
(Brutus dan Calpurnia) dengan cepat. Interseksi ini digambarkan dalam
gambar 2.5 berikut:
Gambar 2. 5 Intersection posting list (Manning, 2008)
Berikut ini merupakan algoritma untuk melakukan pemotongan kedua
posting list pada gambar 2.5 (Manning, 2008):
INTERSECT (p1,p2)
1. answer ← ( )
2. while p1 ≠ NIL and p2 ≠ NIL
3. do if docID(p1) = docID(p2)
4. then ADD(answer, docID(p1))
5. p1 ← next(p1)
6. p2 ← next(p2)
7. else if docID(p1) < docID(p2)
8. then p1 ← next(p1)
9. else p2 ← next(p2)
10. return answer
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
2.4 Pembobotan TF-IDF
Term Frequency (TF) dan Inverse Document Frequency (IDF)
merupakan skema pembobotan yang populer pada pemerolehan informasi
(Baeza-Yates, 1999). Metode TF-IDF merupakan metode untuk menghitung
bobot setiap kata yang paling umum digunakan.
Savoy (1993) merumuskan pembobotan TF-IDF sebagai berikut:
Wij = ntfij * nidfj …………(2.2)
dimana
dan
…………(2.3)
Keterangan:
- Wij adalah bobot istilah pada Tj pada dokumen Di.
- tfij adalah frekuensi dari Tj dalam dokumen Di.
- m adalah jumlah dokumen Di.
- dfj adalah jumlah dokumen yang mengandung istilah Tj.
- Max tfi merupakan frekuensi terbesar pada satu dokumen.
Pada teknik ini, bobot istilah sudah dalam keadaan dinormalisasi.
Penentuan bobot ditentukan dari jumlah frekuensi kemunculan istilah di satu
dokumen dan frekuensi terbesar pada suatu istilah yang dimiliki dokumen
bersangkutan. Jumlah dokumen pun diperhitungkan dalam teknik pembobotan
TF-IDF untuk mengetahui posisi relatif bobot istilah yang bersangkutan pada
suatu dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki
istilah yang sama. Oleh karena itu, jika sebuah istilah memiliki jumlah
frekuensi kemunculan yang sama pada dua dokumen maka nilai bobotnya
belum tentu sama (Hasibuan, 2001).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
2.5 Struktur Data
Sebelum lebih lanjut berbicara tentang arraylist terlebih dahulu
membahas mengenai array. Array merupakan sekelompok variable (disebut
elemen atau komponen) yang memiliki nilai dan bertipe sama. Namun, array
tidak mendukung untuk mengubah ukuran kapasitas secara otomatis (Deitel,
2012). Maka, untuk memberi solusi permasalahan pada array tersebut
dikembangkan struktur data yaitu ArrayList.
ArrayList merupakan implementasi dari sebuah array dalam suatu list.
ArrayList memiliki sifat fleksibel dan dapat ditingkatkan kapasitas
penyimpanannya secara otomatis. ArrayList memungkinkan untuk mengakses
elemen-elemennya secara acak dalam waktu yang bersamaan.
Gambar 2. 6 Array
Linked list adalah suatu bentuk struktur data, berisi kumpulan data
(node) yang terhubung secara sekuensial, saling sambung menyambung,
dinamis, dan terbatas. Ukuran linked list menjadi dinamis karena
menyesuaikan jumlah node yang dimasukkan kedalam rantai node (Robert,
2003). Linked list pertama kali dikembangkan oleh Allen Newell, Cliff Shaw
dan Herbert Simon di RAND Corporation pada tahun 1955-1956 sebagai
struktur data utama untuk bahasa Information Processing Language (IPL).
Dalam linked list, setiap data terhubung dalam sebuah link. Setiap link
objek mengandung referensi (biasa disebut next) pada setiap link selanjutnya.
Gambar 2.7 menggambarkan pengertian dari linked list (Robert, 2003):
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
Gambar 2. 7 Linked list (Robert, 2003)
Data yang satu terhubung pada link yang lain sehingga membentuk
seperti suatu rantai.
2.5 Precision dan Recall
Dalam pemerolehan informasi, keakurasian perlu diukur dan
dianalisis. Untuk menganalisis keakurasian diperlukan precision dan recall.
Recall adalah istilah yang digunakan untuk dokumen terpanggil yang relevan
dengan query yang dimasukkan pengguna dalam pemerolehan informasi.
Precision adalah jumlah dokumen relevan dari total jumlah dokumen yang
ditemukan oleh sistem.
Precision dan recall dirumuskan sebagai berikut (Manning, 2008):
Precision=
……....(2.4)
Recall =
.……(2.5)
Interpolasi = …………..(2.6)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
BAB III
METODOLOGI PENELITIAN
3.1 Gambaran Umum Penelitian
Penelitian ini dilakukan untuk membandingkan kecepatan struktur
data arraylist dan linked list. Objek yang menjadi penelitian adalah judul buku
koleksi perpustakaan Universitas Sanata Dharma. Diharapkan penelitian ini
bermanfaat bagi pihak perpustakaan maupun pihak mahasiswa yang akan
mencari buku-buku yang dikoleksi oleh perpustakaan Universitas Sanata
Dharma.
3.2 Sumber Data
Sumber data berasal perpustakaan Universitas Sanata Dharma. Data
yang diambil berupa judul buku yang merupakan koleksi dari perpustakaan
Universitas Sanata Dharma.
Teknik pengumpulan data dilakukan dengan survey di perpustakaan
Universitas Sanata Dharma dan melakukan wawancara dengan berbagai pihak
pengelola perpustakaan.
3.3 Spesifikasi Alat
Sistem dibuat dengan minimal spesifikasi software dan hardware
sebagai berikut:
a. Spesifikasi hardware:
- Processor Intel Core i-5 4200U CPU @ 1.60 GHz 2.30 GHz
- RAM 4 GB
- Hard Disk Drive 500 GB
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
b. Spesifikasi software:
- Windows 10 Pro 64 bit Operating System
- Compiler IDE NetBeans 8.0
- Oracle Database
3.4 Perbandingan Struktur Data
Struktur data yang akan dibandingkan oleh peneliti adalah struktur
data inverted index dengan menggunakan arraylist dan linked list. Struktur
data inverted index akan dijelaskan lebih lanjut pada bab 4. Adapun gambar
mengenai arraylist dan linkedlist ditampilkan pada gambar 2.8 dan 2.9 berikut
ini:
Gambar 3. 1 Linked List
Dibandingkan dengan:
Gambar 3. 2 Array List
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
3.5 Tahap-Tahap Penelitian
3.5.1 Studi Kasus
Kasus yang akan dipelajari adalah kebiasaan pengunjung
perpustakaan dalam memasukkan kata kunci pada saat melakukan
pencarian buku di perpustakaan Universitas Sanata Dharma.
3.5.2 Studi Pustaka
Studi pustaka yang dilakukan adalah mencari dan memahami
informasi-informasi beserta teori yang berkaitan dengan materi
pemerolehan informasi maupun struktur data. Dalam penelitian ini,
penulis mempelajari literatur yang berkaitan dengan struktur data
arraylist dan linked list yang keduanya sama-sama dapat digunakan
untuk membuat inverted index. Literature yang dipelajari akan
membantu peneliti untuk membangun sistem pencarian judul buku
perpustakaan Universitas Sanata Dharma.
3.5.3 Pengembangan Perangkat Lunak
3.5.3.1 Metode Pengembangan Perangkat Lunak
Metode yang digunakan peneliti dalam
mengembangkan perangkat lunak adalah waterfall. Pressman
& Roger (2001) menuturkan bahwa metode waterfall
merupakan metode pengembangan perangkat lunak yang
dilakukan secara berurutan, dan kemajuan dipantau secara
terus menerus mengalir ke bawah. Fase-fase yang dilalui dalam
pengembangan perangkat lunak metode waterfall yaitu
perencanaan, pemodelan, implementasi, dan pengujian.
Gambar 3.5.3 menggambarkan alur proses dari metode
waterfall dan disajikan seperti berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
Gambar 3. 3 Metode waterfall (Pressman & Roger(2001))
Ada lima tahap yang digunakan dalam metode
waterfall yaitu:
a. Analisa
Langkah ini merupakan analisa terhadap kebutuhan sistem.
Pengumpulan data dalam tahap ini bisa melalui wawancara,
studi literatur, dan studi kasus. Wawancara yang dilakukan
adalah mewawancarai pengunjung perpustakaan.
Wawancara digunakan untuk mencari informasi sebanyak
mungkin dari pengguna sehingga sistem pencarian yang
dibuat sesuai dengan kebutuhan pengguna.
b. Design
Proses design adalah proses mengubah hasil analisa
menjadi representasi kebutuhan perangkat lunak yang dapat
diprediksi bentuk dan fungsinya sebelum diubah ke dalam
bahasa pemrograman. Titik fokus pada proses ini terletak
pada struktur data, arsitektur perangkat lunak, tampilan
user interface, dan algoritma.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
c. Implementasi (Coding)
Coding merupakan proses penerjemahan dari desain ke
dalam bahasa pemrograman. Dalam tahap ini, programmer
akan membangun sistem yang dibutuhkan oleh pengguna.
d. Testing (Pengujian)
Testing merupakan tahap yang dilalui setelah pengkodean
selesai. Tujuan dari pengujian adalah menguji kemampuan
dan performa dari sistem yang telah dibangun. Selain itu,
pengujian juga bermanfaat untuk menemukan kesalahan
maupun error yang kemungkinan masih dapat ditemukan
dan selanjutnya dilakukan perbaikan.
e. Pemeliharaan
Merupakan tahap akhir dari metode waterfall. Sistem yang
sudah selesai dibangun dan melewati beberapa tahap
kemudian dijalankan dan dilakukan pemeliharaan.
Pemeliharaan yang dimaksud adalah meningkatkan
performa dan perbaikan fitur-fitur yang mungkin masih
bisa terjadi error.
f. Analisis Hasil
Hasil pencarian judul buku yang ditemukan dari sistem
pemerolehan informasi dengan sistem pencarian
perpustakaan minimal sama. Selanjutnya adalah menguji
unjuk kerja struktur data inverted index yang dibangun
menggunakan arraylist dan linkedlist.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
BAB IV
ANALISA DAN PERANCANGAN SISTEM
4.1 Analisa Sistem
4.1.1 Analisis Kerja ArrayList dan Linkedlist
Cara Kerja Linked List
Linked list merupakan struktur data yang memungkinkan untuk
menyimpan obyek. Obyek yang dimaksud adalah obyek yang
mengimplementasikan antarmuka dari list tersebut. Obyek tersebut disimpan
dalam bentuk elemen-elemen. Elemen-elemen tersebut saling terhubung
dalam suatu reference yang disebut dengan link. Gambar 4.1 berikut
memudahkan dalam pemahaman mengenai linked list.
Gambar 4. 1 LinkedList
Linked list mendukung berbagai metode berbasis indeks seperti get
dan indexOf. Indeks selalu dimulai dari angka nol (0) sehingga bila terdapat
tiga elemen, maka elemen pertama terletak pada indeks nol (0), elemen kedua
pada indeks pertama (1) dan begitu seterusnya (Collins, 2001).
Cara Kerja ArrayList
ArrayList dapat dikatakan sebagai perbaikan dari satu dimensi array.
Seperti array, kelas ArrayList mendukung akses semua elemennya secara
acak. Artinya, semua elemen dapat diakses dalam waktu yang sangat singkat
dan setiap elemen mempunyai indeks. Tidak seperti array, ukuran obyek
dalam ArrayList secara otomatis dipertahankan selama eksekusi program.
Ukuran default arraylist adalah 10 (sepuluh) dan ketika penuh maka akan
mengalamai penggembungan ukuran dengan cara kapasitas yang lama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
ditambah nilai kapasitas lama + 1. Jika data penuh, maka elemen lama
dikopikan ke kapasitas baru ditambah dengan data baru.
Gambar 6. 1 ArrayList
4.1.2 Gambaran Sistem
Sistem Pemerolehan Informasi Judul Buku Perpustakaan Universitas
Sanata Dharma dikembangkan untuk membantu mahasiswa dalam mencari
judul buku yang dibutuhkan. Namun, sistem pemerolehan informasi yang
akan dikembangkan adalah sistem yang membandingkan kecepatan dalam
pencarian judul buku perpustakaan. Tujuannya adalah mencari metode
pencarian yang efekif, cepat dan mampu mengembangkan pencarian dalam
website perpustakaan Universitas Sanata Dharma.
Arsitektur perancangan sistem pemerolehan informasi ditunjukkan
dalam gambar berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996)
Berdasarkan struktur tersebut, sistem melakukan text operation pada
koleksi judul buku, berupa pembuangan kata dan stemming. Langkah
selanjutnya sistem melalukan indexing kata dan dokumen pada RDBMS.
Sistem mengambil index dari RDBMS ke random access memory secara
periodik di dalam inverted index serta melakukan pembobotan.
Proses pencarian melibatkan user yang memasukkan pencarian
menggunakan query yang selanjutnya masuk pada tahap text processing.
Sistem melakukan pencarian pada inverted index dengan operasi AND
kemudian melakukan ranking berdasarkan bobot dokumen. Hasil dokumen
yang sudah memiliki peringkat ditampilkan melalui user interface.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
4.2 Analisis Kebutuhan Pengguna
4.2.1 Use Case Diagram
Sistem ini diperuntukkan kepada pengguna (user) sehingga use case
diagram digambarkan sebagai berikut:
Gambar 4. 3 Use Case Diagram
Sistem pemerolehan informasi judul buku perpustakaan diakses oleh
satu aktor yaitu pengguna. Gambar use case diagram diatas dijelaskan dengan
tabel berikut ini:
Tabel 4. 1 Keterangan Use Case Diagram
Aktor Keterangan
Pengguna 1. Dapat melakukan
searching judul buku
perpustakaan.
4.2.2 Skenario Use Case
a. Mencari Judul Buku Perpustakaan
Tabel 4. 2 Mencari Judul Buku Perpustakaan
Nama Use Case Mencari judul buku perpustakaan
ID Use Case 1
Prioritas Tinggi
Aktor Pengguna
Deskripsi Use case ini merupakan proses untuk pencarian
judul buku perpustakaan
Pra kondisi Aktor berada di halaman utama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Pemicu Aktor akan melakukan pencarian judul buku
perpustakaan.
Langkah utama Aksi Aktor Reaksi Sistem
Langkah 1:
Aktor memasukkan
kata kunci dan
menekan tombol cari.
Langkah 2:
Sistem akan
mengecek kata kunci
yang dimasukkan
Langkah 3:
Sistem akan
menampilkan hasil
pencarian
Langkah
alternatif
Jika kata kunci yang dimasukkan tidak ada,
maka sistem akan memberi tahu aktor bahwa
kata kunci yang dicari tidak ditemukan.
Kesimpulan Use case ini digunakan untuk pencarian judul
buku perpustakaan dan akan berhenti bila aktor
menemukan judul buku yang dicari
Pasca kondisi Aktor menemukan judul buku yang dicari.
Aktor tidak berhasil menemukan judul buku
yang dicari karena kata kunci yang dimasukkan
tidak ditemukan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
4.3 Perancangan Sistem
4.3.1 Desain Logikal
4.3.1.1 Diagram Aktifitas
4.3.1.1.1 Mencari Judul Buku
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
4.3.1 Desain Model Kelas Analisis
Berikut ini merupakan desain model kelas analisis untuk sistem
pemerolehan informasi judul buku:
Gambar 4. 4 Desain Kelas Analisis
4.3.2 Diagram Sequence
4.3.2.1 Mencari Judul Buku
Berikut ini merupakan diagram sequence alur pencarian judul
buku yang dilakukan oleh pengguna:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Gambar 4. 5 Diagram Sequence
4.3.3 Perancangan Database
4.3.3.1 Desain Konseptual
Desain konseptual database disajikan dalam bentuk ERD yang
ditunjukkan pada gambar 4.6 berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Gambar 4. 6 Entity Relationship Diagram
4.3.3.2 Desain Logical
Hubungan relasi antar tabel pada database perpustakaan ditunjukkan
pada gambar 4.6 berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
Gambar 4. 7 Logical design
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
4.4 Rancangan Struktur Data Inverted Index
Inverted index merupakan indeks yang terbentuk dari proses
pengindeksan. Pengindeksan (indexing) merupakan cara untuk memudahkan
proses pencarian dengan tujuan meningkatkan efisiensi pencarian. Dengan
melakukan pengindeksan pada dokumen yang akan dicari, maka pencarian
dokumen dengan query tertentu tidak perlu dilakukan secara sekuensial atau
diperiksa satu persatu. Inverted index memotong tiap kata (term) yang berbeda
dari suatu daftar dokumen.
Struktur data inverted index merupakan pasangan term dan posting list
di dalam sebuah dokumen (t{d1,d2,3}). Istilah t merujuk pada term sedangkan
d1-d3 merujuk pada dokumen. Sebagai contoh, misalkan jika t1 terdapat pada
dokumen d1, d2, d5 sedangkan t2 terdapat pada dokumen d2, d5 maka inverted
index yang dihasilkan adalah sebagai berikut:
t1 d1, d2, d5
t2 d2, d5
Rancangan struktur data untuk inverted index akan dijelaskan pada
diagram berikut ini:
Gambar 4. 8 Representasi Inverted Index
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
4.5 Algoritma pencarian dengan operator AND
Sistem pemerolehan informasi yang dibangun menggunakan operator
AND. Operator AND merupakan fungsi yang digunakan untuk menguji
beberapa nilai atau kondisis sekaligus untuk menghasilkan nilai true or false.
Operator AND memiliki ketentuan yaitu bernilai true jika semua kondisi
argument terpenuhi dan bernilai false jika salah satu argument tidak terpenuhi.
Algoritma AND dijelaskan berikut ini:
1. answer ← ( )
2. while p1 ≠ NIL and p2 ≠ NIL
3. do if docID(p1) = docID(p2)
4. then ADD(answer, docID(p1))
5. p1 ← next(p1)
6. p2 ← next(p2)
7. else if docID(p1) < docID(p2)
8. then p1 ← next(p1)
9. else p2 ← next(p2)
10. return answer
4.6 Rancangan Basis Data
Basis data yang digunakan yaitu Oracle 11g dengan tools yaitu aplikasi SQL
Developer. Database ini digunakan untuk menyimpan teks judul-judul buku
yang merupakan koleksi Perpustakaan Universitas Sanata Dharma.
Berikut ini merupakan rancangan tabel-tabel untuk membangun sistem
pemerolehan informasi judul buku perpustakaan:
1. Tabel buku_perpus
Tabel 4. 1 Tabel buku_perpus
Nama Field Tipe Data Ukuran Keterangan
ID_Buku bigint Merupakan id buku
perpustakaan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
ISBN varchar 300 Nomor ISBN Buku
Judul_Buku Varchar 500 Judul dari buku
Klasifikasi Varchar 300 Klasifikasi dari buku
Tahun Integer 11 Tahun dari sebuah buku
Id_status_ready Integer Status untuk buku
Id_status2 Integer Status untuk pencarian
2. Tabel terms
Tabel 4. 2 Table Terms
Nama Field Tipe Data Ukuran Keterangan
Id_term Integer ID untuk term
terms varchar 50 Term dari sebuah judul
buku
Stemmed_word varchar 50 Term yang sudah di
stemming
Is_root_word char 1 Untuk mengecek sebuah
kata termasuk kata dasar
atau bukan
3. Tabel sourceterm
Tabel 4. 3 Tabel Sourceterm
Nama Field Tipe Data Ukuran Keterangan
Id_sourceterm Integer Merupakan primary key
untuk tabel sourceterm
Id_term Integer Merupakan foreign key
untuk tabel terms
Word varchar 50 Kata tanpa proses
stemming
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Is_root_word char 1 Keterangan yang
menunjukkan bila kata
terdapat dalam kamus. 1
untuk benar, dan 0 untuk
salah
4. Tabel posting
Tabel 4. 4 Tabel Posting
Nama Field Tipe data Ukuran Keterangan
ID_Buku Bigint 10 Merupakan foreign key
dari tabel buku_perpus
Id_term Integer - Merupakan foreign key
dari tabel terms
frequency Integer - Merupakan frequency dari
sebuah kata
Ntfik Integer - Merupakan hasil
perhitungan frequency
w integer - Bobot dari sebuah term
5. Tabel posting_stopword
Tabel 4. 5 Tabel posting_stopword
Nama Field Tipe Data Ukuran Keterangan
ID_Buku Integer - Merupakan foreign key
dari tabel buku_perpus
Id_stopword Integer - Merupakan foreign key
dari tabel stopword
Frequency integer - Merupakan frequency
stopword pada buku.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
6. Tabel stopwords
Tabel 4. 6 Tabel stopwords
Nama Field Tipe data Ukuran Keterangan
Id_stopword integer - Merupakan primary key
pada tabel stopwords
stopword varchar 50 Merupakan daftar kata
yang merupakan
stopword
4.7 Rancangan Desain Antarmuka
Antar muka sistem pemerolehan informasi terdiri dari satu tampilan yakni
halaman pencarian. Pada halaman pencarian, pengguna diminta untuk
memasukkan keyword yang akan dicari, kemudian bisa menekan Enter atau
mengklik tombol Search.
Tampilan dari halaman pencarian digambarkan dalam ilustrasi berikut ini:
Gambar 4. 9 Halaman awal
Sedangkan hasil pencarian masih merujuk pada halaman utama, namun
hasil dari pencarian akan ditampilkan di bawah tombol Search sebagaimana
ditampilkan berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Gambar 4. 10 Halaman hasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
BAB V
IMPLEMENTASI DAN ANALISIS HASIL
5.1 Spesifikasi Software dan Hardware
5.1.1 Spesifikasi Software (Perangkat Lunak)
Sistem yang dibangun menggunakan perangkat lunak yang
mendukung untuk implementasi pemrosesan teks dan pencarian judul buku
yaitu:
a. Sistem Operasi : Windows 10 Pro
b. SQL Developer
c. NetBeans IDE 8.0
d. Browser: Mozilla Firefox
5.1.2 Spesifikasi Hardware (Perangkat Keras)
Perangkat keras yang diperlukan untuk membuat sistem pencarian
judul buku koleksi perpustakaan Universitas Sanata Dharma yaitu:
a. Memory RAM: 4GB DDR3
b. Processor Intel i5 4200U
c. Harddisk: 500GB
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
5.2 Implementasi Antar Muka (Interface)
5.2.1 Implementasi Halaman Awal
Gambar 5. 1 Tampilan Awal
5.2.2 Implementasi Halaman Hasil Pencarian
Gambar 5. 2 Halaman Hasil Pencarian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
5.3 Implementasi Stemming
Stemming digunakan untuk menghilangkan prefix dan suffix suatu kata
bentukan menjadi kata dasar. Stemming sangat diperlukan untuk
meningkatkan performa pemerolehan informasi dengan cara mentransformasi
kata-kata dalam sebuah dokumen teks menjadi kata dasar.
Proses stemming didukung dengan daftar kata-kata dasar yang
diperoleh dari Kamus Besar Bahasa Indonesia. Implementasi stemming
diambil dari kelas Stemming yang dibuat oleh Reza Darojad (2008)
menggunakan algoritma Nazief dan Andriani.
5.4 Implementasi inverted index
Inverted index digunakan untuk menambahkan data posting yang baru
dari indeks posisi 0 dan menemukan posisi indeks yang tepat berdasarkan
nomor id_document data posting baru dibandingkan dengan id dokumen yang
sudah ada.
Berikut ini merupakan listing program untuk inverted index yang
berfungsi untuk menambahkan kata dalam posting:
Gambar 5. 3 Inverted index
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
5.5 Pengujian dan Analisa Hasil
5.5.1 Hasil Pengujian
Data judul buku perpustakaan yang digunakan sebanyak 135425 buah
judul. Data tersebut diambil sampel sebanyak 538 judul buku dengan
memastikan jumlah judul buku yang diambil sama dengan hasil pencarian
pada website perpustakaan. Data-data tersebut diperoleh dari pihak
Perpustakaan Universitas Sanata Dharma. Kamus kata yang digunakan
diambil dari Kamus Besar Bahasa Indonesia sebanyak 28526 kata dasar yang
digunakan untuk proses stemming. Jumlah stopword yang dipakai sebanyak
399 kata dan menghasilkan term sebanyak 60531.
Salah satu tujuan dari pengujian ini adalah membandingkan unjuk
kerja struktur data inverted index yang dibuat menggunakan arraylist dan
linkedlist. Cara pengujian adalah memasukkan keyword pada sistem
pemerolehan informasi yang dibangun.
Cara melakukan pengujian yaitu dengan mencari responden sebanyak
10 orang. Masing-masing orang memasukkan kata kunci judul buku
perpustakaan yang akan dicari.
5.6 Perbandingan Relevansi Hasil Pencarian Judul Buku
Perbandingan relevansi yang dimaksud adalah membandingkan antara
sistem pemerolehan informasi yang dibuat dengan website dari Perpustakaan
Universitas Sanata Dharma. Adapun cara membandingkan adalah dengan
memasukkan kata kunci yang sama kemudian dihitung recall and precision
untuk menentukan relevansi judul buku yang dicari. Berikut ini adalah hasil
perbandingan antara sistem pemerolehan informasi dengan website
perpustakaan Universitas Sanata Dharma.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
5.6.1 Kata Kunci “struktur data”
5.6.1.1 Pencarian pada Sistem Pencarian Perpustakaan
Responden mencoba untuk mencari judul buku yang berkaitan dengan
kata kunci “struktur data”. Hasilnya, sistem menemukan 17 judul buku yang
relevan dalam bahasa Indonesia. Maka perhitungan recall (persamaan (2.4))
dan precision (persamaan (2.5)) adalah sebagai berikut
Recall =
=
= 1
Precision =
=
= 1
Tabel 5. 1 recall and precision
Relevan Recall Precision
R 0.0588 1
R 0.1176 1
R 0.1765 1
R 0.2353 1
R 0.2941 1
R 0.3529 1
R 0.4118 1
R 0.4706 1
R 0.5294 1
R 0.5882 1
R 0.6471 1
R 0.7059 1
R 0.7647 1
R 0.8235 1
R 0.8824 1
R 0.9412 1
R 1.0000 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Percision menjadi bernilai 1 semua dikarenakan tidak menyertakan
judul buku dalam bahasa Inggris dari kata kunci “struktur data”. Maka
perhitungan precision dalam 11 titik recall menjadi seperti berikut:
Tabel 5. 2 precision dalam 11 titik recall
Recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
Dan bila digambarkan dalam bentuk grafik adalah seperti berikut:
Gambar 5. 3 Grafik precision dalam 11 titik recall
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90%100%
Interpolation
Interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
5.6.1.2 Pencarian pada Sistem Pemerolehan Informasi dengan Arraylist
Responden mencoba untuk mencari buku dengan kata kunci pencarian
“struktur data”. Hasilnya sistem menemukan 17 buku yang relevan dengan
kata kunci pencarian. Maka perhitungan recall and precision adalah sebagai
berikut:
Tabel 5. 3 recall and precision
Relevan Recall Precision
R 0.0588 1
R 0.1176 1
R 0.1765 1
R 0.2353 1
R 0.2941 1
R 0.3529 1
R 0.4118 1
R 0.4706 1
R 0.5294 1
R 0.5882 1
R 0.6471 1
R 0.7059 1
R 0.7647 1
R 0.8235 1
R 0.8824 1
R 0.9412 1
R 1.0000 1
Maka perhitungan precision dalam 11 titik recall menjadi seperti
berikut:
Tabel 5. 4 precision dalam 11 titik recall
Recall Precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
80% 1
90% 1
100% 1
Rata-rata 1
Berdasarkan tabel nilai precision dalam 11 titik recall tersebut, jika
digambarkan dalam grafik menjadi seperti berikut:
Gambar 5. 4 Grafik precision dalam 11 titik recall
5.6.1.3 Pencarian pada Sistem Pemerolehan Informasi dengan Linkedlist
Dengan menggunakan kata kunci yang sama yakni “struktur data”
hasilnya adalah website perpustakaan Universitas Sanata Dharma menemukan
16 buku yang relevan dengan kata kunci pencarian. Maka perhitungan recall
and precision adalah sebagai berikut:
Tabel 5. 5 recall and precision
Relevan Recall Precision
R 0.0625 1
R 0.1250 1
R 0.1875 1
R 0.2500 1
R 0.3125 1
R 0.3750 1
R 0.4375 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10%20%30%40%50%60%70%80%90%100%
Interpolation
Interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
R 0.5000 1
R 0.5625 1
R 0.6250 1
R 0.6875 1
R 0.7500 1
R 0.8125 1
R 0.8750 1
R 0.9375 1
R 1.0000 1
Maka perhitungan precision dalam 11 titik recall adalah seperti
berikut:
Tabel 5. 6 precision dalam 11 titik recall
recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
Maka bila digambarkan dengan bentuk grafik adalah seperti berikut ini:
Gambar 5. 5 Grafik precision dalam 11 titik recall
5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi
dengan Sistem Pencarian Perpustakaan Sanata Dharma
Berdasarkan perhitungan recall and precision untuk perbandingan
hasil pencarian antara sistem pencarian yang dimiliki dengan sistem
pemerolehan informasi yang dibangun, maka dapat disimpulkan perbandingan
rata-rata precision sebagai berikut:
Tabel 5. 7 Perbandingan rata-rata precision
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Interpolation
Interpolation
Recall
Rata-rata precision
sistem pencarian
perpustakaan
rata-rata precision sistem
pemerolehan informasi
menggunakan arraylist
rata-rata precision sistem
pemerolehan informasi
menggunakan linkedlis
0% 1 1 1
10% 1 1 1
20% 1 1 1
30% 1 1 1
40% 1 1 1
50% 1 1 1
60% 1 1 1
70% 1 1 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
Berdasarkan tabel tersebut maka dapat disajikan dalam bentuk grafik sebagai
berikut:
Gambar 5. 6 Grafik relevansi sistem pencarian dan pemerolehan informasi
Berdasarkan grafik tersebut, sistem pemerolehan informasi judul buku
perpustakaan berhasil dikembangkan dibuktikan dengan hasil yang sama dengan
sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma. Dalam proses
evaluasi dan pengujian lebih lanjut, penulis menemukan bahwa sistem
pemerolehan informasi lebih baik dibandingkan sistem pencarian yang dimiliki
oleh perpustakaan Sanata Dharma. Evaluasi dilakukan dengan melakukan
pengujian terhadap sistem pencarian dengan kondisi kata kunci yang berbeda
yaitu terbalik dan tidak urut (hasil perhitungan akurasi dapat dilihat pada
Lampiran III).
0
0.2
0.4
0.6
0.8
1
1.2
0% 20% 40% 60% 80% 100% 120%
Rata-rata precision sistempencarian perpustakaan
rata-rata precision sistempemerolehan informasimenggunakan arraylist
rata-rata precision sistempemerolehan informasimenggunakan linkedlist
80% 1 1 1
90% 1 1 1
100% 1 1 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List
Perbandingan kecepatan yang diteliti adalah kecepatan pencarian antara
struktur data linked list dengan array list. Cara menguji kecepatan tersebut
dengan cara memasukkan kata kunci pencarian, kemudian melihat hasil waktu
pencarian yang ditempuh oleh sistem. Pengujian dilakukan sebanyak 400 kali
untuk memperoleh hasil yang stabil. Tabel pengujian ditampilkan pada tabel 5.8
dibawah ini:
Tabel 5. 8 Perbedaan waktu pencarian ArrayList dan Linkedlist
Jumlah
kata (dalam 100
kali ujicoba
dengan
keyword
yang
berbeda)
Total waktu
pencarian
Rata-rata waktu
pencarian
Selisih waktu
rata-rata
Arraylist
(dalam
detik)
Linkedlist
(dalam
detik)
Arraylist
(dalam
detik)
Linkedlist
(dalam
detik)
Satu kata 0.674 1.254 0.007 0.013 0.006
Dua kata 3.842 5.956 0.038 0.060 0.022
Tiga kata 9.507 14.213 0.095 0.142 0.047
Empat kata 174.708 234.42 1.747 2.344 0.597
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Sistem pemerolehan informasi yang dibuat dengan arraylist lebih cepat dalam
melakukan pencarian dibandingkan dengan linkedlist dibuktikan dengan selisih rata-
rata waktu pencarian. Pengujian satu kata kunci membutuhkan waktu kecepatan rata-
rata 0.006 miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata
kuncidalam waktu 0.047 ms, dan empat kata kunci dalam waktu 0.597 ms lebih cepat
arraylist daripada linkedlist.
Perhitungan tersebut berdasarkan ketelitian sistem yang mencapai tiga angka
nol dibelakang koma. Ketelitian sistem mencapai tiga angka nol dibelakang koma
dikarenakan method timer yang digunakan pada java menggunakan parameter period
dalam satuan miliseconds untuk menjaga agar frekuensi tetap akurat dalam jangka
pendek ketika program masih berjalan.
Berdasarkan tabel 5.8 tersebut, dapat dilihat bahwa struktur data arraylist
lebih cepat dibandingkan dengan linkedlist. Hal ini dikarenakan arraylist berkaitan
dengan alamat memory. Alamat memori atau memory address register merupakan
register yang mencatat alamat memory yang akan diakses (baik yang akan ditulis
maupun yang akan dibaca) (Hariyanto, 2009). Dengan kata lain, data yang akan
diambil dimasukkan ke dalam memory address kemudian mengirimkan alamat
tersebut ke dalam RAM. Sedangkan linkedlist harus mencari satu persatu data yang
dicari karena bentuk dari linkedlist yang seperti rantai. Pada saat build index dengan
lima kali percobaab, struktur data inverted index yang dibangun menggunakan
arraylist memerlukan waktu rata-rata 0.013 miliseconds (ms) sedangkan struktur data
inverted index yang dibangun menggunakan linkedlist memerlukan waktu rata-rata
0.02 ms.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
BAB VI
KESIMPULAN DAN SARAN
6.1 Kesimpulan
Kesimpulan yang didapat dari perbandingan antara sistem pencarian
judul buku yang dimiliki oleh Perpustakaan Universitas Sanata Dharma
dengan sistem pemerolehan informasi yang dibangun menggunakan struktur
data LinkedList dan ArrayList dalam inverted index adalah sebagai berikut:
1. Sistem pemerolehan informasi perpustakaan yang dibangun
menggunakan struktur data arraylist dan linkedlist dalam inverted
index telah berhasil dikembangkan dibuktikan mampu mencari
judul buku dengan hasil yang minimal sama dengan sistem
pencarian perpustakaan.
2. Sistem pemerolehan informasi yang dibuat dengan arraylist lebih
cepat dalam melakukan pencarian dibandingkan dengan linkedlist
dibuktikan dengan selisih rata-rata waktu pencarian. Pengujian
satu kata kunci mempunyai selisih waktu kecepatan rata-rata 0.006
miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata
kunci dalam waktu 0.047 ms, dan empat kata kunci dalam waktu
0.597 ms lebih cepat arraylist daripada linkedlist.
3. Pembentukan struktur data inverted index yang menggunakan
arraylist membutuhkan waktu rata-rata 0.013 miliseconds (ms)
lebih cepat dibandingkan linkedlist yang membutuhkan waktu rata-
rata 0.015 ms.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
6.2 Saran
Saran yang mendukung pengembangan dari sistem pemerolehan
informasi judul buku perpustakaan yaitu:
Hasil evaluasi dan pengujian sistem pemerolehan informasi
dibandingkan sistem pencarian perpustakaan Universitas Sanata
Dharma memiliki beberapa kelebihan sebagai berikut:
a. Sistem pemerolehan informasi ini mampu mencari judul
dengan kata kunci pencarian yang dibalik, sedangkan
sistem pencarian milik Perpustakaan Universitas Sanata
Dharma tidak dapat melakukan pencarian judul buku.
b. Sistem pemerolehan informasi ini mampu mencari judul
buku dengan kata kunci pencarian yang tidak urut,
sedangkan sistem pencarian milik Perpustakaan
Universitas Sanata Dharma tidak dapat melakukan
pencarian judul buku.
Untuk lebih detail dapat dilihat pada Lampiran III
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
DAFTAR PUSTAKA
Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M. & Williams, H.E. 2007.
Stemming Indonesian : A Confix-Stripping Approach. Transaction on Asian
Langeage Information Processing. Vol. 6, No. 4, Articel 13. Association for
Computing Machinery : New York .
Agusta, Ledy. (2009). Perbandingan Algoritma Stemming Porter dengan
Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa
Indonesia. Jurnal Konferensi Nasional Sistem dan Informatika 2009, Bali.
Baeza-Yates, R., Riberio-Neto, B. (1999). Modern Information Retrieval the
Concepts and Technology Behind Search. England: A division of the
association for Computing Machinary
Büttcher, Stefan., Clarke, L.A Charles., Cormack, V. Gordon. (2010).
Information Retrieval Implementing and Evaluating Search Engines. USA:
Massachusetts Institute of Technology.
Darojad, Reza Mohammad. (2013). Sistem Temu Balik Informasi Dokumen
Makalah Ilmiah Berbahasa Indonesia Menggunakan Struktur Data
Inverted Index Berbasis Hash Table dan Linked List. Universitas Sanata
Dharma: Yogyakarta.
Hariyanto, Bambang. (2009). Sistem Operasi revisi keempat. Informatika:
Bandung.
Hasibuan, Zainal A., & Andri, Yofi. (2001). Penerapan Berbagai Teknik
Sistem Temu-Kembali Informasi Berbasis Hiperteks. Jurnal Ilmu Komputer
dan Teknologi Informasi, Vol. 1, No. 2
Ingwersen, Peter. (2002). Information Retrieval Interaction. Denmark: Royal
School of Library and Information Science.
Manning, Christopher, D., Raghavan, Prakbhakar., Schütze, Hinrich. (2008).
Introduction to Information Retrieval. England: Cambridge University
Press.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
P.J, Deitel., Deitel H.M. (2012). Java How to Program, 9th
Edition. Pearson
Education Inc:USA.
Pressman, Roger S. (2001). Software Enginerring: A Practitioner’s Approach,
7th
Edition. The McGraw-Hill Companies: USA.
Puspitaningrum, Fredes Winda Oktaviani. (2011). Sistem Pemerolehan
Informasi Undang-Undang dan Kasus Menggunakan Struktur Data
Inverted Index dengan Pembobotan TF-IDF. Universitas Sanata Dharma:
Yogyakarta.
Wulandari, Justina Septiani. (2013). Sistem Pemerolehan Informasi Makalah
Ilmiah Berbahasa Indonesia Menggunakan Struktur Data Inverted Index
Dengan Metode Pembobotan TF-IDF Berbasis ORDBMS. Universitas
Sanata Dharma: Yogyakarta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
Lampiran
Lampiran I
Source code Stemming.java
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
Lampiran II
A. Uji coba satu kata
no kata arraylist linkedlist
1 akademik 0.001 0.001
2 agama 0.036 0.092
3 sistem 0.018 0.217
4 informasi 0.128 0.226
5 pemerolehan 0.001 0.001
6 java 0.001 0.001
7 data 0.001 0.001
8 struktur 0.001 0.001
9 katolik 0.001 0.001
10 hindu 0.001 0.001
11 budha 0.001 0.001
12 islam 0.001 0.001
13 kristen 0.001 0.001
14 sanata 0.001 0.001
15 dharma 0.001 0.001
16 retrieval 0.001 0.001
17 information 0.001 0.001
18 mining 0.001 0.001
19 structures 0.157 0.252
20 framework 0.001 0.001
21 collections 0.001 0.001
22 basis 0.145 0.151
23 algoritma 0.001 0.001
24 modeling 0.001 0.001
25 classification 0.001 0.001
26 methods 0.001 0.001
27 business 0.001 0.001
28 industry 0.001 0.001
29 accounting 0.001 0.001
30 akuntansi 0.001 0.001
31 analisa 0.001 0.001
32 analisis 0.001 0.001
33 disain 0.001 0.001
34 implementasi 0.001 0.001
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
35 auditing 0.001 0.001
36 bunga 0.001 0.001
37 evaluasi 0.001 0.001
38 studi 0.096 0.222
39 dampak 0.001 0.001
40 kredit 0.001 0.001
41 keamanan 0.001 0.001
42 program 0.001 0.001
43 manajemen 0.001 0.001
44 teknologi 0.001 0.001
45 technology 0.001 0.001
46 perpustakaan 0.001 0.001
47 geografis 0.001 0.001
48 bisnis 0.001 0.001
49 autocad 0.001 0.001
50 fotografi 0.001 0.001
51 statistical 0.001 0.001
52 professionals 0.001 0.001
53 concepts 0.001 0.001
54 techniques 0.001 0.001
55 multimedia 0.001 0.001
56 computing 0.001 0.001
57 bioinformatics 0.001 0.001
58 machine 0.001 0.001
59 learning 0.001 0.001
60 implementations 0.001 0.001
61 introduction 0.001 0.001
62 preparation 0.001 0.001
63 mastering 0.001 0.001
64 aplikasi 0.001 0.001
65 apriori 0.001 0.001
66 analysis 0.001 0.001
67 practical 0.001 0.001
68 clustering 0.001 0.001
69 konsep 0.001 0.001
70 discovering 0.001 0.001
71 knowledge 0.001 0.001
72 hypertext 0.001 0.001
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
73 modern 0.001 0.001
74 warehousing 0.001 0.001
75 visualization 0.001 0.001
76 core 0.001 0.001
77 support 0.001 0.001
78 decision 0.001 0.001
79 systems 0.001 0.001
80 programmer 0.001 0.001
81 recognition 0.001 0.001
82 pattern 0.001 0.001
83 algorithms 0.001 0.001
84 perancangan 0.001 0.001
85 relational 0.001 0.001
86 scientific 0.001 0.001
87 perspective 0.001 0.001
88 teori 0.001 0.001
89 delphi 0.001 0.001
90 turbo 0.001 0.001
91 pascal 0.001 0.001
92 simulasi 0.001 0.001
93 kamus 0.001 0.001
94 time 0.001 0.001
95 databases 0.001 0.001
96 penelusuran 0.001 0.001
97 filsafat 0.001 0.001
98 ilmu 0.001 0.001
99 ontologi 0.001 0.001
100 aksiologi 0.001 0.001
TOTAL 0.674 1.254
Rata-Rata 0.00674 0.01254
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
B. Uji coba dua kata
no kata arraylist linkedlist
1 accounting systems 0.001 0.001
2 accounting information 0.099 0.166
3 sistem akuntansi 0.208 0.41
4 teori bisnis 0.001 0.001
5 analisis desain 0.001 0.001
6 Informasi sistem 0.114 0.256
7 praktek bisnis 0.001 0.001
8 desain sistem 0.224 0.152
9 smart card 0.001 0.001
10 Informasi parkir 0.001 0.001
11 audit sistem 0.222 0.282
12 audit Informasi 0.001 0.001
13 aplikasi informasi 0.001 0.001
14 aplikasi smart 0.001 0.001
15 card smart 0.001 0.001
16 disain analisis 0.001 0.001
17 bunga rampai 0.001 0.001
18 evaluasi Informasi 0.001 0.001
19 unit informasi 0.001 0.001
20 penggajian pengupahan 0.001 0.001
21 sistem pengendalian 0.16 0.222
22 resiko keamanan 0.001 0.001
23 kasus studi 0.029 0.225
24 studi kasus 0.029 0.225
25 indeks pencarian 0.001 0.001
26 implementasi oracle 0.001 0.001
27 information systems 0.018 0.181
28 web tourism 0.001 0.001
29 berbasis web 0.021 0.221
30 internal auditing 0.001 0.001
31 tinjauan sistem 0.115 0.077
32 informasi manajemen 0.001 0.001
33 kamus sistem 0.198 0.302
34 sistem pendukung 0.269 0.335
35 pendukung keputusan 0.001 0.001
36 sistem keputusan 0.075 0.085
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
37 keamanan Informasi 0.001 0.001
38 sistem keamanan 0.211 0.243
39 kerangka dasar 0.001 0.001
40 sistem manajemen 0.097 0.158
41 manajemen informasi 0.001 0.001
42 organisasi perusahaan 0.001 0.001
43 manajemen pendidikan 0.001 0.001
44 informasi data 0.084 0.099
45 konsep tuntunan 0.001 0.001
46 sistem penjualan 0.062 0.086
47 sistem informasi 0.134 0.275
48 toko buku 0.001 0.001
49 model kesuksesan 0.001 0.001
50 sistem teknologi 0.081 0.156
51 teknologi informasi 0.028 0.218
52 informasi teknologi 0.001 0.001
53 model teknologi 0.001 0.001
54 sistem geografis 0.133 0.12
55 Informasi geografis 0.001 0.001
56 Informasi akademik 0.001 0.001
57 perangkat bergerak 0.001 0.001
58 pemetaan pengawasan 0.001 0.001
59 Informasi perpustakaan 0.001 0.001
60 metodologi Informasi 0.001 0.001
61 metodologi sistem 0.308 0.172
62 pengantar sistem 0.041 0.081
63 pengantar manajemen 0.001 0.001
64 perspektif bisnis 0.001 0.001
65 bisnis manajerial 0.001 0.001
66 aplikasi akademik 0.001 0.001
67 perangkat lunak 0.001 0.001
68 sistem pariwisata 0.032 0.209
69 open source 0.001 0.001
70 pengembangan sistem 0.176 0.214
71 template pengembangan 0.001 0.001
72 pengenalan informasi 0.001 0.001
73 book shop 0.001 0.001
74 sistem bisnis 0.107 0.247
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
75 sistem dokumentasi 0.242 0.186
76 algoritma mining 0.001 0.001
77 data mining 0.028 0.119
78 mining concepts 0.001 0.001
79 bisnis perusahaan 0.001 0.001
80 structures abstractions 0.001 0.001
81 structures java 0.001 0.004
82 mining multimedia 0.001 0.001
83 machine tools 0.001 0.001
84 data preparation 0.227 0.161
85 java programming 0.001 0.001
86 relasional kabur 0.001 0.001
87 data relasional 0.001 0.001
88 analysis modeling 0.001 0.001
89 learning tools 0.001 0.001
90 programmer java 0.001 0.001
91 web discovering 0.001 0.001
92 pattern recognition 0.001 0.001
93 pattern algorithms 0.001 0.001
94 kamus besar 0.001 0.001
95 technology information 0.001 0.001
96 introduction computers 0.001 0.001
97 computers communications 0.001 0.001
98 buku ajar 0.001 0.001
99 farmasi kedokteran 0.001 0.001
100 mikrobiologi imunologi 0.001 0.001
TOTAL 3.842 5.956
Rata-rata 0.03842 0.05956
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
C. Uji coba tiga kata
no kata arraylist linkedlist
1 data mining algoritma 0.001 0.001
2 accounting information systems 0.248 0.268
3 analisa sistem Informasi 0.075 0.241
4 analisis desain sistem 0.095 0.3
5 audit sistem Informasi 0.203 0.105
6 analisis disain implementasi 0.001 0.001
7 implementasi sistem Informasi 0.192 0.225
8 praktek aplikasi bisnis 0.001 0.001
9 dampak teknologi Informasi 0.222 0.262
10 bunga rampai sistem 0.059 0.122
11 pengelolaan sistem manajemen 0.091 0.121
12 akuntansi sistem Informasi 0.121 0.222
13 pengontrolan sistem Informasi 0.106 0.231
14 kerangka dasar sistem 0.123 0.136
15 keamanan sistem Informasi 0.026 0.122
16 sistem manajemen pendidikan 0.101 0.055
17 geografis Informasi sistem 0.27 0.322
18 pengantar sistem Informasi 0.005 0.109
19 pengembangan sistem Informasi 0.038 0.232
20 perspektif bisnis Informasi 0.001 0.001
21 perangkat lunak sistem 0.168 0.269
22 sistem pemetaan pengawasan 0.132 0.31
23 perpustakaan sistem Informasi 0.89 1.113
24 pengantar Informasi manajemen 0.001 0.001
25 pengembangan perangkat lunak 0.001 0.001
26 pengelolaan sistem informasi 0.085 0.174
27 sistem Informasi administrasi 0.156 0.274
28 pengenalan sistem Informasi 0.112 0.282
29 perancangan sistem Informasi 0.145 0.228
30 prototipe sistem Informasi 0.141 0.156
31 desain pemrograman komputer 0.001 0.001
32 Informasi berbasis web 0.087 0.168
33 sistem berbasis web 0.222 0.391
34 prestasi akademik mahasiswa 0.001 0.001
35 sistem Informasi bisnis 0.145 0.223
36 studi konsultasi kanker 0.001 0.001
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
37 sistem Informasi data 0.034 0.087
38 algoritma data mining 0.212 0.222
39 business industry methods 0.003 0.001
40 data mining applied 0.106 0.222
41 preparation mining data 0.112 0.234
42 java programming introduction 0.001 0.001
43 data relasional kabur 0.222 0.238
44 implementasi data mining 0.29 0.36
45 web discovering knowledge 0.001 0.001
46 algorithms pattern recognition 0.001 0.001
47 warehousing mining visualization 0.001 0.001
48 modern data warehousing 0.222 0.274
49 visualization core concepts 0.001 0.001
50 decision support systems 0.001 0.001
51 data mining scalability 0.005 0.018
52 scalability discovery algorithms 0.001 0.001
53 perancangan basis data 0.124 0.234
54 penerapan data mining 0.108 0.231
55 metode naïve bayessian 0.001 0.001
56 naïve bayessian clasification 0.001 0.001
57 data mining relational 0.005 0.082
58 data mining scientific 0.188 0.245
59 pengantar struktur data 0.122 0.224
60 simulasi algoritma aplikasi 0.001 0.001
61 pencarian pengurutan data 0.051 0.145
62 algoritma struktur data 0.242 0.352
63 databases mining data 0.258 0.358
64 information retrieval evaluating 0.283 0.342
65 information retrieval systems 0.372 0.222
66 information retrieval modern 0.122 0.135
67 search engines practice 0.001 0.001
68 kemajuan pengetahuan ilmu 0.134 0.322
69 filsafat hukum kodrat 0.001 0.001
70 epistemologi logika studi 0.143 0.232
71 filsafat studi orientasi 0.001 0.001
72 logika ilmu pengetahuan 0.002 0.001
73 ontologi filsafat ilmu 0.001 0.001
74 ontologi epistemologi aksiologi 0.001 0.001
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
75 filsafat ilmu pengetahuan 0.097 0.142
76 asketik dimensi etik 0.001 0.001
77 ilmu pengetahuan manusia 0.001 0.001
78 filsafat ilmu kajian 0.001 0.001
79 buku ajar filsafat 0.002 0.001
80 analitis dinamis dialektis 0.001 0.001
81 pencerahan ilmu pengetahuan 0.001 0.001
82 cakrawala pluralitas ilmu 0.222 0.421
83 susunan ilmu pengetahuan 0.001 0.001
84 bidang teknologi informasi 0.001 0.001
85 komunikasi dunia pendidikan 0.021 0.033
86 teknologi informasi komunikasi 0.338 0.378
87 tantangan teknologi informasi 0.001 0.001
88 globalisasi pemanfaatan informasi 0.001 0.001
89 peluang perguruan tinggi 0.001 0.001
90 information technology management 0.222 0.391
91 integrasi teknologi informasi 0.001 0.001
92 penerapan pemanfaatan dampak 0.001 0.001
93 teknologi informasi kualitas 0.191 0.222
94 konsep dasar aplikasi 0.001 0.001
95 informasi komunikasi pendidikan 0.222 0.341
96 perancangan perpustakaan digital 0.001 0.001
97 it research metodologi 0.001 0.001
98 teknologi informasi penelitian 0.262 0.356
99 matematika teknologi informasi 0.234 0.342
100 teknologi informasi bisnis 0.039 0.105
TOTAL 9.507 14.213
Rata-rata 0.09507 0.14213
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
D. Uji coba empat kata
no kata arraylist linkedlist
1 pengenalan teknologi komputer informasi 0.104 0.222
2 kamus istilah teknologi informasi 0.222 0.371
3 peranana matematika pengembangan teknologi 0.243 0.356
4 ergonomika manajemen teknologi informasi 0.104 0.222
5 sistem tatakelola teknologi informasi 0.425 0.585
6 algorithms data structures design 0.007 0.234
7 structures design correctness analysis 0.001 0.002
8 data structures algorithm analysis 0.541 0.699
9 c++ plus data structures 0.305 0.408
10 data structures algorithms java 0.231 0.333
11 data structures program design 0.23 0.322
12 data structures personal computers 0.268 0.469
13 object oriented programming algoritmsm 0.001 0.001
14 open source aplikasi quantum 0.234 0.366
15 sms konseling kesehatan pengaturan 0.002 0.002
16 open source wireless java 0.212 0.321
17 windows aplikasi statistika gratis 0.001 0.001
18 panduan buku pengantar mikrobiologi 0.091 0.221
19 mini riset mikrobiologi terapan 0.001 0.001
20 medical microbiology review of 0.252 0.662
21 mikrobiologi kedokteran laboratorium klinik 0.234 0.354
22 unjuk kerja access point 0.001 0.001
23 implementasi unjuk kerja perbandingan 0.231 0.422
24 mikrobiologi dasar praktek teknik 0.222 0.345
25 praktek teknik prosedur laboratorium 0.342 0.442
26 kamus besar ilmu pengetahuan 0.435 0.532
27 kamus bahasa besar indonesia 0.421 0.534
28 kamus bahasa korea besar 0.342 0.356
29 intisari mikrobiologi imunologi hardcore 0.444 0.531
30 panduan mahasiswa farmasi kedokteran 0.564 0.754
31 buku ajar mikrobiologi panduan 0.765 1.081
32 information technology business evolution 0.776 0.897
33 using information technology practical 1.231 1.453
34 change business evolution information 1.001 1.232
35 information technology effectively teaching 2.452 3.423
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
36 teaching learning information technology 3.245 4.323
37 teacher education information technology 2.222 3.421
38 visually impaired learning technology 1.221 2.221
39 library information system active 1.568 2.763
40 active server pages technology 2.561 3.645
41 architecture computer hardware software 3.241 4.653
42 hardware software systems computer 3.568 4.032
43 revolution impact science technology 2.456 3.241
44 information technology revolution science 3.234 4.236
45 information weapon customers markets 2.346 3.212
46 information technology weapon customers 3.256 5.321
47 market beyond cooperation competition 4.352 5.463
48 information technology development competition 3.462 5.231
49 cooperation competition technology information 2.344 3.452
50 technology connection strategy information 3.214 4.252
51 technology information change age 3.241 4.643
52 relationship computer mediated communication 6.743 9.143
53 communicaton learner autonomy technology 3.124 4.342
54 learning achievement information technology 3.425 3.421
55 disease information system built 2.314 3.245
56 activex data object technology 3.241 4.352
57 pendidikan agama para remadja 1.231 2.225
58 media audiovisual pendidikan agama 1.224 2.453
59 pendidikan agama iman katolik 1.341 2.314
60 service operations strategy technology 1.463 2.412
61 operations service technology information 2.314 3.452
62 information technology service operations 3.425 2.412
63 sejarah nasional perjuangan indonesia 5.435 6.312
64 kebangkitan nasional hindia belanda 1.231 2.311
65 sejarah jaman pertumbuhan kerajaan 1.021 2.092
66 sejarah jaman prasejarah indonesia 3.009 4.063
67 sejarah indonesia baru pergerakan 2.314 3.412
68 pergerakan nasional kolonialisme nasionalisme 3.124 2.231
69 pendidikan iman anak keluarga 2.123 2.001
70 kawin campur beda agama 3.124 4.231
71 pengembangan kepribadian pendidikan pancasila 2.421 3.245
72 pendidikan agama pancasila kewarganegaraan 3.241 4.324
73 kewarganegaraan pancasila pendidikan agama 1.201 2.221
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
74 kurikulum pendidikan agama katolik 2.001 3.121
75 lokakarya kurikulum agama katolik 6.754 7.534
76 cendekiawan beriman dewasa katolik 1.785 2.098
77 pendidikan agama kristen protestan 0.987 1.273
78 materi pokok pendidikan agama 2.321 3.474
79 materi pokok agama islam 0.321 0.234
80 konsep karakteristik metodologi islam 4.125 5.321
81 information technology management systems 2.124 3.212
82 essentials management information systems 3.212 4.213
83 refleksi mahasiswa pendidikan agama 3.321 4.212
84 sejarah nasional kolonialisme kemerdekaan 2.123 3.244
85 information social context technology 1.231 2.222
86 social context technology information 3.121 3.212
87 sistem hukum pertahanan indonesia 1.231 4.231
88 ensiklopedia sejarah budaya indonesia 2.422 3.211
89 budaya sejarah indonesia raya 2.125 2.221
90 agama pendidikan ekonomi budaya 3.212 2.242
91 encyclopedia information technology communication 2.314 4.231
92 english learning communication technology 0.342 0.763
93 information computers technology perspective 0.421 0.432
94 pendidikan putera puteri agama 2.152 1.231
95 membaca sejarah nasional indonesia 3.242 2.123
96 programming methods algorithms structures 4.232 5.312
97 java structures designing software 1.092 1.221
98 java collections framework structures 0.975 2.021
99 pengembangan teknologi informasi komunikasi 0.754 2.121
100 cepat menguasai teknologi informasi 0.212 1.212
TOTAL 174.708 234.42
Rata-rata 1.74708 2.3442
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
Lampiran III
Perbandingan Hasil Pencarian dan Relevansi Sistem Pemerolehan Informasi dengan
Sistem Pencarian Perpustakaan
1. Kata kunci “struktur data”
1.1 Pencarian pada web perpustakaan dan sistem pemerolehan informasi.
Sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma dan sistem
pemerolehan informasi mampu mencari judul buku dengan kata kunci tersebut
dan diperoleh hasil 17 judul buku yang ditemukan dalam bahasa Indonesia.
Namun, ada buku-buku lain dalam bahasa Inggris yang juga berkaitan dengan
struktur data
Hasil perhitungan selengkapnya disajikan dalam tabel 5.1 berikut ini:
Recall =
=
= 0.3036
Precision =
=
= 1
Tabel 1 recall and precision
No R/N recall precision
1 R 0.0179 0.0588
2 R 0.0357 0.1176
3 R 0.0536 0.1765
4 R 0.0714 0.2353
5 R 0.0893 0.1852
6 R 0.1071 0.2222
7 R 0.1250 0.2593
8 R 0.1429 0.4706
9 R 0.1607 0.5294
10 R 0.1786 0.5882
11 R 0.1964 0.6471
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
12 R 0.2143 0.7059
13 R 0.2321 0.7647
14 R 0.2500 0.8235
15 R 0.2679 0.8824
16 R 0.2857 0.9412
17 R 0.3036 1
Maka perhitungan precision untuk 11 titik recall yang terinterpolasi
menjadi seperti berikut:
Tabel 2 precision dalam 11 titik recall
recall Precision
0% 1
10% 1
20% 1
30% 1
40% 0
50% 0
60% 0
70% 0
80% 0
90% 0
100% 0
Rata-rata 0.36 Dari perhitungan tersebut, nilai relevansi untuk recall diatas 30% tidak
bernilai 1 mungkin dikarenakan terdapat buku struktur data dalam bahasa
Inggris. Dalam hal ini, pengguna harus memperluas pencarian dengan
memasukkan kata kunci dalam bahasa Inggris. Maka bila pengguna
memasukkan kata kunci struktur data, maka sistem akan mencari juga kata
struktur data dalam bahasa Inggris. Salah satu contoh judul buku yang
berbahasa Inggris yaitu “Data Structures And The Java Collections
Framework“. Dengan demikian maka bila digambarkan dalam bentuk grafik
akan menjadi seperti berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
Gambar 1 Grafik precision dalam 11 titik recall
Maka sistem pencarian yang dimiliki oleh sistem pencarian
perpustakaan maupun sistem pemerolehan informasi sama-sama mampu
mencari judul buku dalam bahasa Indonesia namun belum mampu mencari
dalam dua bahasa yang berbeda sekaligus.
1. Kata kunci “pendidikan agama”
1.1 Pencarian pada Sistem Pemerolehan Informasi
Responden mencari judul buku yang berkaitan dengan
pendidikan agama. Hasilnya, sistem pemerolehan informasi
menemukan judul buku sebanyak 30 yang relevan dengan kata kunci
pencarian. Maka perhitungan recall and precision sebagai berikut:
Tabel 3 recall and precision
Relevan Recall Precision
R 0.0333 1
R 0.0667 1
R 0.1000 1
R 0.1333 1
R 0.1667 1
R 0.2000 1
R 0.2333 1
R 0.2667 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 20% 40% 60% 80% 100% 120%
interpolation
interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
R 0.3000 1
R 0.3333 1
R 0.3667 1
R 0.4000 1
R 0.4333 1
R 0.4667 1
R 0.5000 1
R 0.5333 1
R 0.5667 1
R 0.6000 1
R 0.6333 1
R 0.6667 1
R 0.7000 1
R 0.7333 1
R 0.7667 1
R 0.8000 1
R 0.8333 1
R 0.8667 1
R 0.9000 1
R 0.9333 1
R 0.9667 1
R 1 1
Berdasarkan tabel tersebut, maka perhitungan precision dalam 11 titik
recall adalah sebagai berikut:
Tabel 4 precision dalam 11 titik recall
recall Precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
Maka grafik precision yang sudah diinterpolasi menjadi seperti
berikut:
Gambar 2 Grafik precision dalam 11 titik recall
1.2 Pencarian pada Sistem Pencarian Perpustakaan Sanata Dharma
Menggunakan kata kunci yang sama, maka pada sistem
pencarian yang dimiliki oleh Perpustakaan Universitas Sanata Dharma
menemukan 30 judul buku yang relevan. Maka hasil perhitungan
recall and precision adalah sebagai berikut:
Tabel 5 recall and precision
Relevan Recall Precision
R 0.0333 1
R 0.0667 1
R 0.1000 1
R 0.1333 1
R 0.1667 1
R 0.2000 1
R 0.2333 1
R 0.2667 1
R 0.3000 1
R 0.3333 1
R 0.3667 1
R 0.4000 1
R 0.4333 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 50% 100% 150%
Precision
Precision
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
R 0.4667 1
R 0.5000 1
R 0.5333 1
R 0.5667 1
R 0.6000 1
R 0.6333 1
R 0.6667 1
R 0.7000 1
R 0.7333 1
R 0.7667 1
R 0.8000 1
R 0.8333 1
R 0.8667 1
R 0.9000 1
R 0.9333 1
R 0.9667 1
R 1 1
Berdasarkan tabel tersebut, maka perhitungan precision dalam 11 titik
recall adalah sebagai berikut:
Tabel 6 precision dalam 11 titik recall
recall Precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Maka grafik precision yang sudah diinterpolasi menjadi seperti
berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
Gambar 3 Grafik precision dalam 11 titik recall
2. Kata kunci “teknologi informasi”
2.1 Pencarian pada Sistem Pemerolehan Informasi
Responden mencari judul buku yang berkaitan dengan
teknologi informasi. Hasilnya, sistem pemerolehan informasi
menemukan 25 judul buku yang relevan dengan kata kunci. Maka
perhitungan recall and precision adalah sebagai berikut:
Tabel 6 recall and precision
no R recall precision
1 r 0.04 1
2 r 0.08 1
3 r 0.12 1
4 r 0.16 1
5 r 0.2 1
6 r 0.24 1
7 r 0.28 1
8 r 0.32 1
9 r 0.36 1
10 r 0.4 1
11 r 0.44 1
12 r 0.48 1
13 r 0.52 1
14 r 0.56 1
15 r 0.6 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 50% 100% 150%
Precision
Precision
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
16 r 0.64 1
17 r 0.68 1
18 r 0.72 1
19 r 0.76 1
20 r 0.8 1
21 r 0.84 1
22 r 0.88 1
23 r 0.92 1
24 r 0.96 1
25 r 1 1
Maka tabel tersebut, maka perhitungan precision dalam 11 titik recall
adalah sebagai berikut:
Tabel 7 precision dalam 11 titik recall Recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Grafik disajikan sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
Gambar 4 Grafik precision dalam 11 titik recall
2.2 Pencarian pada Sistem Pencarian Perpustakaan Sanata Dharma
Responden mencari judul buku yang berkaitan dengan
teknologi informasi. Hasilnya, sistem pemerolehan informasi
menemukan 25 judul buku yang relevan dengan kata kunci. Maka
perhitungan recall and precision adalah sebagai berikut:
Tabel 8 recall and precision
no R recall precision
1 r 0.04 1
2 r 0.08 1
3 r 0.12 1
4 r 0.16 1
5 r 0.2 1
6 r 0.24 1
7 r 0.28 1
8 r 0.32 1
9 r 0.36 1
10 r 0.4 1
11 r 0.44 1
12 r 0.48 1
13 r 0.52 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
interpolasi
interpolasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
14 r 0.56 1
15 r 0.6 1
16 r 0.64 1
17 r 0.68 1
18 r 0.72 1
19 r 0.76 1
20 r 0.8 1
21 r 0.84 1
22 r 0.88 1
23 r 0.92 1
24 r 0.96 1
25 r 1 1
Maka tabel tersebut, maka perhitungan precision dalam 11 titik recall
adalah sebagai berikut:
Tabel 9 precision dalam 11 titik recall Recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Grafik disajikan sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
Gambar 5 Grafik precision dalam 11 titik recall
Kesimpulan yang dapat diambil yaitu baik sistem pemerolehan
informasi maupun sistem pencarian yang dimiliki oleh perpustakaan
Universitas Sanata Dharma sama-sama mampu mencari kata kunci yang dicari
dengan kata kunci yang urut.
3. Kata kunci “data struktur”
3.1 Pencarian pada Sistem Pemerolehan Informasi
Penulis sengaja untuk memasukkan kata kunci terbalik, dari
“struktur data” menjadi “data struktur”. Tujuan dari pengujian ini untuk
mengetahui sistem pemerolehan informasi mampu mencari buku dengan kata
kunci yang terbalik atau tidak.
Hasil yang didapat yaitu sistem pemerolehan informasi mampu
untuk mencari buku dengan kata kunci yang tidak berurutan tersebut.
Diperoleh 17 judul buku yang relevan. Maka perhitungan recall and precision
adalah sebagai berikut:
Tabel 10 recall and precision
Relevan Recall Precision
R 0.0588 1
R 0.1176 1
R 0.1765 1
R 0.2353 1
R 0.2941 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
interpolasi
interpolasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
R 0.3529 1
R 0.4118 1
R 0.4706 1
R 0.5294 1
R 0.5882 1
R 0.6471 1
R 0.7059 1
R 0.7647 1
R 0.8235 1
R 0.8824 1
R 0.9412 1
R 1.0000 1
Maka perhitungan precision dalam 11 titik recall menjadi seperti
berikut:
Tabel 11 precision dalam 11 titik recall
Recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
Berdasarkan tabel nilai precision dalam 11 titik recall tersebut, jika
digambarkan dalam grafik menjadi seperti berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
Gambar 6 Grafik precision dalam 11 titik recall
3.2 Pencarian pada Website Perpustakaan Sanata Dharma
Menggunakan kata kunci yang sama yakni “data struktur”
penulis mencoba untuk mengetahui sistem pencarian yang dimiliki
oleh perpustakaan Sanata Dharma mampu melakukan pencarian atau
tidak. Hasilnya adalah sistem pencarian yang dimiliki oleh
perpustakaan tidak bisa mencari dibuktikan dengan hasil pencarian
yang nol (0). Maka perhitungan relevansi adalah sebagai berikut:
Tabel 12 recall and precision
R Recall Precision
0 0 0
Maka nilai precision dalam 11 titik recall dapat diperoleh sebagai
berikut:
Tabel 13 precision dalam 11 titik recall
Recall precision
0% 0
10% 0
20% 0
30% 0
40% 0
50% 0
60% 0
70% 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90%100%
Interpolation
Interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
80% 0
90% 0
100% 0
Rata-rata 0
Grafik dapat disajikan sebagai berikut berdasarkan data tersebut:
Gambar 7 Grafik precision dalam 11 titik recall
Kesimpulan yang bisa diambil adalah sistem pemerolehan informasi
pencarian judul buku perpustakaan mampu mencari judul buku walaupun kata
kunci terbalik, sedangkan sistem pencarian yang dimiliki oleh perpustakaan
Universitas Sanata Dharma tidak mampu melakukan pencarian jika kata kunci
dibalik.
4. Kata Kunci “teori data struktur ”
4.1 Pencarian pada Sistem Pemerolehan Informasi
Selain menguji dengan kata kunci yang terbalik, penulis juga meminta
kepada responden untuk mencari dengan tiga kata kunci yang tidak urut.
Salah satu contoh adalah buku dengan judul lengkap “Teori Dan Aplikasi
Struktur Data Menggunakan Java” dan diambil kata kunci pencarian “teori
data struktur”. Hasilnya yaitu sistem menghasilkan satu judul buku yang
relevan dengan kata kunci pencarian. Maka perhitungan recall and precision
menjadi seperti berikut:
Tabel 14 recall and precision
Relevan Recall Precision
R 0.0584 1
0
0.2
0.4
0.6
0.8
1
0% 50% 100% 150%
Interpolation
Interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
Maka perhitungan precision dalam 11 titk recall dari kata kunci “teori
data struktur” adalah sebagai berikut:
Tabel 15 precision dalam 11 titik recall
Recall precision
0% 1
10% 0
20% 0
30% 0
40% 0
50% 0
60% 0
70% 0
80% 0
90% 0
100% 0
Rata-rata 0.09
Dengan demikian maka bila digambarkan dalam bentuk grafik akan
menjadi seperti berikut:
Gambar 8 Grafik precision dalam 11 titik recall
0
0.2
0.4
0.6
0.8
1
1.2
0% 20% 40% 60% 80% 100% 120%
precision
precision
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
4.2 Pencarian pada Sistem Perpustakaan Sanata Dharma
Dengan kata kunci dan cara yang sama website perpustakaan
Universitas Sanata Dharma menemukan sebanyak 0 judul buku yang
mengandung kata kunci pencarian. Maka hasil perhitungan adalah sebagai
berikut:
Tabel 16 recall and precision
R Recall Precision
0 0 0
Maka nilai precision dalam 11 titik recall adalah sebagai berikut:
Tabel 17 precision dalam 11 titik recall
Recall Precision
0% 0
10% 0
20% 0
30% 0
40% 0
50% 0
60% 0
70% 0
80% 0
90% 0
100% 0
Rata-rata 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
87
Grafik dapat disajikan sebagai berikut berdasarkan data tersebut:
Gambar 9 Grafik precision dalam 11 titik recall
Kesimpulan yang bisa diambil adalah sistem pencarian yang dimiliki
oleh Perpustakaan Universitas Sanata Dharma tidak mampu untuk mencari
bila kata kunci pencarian bila judul yang dimasukkan tidak berurutan
sedangkan sistem pemerolehan informasi pencarian judul buku yang dibangun
mampu untuk mencari judul dengan kata kunci yang tidak berurutan.
Rata-Rata Grafik Relevansi yang diperoleh Sistem dan Perpustakaan
Berdasarkan grafik-grafik interpolasi yang sudah diperoleh
sebelumnya, maka rata-rata relevansi sistem pemerolehan informasi judul
buku perpustakaan dapat digambarkan dalam gambar grafik di bawah ini:
Tabel 18 rata-rata precision dalam 11 titik recall sistem pemerolehan informasi
Recall precision
0% 1
10% 0.6667
20% 0.6667
30% 0.6667
40% 0.6667
50% 0.6667
60% 0.6667
70% 0.6667
0
0.2
0.4
0.6
0.8
1
0% 50% 100% 150%
Interpolation
Interpolation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
80% 0.6667
90% 0.6667
100% 0.6667
Maka bila disajikan dalam bentuk grafik adalah sebagai berikut:
Gambar 10 Grafik rata-rata precision dalam 11 titik recall
Sedangkan relevansi sistem pencarian yang dimiliki oleh Perpustakaan
Universitas Sanata Dharma adalah sebagai berikut:
Tabel 19 rata-rata precision dalam 11 titik recall sistem pencarian
Recall Precision
0% 0.333333
10% 0.333333
20% 0.333333
30% 0.333333
40% 0.333333
50% 0.333333
60% 0.333333
70% 0.333333
80% 0.333333
90% 0.333333
100% 0.333333
0
0.2
0.4
0.6
0.8
1
1.2
0% 50% 100% 150%
rata-rata precision
rata-rata precision
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
Gambar 11 Grafik rata-rata precision dalam 11 titik recall
Hasil rata-rata tersebut kemudian dibandingkan dengan rata-rata interpolasi
yang dihasilkan oleh sistem pemerolehan informasi. Tujuan dibandingkan adalah
untuk mencari tahu sistem pencarian judul buku yang lebih baik. Grafik rata-rata
ditampilkan pada gambar 5.13 berikut ini:
Gambar 12 Perbandingan grafik rata-rata precision dalam 11 titik recall
0.0000
0.0500
0.1000
0.1500
0.2000
0.2500
0.3000
0.3500
0% 50% 100% 150%
rata-rata precision
rata-rata precision
0
0.2
0.4
0.6
0.8
1
1.2
0% 20% 40% 60% 80% 100% 120%
Rata-rata Precision SistemPemerolehan InformasiPencarian Judul BukuPerpustakaan
Rata-rata Precision SistemPencarian PerpustakaanSanata Dharma
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
Berdasarkan grafik yang ditunjukkan gambar 5.17 di atas, terlihat bahwa
grafik yang dimiliki oleh sistem pemerolehan informasi lebih condong ke kanan atas
daripada sistem pencarian yang dimiliki oleh Perpustakaan Universitas Sanata
Dharma. Maka dapat disimpulkan bahwa sistem pemerolehan informasi yang
dibangun lebih baik dalam melakukan pencarian judul buku perpustakaan daripada
sistem pencarian yang dimiliki oleh Perpustakaan Universitas Sanata Dharma saat ini.
Tabel 20 Perbedaan Sistem Pemerolehan Informasi dengan Sistem Pencarian Judul
Buku Perpustakaan
No Perbedaan
Sistem Pemerolehan Informasi Web Perpustakaan USD
1 Belum dapat mencari judul buku
dalam dua bahasa sekaligus
dibuktikan dengan nilai akurasi
dibawah satu.
Belum dapat mencari judul buku dalam
dua bahasa sekaligus dibuktikan dengan
nilai akurasi dibawah satu.
2 Mampu mencari judul buku dengan
kata kunci yang dibalik, dibuktikan
dengan nilai akurasi sama dengan
satu.
Tidak mampu mencari judul buku bila
kata kunci dibalik, dibuktikan dengan
nilai akurasi nol.
3 Mampu mencari judul buku dengan
kata kunci yang tidak urut.
Dibuktikan dengan nilai akurasi
sama dengan satu.
Tidak mampu mencari judul buku bila
kata kunci tidak urut, dibuktikan dengan
nilai akurasi nol.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI