i
EKSTRAKSI LOKASI DAN PRODUK
DARI DATA TRANSAKSI ONLINE PADA TWITTER
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
LINDA NUR WULANSARI
201010370311072
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2015
ii
iii
iv
v
KATA PENGANTAR
Alhamdullilah segala puja dan puji syukur senantiasa penulis panjatkan
kehadirat Allah SWT yang telah memberikan rahmat, taufiq serta hidayahnya,
sehingga penulis dapat menyelesaikan pembuatan Laporan Tugas Akhir (TA)
dengan judul "Ekstraksi Lokasi dan Produk dari Data Transaksi Online pada
Twitter" yang diajukan sebagai salah satu syarat untuk meraih gelar Sarjana
Strata 1.
Dalam penyusunan Tugas Akhir ini penulis berusaha untuk menerapkan
ilmu yang telah didapat selama menjalani perkuliahan dengan tidak terlepas dari
petunjuk, bimbingan, bantuan dan dukungan dari berbagai pihak.
Penulis menyampaikan rasa terima kasih yang tidak terhingga kepada pihak-
pihak yang telah memberikan bantuan moral maupun material secara langsung
maupun tidak langsung kepada :
1. Allah SWT, atas terselesaikannya Laporan Tugas Akhir (TA).
2. Kedua orang tuaku, Bapak Drs. Margiono dan Ibu Hj. Habibah Suyeti,
terima kasih atas kasih sayang, doa, kesabaran dan pengorbanan tak
terhingga yang telah tercurahkan selama ini.
3. Kakakku Andika Gugus Prasetyo, terima kasih atas segala bantuan,
semangat dan doa.
4. Adikku Sheila Ifana Aulia Maharani, terima kasih atas keceriaan yang kau
bagi selama ini.
5. Bapak Yufis Azhar S.Kom, M.kom selaku Dosen Pembimbing 1.
6. Bapak Yuda Munarko, S.Kom, M.Sc selaku Dosen Pembimbing 2.
7. Dosen Pengajar yang telah banyak memberikan ilmunya untuk kami.
8. Bapak Agus Eko Minarno, M.Kom dan Bapak Aminudin, S.Kom selaku
penguji yang telah dengan sabar memberikan saran demi perbaikan Tugas
Akhir ini.
9. Terima kasih untuk Lu’lu’ul Mukarromah, Nurul Solechah, Marisa Dyah
Anggraini, Gema Ulama Putra, kalian teman yang luar biasa.
vi
10. Teman-teman seangkatan dan seperjuangan, terima kasih atas persahabatan,
kebersamaan dan semangat kekeluargaan yang telah terjalin selama ini.
11. Semua pihak yang tidak dapat disebutkan satu persatu oleh penulis terima
kasih atas bantuannya.
Jazakumullah khoiron katsiron atas semuanya, penulis menyadari bahwa
pembuatan Tugas Akhir ini memiliki banyak kekurangan karena keterbatasan dan
kemampuan penulis.
Akhirnya penulis berharap semoga memberikan manfaat bagi penulis
khususnya, pembaca pada umumnya.
Malang, 5 Februari 2015
Penulis
vii
DAFTAR ISI
Abstrak ................................................................................................................. i
Abstract ................................................................................................................ ii
Kata Pengantar ..................................................................................................... iii
Daftar Isi ............................................................................................................... v
Daftar Gambar ...................................................................................................... vii
Daftar Tabel .......................................................................................................... viii
BAB I PENDAHULUAN ................................................................................... 1
1.1 Latar Belakang ............................................................................................ 1
1.2 Rumusan Masalah ....................................................................................... 2
1.3 Tujuan Penelitian ........................................................................................ 2
1.4 Batasan Masalah ......................................................................................... 2
1.5 Metodologi ................................................................................................. 2
1.5.1 Studi Pustaka ................................................................................... 3
1.5.2 Analisa dan Perancanga Sistem ...................................................... 3
1.5.3 Implementai Sistem ........................................................................ 3
1.5.4 Pengujian Sistem ............................................................................. 3
1.5.5 Penulisan Laporan ........................................................................... 3
1.6 Sistematika Penulisan ................................................................................. 3
BAB II LANDASAN TEORI ........................................................................... 5
2.1 Ekstraksi Informasi ..................................................................................... 5
2.2 Twitter ........................................................................................................ 6
2.3 Preprocessing ............................................................................................. 7
2.3.1 Case Folding .................................................................................. 7
2.3.2 Tokenizing ...................................................................................... 7
2.4 Klasifikasi ................................................................................................... 7
2.5 Algoritma Naïve Bayes ............................................................................... 8
2.6 Pengujian .................................................................................................... 9
viii
BAB III ANALISA DAN PERANCANGAN SISTEM ................................... 10
3.1 Analisa Sistem ............................................................................................. 10
3.1.1 Kebutuhan Fungsional .................................................................... 10
3.1.2 Kebutuhan Non Fungsional ............................................................ 10
3.2 Perancangan Sistem .................................................................................... 11
3.2.1 Pengumpulan Data (Tweet) ............................................................. 11
3.2.2 Preprocessing ................................................................................. 12
3.2.3 Naïve Bayes Clasifier untuk Ekstraksi ............................................ 14
3.3 Perancangan Database ................................................................................ 19
3.4 Perancangan Antar Muka / Interface .......................................................... 21
BAB IV IMPLEMENTASI DAN PENGUJIAN ............................................. 23
4.1 Implementasi Sistem ................................................................................... 23
4.1.1 Implementasi Pembuatan Data Training ........................................ 23
4.1.2 Implementasi Preprocessing ........................................................... 24
4.1.3 Implementasi Tahap Ekstraksi dengan Naïve Bayes Clasifier ....... 25
4.2 Implementasi Antarmuka / Interface ........................................................... 27
4.2.1 Halaman Utama .............................................................................. 27
4.2.2 Halaman Grafik ............................................................................... 27
4.2.3 Halaman Ekstraksi ........................................................................... 28
4.2.4 Menu Debug ................................................................................... 29
4.2.5 Menu Data Training ........................................................................ 30
4.2.6 Menu Data Testing .......................................................................... 31
4.2.7 Menu Data Peta ................................................................................ 31
4.3 Pengujian Sistem ......................................................................................... 32
BAB V KESIMPULAN DAN SARAN ............................................................. 44
5.1 Kesimpulan ................................................................................................. 44
5.2 Saran ........................................................................................................... 44
DAFTAR PUSTAKA ......................................................................................... 45
BIOGRAFI PENULIS ....................................................................................... 47
ix
DAFTAR GAMBAR
Gambar 3.1 Alur Perancangan Sistem ............................................................ 11
Gambar 3.2 Proses Case Folding ................................................................... 13
Gambar 3.3 Proses Tokenizing ....................................................................... 13
Gambar 3.4 Interface Halaman Utama .......................................................... 22
Gambar 3.5 Interface Menu Input Tweet dan Hasil Ekstraksi ...................... 22
Gambar 4.1 Implementasi Data Training ...................................................... 24
Gambar 4.2 Implementasi Case Folding dan Tokenizing .............................. 24
Gambar 4.3 Implementasi Tahap 1 ................................................................ 25
Gambar 4.4 Implementasi Tahap 2 ................................................................. 26
Gambar 4.5 Implementasi Tahap 3 ................................................................ 26
Gambar 4.6 Implementasi Tahap 4 ................................................................ 26
Gambar 4.7 Halaman Utama .......................................................................... 27
Gambar 4.8 Halaman Grafik .......................................................................... 27
Gambar 4.9 Contoh Input Tweet yang Akan Diekstrak ................................. 28
Gambar 4.10 Hasil Ekstraksi Tweet ................................................................. 28
Gambar 4.11 Halaman Menu Debug ............................................................... 29
Gambar 4.12 Halaman Menu Data Training ................................................... 30
Gambar 4.13 Pelabelan Tweet .......................................................................... 30
Gambar 4.14 Data Testing ............................................................................... 31
Gambar 4.15 Data Peta ..................................................................................... 31
Gambar 4.16 Edit Peta ..................................................................................... 31
Gambar 4.17 Tahapan Perhitungan .................................................................. 41
x
DAFTAR TABEL
Tabel 2.1 Perumusan Precission dan Recall .............................................. 9
Tabel 3.1 Contoh Tabel Training ................................................................ 15
Tabel 3.2 Contoh Tabel Testing .................................................................. 16
Tabel 3.3 Contoh Hasil Ekstraksi ................................................................ 18
Tabel 3.4 Perancangan Tabel Tweet ........................................................... 19
Tabel 3.5 Perancangan Tabel Training ...................................................... 20
Tabel 3.6 Perancangan Tabel Testing ........................................................ 21
Tabel 4.1 Pengujian Sistem ........................................................................ 32
Tabel 4.2 Tabel Confusion Matrix ............................................................. 42
xi
DAFTAR PUSTAKA
[1] Bontcheva, K., Derczynski, L., Funk, A., Greenwood, M.A., Maynard, D.,
Aswani, N. 2013. TwitIE: An Open-Source Information Extraction
Pipeline for Microblog Text. University of Sheffield
[2] Coen, T. A., Salma, Haryanto. Bahasa dalam User Interface. 2002.
[Online]. http://www.master.web.id/mwmag/issue/02/content/bdt-
bahasa_dalam_user_interface/bdt-bahasa_dalam_user_interface.html
[3] Dita. Algoritma Naive Bayes Classification. 2011. [Online].
https://ditut113070242.wordpress.com/tag/teorema-bayes/
[4] Elsaid, Fairuz. 2009. Preprocessing Data Mining. [Online].
https://fairuzelsaid.files.wordpress.com/2009/10/bab-4-preprocessing-data-
mining.pdf
[5] Geek. Perbedaan: Precision, Recall & Accuracy. 2013. [Online].
https://dataq.wordpress.com/tag/precision/
[6] Hasby, M., Khodra, M.L. Optimal Path Finding based on Traffic
Information Extraction from Twitter. 2013. Prosiding International
Conference on ICT for Smart Society 2013.
[7] Jiang, J. 2012. Information Extraction from Text, in Mining Text Data.
Springer.
[8] Kumar, S., Morstatter, F., Liu, H. 2013. Twitter Data Analytics.
TweetTracker Edu
[9] Leylia, M.K., Purwarianti, A. 2013. Ekstraksi Informasi Transaksi Online
pada Twitter. Institut Teknologi Bandung
[10] Lorena, Selvia., Pasya, Reggy Trinanda. 2011. Penggunaan Metode Naïve
Bayes Classifier Pada Aplikasi Perpustakaan. Jurusan Teknik Komputer
Unikom, Bandung.
[11] Nugraha, Terry. Fase Perancangan Basis Data. 2013 [Online].
http://terrymbienugraha.blogspot.com/2013/07/fase-perancangan-basis-
data.html
[12] Rahman, Hidayatul. 2013. Naïve Bayes Algorithm. [Online].
http://education-programmer.blogspot.com/2013/01/naive-bayes-
algorithm_22.html
xii
[13] Rahman, Hidayatul. 2013. Perhitungan Sederhana Naïve Bayes untuk
Predeksi Kelulusan. [Online]. http://education-
programmer.blogspot.com/2013/01/ perhitungan-sederhana-naive-bayes-
untuk.html
[14] Rizki, Mochamad., Saleh, Akuwan. 2011. Kontrol Ekspresi Wajah
Berdasarkan Klasifikasi Teks Menggunakan Metode Naive Bayes. Jurusan
Teknik Telekomunikasi Politeknik Elektronika Negeri Surabaya.
[15] Shadiq, M.A. 2012. Keoptimalan Naïve Bayes dalam Klasifikasi. Program
Ilmu Komputer FPMIPA Universitas Pendidikan Indonesia
[16] Wikipedia. 2013. Twitter. [Online]. http://id.wikipedia.org/wiki/Twitter