Upload
dokhanh
View
230
Download
0
Embed Size (px)
Citation preview
PARSING TWITTER MENGGUNAKAN METODE
LEFT-CORNER PARSING DENGAN
MEMANFAATKAN POS TAGGER
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik
Informatika Univesitas Muhammadiyah Malang
Oleh :
DYAH ANITIA
201110370311255
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2018
Lembar Pernyataan
Yang bertanda tangan di bawah ini :
NAMA : DYAH ANITIA
NIM : 201110370311255
FAKULTAS/JURUSAN : TEKNIK INFORMATIKA
Dengan ini saya menyatakan Tugas Akhir dengan judul “PARSING
TWITTER MENGGUNAKAN METODE LEFT-CORNER PARSING
DENGAN MEMANFAATKAN POS TAGGER” beserta seluruh isinya adalah
karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian
maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan
sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya, apabila
kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya
tulis saya ini, atau klaim dari pihak lain terhadap keaslian karya tulis saya ini
maka saya siap menanggung segala bentuk resiko atau sanksi yang berlaku.
Mengetahui, Malang, 18 April 2018
Dosen Pembimbing I
Yuda Munarko, S.Kom, M.Sc.
NIDN. 0706077902
Yang membuat pernyataan
Dyah Anitia
NIM 201110370311255
KATA PENGANTAR
Assalamualaikum warahmatullah wabarakatuh
Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu wa ta’ala yang telah
melimpahkan kasih dan sayang-Nya kepada kita, sehingga penulis bisa
menyelesaikan skripsi, yang kami beri Judul “Parsing Twitter menggunakan
metode left-corner parsing dengan memanfaatkan Pos Tagger”.
Tujuan dari penyusunan skripsi ini guna memenuhi salah satu syarat untuk bisa
menempuh ujian sarjana pendidikan pada Fakultas Teknik Program Studi Teknik
Informatika di Universitas Muhammadiyah Malang (UMM).
Penulis menyadari sepenuhnya bahwa Tugas Akhir ini masih banyak kekurangan.
Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar
Tugas Akhir ini bermanfaat bagi semua pihak.
Wassalamu’alaikum warramatullahi wabarakatuh
Malang, April 2018
Penulis,
DAFTAR ISI
LEMBAR PERSETUJUAN........................................................................ i
LEMBAR PENGESAHAN ....................................................................... ii
LEMBAR PERNYATAAN. ...................................................................... iii
LEMBAR PERSEMBAHAN .................................................................... iv
ABSTRAK ................................................................................................. v
ABSTRACT ................................................................................................. vi
KATA PENGANTAR .............................................................................. vii
DAFTAR ISI ............................................................................................. viii
DAFTAR GAMBAR ................................................................................. xi
DAFTAR TABEL ..................................................................................... xii
BAB I PENDAHULUAN .......................................................................... 1
1.1 Latar Belakang ............................................................................... 1
1.2 Rumusan Masalah .......................................................................... 2
1.3 Tujuan Penelitian ........................................................................... 2
1.4 Batasan Masalah............................................................................. 2
1.5 Metodelogi ..................................................................................... 3
1.5.1 Studi Pustaka ................................................................. 3
1.5.2 Analisa Dan Rancangan Sistem ..................................... 3
1.5.3 Implementasi Sistem ...................................................... 3
1.5.4 Arsitektur Sistem ........................................................... 3
1.5.5 Pengujian ....................................................................... 4
1.5.6 Pembuatan Laporan ....................................................... 4
1.6 Sistematika Penulisan .................................................................... 4
BAB II LANDASAN TEORI .................................................................... 6
2.1 Telaah Pustaka ............................................................................... 6
2.2 Twitter ............................................................................................ 7
2.3 Bahasa Indonesia Formal ............................................................... 8
2.4 Kelas Kata Dalam Bahasa Indonesia ............................................. 8
2.5 Struktur Kalimat Bahasa Indonesia ............................................... 10
2.6 Natural Language Processing ........................................................ 13
2.7 Tagging ......................................................................................... 15
2.8 Parsing ........................................................................................... 15
2.8.1 Top-Down Dan Bottom-Up Parsing ............................. 17
2.8.2 Left Corner Parsing ....................................................... 17
2.8.3 Adaptasi Left Corner Parsing ....................................... 18
2.9 Stanford NLP Group ..................................................................... 18
BAB III ANALISA DAN PERANCANGAN SISTEM ........................... 19
3.1 Analisa Kebutuhan Sistem ............................................................ 19
3.2.1 Analisa Tweet Berbahasa Indonesia Formal ................ 19
3.2.2 Analisa Kebutuhan POS Tagger ................................... 20
3.2.3 Analisa Kebutuhan Parser ............................................. 23
3.2 Perancangan Sistem ...................................................................... 24
3.2.1 Arsitektur Sistem .......................................................... 24
3.2.2 Metodelogi .................................................................... 24
3.2.2.1 Pengumpulan Data Tweet ..................................... 24
3.2.2.2 Pembuatan Model Tagger ..................................... 24
3.2.2.3 Pembuatan Model Parser....................................... 25
3.2.2.4 Pengujian ............................................................... 27
BAB IV IMPLEMENTASI DAN PENGUJIAN ...................................... 28
4.1 Implementasi.................................................................................... 28
4.1.1 Pembuatan Model Stanford POS Tagger .......................... 28
4.1.2 Pembuatan Model Stanford Parser .................................... 31
4.2 Pengujian ......................................................................................... 32
4.2.1 Pengujian Akurasi Kata..................................................... 32
4.2.2 Pengujian Akurasi Kalimat ............................................... 34
BAB V KESIMPULAN DAN SARAN ................................................... 36
5.1 Kesimpulan ................................................................................... 36
5.2 Saran .............................................................................................. 36
DAFTAR PUSTAKA ............................................................................... 37
LAMPIRAN .............................................................................................. 38
DAFTAR GAMBAR
Gambar 1.1 Arsitektur Sistem ...................................................................................... 4
Gambar 2.1 Perubahan Logo Twitter ........................................................................... 7
Gambar 2.2 Deviration Atau Parse Tree Kalimat “Kucing Itu Mencuri Ikan” ......... 16
Gambar 2.3 Cara Kerja Left-Corner Parsing ............................................................. 18
Gambar 3.1 Arsitektur Sistem .................................................................................... 24
Gambar 3.2 Pembuatan Model Tagger ...................................................................... 25
Gambar 3.3 Pembuatan Model Parser ....................................................................... 26
Gambar 3.4 Parse Tree .............................................................................................. 27
Gambar 4.1 File Stanford ........................................................................................... 28
Gambar 4.2 Data Train POS Tagger.......................................................................... 29
Gambar 4.3 File props.props ..................................................................................... 30
Gambar 4.5 File Model POS Tagger ......................................................................... 31
Gambar 4.6 Data Train Parser................................................................................... 31
Gambar 4.7 File Model Parser .................................................................................. 32
Gambar 4.8 Data Test POS Tagger ............................................................................ 33
Gambar 4.9 Hasil Tagging ......................................................................................... 33
Gambar 4.9 Hasil Pengujian POS Tagger.................................................................. 34
Gambar 4.10 Data Test Parser ................................................................................... 34
Gambar 4.11 Hasil Pengujian Left-Corner Parsing ................................................... 35
Gambar 4.12 Hasil Pengujian Bottom-Up Parsing .................................................... 35
DAFTAR TABEL
Tabel 3.1 Tagset Bahasa Indonesia .................................................................. 20
Tabel 3.2 Context-Free Grammar Bahasa Indonesia ...................................... 23
Tabel 4.1 Hasil Pengujian ................................................................................ 35
DAFTAR PUSTAKA
[1] N. D. Putranti and E. Winarko, “Analisis Sentimen Twitter untuk Teks
Berbahasa Indonesia dengan Maximum Entropy dan Support Vector
Machine,” Ijcss, vol. 8, no. 1, pp. 91–100, 2014.
[2] M. Arrington, “Odeo Releases Twttr,” TechCrunch, 2006. [Online].
Available: http://techcrunch.com/2006/07/15/is-twttr-interesting/.
[3] R. A. Setiorini, “Analisis Penggunaan Tata Bahasa Indonesia Dalam
Penulisan Karya Tulis Ilmiah : Studi Kasus Artikel Ilmiah,” Visi Pustaka,
Perpust. Nas. R.I., vol. 12, no. 1, pp. 6–10, 2010.
[4] D. Novel, D. Umayi, and K. Y. B. Mangunwijaya, “K a n d a i,” vol. 12,
no. 1, pp. 150–164, 2016.
[5] P. Slntaksls and D. A. N. Wacana, “Urutan Klausa Dalam Kalimat
Majemuk Subordinatif Bahasa Indonesia: Kajian Dari Perspektif Sintaksis
Dan Wacana,” Fac. Cult. Sci., vol. Vol 19, No, no. 3, 2007.
[6] D. Tata and B. Baku, “KESANTUNAN BERBAHASA INDONESIA
SEBAGAI UPAYA,” vol. XVII, pp. 17–25, 2015.
[7] N. Sabloak, “Part-of-Speech (POS) Tagging Bahasa Indonesia
Menggunakan Algoritma Viterbi,” no. x, pp. 1–11, 2016.
[8] J. Suciadi, “Studi Analisis Metode-Metode Parsing Dan Interpretasi
Semantik Pada Natural Language Processing,” J. Inform. Fak. Teknol. Ind.
Univ. Kristen Petra, vol. 2, no. 1, pp. 13–22, 2014.
[9] A. J. Demers, “Generalized Left Corner Parsing,” in POPL
’77:Proceedings of the 4th ACM SIGACT-SIGPLAN symposium on
Principles of programming languages, 1977, pp. 170–181.
[10] F. Khusaini and F. Kurniawan, “Implementasi Left Corner Parsing Untuk
Pembelajaran Grammar Bahasa Inggris Pada Game 3D Adventure ‘Go To
London,’” Matics, vol. 5, no. 3, 2013.