12
PARSING TWITTER MENGGUNAKAN METODE LEFT-CORNER PARSING DENGAN MEMANFAATKAN POS TAGGER TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Univesitas Muhammadiyah Malang Oleh : DYAH ANITIA 201110370311255 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2018

TUGAS AKHIR - eprints.umm.ac.ideprints.umm.ac.id/40166/1/Pendahuluan.pdf · kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya tulis saya ini, atau klaim dari

  • Upload
    dokhanh

  • View
    230

  • Download
    0

Embed Size (px)

Citation preview

PARSING TWITTER MENGGUNAKAN METODE

LEFT-CORNER PARSING DENGAN

MEMANFAATKAN POS TAGGER

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik

Informatika Univesitas Muhammadiyah Malang

Oleh :

DYAH ANITIA

201110370311255

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2018

Lembar Pernyataan

Yang bertanda tangan di bawah ini :

NAMA : DYAH ANITIA

NIM : 201110370311255

FAKULTAS/JURUSAN : TEKNIK INFORMATIKA

Dengan ini saya menyatakan Tugas Akhir dengan judul “PARSING

TWITTER MENGGUNAKAN METODE LEFT-CORNER PARSING

DENGAN MEMANFAATKAN POS TAGGER” beserta seluruh isinya adalah

karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian

maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan

sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya, apabila

kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya

tulis saya ini, atau klaim dari pihak lain terhadap keaslian karya tulis saya ini

maka saya siap menanggung segala bentuk resiko atau sanksi yang berlaku.

Mengetahui, Malang, 18 April 2018

Dosen Pembimbing I

Yuda Munarko, S.Kom, M.Sc.

NIDN. 0706077902

Yang membuat pernyataan

Dyah Anitia

NIM 201110370311255

KATA PENGANTAR

Assalamualaikum warahmatullah wabarakatuh

Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu wa ta’ala yang telah

melimpahkan kasih dan sayang-Nya kepada kita, sehingga penulis bisa

menyelesaikan skripsi, yang kami beri Judul “Parsing Twitter menggunakan

metode left-corner parsing dengan memanfaatkan Pos Tagger”.

Tujuan dari penyusunan skripsi ini guna memenuhi salah satu syarat untuk bisa

menempuh ujian sarjana pendidikan pada Fakultas Teknik Program Studi Teknik

Informatika di Universitas Muhammadiyah Malang (UMM).

Penulis menyadari sepenuhnya bahwa Tugas Akhir ini masih banyak kekurangan.

Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar

Tugas Akhir ini bermanfaat bagi semua pihak.

Wassalamu’alaikum warramatullahi wabarakatuh

Malang, April 2018

Penulis,

DAFTAR ISI

LEMBAR PERSETUJUAN........................................................................ i

LEMBAR PENGESAHAN ....................................................................... ii

LEMBAR PERNYATAAN. ...................................................................... iii

LEMBAR PERSEMBAHAN .................................................................... iv

ABSTRAK ................................................................................................. v

ABSTRACT ................................................................................................. vi

KATA PENGANTAR .............................................................................. vii

DAFTAR ISI ............................................................................................. viii

DAFTAR GAMBAR ................................................................................. xi

DAFTAR TABEL ..................................................................................... xii

BAB I PENDAHULUAN .......................................................................... 1

1.1 Latar Belakang ............................................................................... 1

1.2 Rumusan Masalah .......................................................................... 2

1.3 Tujuan Penelitian ........................................................................... 2

1.4 Batasan Masalah............................................................................. 2

1.5 Metodelogi ..................................................................................... 3

1.5.1 Studi Pustaka ................................................................. 3

1.5.2 Analisa Dan Rancangan Sistem ..................................... 3

1.5.3 Implementasi Sistem ...................................................... 3

1.5.4 Arsitektur Sistem ........................................................... 3

1.5.5 Pengujian ....................................................................... 4

1.5.6 Pembuatan Laporan ....................................................... 4

1.6 Sistematika Penulisan .................................................................... 4

BAB II LANDASAN TEORI .................................................................... 6

2.1 Telaah Pustaka ............................................................................... 6

2.2 Twitter ............................................................................................ 7

2.3 Bahasa Indonesia Formal ............................................................... 8

2.4 Kelas Kata Dalam Bahasa Indonesia ............................................. 8

2.5 Struktur Kalimat Bahasa Indonesia ............................................... 10

2.6 Natural Language Processing ........................................................ 13

2.7 Tagging ......................................................................................... 15

2.8 Parsing ........................................................................................... 15

2.8.1 Top-Down Dan Bottom-Up Parsing ............................. 17

2.8.2 Left Corner Parsing ....................................................... 17

2.8.3 Adaptasi Left Corner Parsing ....................................... 18

2.9 Stanford NLP Group ..................................................................... 18

BAB III ANALISA DAN PERANCANGAN SISTEM ........................... 19

3.1 Analisa Kebutuhan Sistem ............................................................ 19

3.2.1 Analisa Tweet Berbahasa Indonesia Formal ................ 19

3.2.2 Analisa Kebutuhan POS Tagger ................................... 20

3.2.3 Analisa Kebutuhan Parser ............................................. 23

3.2 Perancangan Sistem ...................................................................... 24

3.2.1 Arsitektur Sistem .......................................................... 24

3.2.2 Metodelogi .................................................................... 24

3.2.2.1 Pengumpulan Data Tweet ..................................... 24

3.2.2.2 Pembuatan Model Tagger ..................................... 24

3.2.2.3 Pembuatan Model Parser....................................... 25

3.2.2.4 Pengujian ............................................................... 27

BAB IV IMPLEMENTASI DAN PENGUJIAN ...................................... 28

4.1 Implementasi.................................................................................... 28

4.1.1 Pembuatan Model Stanford POS Tagger .......................... 28

4.1.2 Pembuatan Model Stanford Parser .................................... 31

4.2 Pengujian ......................................................................................... 32

4.2.1 Pengujian Akurasi Kata..................................................... 32

4.2.2 Pengujian Akurasi Kalimat ............................................... 34

BAB V KESIMPULAN DAN SARAN ................................................... 36

5.1 Kesimpulan ................................................................................... 36

5.2 Saran .............................................................................................. 36

DAFTAR PUSTAKA ............................................................................... 37

LAMPIRAN .............................................................................................. 38

DAFTAR GAMBAR

Gambar 1.1 Arsitektur Sistem ...................................................................................... 4

Gambar 2.1 Perubahan Logo Twitter ........................................................................... 7

Gambar 2.2 Deviration Atau Parse Tree Kalimat “Kucing Itu Mencuri Ikan” ......... 16

Gambar 2.3 Cara Kerja Left-Corner Parsing ............................................................. 18

Gambar 3.1 Arsitektur Sistem .................................................................................... 24

Gambar 3.2 Pembuatan Model Tagger ...................................................................... 25

Gambar 3.3 Pembuatan Model Parser ....................................................................... 26

Gambar 3.4 Parse Tree .............................................................................................. 27

Gambar 4.1 File Stanford ........................................................................................... 28

Gambar 4.2 Data Train POS Tagger.......................................................................... 29

Gambar 4.3 File props.props ..................................................................................... 30

Gambar 4.5 File Model POS Tagger ......................................................................... 31

Gambar 4.6 Data Train Parser................................................................................... 31

Gambar 4.7 File Model Parser .................................................................................. 32

Gambar 4.8 Data Test POS Tagger ............................................................................ 33

Gambar 4.9 Hasil Tagging ......................................................................................... 33

Gambar 4.9 Hasil Pengujian POS Tagger.................................................................. 34

Gambar 4.10 Data Test Parser ................................................................................... 34

Gambar 4.11 Hasil Pengujian Left-Corner Parsing ................................................... 35

Gambar 4.12 Hasil Pengujian Bottom-Up Parsing .................................................... 35

DAFTAR TABEL

Tabel 3.1 Tagset Bahasa Indonesia .................................................................. 20

Tabel 3.2 Context-Free Grammar Bahasa Indonesia ...................................... 23

Tabel 4.1 Hasil Pengujian ................................................................................ 35

DAFTAR PUSTAKA

[1] N. D. Putranti and E. Winarko, “Analisis Sentimen Twitter untuk Teks

Berbahasa Indonesia dengan Maximum Entropy dan Support Vector

Machine,” Ijcss, vol. 8, no. 1, pp. 91–100, 2014.

[2] M. Arrington, “Odeo Releases Twttr,” TechCrunch, 2006. [Online].

Available: http://techcrunch.com/2006/07/15/is-twttr-interesting/.

[3] R. A. Setiorini, “Analisis Penggunaan Tata Bahasa Indonesia Dalam

Penulisan Karya Tulis Ilmiah : Studi Kasus Artikel Ilmiah,” Visi Pustaka,

Perpust. Nas. R.I., vol. 12, no. 1, pp. 6–10, 2010.

[4] D. Novel, D. Umayi, and K. Y. B. Mangunwijaya, “K a n d a i,” vol. 12,

no. 1, pp. 150–164, 2016.

[5] P. Slntaksls and D. A. N. Wacana, “Urutan Klausa Dalam Kalimat

Majemuk Subordinatif Bahasa Indonesia: Kajian Dari Perspektif Sintaksis

Dan Wacana,” Fac. Cult. Sci., vol. Vol 19, No, no. 3, 2007.

[6] D. Tata and B. Baku, “KESANTUNAN BERBAHASA INDONESIA

SEBAGAI UPAYA,” vol. XVII, pp. 17–25, 2015.

[7] N. Sabloak, “Part-of-Speech (POS) Tagging Bahasa Indonesia

Menggunakan Algoritma Viterbi,” no. x, pp. 1–11, 2016.

[8] J. Suciadi, “Studi Analisis Metode-Metode Parsing Dan Interpretasi

Semantik Pada Natural Language Processing,” J. Inform. Fak. Teknol. Ind.

Univ. Kristen Petra, vol. 2, no. 1, pp. 13–22, 2014.

[9] A. J. Demers, “Generalized Left Corner Parsing,” in POPL

’77:Proceedings of the 4th ACM SIGACT-SIGPLAN symposium on

Principles of programming languages, 1977, pp. 170–181.

[10] F. Khusaini and F. Kurniawan, “Implementasi Left Corner Parsing Untuk

Pembelajaran Grammar Bahasa Inggris Pada Game 3D Adventure ‘Go To

London,’” Matics, vol. 5, no. 3, 2013.

[11] A. Dinakaramani, F. Rashel, A. Luthfi, and R. Manurung, “Designing an

Indonesian part of speech tagset and manually tagged Indonesian corpus,”

Proc. Int. Conf. Asian Lang. Process. 2014, IALP 2014, pp. 66–69, 2014.