HALAMAN JUDUL ANALISIS PERBAIKAN KUALITAS LAYANAN …

HALAMAN JUDUL

ANALISIS PERBAIKAN KUALITAS LAYANAN PADA APLIKASI ZOOM

CLOUD MEETINGS BERDASARKAN ULASAN END-USER MENGGUNAKAN

METODE TEXT MINING DAN FISHBONE DIAGRAM

TUGAS AKHIR

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Strata-1

Pada Jurusan Teknik Industri Fakultas Teknologi Industri

Nama : M. Agung Pratama

No. Mahasiswa 16522070

PROGRAM STUDI TEKNIK INDUSTRI

FAKULTAS TEKNOLOGI INDUSTRI

UNIVERSITAS ISLAM INDONESIA

YOGYAKARTA

2021

ii

SURAT KETERANGAN PENELITIAN

iii

PERNYATAAN KEASLIAN

iv

ANALISIS PERBAIKAN KUALITAS LAYANAN PADA APLIKASI ZOOM

CLOUD MEETINGS BERDASARKAN ULASAN END-USER MENGGUNAKAN

METODE TEXT MINING DAN FISHBONE DIAGRAM

TUGAS AKHIR

Disusun oleh:

Yogyakarta, 05 Maret 2021

Menyetujui,

Pembimbing Tugas Akhir

LEMBAR PENGESAHAN PEMBIMBING

Nama : Muhammad Agung Pratama

NIM : 16522070

Fak/Jurusan : FTI/Teknik Industri

(Annisa Uswatun Khasanah S.T., M.Sc.)

v

LEMBAR PENGESAHAN PENGUJI

ANALISIS PERBAIKAN KUALITAS LAYANAN PADA APLIKASI ZOOM CLOUD

MEETINGS BERDASARKAN ULASAN END-USER MENGGUNAKAN METODE

TEXT MINING DAN FISHBONE DIAGRAM

Disusun oleh:

Nama : Muhammad Agung Pratama

NIM : 16522070

Fak/Jurusan : FTI/Teknik Industri

Telah dipertahankan di depan sidang penguji sebagai satu syarat untuk

memperoleh gelar Sarjana Strata-1 Teknik Industri


Tim Penguji

Annisa Uswatun Khasanah, S.T., MBA, M.Sc.

Ketua

Winda Nur Cahyo, S.T., M.T., Ph.D.

Anggota I

Harwati, S.T., M.T.

Anggota II

vi

HALAMAN PERSEMBAHAN

Alhamdulillahirobbil’alamin. Puji syukur atas kehadirat Allah SWT dan atas semua

nikmat yang telah diberikan. Dan tak lupa sholawat beriring salam kepada Baginda

Nabi Agung Muhammad SAW. beserta keluarga dan sahabat-sahabatnya. Tugas akhir

ini saya persembahkan kepada:

Bapak Jumakir dan Ibu Nursilawati selaku kedua orang tua saya yang tiada henti

mendo’akan, dan memberikan semangat dan motivasi. Teruntuk adik tercinta, dan

kerabat dekat yang telah memberikan dukungan dan motivasi yang begitu berarti

kepada saya.

Tak lupa saya persembahkan pula kepada seluruh dosen dan karyawan Universitas

Islam Indonesia yang telah mencurahkan ilmu dan bantuan selama saya kuliah di

Universitas Islam Indonesia.

vii

HALAMAN MOTTO

“Maka sesungguhnya beserta kesulitan ada kemudahan, sesungguhnya beserta

kesulitan ada kemudahan” (Q.S. Al-Insyirah ayat 5 – 6)

"Hai orang-orang yang beriman, jadikanlah sabar dan shalat sebagai penolongmu,

sesungguhnya Allah beserta orang-orang yang sabar” (Q.S. Al-Baqarah ayat 153)

“Allah tidak membebani seseorang melainkan sesuai dengan kesanggupannya”

(Q.S. Al-Baqarah ayat 286)

viii

KATA PENGANTAR

Assalamu’alaikum Warahmatullaahi Wabarakaatuh

Alhamdulillahirabbil’aalamin, segala puji dan syukur bagi Allah SWT atas berkah,

rahmat, dan nikmat yang diberikan kepada hamba-Nya. Tidak lupa shalawat serta

salam kepada Nabi agung Muhammad SAW beserta keluarga dan sahabat yang telah

membawa umatnya dari zaman kegelapan menuju zaman terang benderang, dari zaman

jahiliyah menuju zaman yang penuh dengan ilmu pengetahuan.

Atas rahmat dan izin Allah SWT, penulis dapat menyelesaikan tugas akhir

dengan judul “ANALISIS PERBAIKAN KUALITAS LAYANAN PADA

APLIKASI ZOOM CLOUD MEETINGS BERDASARKAN ULASAN END-USER

MENGGUNAKAN METODE TEXT MINING DAN FISHBONE DIAGRAM” yang

disusun sebagai salah satu persyaratan dalam menyelesaikan jenjang strata satu di

Program Studi Teknik Industri, Fakultas Teknologi Industri, Universitas Islam

Indonesia. Dalam penelitian tugas akhir ini, penulis mendapatkan pengetahuan,

bimbingan, dukungan, dan saran dari berbagai pihak. Oleh karena itu, penulis ingin

mengucapkan terimakasih kepada:

1. Bapak Prof. Dr. Ir. Hari Purnomo, M.T. selaku Dekan Fakultas Teknologi

Industri Universitas Islam Indonesia.

2. Bapak Muhammad Ridwan Andi Purnomo, S.T., M.Sc., Ph. D. selaku Ketua

Jurusan Teknik Industri Fakultas Teknologi Industri Universitas Islam

Indonesia.

3. Bapak Dr. Taufiq Immawan, S.T., M.M. selaku Ketua Program Studi Teknik

Industri Universitas Islam Indonesia.

4. Ibu Annisa Uswatun Khasanah, S.T., M.Sc. selaku dosen pembimbing Tugas

Akhir program studi Teknik Industri Universitas Islam Indonesia.

5. Bapak Jumakir dan Ibu Nursilawati selaku orang tua saya serta adik tersayang

Sophie Ananda Rizki yang selalu memberikan kasih sayang dan dukungan

kepada saya hingga saat ini.

ix

6. Teman-teman Lembaga Dakwah Kampus HAWASI. Terutama teman-teman

divisi Pendidikan dan Pengembangan Sumber Daya Manusia (PPSDM) yang

senantiasa memberikan dukungan kepada penulis.

7. Reza Frilian Artha, Andre Saefulloh, M. Dzaki Agung Ghifari, Adli Kurniawan,

Dynta Adiasa, Dentoro Abrilicto selaku teman sehobi yang senantiasa

memberikan dukungan kepada penulis.

8. Teman dekat semasa kuliah Alfian Willy Saputra, Huzein Mulyawan, Munawar

Hakki, Auliya Firdaus, Hariyo Ibrahim Malik dan Abdul Gofur Wiguna yang

senantiasa dengan senang hati berbagi ilmu dan terimakasih atas dukungan dan

semangat yang diberikan kepada penulis.

9. Teman-teman serta sahabat Teknik Industri Fakultas Teknologi Industri

Universitas Islam Indonesia terutama angkatan 2016.

Penulis berharap semoga seluruh pihak yang terlibat tetap diberikan nikmat jasmani dan

rohani, serta dilancarkan segala urusannya oleh Allah SWT.

Dalam penulisan Tugas Akhir ini, penulis menyadari masih banyak kekurangan

yang perlu diberikan kritik dan saran yang membangun. Oleh karena itu, penulis

memohon maaf yang sebesar-besarnya kepada pihak yang terlibat serta pembaca Tugas

Akhir ini. Namun terlepas dari itu semua, penulis berharap Tugas Akhir ini dapat

memberikan manfaat bagi penulis dan para pembaca.

Wassalamu’alaikum warahmatullahi wabarakatuh


Muhammad Agung Pratama

x

ABSTRAK

Pada era revolusi industri 4.0 seperti saat ini, terjadi suatu perkembangan teknologi

yang begitu pesat dan sudah merambah ke berbagai bidang khususnya di bidang

telekomunikasi. Salah satu kemajuan teknologi telekomunikasi ialah teknologi yang

dapat mendukung komunikasi audio maupun video secara bersamaan dan real time

yaitu video conference. Salah satu perusahaan yang bergerak pada bidang jasa

telekomunikasi berbasis video conference yaitu Zoom Technologies, Inc yang

meluncurkan aplikasi zoom cloud meetings yang dapat diunduh melalui Google Play

Store yang tujuannya agar pengguna zoom juga dapat melakukan meeting melalui

smartphone mereka. Namun, hingga Desember 2020 aplikasi Zoom Cloud Meetings

hanya mendapatkan rating sebesar 3,6 bintang dari total keseluruhan rating sebesar 5,0.

Oleh karena itu, diperlukan adanya penelitian terkait Zoom Cloud Meetings dengan

menggunakan ulasan pengguna dari Google Play Store. Ulasan yang dianalisis pada

penelitian berjumlah sebesar 75.454 yang telah diklasifikasikan menjadi kelas sentimen

positif dan negatif menggunakan algoritma Naïve Bayes Classifier serta dilakukan

association rule. Klasifikasi dengan Naïve Bayes Classifier dengan data latih 85% dan

data uji 15% menghasilkan akurasi optimum sebesar 86,67%. Dari hasil analisis ulasan,

didapatkan delapan kata kunci permasalahan yaitu, “meeting”, “video”, “audio”,

“class”, “work”, “update”, “time” dan “connect”. Beberapa penyebab permasalahan

diantaranya connecting ke meeting dalam waktu yang lama, keluhan akan kualitas

suara, video dan waktu yang limited bagi pengguna gratis, serta masalah terkait aplikasi

yang tidak dapat dijalankan. Solusi yang mungkin dapat dilakukan diantaranya

melakukan update untuk menghilangkan bug dan memperbaiki masalah yang dialami

pengguna, meningkatkan kualitas suara dan video serta memberlakukan sistem

unlimited time bagi semua pengguna.

Kata Kunci: Text Mining, Analisis Sentimen, Naïve Bayes Classifier, Zoom Cloud

Meetings, Diagram Fishbone, Association Rules

xi

DAFTAR ISI

HALAMAN JUDUL ................................................................................................................. i

SURAT KETERANGAN PENELITIAN ................................................................................. ii

PERNYATAAN KEASLIAN ................................................................................................. iii

LEMBAR PENGESAHAN PEMBIMBING ........................................................................... iv

LEMBAR PENGESAHAN PENGUJI ..................................................................................... v

HALAMAN PERSEMBAHAN .............................................................................................. vi

HALAMAN MOTTO ............................................................................................................. vii

KATA PENGANTAR ........................................................................................................... viii

ABSTRAK ................................................................................................................................ x

DAFTAR ISI ............................................................................................................................ xi

DAFTAR TABEL .................................................................................................................. xiv

DAFTAR GAMBAR .............................................................................................................. xv

BAB I PENDAHULUAN ....................................................................................................... 1

1.1 Latar Belakang ........................................................................................................... 1

1.2 Rumusan Masalah ...................................................................................................... 5

1.3 Batasan Masalah ......................................................................................................... 5

1.4 Tujuan Penelitian ....................................................................................................... 6

1.5 Manfaat Penulisan ...................................................................................................... 6

1.6 Sistematika Penulisan Laporan .................................................................................. 6

BAB II TINJAUAN PUSTAKA ............................................................................................ 8

2.1 Kajian Induktif ........................................................................................................... 8

2.2 Kajian Deduktif ........................................................................................................ 15

2.2.1 Video Conference ................................................................................................................. 15

2.2.2 Zoom .................................................................................................................................... 16

xii

2.2.3 Google Play .......................................................................................................................... 18

2.2.4 Online Review ...................................................................................................................... 18

2.2.5 Data Mining ......................................................................................................................... 19

2.2.6 Web Scraping ....................................................................................................................... 20

2.2.7 Machine Learning ................................................................................................................ 21

2.2.8 Text Mining .......................................................................................................................... 22

2.2.9 Sentiment Analysis ............................................................................................................... 23

2.2.10 Classification ....................................................................................................................... 24

2.2.11 Ukuran Evaluasi Model Klasifikasi ..................................................................................... 24

2.2.12 Naïve Bayes Classifier ......................................................................................................... 26

2.2.13 Association Rule ................................................................................................................... 26

2.2.14 Diagram Fishbone ................................................................................................................ 27

BAB III METODOLOGI PENELITIAN ............................................................................. 28

3.1 Rancangan Penelitian ............................................................................................... 28

3.2 Populasi dan Sampel ................................................................................................ 28

3.3 Pengumpulan Data ................................................................................................... 29

3.3.1 Metode Pengumpulan Data .................................................................................................. 29

3.4 Jenis dan Sumber Data ............................................................................................. 29

3.5 Metode Analisis Data ............................................................................................... 30

3.6 Alur Penelitian ......................................................................................................... 30

BAB IV PENGUMPULAN DAN PENGOLAHAN DATA ................................................ 36

4.1 Pengumpulan Data ................................................................................................... 36

4.2 Pengolahan Data ....................................................................................................... 39

4.2.1 Analisis Deskriptif ............................................................................................................... 39

4.2.2 Text Preprocessing ............................................................................................................... 41

4.2.3 Representasi Model .............................................................................................................. 45

4.2.4 Pembagian Data Latih dan Data Uji ..................................................................................... 46

4.2.5 Visualisasi ............................................................................................................................ 51

xiii

4.2.6 Association Rule ................................................................................................................... 54

4.2.7 Fishbone Diagram ............................................................................................................... 59

BAB V ANALISIS DAN PEMBAHASAN ......................................................................... 64

5.1 Gambaran Umum Persepsi Pengguna Zoom Cloud Meetings ................................. 64

5.2 Hasil Klasifikasi Metode Naïve Bayes Classifier .................................................... 65

5.3 Hasil Association Rules ............................................................................................ 65

5.4 Rencana Perbaikan Berdasarkan Diagram Fishbone ............................................... 69

BAB VI KESIMPULAN DAN SARAN .............................................................................. 71

6.1 Kesimpulan .............................................................................................................. 71

6.2 Saran ......................................................................................................................... 72

DAFTAR PUSTAKA ............................................................................................................. 73

LAMPIRAN ............................................................................................................................ 78

xiv

DAFTAR TABEL

Tabel 1.1 Jumlah Pengguna Aplikasi Video Conference .................................................. 3

Tabel 2.1 Confusion Matrix ............................................................................................ 20

Tabel 2.2 Penelitian terdahulu ........................................................................................ 26

Tabel 4.1 Contoh Penghapusan Angka Pada Data .......................................................... 45

Tabel 4.2 Contoh Penghapusan Tanda Baca Pada Data ................................................. 45

Tabel 4.3 Contoh Penghapusan Emoji Pada Data ........................................................... 46

Tabel 4.4 Contoh Case Folding Pada Data ..................................................................... 46

Tabel 4.5 Contoh Penerapan Tokenization Pada Data .................................................... 47

Tabel 4.6 Contoh Penerapan Filtering Data ................................................................... 47

Tabel 4.7 Hasil Pelabelan Kelas Sentimen berbasis Kamus Lexicon ............................. 48

Tabel 4.8 Perbandingan Jumlah Data pada Kelas Sentimen ........................................... 49

Tabel 4.9 Pembagian Data Latih dan Data Uji 1 ............................................................ 50

Tabel 4.10 Pembagian Data Latih dan Data Uji 2 .......................................................... 50



Tabel 4.13 Hasil Klasifikasi 1 ......................................................................................... 51




Tabel 5.1 Rencana Perbaikan Masalah ........................................................................... 73

.

xv

DAFTAR GAMBAR

Gambar 1.1 Jumlah Pengguna Internet di Indonesia ........................................................ 1

Gambar 2.1 Logo Zoom .................................................................................................. 10

Gambar 2.2 Tahapan proses KDD .................................................................................. 13

Gambar 3.1 Interface appfollow.id ................................................................................. 32

Gambar 3.2 Flowchart penelitian ................................................................................... 35

Gambar 4.1 Interface Beranda Appfollow ..................................................................... 36

Gambar 4.2 Pemilihan Aplikasi ...................................................................................... 37

Gambar 4.3 Dashboard Rating & Ulasan ....................................................................... 37

Gambar 4.4 Interface Reply to Reviews .......................................................................... 38

Gambar 4.5 Export Data ................................................................................................. 38

Gambar 4.6 Hasil Scraping dari AppFollow .................................................................. 39

Gambar 4.7 Jumlah Ulasan Pengguna ............................................................................ 40

Gambar 4 8 Persentase Rating ........................................................................................ 41

Gambar 4.9 Bar Plot Ulasan Positif ............................................................................... 52

Gambar 4.10 Bar Plot Ulasan Negatif ............................................................................ 53

Gambar 4.11 Asosiasi Kata Ulasan Positif ..................................................................... 54

Gambar 4.12 Asosiasi Kata Ulasan Negatif ................................................................... 57

Gambar 4.13 Diagram Fishbone Untuk Permasalahan Update ...................................... 60

Gambar 4.14 Diagram Fishbone Untuk Permasalahan Durasi ....................................... 60

Gambar 4.15 Diagram Fishbone Untuk Permasalahan Audio ........................................ 61

Gambar 4.16 Diagram Fishbone Untuk Permasalahan Koneksi .................................... 61

Gambar 4.17 Diagram Fishbone Untuk Permasalahan Fitur Video ............................... 62

Gambar 4.18 Diagram Fishbone Untuk Permasalahan Meeting ..................................... 62

Gambar 4.19 Diagram Fishbone Untuk Permasalahan Sistem ....................................... 63

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pada era revolusi industri 4.0 seperti saat ini, terjadi suatu perkembangan teknologi

yang begitu pesat dan sudah merambah ke berbagai bidang khususnya di bidang

telekomunikasi. Telekomunikasi saat ini bukan lagi menjadi kebutuhan sekunder

melainkan telah menjadi kebutuhan primer bagi masyarakat. Kemajuan ilmu

pengetahuan dan teknologi serta kebutuhan manusia akan kemajuan telekomunikasi

menyebabkan perkembangan telekomunikasi yang begitu cepat.

Perkembangan telekomunikasi ini diiringi dengan banyaknya pengguna Internet

pada zaman serba digital seperti saat ini, hal ini dibuktikan dengan survei yang telah

dilakukan lembaga APJII pada 2 – 25 Juni 2020 menunjukkan bahwa jumlah penetrasi

pengguna Internet di Indonesia periode 2019-2020 (Q2) yaitu sebesar 73,7 %. Jumlah

penetrasi tersebut meningkat sebesar 8,9% dibandingkan jumlah pengguna pada tahun

sebelumnya. Terjadi kenaikan pengguna sebanyak 25 juta pengguna, yang sebelumnya

sebanyak 171,7 juta menjadi 196,71 juta pengguna (Ditunjukkan pada gambar 1.1).

Sampel yang digunakan pada survei ditujukan ke 7000 responden di seluruh Indonesia.

Gambar 1.1 Jumlah Pengguna Internet di Indonesia

Sumber: APJII (2020)

2

Seiring dengan berkembangnya zaman teknologi dan kebutuhan manusia,

telekomunikasi telah berevolusi yang awalnya hanya dapat berkomunikasi melalui

komunikasi suara dan teks hingga berkembang menjadi komunikasi melalui video

secara real time, perkembangan ini seakan menyebabkan timbulnya tuntutan akan

layanan teknologi komunikasi yang mendekati kesempurnaan, baik itu dari segi

kecepatan akses, kejernihan suara, ketajaman gambar, keamanan data, dan lain

sebagainya.

Salah satu teknologi modern yang dapat mendukung komunikasi audio maupun

video secara bersamaan yaitu video conference. Video Conference merupakan salah satu

jenis layanan multimedia yang dapat memenuhi kebutuhan user saat ini yang

menginginkan adanya komunikasi secara real time, anytime, dan anywhere. Layanan ini

dapat diimplementasikan melalui suatu jaringan (network) (Novienstinawati, 2008).

Sejak munculnya masa pandemi COVID-19, penggunaan aplikasi yang berbasis

video conference mulai menjadi tren masyarakat karena pandemi COVID-19 yang

menyebar hampir di semua negara termasuk Indonesia. Pemerintah menetapkan

kebijakan baru guna menekan penyebaran virus corona dengan menghimbau

masyarakat agar tidak keluar dari rumah dan bekerja dari rumah atau Work From Home

(WFH). Begitu juga bagi pelajar dan mahasiswa untuk belajar dari rumah atau study

from home (SFH) sehingga secara tidak langsung mewajibkan semua aktivitas tersebut

harus dilakukan secara virtual atau melalui online. Pemberlakuan sistem tersebut

mengharuskan masyarakat menggunakan aplikasi berbasis video conference untuk

melakukan aktivitas secara daring dari rumah. Salah satu diantara perusahaan jasa

layanan komunikasi video conference yang saat ini sedang naik daun dan banyak

digunakan sejak masa pandemi COVID-19 adalah Zoom Technologies Inc.

Berdasarkan data dari Statqo Analytics terkait dengan jumlah penggunaan

aplikasi video conference meningkat setiap minggunya khususnya sejak dikeluarkannya

kebijakan baru untuk melakukan physical distancing dan aktivitas Work From Home

(WFH). Adapun pada bulan Maret 2020, jumlah penggunaan aplikasi Zoom cloud

meetings mengalami peningkatan yang sangat signifikan. Jumlah penggunaan aplikasi

Zoom cloud meetings meningkat hingga sekitar 183% dari 6 Maret – 26 Maret 2020

seperti yang dapat diperhatikan pada Tabel 1.1 berikut :

3

Tabel 1.1 Jumlah Pengguna Aplikasi Video Conference

APLIKASI JUMLAH PENGGUNA

28 Feb-5 Maret 6-12 Maret 13-19 Maret 20-26 Maret

Zoom Meeting 8.714 8.985 91.030 257.853

Google Meet 1.448 1.554 7.917 10.454

Skype 60.614 60.641 65.875 17.115

Cisco Webex 3.983 4.123 8.257 8.748

GoToMeeting 479 505 696 977

Sumber : (Statqo Analytics, 2020)

Zoom sendiri dapat diakses dengan mudah melalui website zoom.us dan dapat

diinstal di smartphone, PC maupun laptop. Zoom juga memiliki aplikasi yang bernama

Zoom cloud meetings yang dapat diunduh di google play store bagi pengguna

smartphone, zoom cloud meetings merupakan produk utama yang diciptakan oleh Zoom

Technologies Inc. dan aplikasi ini secara resmi dirilis pada 25 Januari 2013. Fitur

utama pada aplikasi Zoom Cloud Meetings adalah video conferencing yang berbasis

cloud computing dengan kapasitas lebih dari 100 partisipan untuk bertatap muka secara

virtual. Aplikasi zoom cloud meetings sangat diminati oleh banyak orang karena sangat

reliable, simpel, dengan fitur collaboration, webinar, presentasi dan dapat diakses di PC

maupun di smartphone. Zoom cloud meetings saat ini telah didownload lebih dari 500

juta kali di google play. Zoom cloud meetings telah mendapatkan ulasan dari

penggunanya melalui google play sebanyak lebih dari 300 ribu komentar. Ulasan ini

meliputi keluhan-keluhan pengguna maupun apresiasi dari pengguna.

Ulasan dari pengguna aplikasi sangat membantu perusahaan dalam memperoleh

informasi terhadap citra perusahaan ataupun produk yang dibuat perusahaan itu sendiri.

Hal ini disebabkan karena calon user umumnya mengamati perspektif dari opini

pengguna lain sebelum menggunakan produk atau layanan tersebut (Fanani, 2017).

Zoom Cloud Meetings menawarkan banyak fitur dan kemudahan, akan tetapi

kelebihan yang ada tersebut tidak sepenuhnya membuat pengguna merasa puas akan

layanan yang telah diberikan. Berdasarkan rating yang didapatkan aplikasi zoom cloud

meetings di google play, hingga Desember 2020 zoom cloud meetings hanya

mendapatkan rating sebesar 3,6 bintang dari total penilaian sebesar 5,0 (ditunjukkan

pada Gambar 1.1). Terkadang sebuah sistem juga mempunyai kelemahan, untuk itu

perlu adanya perbaikan–perbaikan yang perlu dilakukan pada aplikasi Zoom Cloud

Meetings. Kelemahan pada aplikasi zoom cloud meetings dibuktikan dengan keluhan-

keluhan pengguna yang disampaikan melalui user reviews pada google play.

4

Gambar 1.2 Rating dan Ulasan Zoom Cloud Meetings

Sumber: Google Play Store (2020)

Berdasarkan ulasan dari pengguna tersebut dapat dianalisa faktor apa saja yang

perlu diperbaiki dan dievaluasi oleh perusahaan. Untuk mengumpulkan dan mengolah

semua ulasan tersebut membutuhkan waktu yang banyak jika dilakukan secara manual,

maka dari itu diperlukan suatu metode atau teknik untuk dapat melakukannya. Salah

satu metode yang sesuai yaitu dengan menggunakan text mining.

Text mining merupakan sebuah proses pengambilan informasi dari data tekstual

yang memiliki kualitas tinggi serta dapat mengetahui permasalahan dalam teks dari

sebuah topik tertentu. Text mining dalam analisa sentimen mampu mengidentifikasi

emosional terhadap suatu pernyataan (Zhang, et al, 2015).

Dari latar belakang yang telah diuraikan tersebut, perlu dilakukan analisis lebih

lanjut mengenai ulasan pengguna Zoom Cloud Meetings di Google Play. Pada tahap

awal penelitian dilakukan pengambilan data dengan teknik scraping data karena jika

dilakukan secara manual membutuhkan waktu untuk jumlah ulasan yang begitu banyak.

Tahap selanjutnya dilakukan pengklasifikasian ulasan menjadi ulasan positif dan negatif

dengan menggunakan algoritma Naïve Bayes Classifier. Naïve Bayes memiliki

keunggulan dibandingkan metode klasifikasi lainnya, naïve bayes merupakan metode

paling sederhana dan memiliki tingkat akurasi yang sangat tinggi ketika diterapkan pada

5

big data (Wati, 2016). Selain itu naïve bayes memiliki tingkat kesalahan yang sangat

minimum dibandingkan algoritma lainnya (Liu et al., 2013).

Setelah tahapan klasifikasi, informasi pada ulasan dengan sentimen positif dan

negatif dilakukan ekstraksi dan eksplorasi pada tahap analisis deskriptif, kemudian pada

tahapan association rules bertujuan untuk mencari kata kunci yang sering muncul dan

menemukan suatu korelasi kata (Dunham, 2003). Setelah itu dilakukan analisis diagram

fishbone untuk menemukan akar permasalahan pada kata kunci yang telah didapatkan

dari ulasan negatif yang kemudian dapat dijadikan referensi untuk rencana perbaikan

terhadap permasalahan yang terdapat pada aplikasi Zoom Cloud Meetings. Harapannya,

penelitian ini mampu memberikan informasi ataupun rekomendasi dalam suatu

pemecahan masalah serta penyajian informasi dari data yang diamati dapat memberikan

informasi yang berguna bagi pihak yang membutuhkan.

1.2 Rumusan Masalah

Berdasarkan latar belakang masalah yang telah diuraikan, maka dalam penelitian ini

permasalahan yang akan dirumuskan diantaranya adalah:

1. Bagaimana gambaran umum tentang ulasan pengguna Zoom Cloud Meetings

berdasarkan situs Google Play ?

2. Berapa akurasi algoritma Naïve Bayes dalam mengklasifikasikan ulasan

pengguna Zoom menjadi kelas ulasan positif dan negatif?

3. Berdasarkan word cloud dan association rule, pola kata apa saja yang sering

muncul dan informasi apa yang didapatkan mengenai ulasan pengguna Zoom

Cloud Meetings berbahasa Inggris berdasarkan situs Google Play?

4. Berdasarkan diagram fishbone, faktor-faktor apa saja yang harus dilakukan

untuk memperbaiki dari hasil ulasan negatif yang didapat?

1.3 Batasan Masalah

Batasan masalah yang ditentukan untuk menghindari perluasan pembahasan dalam

penelitian ini adalah sebagai berikut:

1. Data yang akan digunakan hanya data ulasan pengguna Zoom Cloud Meetings

pada Google Play.

2. Penelitian ini menggunakan data ulasan pengguna aplikasi Zoom Cloud

Meetings yang berbahasa Inggris yang tercatat dari 14 Maret 2019-20 November

2020.

6

3. Penelitian ini menggunakan bantuan software python versi 3.8.6 dan Microsoft

excel untuk melakukan tahapan proses analisis data serta aplikasi appfollow

untuk melakukan scraping data di google play.

4. Penelitian ini yang dilakukan dengan metode klasifikasi tidak sampai ke tahap

memprediksi data yang baru.

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah sebagai berikut :

1. Mengetahui gambaran umum data ulasan tentang Zoom Cloud Meetings

berdasarkan situs Google Play.

2. Mengukur akurasi algoritma Naïve Bayes dalam mengklasifikasikan ulasan pengguna

Zoom menjadi kelas ulasan positif dan negatif

3. Menemukan pola kata yang sering muncul dan mendapatkan informasi penting dari

ulasan pengguna aplikasi zoom cloud meetings berdasarkan hasil word cloud dan

association rule.

4. Mendapatkan informasi faktor apa saja yang harus diperbaiki dan rencana

pemecahan masalah berdasarkan acuan diagram fishbone.

1.5 Manfaat Penulisan

Manfaat dari penelitian ini adalah sebagai berikut:

1. Mengetahui gambaran umum tentang ulasan pengguna aplikasi Zoom Cloud

Meetings berdasarkan Google Play Store.

2. Pengelompokkan ulasan tentang Zoom Cloud Meetings dapat memudahkan

pihak perusahaan dalam mengetahui keluhan pengguna aplikasi, sehingga dapat

dijadikan sebagai acuan dalam upaya menjaga kualitas dan mengembangkan

kualitas dengan cara memperbaiki kekurangan yang terdapat pada aplikasi serta

evaluasi ke arah yang lebih baik.

1.6 Sistematika Penulisan Laporan

Penulisan tugas akhir ini akan disusun dalam beberapa bab yang akan dijelaskan

sebagai berikut :

7

BAB I PENDAHULUAN

Membahas mengenai latar belakang permasalahan yang menjadi alasan

penelitian ini dilakukan, rumusan masalah, batasan masalah, tujuan

penelitian, manfaat penelitian dan sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Berisi pemaparan terkait istilah-istilah yang digunakan dalam penelitian ini.

Bab ini juga memaparkan penelitian-penelitian terdahulu yang berhubungan

dengan permasalahan yang diteliti dan menjadi acuan konseptual.

BAB III METODOLOGI PENELITIAN

Mengandung uraian terkait rancangan penelitian yang dilakukan, populasi

dan sampel penelitian, metode pengumpulan data, jenis dan sumber data,

metode analisis data serta diagram alur penelitian.

BAB IV PENGUMPULAN DAN PENGOLAHAN DATA

Memuat mengenai data yang diperoleh selama penelitian dan bagaimana

pengolahan data tersebut. Hasil pengolahan data menjadi acuan untuk

pembahasan yang akan ditulis pada sub bab pembahasan hasil.

BAB V ANALISIS DAN PEMBAHASAN

Membahas mengenai analisa yang dilakukan terhadap hasil pengumpulan,

pengolahan dan analisa data yang diperoleh dari hasil penelitian sehingga

menghasilkan sebuah saran rekomendasi perbaikan.

BAB VI PENUTUP

Berisi mengenai kesimpulan yang diperoleh dari hasil penelitian dan analisa

data yang telah dilakukan serta saran-saran yang dapat diterapkan dari hasil

pengolahan data yang dapat menjadi masukan yang berguna kedepannya.

DAFTAR PUSTAKA

LAMPIRAN

8

BAB II

TINJAUAN PUSTAKA

2.1 Kajian Induktif

Adiyana et al., (2015) dalam penelitiannya menggunakan metode text mining dan word

cloud bertujuan untuk menganalisis topik – topik terkait “Kpk dan Jokowi”. Penelitian

ini dilakukan dengan bantuan software “R”. Hasil penelitian menunjukkan bahwa

terdapat kesamaan topik utama yang digunakan pada tweet-tweet ketika pengguna

twitter mencari informasi seputar topik KPK dan Jokowi pada search engine twitter

yaitu topik utama KPK dan Polri. Berdasarkan ukuran asosiasi kata dengan nilai

korelasi tidak kurang dari 0.30, kata-kata yang berasosiasi dengan kata KPK adalah kata

Polri dan Lapor. Sedangkan kata-kata yang berasosiasi dengan Jokowi dimana nilai

korelasi tidak kurang dari 0.30 adalah kata Widodo, Menghadiri, Izin, Pintu, Satu,

Investor, Urus, Presiden, Nilai, Aktif, Bahaya, Manuver, Menang, Mulai, Relawan, dan

Sejumlah. Terdapat kesamaan topik yang dibahas pada pengelompokan tweet untuk

topik KPK dan Jokowi yaitu tweet yang membahas mengenai topik "kpk, polri, dan

jokowi”.

Ma’arif (2016) melakukan penelitian mengenai integrasi laman web tentang

pariwisata Daerah Istimewa Yogyakarta yang memanfaatkan teknologi web scraping

dan text mining, penelitian ini bertujuan untuk eksplorasi laman-laman yang menyajikan

informasi mengenai pariwisata DIY kemudian mengumpulkan informasi tersebut secara

otomatis dengan teknik web scraping, informasi yang telah terkumpul, selanjutnya

diolah dengan metode text mining. Dari lima situs yang diambil untuk diolah,

didapatkan hasil berupa enam kategori dan kata kunci untuk setiap kategorinya, kategori

9

yang didapatkan ialah pantai, alam, belanja, kuliner, budaya dan taman. Hasil akhir dari

penelitian ini membangun sebuah laman web baru yang menyajikan informasi-

informasi yang sudah diperoleh dengan kategorisasi yang sudah didapatkan.

Karyadi et al., (2016) melakukan penelitian terkait penggunaan metode text

mining untuk mengetahui kecenderungan topik pemberitaan dan mengetahui topik apa

yang sering muncul. Analisis data pada penelitian ini menggunakan metode text mining

dengan bantuan software R dan metode k-means clustering. Hasil penelitian

berdasarkan word cloud yang telah dibuat menunjukkan bahwa kata yang paling sering

muncul adalah “ahok” dengan kemunculan terbanyak yaitu lebih dari 25 kali. Selain

mengenai ahok kecenderungan pemberitaan lainnya yakni mengenai Rp (rupiah), DKI,

mobil, macet, Luhut, RI, DPR, Jokowi, Eropa dan lain-lain. Cluster tweet yang

terbentuk dari K-means clustering yakni sebanyak tiga cluster.

Priyanto et al., (2018) melakukan sebuah penelitian mengenai implementasi web

scraping dan text mining untuk akuisisi dan kategorisasi informasi laman web tentang

hidroponik. Penelitian ini bertujuan untuk mengimplementasikan teknik web scraping

yang dikombinasikan dengan text mining untuk secara otomatis mengakuisisi informasi

dari laman-laman web yang memuat informasi mengenai hidroponik dan

mengkategorisasikannya. Hasil penelitian ini adalah data mengenai artikel hidroponik

yang tersebar di berbagai laman web dapat diakuisisi secara otomatis kemudian

dikelompokkan menjadi 12 topik menggunakan algoritma topic modelling yakni Latent

Dirichelet Allocation (LDA).

Kurniasari (2018) dalam penelitiannya menerapkan teknik web scraping dan

klasifikasi sentimen dengan menggunakan metode Support Vector Machine (SVM).

Klasifikasi kemudian dianalisis dengan menggunakan text mining. Klasifikasi dengan

metode SVM menunjukkan tingkat akurasi sebesar 96,07% pada ulasan berbahasa

Inggris dan sebesar 84,07% pada ulasan berbahasa Indonesia. Berdasarkan diagram

fishbone, hasil yang didapatkan adalah urutan faktor yang harus dibenahi menurut hasil

dari ulasan negatif adalah faktor fasilitas, pelayanan dan lingkungan.

Fikria (2018) dalam penelitiannya melakukan analisis klasifikasi sentimen pada

ulasan aplikasi e-ticketing. Dengan klasifikasi ulasan pengguna berdasarkan jenis

sentimen akan mempermudah PT. KAI dalam mendapatkan informasi persepsi dari

pengguna aplikasi KAI Access. Penelitian ini menerapkan tahap preprocessing untuk

mengolah data mentah suatu ulasan agar dapat dibuat suatu model yang dapat

10

mempresentasikan suatu data, data ini diolah dengan menggunakan metode Support

Vector Machine (SVM). Klasifikasi dengan algoritma SVM menghasilkan akurasi

klasifikasi sebesar 89,06% pada ulasan KAI Access dan 84,68% pada ulasan Tiket.com.

Kemudian eksplorasi data ulasan menggunakan metode statistika deskriptif dan asosiasi

teks untuk mencari kata-kata yang berhubungan.

Titania (2020) dalam penelitiannya menerapkan text mining dan social network

analysis pada jejaring sosial twitter, dibuatnya penelitian ini bertujuan untuk

mengetahui tanggapan dari masyarakat dan mengidentifikasi aktor penting dalam

diskusi kasus dugaan korupsi Asuransi Jiwasraya dan ASABRI di jejaring sosial, maka

dari itu penelitian ini menggunakan metode text mining dan social network analysis.

Berdasarkan hasil penelitian yang telah didapatkan ditunjukkan bahwa kata yang paling

sering muncul pada data kasus dugaan korupsi Asuransi Jiwasraya adalah “pansus”,

“korupsi”, dan “uang”, sedangkan pada kasus dugaan korupsi ASABRI kata yang sering

digunakan ialah “jiwasraya”, “rampok”, dan “pilpres”. Sedangkan untuk aktor yang

terpenting pada kasus dugaan korupsi Asuransi Jiwasraya dan kasus dugaan korupsi

ASABRI secara berturut-turut adalah Jansen Sitindaon dan Muhammad Said Didu.

Chintalapudi et al., (2020) dalam penelitiannya melakukan analisis sentimen dan

text mining pada dokumen medis pelaut, hal ini didasari karena pelaut lebih rentan

mengalami kecelakaan dan rentan terhadap kesehatan karena budaya kerja, perubahan

iklim dan kebiasaan pribadi maka dari itu dengan penerapan text mining dapat

mengetahui lebih dalam mengenai masalah medis yang sering terjadi di kapal. Data

yang akan digunakan untuk analisis adalah data pasien selama periode 2018-2020 yang

dikumpulkan dari sistem kesehatan digital Centro Internazionale Radio Medico

(C.I.R.M.). Penelitian ini menggunakan algoritma Naïve Bayes dan lexicon dan

eksperimen menggunakan tools software R. Hasil yang didapatkan menunjukkan bahwa

berdasarkan text mining dan document term matrix pembengkakan, nyeri, dan masalah

perut yang memiliki korelasi paling tinggi minimal 96%. Berdasarkan word cloud, kata

yang sering muncul adalah nyeri, bengkak, pendarahan, luka, luka, penyakit kulit,

demam, sakit perut, dll, hal ini menunjukkan bahwa kecelakaan di tempat kerja paling

umum terjadi diakibatkan kesalahan manusia (Human Error) walaupun sudah mentaati

SOP yang ada. Dalam penelitian ini juga didapatkan persentase korelasi antar gejala dan

hasil diagnosis mencapai 96% . Analisis sentimen divalidasi dengan Naïve Bayes dan

menghasilkan akurasi, presisi, dan recall lebih dari 80%.

11

Pradana (2020) melakukan penelitian terkait penggunaan fitur word cloud dan

document term matrix dalam text mining, pada penelitiannya dilakukan perbandingan

kata yang sering muncul terhadap platform facebook dan twitter mengenai topik

maskapai penerbangan. Penelitian ini menggunakan metode text mining, word cloud dan

term document matrix serta menggunakan aplikasi R. Hasil berdasarkan word cloud dan

term document matrix menunjukkan bahwa kata yang sering muncul pada platform

facebook adalah “garuda” dengan frekuensi sebesar 3621 kata, sedangkan pada Twitter

adalah kata “Indonesia” dengan frekuensi sebesar 1572 kata. Facebook memiliki kata-

kata yang lebih cenderung positif, sedangkan Twitter lebih cenderung ke arah sentimen

negatif.

Carracedo et al., (2020) dalam penelitian yang dilakukannya terkait analisis text

mining untuk mengidentifikasi jalur penelitian saat ini yang dikembangkan seputar

COVID-19 dan dampaknya terhadap lingkungan bisnis. Analisis pada penelitian ini

menggunakan tools software R dan terdapat 16 paper yang akan dianalisis. Hasil

penelitian yang didapatkan dari hasil text mining dan document term matrix

menunjukkan bahwa didapatkan tiga cluster dengan masing-masing kata kunci. Cluster

1 berkaitan dengan dampak pada model manajemen kesehatan publik, cluster 2

membahas mengenai perubahan kebiasaan konsumsi masyarakat, dan cluster 3

berkaitan dengan dampak ekonomi pada organisasi bisnis saat pandemi COVID-19.

Kajian induktif berisi tentang penelitian-penelitian sebelumnya yang berkaitan

dengan penelitian yang telah dilakukan. Berdasarkan penelitian terdahulu dapat

diketahui beberapa kesimpulan mengenai web scraping, text mining, analisis sentimen

dan asosiasi dalam tabel berikut:

Tabel 2.1 Penelitian terdahulu

Peneliti Metode Hasil Penelitian

(Adiyana et al.,

2015)

Text Mining,Word

Cloud dan Asosiasi

Kata

Kata-kata yang berasosiasi dengan

kata KPK adalah kata Polri dan Lapor.

Sedangkan kata-kata yang berasosiasi

dengan Jokowi adalah kata Widodo,

Menghadiri, Izin, Pintu, Satu,

Investor, Urus, Presiden, Nilai, Aktif,

12


Bahaya, Manuver, Menang, Mulai,

Relawan, dan Sejumlah. Diantara dua

topik tersebut memiliki kesamaan

tweet yaitu topik "kpk, polri, dan

jokowi”

(Ma’arif, 2016) Web Scraping dan Text

Mining

Dari lima situs yang diambil untuk

diolah, didapatkan hasil berupa enam

kategori dan kata kunci untuk setiap

kategorinya, kategori yang didapatkan

ialah pantai, alam, belanja, kuliner,

budaya dan taman.

(Karyadi et al.,

2016)

Text Mining, Word

Cloud dan K-Means

Clustering

Kata yang paling sering muncul

adalah “ahok” dengan kemunculan

terbanyak yaitu lebih dari 25 kali.

Kecenderungan pemberitaan lainnya

yakni mengenai Rp (rupiah), DKI,

mobil, macet, Luhut, RI, DPR,

Jokowi, Eropa dan lain-lain. Cluster

tweet yang terbentuk dari K-means

clustering yakni sebanyak tiga cluster.

(Priyanto et al.,

2018)

Web Scraping dan Text

Mining

Data mengenai artikel hidroponik

dapat diakuisisi secara otomatis

kemudian dikelompokkan ke dalam

12 topik dengan klaster dan kata kunci

yang sesuai.

(Kurniasari, 2018) Web Scraping, SVM,

dan Fishbone Diagram

Klasifikasi dengan metode SVM

menunjukkan tingkat akurasi sebesar

96,07% pada ulasan berbahasa Inggris

dan sebesar 84,07% pada ulasan

berbahasa Indonesia. Berdasarkan

diagram fishbone, hasil yang

13


didapatkan adalah urutan faktor yang

harus dibenahi menurut hasil dari

ulasan negatif adalah faktor fasilitas,

pelayanan dan lingkungan.

(Fikria, 2018) SVM dan asosiasi teks Klasifikasi dengan algoritma SVM

menghasilkan akurasi klasifikasi

sebesar 89,06% pada ulasan KAI

Access dan 84,68% pada ulasan

Tiket.com.

(Titania, 2020) Text Mining dan Social Kata yang paling sering muncul

Network Analysis pada data kasus dugaan korupsi

Asuransi Jiwasraya adalah

“pansus”, “korupsi”, dan “uang”,

sedangkan pada kasus dugaan

korupsi ASABRI kata yang

sering digunakan ialah

“jiwasraya”, “rampok”, dan

“pilpres”. Aktor yang penting

dalam diskusi ini secara berturut-

turut adalah Jansen Sitindaon dan

Muhammad Said Didu.

(Chintalapudi et al., Text Mining,Document Berdasarkan text mining dan

2020) Term Matrix, Naïve document term matrix

Bayes dan Word Cloud pembengkakan, nyeri, dan

masalah perut yang memiliki

korelasi paling tinggi minimal

96%. Berdasarkan word cloud,

kata yang sering muncul adalah

nyeri, bengkak, pendarahan,

luka, luka, penyakit kulit,

demam, sakit perut, dll. Analisis

14


sentimen divalidasi dengan Naïve

Bayes dan menghasilkan akurasi,

presisi, dan recall lebih dari

80%.

(Pradana, 2020) Text Mining, Word Kata “garuda” merupakan kata

Cloud dan Term yang paling sering muncul pada

Document Matrix platform facebook dengan

frekuensi sebesar 3621 kata,

sedangkan pada Twitter adalah

kata “Indonesia” dengan

frekuensi sebesar 1572 kata.

Facebook memiliki kata-kata

yang lebih cenderung positif,

sedangkan Twitter lebih

cenderung ke arah sentimen

negatif.

(Carracedo et al., Text Mining, Document Didapatkan tiga cluster dengan

2020) Term Matrix masing-masing kata kunci.

Cluster 1 berkaitan dengan

dampak pada model manajemen

kesehatan publik, cluster 2

membahas mengenai perubahan

kebiasaan konsumsi masyarakat,

dan cluster 3 berkaitan dengan

dampak ekonomi pada organisasi

bisnis saat COVID-19.

Berdasarkan kajian empiris, diketahui bahwa text mining dapat diaplikasikan ke bidang

politik, kesehatan, bisnis dan lain sebagainya. Pada penelitian terdahulu diketahui

bahwa metode yang digunakan seperti Support Vector Machine, Naïve Bayes & Term

Document Matrix. Namun pada penelitian ini lebih membahas terkait text mining pada

15

bidang jasa telekomunikasi dan penelitian ini menggunakan metode klasifikasi dengan

algoritma Naïve Bayes, confusion matrix & fishbone diagram. Berdasarkan penelitian

terdahulu diketahui bahwa metode Naïve Bayes merupakan metode paling sederhana

dari pengklasifikasian probabilitas, memiliki tingkat akurasi yang sangat tinggi ketika

diaplikasikan pada database dengan jumlah data yang besar, maka dari itu dalam

penelitian ini menggunakan metode Naïve Bayes. Pada sebagian penelitian terdahulu

metode yang digunakan lebih berfokus ke hasil akhir klasifikasi sedangkan penelitian

ini menganalisis sampai ke akar permasalahan suatu aplikasi dan memberikan rencana

perbaikan dari permasalahan tersebut. Penelitian ini diharapkan dapat menjadikan

gambaran dan bahan evaluasi kinerja dari perusahaan di bidang jasa telekomunikasi,

khususnya aplikasi berbasis video conference seperti zoom cloud meetings.

2.2 Kajian Deduktif

2.2.1 Video Conference

Video conference merupakan suatu telekomunikasi berupa audio dan video untuk

menghubungkan orang ke tempat berbeda dalam waktu yang bersamaan untuk

pertemuan (Herryawan, 2009). Video conference adalah salah satu sarana yang

memungkinkan komunikasi data, suara, dan gambar yang bersifat duplex serta real time

(Nurdiansyah, 2013).

Menurut (Gough, 2006), video conferencing dapat dibagi menjadi 3 jenis, yaitu :

1. Personal video conferencing

Dalam personal video conferencing, terdapat komunikasi yang berupa video dan

audio antara dua orang yang berinteraksi. Dapat ditambahkan fitur tambahan

berupa pengiriman teks, seperti yang terdapat pada kebanyakan perangkat lunak

Instant Messaging (IM), seperti Windows Live Messenger dan Yahoo!

Messenger.

2. Business video conferencing

Business video conferencing memiliki fitur yang sama dengan personal video

conferencing ditambah dengan beberapa fitur seperti:

● Kemampuan untuk berkomunikasi tidak hanya antara dua orang, namun

bisa lebih

● Fitur untuk berbagi file (file sharing)

● Kemampuan untuk melakukan presentasi

● Fasilitas whiteboard dan fitur-fitur lainnya

Business video conferencing ini membutuhkan biaya yang lebih besar

dibandingkan dengan personal video conferencing, sebagai akibat dari fasilitas-

16

fasilitas yang disediakan.

3. Web video conferencing

Web video conferencing umumnya digunakan pada seminar yang menggunakan

web, dimana pemirsa dapat melihat video yang dikirimkan oleh pembicara

seminar. Oleh karena itu, web video conferencing merupakan komunikasi satu

arah, karena pemirsa tidak dapat mengirimkan videonya kepada si pengirim.

Video conference menjadi kebutuhan yang mengalami demand yang tinggi sebagai

satu- satunya alternatif yang paling aman dan terbukti dapat diandalkan khususnya pada

saat masa pandemi COVID-19. Selain itu video conference juga mampu mengatasi

masalah geografis karena setiap orang bisa terhubung tanpa harus memikirkan jarak.

Saat ini layanan video conference sudah semakin berkembang dan bahkan sudah

merebak ke berbagai sektor kehidupan, misalnya: pendidikan, bisnis, kesehatan, dan

lainnya (Herryawan, 2009). Persaingan antar perusahaan layanan yang mendukung fitur

video conferencing sudah semakin ketat. Terbukti bahwa saat ini sudah ada banyak

aplikasi untuk melakukan video conferencing yaitu seperti: Zoom, Google Meet, Cisco

Webex, Skype, Microsoft Teams, dan lain sebagainya.

2.2.2 Zoom

Zoom Technologies, Inc didirikan pada 21 April 2011 oleh Eric Yuan yang saat ini

merupakan CEO dari Zoom Technologies, Inc itu sendiri. Zoom memiliki visi

perusahaan yaitu “Komunikasi video mendorong orang untuk meraih sesuatu yang

lebih”, dan misi “Menjadikan komunikasi video yang mudah dan aman”. Zoom hanya

menganut satu value saja yaitu “peduli”, peduli disini maknanya adalah Zoom peduli

dengan penggunanya, komunitasnya, perusahaannya, rekan tim dan diri sendiri.

Gambar 2.1 Logo Zoom

Sumber: https://zoom.us (2020)

Zoom menawarkan berbagai produk dan layanan antara lain adalah Zoom Cloud

Meetings dan Zoom rooms. Zoom Cloud Meetings merupakan aplikasi video conference

berbasis cloud computing yang sangat mudah digunakan, memiliki banyak ragam fitur

https://zoom.us/

17

dan aplikasi ini dapat diakses di PC ataupun di smartphone (Herlinawati et al., 2020).

Fitur utama pada aplikasi zoom cloud meetings adalah sebagai berikut:

a) One-on-one meetings: Pengguna melakukan meeting atau konferensi video

dengan satu pengguna lainnya. Fitur ini dapat digunakan secara terus-menerus

(unlimited) bahkan dengan free plan (tidak berlangganan layanan Zoom).

b) Group Video Conferences: Konferensi video dengan grup yang besar atau lebih

dari satu orang. Layanan Zoom dapat mengakomodir pertemuan virtual hingga

lebih dari 500 orang (jika pengguna menggunakan add-on tertentu). Free

plan mengizinkan kamu untuk mengadakan konferensi video hingga 100 orang

dengan batas waktu 40 menit.

c) Screen sharing: Konferensi one-on-one atau dengan grup besar dan screen

sharing dengan peserta lain sehingga mereka dapat melihat apa yang kita lihat.

Masih ada beragam fitur lainnya dari zoom yang menjadi ciri khasnya tersendiri

seperti: virtual background, webinar, dan lain sebagainya. Selain zoom cloud meetings,

zoom juga memiliki layanan zoom rooms. Zoom rooms merupakan sistem ruangan

berbasis perangkat lunak yang memberikan pengalaman terintegrasi untuk konferensi

audio, berbagi layar nirkabel, dan konferensi video.

Zoom rooms dapat digunakan untuk peserta ruangan saja, atau peserta jarak jauh

yang bergabung dari ruangan lain, dari desktop mereka, atau dari perangkat seluler

mereka. Setiap ruangan memerlukan minimal support device seperti komputer macOS,

tablet iPad, Android, atau Windows 10 yang menjalankan aplikasi Zoom rooms.

Peralatan tambahan dapat mencakup layar TV, speaker, kamera, mikrofon, dan iPad

untuk menjalankan tampilan penjadwalan Zoom rooms. Perangkat dapat didaftarkan di

Zoom Device Management untuk menyediakan manajemen jarak jauh tambahan dari

portal web Zoom.

Zoom merupakan perusahaan yang menawarkan kemudahan, kecepatan akses dan

kehandalan serta peduli terhadap kebutuhan penggunanya. Hal ini dibuktikan dengan

diraihnya berbagai bentuk penghargaan yang telah didapatkan oleh zoom. Pada tahun

2019 zoom memenangkan 8 penghargaan dan pada tahun 2020 zoom berhasil

menambah penghargaannya menjadi 12 penghargaan. Salah satu penghargaan yang

telah berhasil diraih oleh zoom adalah termasuk salah satu Best Company Professional

Development. Selain itu juga, zoom berhasil menjadi 100 brand terbaik di dunia pada

tahun 2020 yang diselenggarakan oleh Interbrand.

18

2.2.3 Google Play

Google Play adalah layanan konten digital milik Google yang melingkupi toko online

untuk produk-produk seperti musik/lagu, buku, aplikasi, permainan, ataupun pemutar

media berbasis cloud. Layanan ini dapat diakses baik melalui web, aplikasi android

(Play Store) dan Google TV. Google Play mulai dikenalkan pada bulan Maret 2012

sebagai pengganti dari Google Play dan layanan musik Google.

Google Play milik Google saat ini telah menyediakan sekitar 700.000 aplikasi

mobile menurut AppBrain7. Setelah beberapa bulan, mungkin ada lebih dari sepuluh

ribu komentar tekstual dari aplikasi baru yang diluncurkan di Google Play (Liu et al,

2013). Hal ini sangat sesuai untuk penerapan analisis text mining terhadap komentar-

komentar pengguna tentang aplikasi pada Google Play untuk membantu pihak

perusahaan untuk menganalisis dan mengevaluasi aplikasinya.

2.2.4 Online Review

Dalam Kamus Besar Bahasa Indonesia, ulasan yang diterjemahkan ke dalam bahasa

Indonesia menjadi ulasan memiliki pengertian kupasan, tafsiran, komentar, sedangkan

kata online memiliki arti controlled by or connected to a computer sesuai dengan

pengertian yang dijelaskan dalam Oxford Dictionaries online yang apabila

diterjemahkan yaitu dikontrol oleh atau terkoneksi pada sebuah komputer. Menurut

Mudambi dan Schuff dalam jurnal yang berjudul “A Study of Customer Review on

Amazon.com, “Online customer reviews can be defined as peer-generated product

evaluations posted on company or third party websites”. Dalam terjemahannya yaitu

online review dari pelanggan diartikan sebagai hasil evaluasi produk yang diunduh

dalam situs perusahaan atau situs pihak ketiga.

Menurut Kotler & Amstrong (1996) ada empat metode untuk mengukur

kepuasan pelanggan yang salah satunya adalah sistem keluhan dan saran melalui

berbagai media seperti kolom komentar dan juga internet seperti online review.

19

2.2.5 Data Mining

Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan

pengetahuan di dalam database. Data mining adalah suatu proses yang menggunakan

teknik statistik, matematika, kecerdasan tiruan, dan machine learning untuk

mengekstraksi serta mengidentifikasi informasi yang bermanfaat untuk pengetahuan

yang terkait dari berbagai database besar (Turban et al, 2005). Menurut Tan et al (2006)

data mining adalah proses untuk mendapatkan informasi yang berguna dari gudang

basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan

informasi baru yang diambil dari bongkahan data besar yang membantu dalam

pengambilan keputusan. Istilah data mining kadang disebut juga knowledge discovery.

Data mining adalah bagian integral dari penemuan pengetahuan dalam database

(KDD) yang merupakan proses keseluruhan mengubah data mentah menjadi pola-pola

data menarik yang merupakan informasi yang dibutuhkan oleh pengguna sebagai

pengetahuan. Untuk mengetahui proses knowledge discovery dalam database dapat

dilihat pada Gambar 2.1 berikut :

Gambar 2.2 Tahapan proses KDD

Sumber: Han & Kamber (2006)

Han & Kamber (2006) menyatakan bahwa KDD terdiri dari langkah-langkah

sebagai berikut:

20

1. Data cleaning adalah proses mengecek data yang tidak konsisten dan

menghilangkan noise.

2. Data integration adalah proses pengecekan penggabungan data apabila memiliki

sumber data terdiri dari banyak sumber.

3. Data selection adalah pemilihan data yang relevan yang akan digunakan sebelum

masuk proses data mining.

4. Data transformation adalah proses transformasi data berdasarkan pada jenis atau

pola informasi yang akan dicari dalam basis data. Transformasi data dapat

dilakukan juga sebelum tahap proses seleksi data.

5. Data mining adalah suatu proses yang penting dengan melibatkan metode dan

teknik tertentu untuk menemukan suatu pola data atau informasi yang menarik.

6. Pattern evaluation adalah proses untuk mengidentifikasi pola data yang mewakili

knowledge yang ada didalam data itu sendiri.

7. Knowledge representation adalah proses visualisasi dan teknik menyajikan

knowledge digunakan untuk menampilkan hasil proses data mining kepada pihak

yang berkepentingan.

2.2.6 Web Scraping

Web Scraping adalah proses pengambilan sebuah dokumen semi-terstruktur dari

internet, umumnya berupa halaman-halaman web seperti HTML atau XHTM yang

kemudian dokumen tersebut dianalisis untuk diambil data tertentu dari halaman tersebut

untuk digunakan bagi kepentingan lain (Turland, 2010). Web scraping sering dikenal

sebagai screen scraping. Web Scraping tidak termasuk dalam bidang data mining

karena data mining menyiratkan upaya untuk memahami pola semantik atau tren dari

sejumlah besar data yang telah diperoleh (Josi et al., 2014). Pengaplikasian web

scraping (dengan kata lain seperti: intelligent, automated, or autonomous agents) hanya

fokus pada cara memperoleh data melalui pengambilan dan ekstraksi data dengan

ukuran data yang bervariasi. Web scraping memiliki beberapa langkah untuk

melakukannya (Juliasari & Sitompul, 2012), yaitu sebagai berikut:

1. Create Scraping Template

Pembuat program mempelajari dokumen HTML dari laman web yang akan

diambil informasinya untuk tag HTML yang mengapit informasi yang akan

diambil.

21

2. Explore Site Navigation

Pembuat program mempelajari teknik navigasi pada laman web yang akan

diambil data informasinya untuk ditirukan pada aplikasi web scraper yang akan

dibuat baru.

3. Automate Navigation and Extraction

Berdasarkan informasi yang didapat pada langkah sebelumnya, aplikasi web

scraper dibuat untuk mengotomatisasi pengambilan informasi dari laman web

yang sudah ditentukan.

4. Extracted Data and Package History

Informasi yang didapat dari langkah 3 disimpan dalam tabel atau database tabel.

Adapun manfaat dari pengambilan data dengan web scraping ini agar informasi yang

diambil lebih terfokus sehingga memudahkan dalam melakukan pencarian sesuatu.

2.2.7 Machine Learning

Machine Learning (ML) atau pembelajaran mesin merupakan pendekatan dalam

Artificial Intelligence (AI) yang banyak digunakan untuk menggantikan atau menirukan

perilaku manusia untuk menyelesaikan masalah atau melakukan otomatisasi. Sesuai

dengan namanya, machine learning mencoba menirukan bagaimana proses manusia

atau makhluk cerdas belajar dan mengeneralisasi (Tanaka & Okutomi, 2014). Dalam

pembelajaran machine learning, terdapat beberapa skenario-skenario seperti:

1. Supervised Learning

Penggunaan skenario supervised learning, pembelajaran menggunakan masukan

data pembelajaran yang telah diberi label. Setelah itu membuat prediksi dari data

yang telah diberi label.

2. Unsupervised Learning

Penggunaan skenario unsupervised learning, pembelajaran menggunakan

masukan data pembelajaran yang tidak diberi label. Setelah itu mencoba untuk

mengelompokan data berdasarkan karakteristik-karakteristik yang ditemui.

3. Reinforcement Learning

Pada skenario reinforcement learning fase pembelajaran dan tes saling

dicampur. Untuk mengumpulkan informasi pembelajar secara aktif dengan

berinteraksi ke lingkungan sehingga untuk mendapatkan balasan untuk setiap

aksi dari pembelajar.

22

2.2.8 Text Mining

Text mining adalah sebuah proses pengambilan informasi dari data tekstual yang

memiliki kualitas tinggi serta dapat mengetahui permasalahan dalam teks dari sebuah

topik tertentu. Text mining dalam analisa sentimen mampu mengidentifikasi emosional

terhadap suatu pernyataan (Zhang, et al, 2015). Pekerjaan yang dilakukan dalam konsep

Text Mining secara garis besar adalah penggalian deskriptif (descriptive mining) dan

penggalian prediktif (predictive mining). Pekerjaan predictive mining meliputi

klasifikasi dokumen ke dalam kategori-kategori, lalu menggunakan informasi tersebut

untuk membuat keputusan (SAS Institute, 2010).

Perbedaan antara text mining dengan data mining terletak pada sumber data yang

digunakan. Dalam text mining pola–pola yang diekstrak dari data tekstual yang tidak

terstruktur bukan berasal dari suatu database. Beberapa kesamaannya adalah data yang

digunakan merupakan data besar dan data berdimensi tinggi dengan struktur yang terus

berubah. Dalam data mining, data yang diolah adalah data yang terstruktur dari proses

warehousing sehingga lebih mudah diproses oleh mesin/komputer. Analisis teks lebih

sulit karena teks umumnya berupa konsumsi manusia secara langsung bukan digunakan

untuk mesin/komputer. Ditambah struktur teks yang kompleks, struktur yang tidak

lengkap, bahasa yang berbeda, dan arti yang tidak standar. Oleh sebab itu pada

umumnya digunakan Natural Language Processing untuk analisis teks yang tidak

berstruktur tersebut. Tahapan-tahapan dalam text mining secara umum adalah text

preprocessing dan feature selection (Feldman & Sanger, 2007). Dimana penjelasan dari

tahap-tahap tersebut adalah sebagai berikut:

a. Text Preprocessing

Tahapan awal dari text mining adalah text preprocessing yang bertujuan untuk

mempersiapkan teks menjadi data yang akan mengalami pengolahan pada tahapan

berikutnya. Tahap ini mencakup semua rutinitas dan proses untuk mempersiapkan data

yang akan digunakan pada operasi knowledge discovery sistem text mining (Feldman &

Sanger, 2007). Text preprocessing berfungsi untuk mengubah data teks yang tidak

terstruktur atau sembarang menjadi data yang terstruktur. Secara umum proses yang

dilakukan dalam tahapan preprocessing adalah sebagai berikut:

1. Spelling

Proses perbaikan kata-kata yang masih salah dalam pengejaan atau merupakan

singkatan dalam bentuk tertentu. Perbaikan kata dilakukan agar jumlah

perhitungan dimensi kata tidak melebar. Perhitungan jumlah dimensi kata akan

melebar jika kata yang salah eja atau kata singkatan tidak dirubah karena akan

dihitung sebagai kata yang berbeda pada proses penyusunan matriks.

23

2. Case Folding

Case folding adalah mengubah semua huruf dalam dokumen menjadi satu

bentuk yang sama, peran case folding dibutuhkan dalam mengkonversi

keseluruhan teks dalam dokumen menjadi suatu bentuk standar (dalam hal ini

huruf kecil atau lowercase).

3. Filtering

Tahap filtrasi adalah tahap pengambilan kata-kata penting dengan menggunakan

algoritma stoplist. Algoritma stoplist (membuang kata yang kurang penting) atau

wordlist (menyimpan kata yang penting) dapat digunakan pada tahap ini.

Stopword adalah kata-kata yang tidak memiliki makna dan bukan merupakan

kata penting dari suatu dokumen sehingga dapat dibuang. Contoh stopword

adalah “yang”, “dan”, “di”, “dari” dan seterusnya (Putri, 2016). Dalam filtrasi

ini menggunakan stoplist/stopword agar kata-kata yang kurang penting dan

sering muncul dalam suatu dokumen dapat dibuang sehingga kata-kata yang

penting dan memiliki makna dapat diproses ke tahap selanjutnya.

4. Tokenization

Proses pemecahan teks kalimat menjadi potongan kata-kata guna membuat

kalimat yang terbentuk menjadi lebih bermakna yang disebut token. Tujuan dari

proses ini adalah mendapatkan potongan kata yang akan menjadi entitas yang

memiliki nilai dalam matriks dokumen teks yang akan dianalisis.

b. Feature Selection

Kata-kata yang tidak relevan dengan proses pengkategorisasian dapat dihilangkan tanpa

mempengaruhi classifier bahkan meningkatkan kinerja karena mengurangi noise.

Langkah preprocessing ini disebut feature selection (Feldman & Sanger, 2007).

Walaupun di tahap sebelumnya sudah dilakukan tahap penghapusan kata–kata yang

tidak deskriptif (stopwords), tidak semua kata–kata di dalam dokumen memiliki arti

penting. Maka dari itu untuk mengurangi dimensi, pemilihan hanya dilakukan pada

kata–kata yang relevan dan mempresentasikan isi dari suatu dokumen. Kata-kata yang

dinilai penting dilihat dari banyaknya kemunculan suatu kata dan kata yang paling

informatif dari semua data

2.2.9 Sentiment Analysis

Analisis sentimen atau istilah lainnya opinion mining merupakan salah satu cabang

penelitian Text Mining. Analisis sentimen adalah riset komputasional dari opini,

sentimen dan emosi yang diekspresikan secara tekstual. Jika diberikan suatu data teks

24

yang berisi opini mengenai suatu objek, maka analisis sentimen bertujuan untuk

mengekstrak atribut dan komponen dari objek yang telah didokumentasi pada setiap

dokumen dan untuk menentukan apakah komentar tersebut mempunyai arti positif atau

negatif (Rozi et al, 2012). Analisis sentimen dapat digunakan dalam berbagai macam

domain seperti, produk konsumen, jasa kesehatan, jasa keuangan, peristiwa sosial

maupun politik. Dalam dunia nyata, bisnis dan organisasi selalu ingin melihat opini

publik tentang suatu produk atau jasa (Liu et al, 2012).

2.2.10 Classification

Klasifikasi dapat didefinisikan sebagai proses untuk menyatakan suatu objek data

sebagai salah satu kategori (kelas) yang telah didefinisikan sebagai proses untuk

menyatakan suatu objek data sebagai salah satu kategori (kelas) yang telah didefinisikan

sebelumnya. Klasifikasi banyak digunakan dalam untuk berbagai hal, diantaranya

adalah deteksi kecurangan (fraud detection), pengelolaan pelanggan, diagnosis medis,

prediksi penjualan, dan sebagainya (Azizah, 2019).

Pada umumnya proses klasifikasi dibagi menjadi dua tahap yaitu tahap pembelajaran

dan tahap pengujian. Pada tahap pembelajaran, sebagian data yang telah diketahui kelas

datanya diumpankan untuk membentuk model perkiraan. Kemudian pada model tahap

pengujian yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui

akurasi dari model tersebut. Jika akurasinya mencukupi, model ini dapat dipakai untuk

prediksi kelas data yang belum diketahui. Teknik ini dapat memberikan klasifikasi pada

data baru dengan memanipulasi data yang telah diklasifikasi dan dengan menggunakan

hasilnya untuk menghitung jarak antara ciri-ciri citra template dan citra masukan

(Ulwan, 2016).

2.2.11 Ukuran Evaluasi Model Klasifikasi

Pada umumnya evaluasi terhadap suatu klasifikasi dilakukan menggunakan sebuah

himpunan data uji. Model klasifikasi yang dibuat adalah pemetaan dari suatu baris data

dengan keluaran sebuah hasil prediksi kelas/target dari data tersebut. Klasifikasi yang

memiliki dua kelas sebagai keluarannya disebut dengan klasifikasi biner. Kedua kelas

tersebut direpresentasikan dalam {0,1}, {+1,- 1} atau {positive; negative} (Kurniasari,

2018).

Dalam proses evaluasi klasifikasi terdapat empat kemungkinan hasil yang terjadi dari

proses pengklasifikasian suatu baris data. Jika data positif dan diprediksi positif maka

akan dihitung sebagai true positive, tetapi jika data itu diprediksi negatif maka akan

dihitung sebagai false negative. Jika data negatif dan diprediksi negatif akan dihitung

25

sebagai true negative, tetapi jika data tersebut diprediksi positif maka akan dihitung

sebagai false positive (Fawcett, 2006). Hasil klasifikasi biner pada suatu dataset dapat

direpresentasikan dengan matriks 2 x 2 yang disebut confusion matrix.

Tabel 2.2 Confusion Matrix

Prediksi Aktual

Positif Negatif

Positif True Positive

(TP)

False Negative

(FN)

Negatif False Positive

(FP)

True Negative

(TN)

Sumber: Fawcett (2006)

Menurut Manning, Prabhakar, dan Hinrich (2009), confusion matrix merupakan salah

satu tools yang digunakan pada machine learning untuk melakukan visualisasi dan pada

umumnya memuat dua kategori atau lebih. Confusion matrix digunakan untuk

mengevaluasi performansi model yang dibangun oleh algoritma klasifikasi. Confusion

matrix memiliki beberapa rumus umum yang dapat digunakan untuk menghitung

performa klasifikasi. Hasil dari nilai akurasi, presisi, dan recall dapat ditampilkan dalam

persentase. Berikut rumus yang digunakan pada confusion matrix (Song et al, 2006):

a. Akurasi

Akurasi adalah jumlah proporsi prediksi yang benar. Adapun rumus penghitungan

akurasi dapat dilihat pada persaman 2.1.

b. Presisi

Akurasi = TP+FN TP+FP+TN+FN

… (2.1)

Presisi adalah proporsi jumlah dokumen teks yang relevan terkenali diantara semua

dokumen teks yang terpilih oleh sistem. Rumus presisi dapat dilihat pada persamaan

2.2.

c. Recall

Presisi = TP TP+FP

… (2.2)

Recall adalah proporsi jumlah dokumen teks yang relevan terkenali diantara semua

dokumen teks relevan yang ada pada koleksi. Rumus recall dapat dilihat pada

persamaan 2.3.

Recall = TP TP+FN

… (2.3)

26

2.2.12 Naïve Bayes Classifier

Naive Bayes Classifier merupakan teknik klasifikasi berdasarkan Teorema Bayes

dengan asumsi independensi di antara para prediktor. Naive Bayes Classifier

memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya

sehingga dikenal sebagai Teorema Bayes. Naïve bayes merupakan metode paling

sederhana dari pengklasifikasian probabilitas, memiliki tingkat akurasi yang sangat

tinggi ketika diaplikasikan pada database dengan jumlah data yang besar (Big Data)

(Wati, 2016). Selain itu model naïve bayes juga memiliki tingkat kesalahan yang sangat

minimum dibandingkan dengan algoritma klasifikasi lainnya (Liu et al., 2013).

2.2.13 Association Rule

Analisis asosiasi atau association rule adalah teknik data mining untuk menemukan

aturan asosiatif antara suatu kombinasi item (Fauzy, 2015). Association Rule adalah

teknik data mining yang berguna untuk menemukan suatu korelasi atau pola yang

terpenting atau menarik dari sekumpulan data besar (Dunham 2003). Motivasi awal

Association Rule berasal dari keinginan untuk menganalisis data transaksi supermarket

ditinjau dari perilaku pelanggan dalam membeli produk. Interestingness measure yang

dapat digunakan dalam analisis asosiasi adalah (Han et al. 2012):

1. Support

Nilai support dari aturan A => B dalam set transaksi D adalah persentase dari

transaksi D yang mengandung item A dan B, seperti pada persamaan (2.1)

berikut:

Support (A=> B) = P (A 𝖴 B) …. (2.1)

2. Confidence

Nilai confidence dalam aturan A => B dalam set transaksi D adalah persentase

dari jumlah transaksi yang mengandung A dan B, dengan jumlah transaksi yang

mengandung A, seperti pada persamaan (2.2) berikut:

Confidence (A => B) = P (B | A) = nilai support(A∪B)

nilai support A ….(2.2)

3. Lift

Nilai lift adalah perhitungan korelasi sederhana. Nilai lift yang kurang dari 1

maka item A berkorelasi negatif dengan item B. Nilai lift yang lebih dari 1

menunjukkan item A berkorelasi positif dengan item B yang berarti kedua item

saling berhubungan, seperti yang ditunjukkan pada persamaan (2.3) berikut

Lift (A, B) = 𝑃 (𝐴 𝖴 𝐵) 𝑃 (𝐴)𝑃 (𝐵)

…. (2.3)

27

Salah satu algoritma yang digunakan untuk association rule mining adalah

algoritma apriori. Algoritma apriori adalah suatu algoritma yang dikenal dalam

melakukan pencarian frequent itemset dengan association rule (Aprianti et al. 2017).

Algoritma ini menggunakan pendekatan iterasi yang dikenal sebagai “level-wise

search”, di mana k-itemsets digunakan untuk mendapatkan (k+1)-itemsets. Pertama, set

dari frequent 1-itemsets ditemukan dengan pembacaan pada basis data untuk akumulasi

jumlah dari masing-masing item, dan mengumpulkan items tersebut sesuai dengan

minimum support yang ditentukan. Hasil dari set tersebut adalah L1, kemudian L1

digunakan untuk menemukan L2, dan dilakukan iterasi sampai mendapatkan Lk setelah

melakukan pencarian dalam satu basis data. Cara untuk meningkatkan efisiensi dari

iterasi pada Apriori digunakan sebuah properti Apriori, yang merupakan minimum

support untuk melakukan pemangkasan itemset yang tidak memenuhi minimum support

(Han et al. 2012).

2.2.14 Diagram Fishbone

Diagram fishbone dikembangkan oleh Dr. Kaoru Ishikawa pada tahun 1943, sehingga

sering disebut dengan diagram Ishikawa. Diagram sebab-akibat (cause and effect

diagram atau fishbone diagram) adalah sebuah teknik grafis yang digunakan untuk

mengurutkan dan menghubungkan interaksi antara faktor-faktor yang berpengaruh

dalam suatu proses. Diagram ini berguna untuk menganalisis dan menemukan faktor-

faktor yang berpengaruh atau efek secara signifikan di dalam menentukan karakteristik

kualitas output kerja. Efek ini dapat bernilai "baik" dan dapat bernilai "buruk". Jadi

dengan diketahui sebab dari efek yang terjadi, diharapkan hasil dari proses produksi

bisa diperbaiki dengan mengubah faktor terkontrol dari suatu proses. Diagram ini juga

berguna untuk mengidentifikasi akar penyebab potensi dari suatu masalah. Diagram

fishbone memfokuskan pada penekanan masalah atau gejala yang merupakan akar

penyebab masalah. Diagram fishbone juga menampilkan penyebab-penyebab suatu

masalah dengan cara menghubungkan penyebab-penyebab menjadi satu (Fauziah,

2009).

28

BAB III

METODOLOGI PENELITIAN

3.1 Rancangan Penelitian

Penelitian ini merupakan penelitian dengan menggunakan analisis kuantitatif untuk

beberapa data yang berupa hasil scraping data dari ulasan google play. Pada proses

scraping menggunakan aplikasi web scraping berbasis web yaitu, appfollow. Proses

pengambilan data dilakukan secara online dan penggalian informasi terhadap ulasan-

ulasan terhadap penggunaan aplikasi zoom cloud meetings dan nantinya proses text

mining menggunakan bantuan tool berupa python 3.8.6. Setelah data primer atau data

mentah telah didapatkan, dilanjutkan dengan tahap text preprocessing melalui tahap

cleaning, case folding, tokenizing dan filtering yang bertujuan untuk membersihkan dan

mempersiapkan teks menjadi data yang akan digunakan untuk tahap word cloud, setelah

itu data diprediksi dan diklasifikasikan bantuan tool python 3.8.6. Data ulasan yang

sudah dikelompokkan berdasarkan kategori ulasan positif dan negatif, selanjutnya

dilakukan word cloud yang bertujuan untuk menemukan pola kata yang sering muncul

terkait keluhan atau masalah yang dialami pengguna selama menggunakan aplikasi.

Data pola kata dari word cloud dilanjutkan ke tahap asosiasi untuk menemukan

hubungan antar kata baik pada ulasan positif maupun ulasan negatif dari hasil word

cloud, sehingga mendapatkan informasi yang dapat dijadikan referensi untuk

menemukan faktor-faktor apa saja yang menjadi akar permasalahan di fishbone

diagram.

3.2 Populasi dan Sampel

Populasi dalam penelitian ini adalah database website Google Play Store, yaitu semua

data review pengguna aplikasi Zoom Cloud Meetings sedangkan sampel yang digunakan

dalam penelitian ini adalah review pengguna aplikasi Zoom Cloud Meetings berbahasa

Inggris pada tanggal 14 Maret 2019 – 20 November 2020. Ulasan pengguna tersebut

29

diambil dari ulasan pengguna paling awal dalam bahasa Inggris pada tanggal 14 Maret

2019 sampai hari pengambilan data yakni tanggal 20 November 2020.

3.3 Pengumpulan Data

3.3.1 Metode Pengumpulan Data

1. Web Scraping

Data yang digunakan dalam penelitian yaitu berupa ulasan pengguna aplikasi

Zoom Cloud Meetings di Google Play Store. Data yang dikumpulkan berupa

data teks yang diambil dengan scraping data melalui situs web appfollow.io.

Gambar 3.1 Interface appfollow.id

Sumber: https://appfollow.io/ (2020)

2. Studi Pustaka

Studi pustaka dilakukan untuk mencari materi dan teori yang berhubungan

dengan penelitian ini dan memudahkan dalam menentukan proses yang akan

dilakukan selama penelitian. Studi pustaka meliputi text mining, analisis

sentimen, association rule dan fishbone diagram.

3.4 Jenis dan Sumber Data

Jenis data yang digunakan dalam penelitian ini adalah data primer. Data tersebut

diperoleh dengan scraping dari halaman situs web Google Play. Data yang diperoleh

merupakan data dari database website Google Play, yaitu data yang berupa ulasan

pengguna Zoom Cloud Meetings sebanyak 96.122 ulasan.

https://appfollow.io/

30

3.5 Metode Analisis Data

Dalam penelitian ini, peneliti menggunakan software appfollow.id, Python 3.8.6 dan

Microsoft Excel 2010. Adapun metode analisis data yang digunakan dalam penelitian

ini yaitu:

1. Analisis Deskriptif, digunakan untuk memberikan gambaran umum ulasan

pengguna Zoom Cloud Meetings yang ada pada Google Play Store.

2. Metode text mining yaitu text preprocessing dan word cloud yang digunakan

untuk menemukan pola kata yang sering muncul didalam suatu ulasan

khususnya ulasan negatif.

3. Metode klasifikasi berbasis machine learning yaitu Naïve Bayes Classifier yang

digunakan untuk melakukan klasifikasi ulasan pengguna yang dibagi menjadi

kelas positif dan kelas negatif.

4. Association Rule, digunakan untuk mengidentifikasi dan membentuk pola kata

yang berasosisasi dengan kata lainnya guna mendapatkan informasi yang

dianggap penting dan berguna.

5. Diagram Fishbone, digunakan untuk mengidentifikasi faktor-faktor penyebab

permasalahan yang didapatkan dari ulasan negatif sehingga dapat dilakukan

pencarian solusi yang mungkin terhadap masalah yang ada.

3.6 Alur Penelitian

Alur penelitian membahas sistematis mengenai tahapan-tahapan sistematis yang

dilakukan dalam penelitian. Adapun alur penelitian yaitu sebagai berikut:

31

32

Gambar 3.2 Flowchart penelitian

Berikut penjelasan dari setiap tahap dalam penelitian yang dilakukan berdasarkan

diagram alir penelitian pada Gambar 3.2:

1. Identifikasi Masalah

a) Perumusan Masalah

Melakukan identifikasi masalah yang terdapat pada aplikasi Zoom Cloud

Meetings melalui via website Google Play. Mengetahui gambaran umum objek

33

penelitian dengan melihat rating aplikasi dan tanggapan pengguna selama

menggunakan aplikasi tersebut baik itu tanggapan positif maupun tanggapan

negatif.

b) Tujuan Penelitian

Ide tujuan penelitian didapatkan berdasarkan rumusan masalah pada penelitian

dan tujuan penelitian merupakan hasil yang akan dicapai pada akhir penelitian.

c) Batasan Penelitian

Pada penelitian ini terdapat batasan masalah yang bertujuan untuk membatasi

ruang lingkup masalah yang terlalu luas sehingga penelitian ini dapat tetap fokus

pada hal apa yang ingin diteliti.

2. Studi Pustaka

Studi pustaka dilakukan untuk mencari materi dan teori yang berhubungan dengan

penelitian ini dan memudahkan dalam menentukan proses yang akan dilakukan

selama penelitian. Studi pustaka meliputi text mining, analisis sentimen, klasifikasi

association rule dan fishbone diagram.

3. Pengambilan Data

Pengambilan data dilakukan dengan cara web scraping data karena lebih mudah

dan lebih efisien dibandingkan dengan cara manual. Pada proses scraping

menggunakan aplikasi web scraping berbasis web yaitu, appfollow. Proses

pengambilan data dilakukan secara online dan penggalian informasi terhadap

ulasan-ulasan terhadap penggunaan aplikasi zoom cloud meetings Hasil dari

pengambilan data dengan web scraping data merupakan data primer.

4. Analisis Deskriptif

Pada penelitian ini dilakukan analisis deskriptif untuk mengetahui gambaran umum

mengenai pelayanan yang diberikan ataupun performansi aplikasi zoom cloud

meetings berdasarkan data ulasan pengguna baik ulasan positif maupun ulasan

negatif yang telah didapatkan dari hasil scraping di Google Play.

5. Text Preprocessing

Dilakukannya text preprocessing bertujuan untuk membersihkan data dan

mengubah data menjadi lebih terstruktur. Pada penelitian ini tahapan text

preprocessing menggunakan tool python 3.8.6 dan terdapat empat tahapan yang

dilakukan pada text preprocessing, yaitu:

a) Case Folding

34

Mengubah semua huruf pada data menjadi huruf lowercase.

b) Cleaning

Menghilangkan hal yang tidak penting pada data seperti tanda baca,

angka,emoji,dll.

c) Tokenizing

Tokenizing merupakan proses pemecahan teks kalimat menjadi potongan kata-

kata guna membuat kalimat yang terbentuk menjadi lebih bermakna.

d) Filtering

Tahap filtering adalah tahap mengambil kata-kata penting dari hasil proses

tokenizing. Penelitian ini menggunakan stopword berbahasa Inggris berdasarkan

modul NLTK.

6. Pelabelan dan Pembobotan Kata

Pelabelan kelas sentimen dilakukan dengan bantuan library VADER. Pelabelan

dilakukan dengan membagi data menjadi tiga kelas sentimen yaitu sentimen positif,

sentimen netral, dan sentimen negatif.

7. Klasifikasi dengan Metode Naïve Bayes

Pada penelitian ini metode Machine learning yang digunakan yaitu Naïve bayes

Classifier yang digunakan untuk melakukan klasifikasi ulasan pengguna yang

berbentuk kelas positif maupun negatif. Adapun pada tahap ini menggunakan

python 3.8.6 untuk melakukan klasifikasi.

8. Visualiasi

Visualisasi merupakan tampilan suatu informasi yang berisi kata yang sering

muncul dalam ulasan pengguna baik itu ulasan positif ataupun negatif. Visualisasi

ditampilkan dalam bentuk bar plot dan word cloud

9. Association Rules

Association rules dilakukan untuk mencari asosiasi antar kata yang paling sering

muncul secara bersamaan agar dapat memperkuat pencarian informasi dan dapat

memprediksi suatu penyebab permasalahan dari suatu topik pembicaraan. Asosiasi

antar kata dilakukan pada ulasan positif maupun ulasan negatif dengan

menggunakan python 3.8.6 dan Ms. Excel 2010.

10. Fishbone Diagram

35

Akar penyebab permasalahan yang telah didapatkan berdasarkan analisis ulasan

negatif dipresentasikan pada diagram fishbone dan mengidentifikasi hal apa saja

yang perlu dilakukan untuk menangani permasalahan tersebut.

11. Analisis dan Pembahasan

Pada tahapan ini akan menjelaskan terkait pembahasan gambaran umum ulasan

pengguna Zoom Cloud Meetings, hasil klasifikasi, hasil association rules dan

rencana perbaikan berdasarkan akar permasalahan pada fishbone diagram.

12. Kesimpulan dan Saran

Tahap terakhir yaitu penarikan kesimpulan dan pemberian saran yang berdasarkan

hasil penelitian.

36

BAB IV

PENGUMPULAN DAN PENGOLAHAN DATA

4.1 Pengumpulan Data

Pada penelitian ini dilakukan tahap pengambilan data berupa ulasan pengguna Zoom

melalui aplikasinya yaitu Zoom Cloud Meetings pada situs Google Play. Pengambilan

data dilakukan dengan teknik web scraping menggunakan aplikasi berbasis web.

Terdapat berbagai website atau aplikasi untuk melakukan scraping data. Salah satunya

ialah appfollow, appfollow merupakan sebuah aplikasi monitoring, optimisasi toko, dan

customer support platform. Appfollow dapat digunakan untuk mengestraksi data secara

gratis (dalam 10 hari). Data yang diekstraksi dapat diekspor menjadi file dengan format

.xlsx (Ms. Excel) maupun .CSV.


Tahap pertama yang harus dilakukan adalah mengakses ke situs appfollow, yaitu

https://appfollow.id dan sign up atau membuat akun terlebih dahulu. Pada tahap proses

pembuatan akun, user baru diharuskan memilih aplikasi apa saja untuk dilakukan

scraping data.

Gambar 4.1 Interface Beranda Appfollow


37

Gambar 4.2 Pemilihan Aplikasi


Setelah melakukan pemilihan aplikasi maka akan masuk ke tampilan seperti pada

gambar 4.3, yaitu dashboard rating & ulasan. Selanjutnya klik Reply to Reviews pada

bagan kiri dan akan diarahkan ke tampilan ulasan-ulasan pengguna zoom cloud

meetings seperti yang ditunjukkan pada gambar 4.4.


Gambar 4.1 Dashboard Rating & Ulasan Gambar 4.3 Dashboard Rating & Ulasan



38

Gambar 4.4 Interface Reply to Reviews


Langkah selanjutnya adalah memilih rentang waktu pengambilan data dan memilih

bahasa apa yang akan digunakan untuk discraping. Selanjutnya dapat dilakukan

scraping dengan mengklik export pada kanan atas. Sebelum datanya diekstraksi, pada

gambar 4.5 menampilkan data yang akan dieksport dapat diekstraksi menjadi file xlsx

atau CSV dan dapat ditentukan jangka waktu ulasannya sesuai yang diinginkan.


Adapun pada penelitian ini hasil scraping data disimpan dalam bentuk file .xlsx. Pada

gambar 4.6 menunjukkan hasil scraping yang telah diekstraksi dan dapat dilihat bahwa

Gambar 4.2 Export Data Gambar 4.5 Export Data



39

terdapat beberapa kolom yang kurang penting dan dapat diabaikan. Maka dari itu, pada

penelitian ini hanya dua aspek/kolom saja yang akan digunakan untuk tahap pengolahan

data yaitu, terdiri dari komentar dan rating.

4.2 Pengolahan Data

Data yang telah diekstraksi oleh appfollow selanjutnya dilakukan tahap pengolahan agar

dapat menemukan informasi penting dari data tersebut. Pengolahan data dilakukan pada

ulasan pengguna Zoom dalam Bahasa Inggris dengan sampel data sebanyak 96.122

ulasan.

4.2.1 Analisis Deskriptif

Pada penelitian ini dilakukan analisis deskriptif untuk mengetahui gambaran umum

mengenai pelayanan yang diberikan ataupun performansi aplikasi zoom cloud meetings

berdasarkan data ulasan pengguna baik ulasan positif maupun ulasan negatif yang telah

didapatkan dari hasil scraping di Google Play. Ada dua aspek yang ditampilkan pada

analisis deskriptif ini yaitu, jumlah ulasan berdasarkan urutan waktu (Maret 2019 -

November 2020) dan persentase setiap rating yang diberikan oleh pengguna. Berikut ini

merupakan rating yang menampilkan penilaian pengguna terhadap aplikasi zoom cloud

meetings di google play.

Gambar 4.3 Hasil Scraping dari AppFollow Gambar 4.6 Hasil Scraping dari AppFollow

40

Gambar 4.7 Jumlah Ulasan Pengguna

Berdasarkan Gambar 4.7, dengan rentang waktu pengambilan data selama 14 Maret

2019 sampai dengan 20 November 2020 diperoleh hasil grafik yang awalnya naik

kemudian turun. Adapun pada bulan Maret-Desember 2019 hanya terdapat 5057. Pada

bulan Januari-Mei 2020 terdapat 5216 ulasan, pada bulan Juni ulasan yang masuk

meningkat menjadi 7830 ulasan. Selanjutnya pada bulan Juli ulasan meningkat drastis

menjadi 20.775, hal ini diperkirakan terjadi karena pada bulan-bulan pertengahan tahun

2020 semua negara sudah menerapkan sistem Work From Home (WFH) dan karantina

di rumah yang dimana masyarakat hanya dapat melakukan aktivitas secara daring baik

itu bekerja, belajar, silaturahmi online, dan lain sebagainya, sehingga penggunaan jasa

layanan aplikasi berbasis video conference termasuk didalamnya zoom cloud meetings

juga turut meningkat.

41

Gambar 4 8 Persentase Rating

Berdasarkan Gambar 4.8 diketahui bahwa terdapat 5 kategori rating yang berbeda

berdasarkan penilaian pengguna yaitu, bintang dengan nilai 1 sampai dengan 5. Bintang

1 termasuk dalam kategori “Sangat Tidak Suka”, bintang 2 “Tidak Suka”, bintang 3

“Netral”, bintang 4 “Suka” dan bintang 5 “Sangat Suka”. Dari Gambar 4.7 diatas dapat

diketahui bahwa hampir setengah pengguna aplikasi Zoom Cloud Meetings mempunyai

penilaian yang baik terhadap layanan tersebut. Hal ini terbukti berdasarkan jumlah

penilaian pengguna dari 96.122 ulasan, sebanyak 48.99% atau sebanyak 47.086

pengguna memberikan rating 5 atau sangat suka. Selanjutnya untuk persentase

terbanyak kedua adalah 29.95% atau 28.791 pengguna yang mana memberikan rating 1

atau sangat tidak suka. Kemudian diikuti oleh rating 4 sebanyak 9.83% dengan 9.451

pengguna, rating 3 sebanyak 6.79% dengan 6.531 pengguna, dan rating 2 sebanyak

4.43% dengan 4.263 pengguna.

4.2.2 Text Preprocessing

Pada tahap preprocessing, dilakukan pembersihan data menggunakan metode text

mining. Hal ini disebabkan data ulasan hasil scraping memiliki format yang tidak

42

terstruktur, sehingga informasi yang ada di dalam data tidak bisa diekstrak secara

langsung. Maka dari itu, diperlukan tahapan text preprocessing yang merupakan suatu

tahapan yang bertujuan untuk menyeragamkan bentuk kata, menghilangkan karakter-

karakter selain huruf, dan mengurangi volume kosakata sehingga data akan lebih

terstruktur. Adapun preprocessing data pada penelitian ini dilakukan dengan

menggunakan tools yaitu Python 3.8.6 dan Ms. Excel. Tahapan preprocessing memiliki

beberapa tahapan yang akan dilakukan, antara lain sebagai berikut :

1. Cleaning

Dilakukannya tahapan cleaning ini bertujuan untuk membersihkan data ulasan

dari hal yang tidak penting seperti tanda baca, angka, dan sebagainya. Dalam

melakukan proses cleaning tersebut dilakukan 3 tahapan, di antaranya ialah:

⮚ Menghapus angka

Tabel 4.1 Contoh Penghapusan Angka Pada Data

Input Output

Its great until 2 people talk at the

same time. Then the world

explodes. The next 10 seconds

consists of digital noise and

sentence fragments, followed by a

scream usually, then an obscenity.

Its great until people talk at the same

time. Then the world explodes. The

next seconds consists of digital noise

and sentence fragments, followed by

a scream usually, then an obscenity.

⮚ Menghapus tanda baca

Tabel 4.2 Contoh Penghapusan Tanda Baca Pada Data

Input Output

Always dependable. Zoom has made

so much possible during this time of

shut downs & restrictions.

Always dependable Zoom has made

so much possible during this time of

shut downs restrictions

⮚ Menghapus emoji

43

Tabel 4.3 Contoh Penghapusan Emoji Pada Data

Input Output

very Nice App 👌 for the different

types of meeting GGGGGGGG

very Nice App for the different

types of meeting

Case folding merupakan tahapan penyeragaman bentuk huruf dimana dalam

proses ini hanya menerima huruf latin antara “a” sampai “z”. Karakter lain

selain huruf dianggap sebagai delimiter (pembatas) sehingga karakter tersebut

akan dihapus dari dokumen/data. Penyeragaman dilakukan dengan cara

mengubah isi data teks menjadi huruf kecil secara keseluruhan (dari “a” sampai

dengan “z”). Hal ini bertujuan agar kata yang ditulis dengan huruf awal kapital

dan huruf non kapital tidak terdeteksi memiliki arti yang berbeda dan tidak

terhitung sebagai redundan. Berikut merupakan contoh pengaplikasian case

folding yang dapat dilihat pada Tabel 4.4 berikut :

Tabel 4.4 Contoh Case Folding Pada Data

Input Output

Nice work for you to the same Day

installation of the year and I will be

in the future of our games are b

nice work for you to the same day

installation of the year and i will be

in the future of our games are b

2. Tokenization

Tokenization merupakan proses pemecahan teks kalimat menjadi potongan kata-

kata guna membuat kalimat yang terbentuk menjadi lebih bermakna yang

disebut token. Tokenization bertujuan untuk mendapatkan potongan kata berupa

entitas yang memiliki nilai dalam penyusunan matriks dokumen pada proses

selanjutnya. Tokenization dapat memudahkan proses perhitungan kemunculan

kata dalam data. Berikut merupakan contoh penerapan tokenization pada kalimat

yang tertera pada Tabel 4.5 :

44

Tabel 4.5 Contoh Penerapan Tokenization Pada Data

Input Output

in middle of the meeting it screen

disappeared and sound quality is

also bad sometimes

“in” “middle” “of” “the” “meeting”

“it” “screen” “disappeared” “and”

“sound” “quality” “is” “also” “bad”

“sometimes”

3. Filtering

Tahap filtering adalah tahap mengambil kata-kata penting dari hasil proses

tokenization. Proses filtering dapat menggunakan algoritma stoplist (membuang

kata yang kurang penting) atau wordlist (menyimpan kata penting). Penelitian

ini menggunakan stopword berbahasa Inggris berdasarkan modul NLTK.

Stopword / stoplist adalah kata-kata yang tidak memiliki makna penting yang

dapat dibuang dalam pendekatan bag-of-words. Contoh stopword dalam Bahasa

Inggris adalah “the”, “and”, “to”, “i”, “you”, ”was” dan lain-lain. Selain itu,

proses filtering juga dapat dilakukan secara manual, yakni dengan menghapus

kata-kata yang tidak terdapat dalam daftar stopword dan kata-kata yang kurang

berpengaruh secara signifikan terhadap hasil analisis. Adapun terdapat beberapa

kata yang ditambahkan secara manual dikarenakan tidak terdapat didalam

stopword. Contoh dari stopwords seperti ”app”, “ever”, “bad”, “worst”, dan lain

sebagainya. Berikut merupakan contoh filtering pada kalimat ulasan seperti pada

Tabel 4.6:

Tabel 4.6 Contoh Penerapan Filtering Data

Input Output

“in” “middle” “of” “the” “meeting”

“it” “screen” “disappeared” “and”

“sound” “quality” “is” “also” “bad”

“sometimes”

“middle” “meeting” “screen”

“disappeared” “sound” “quality”

“also” “bad” “sometimes”

45

4.2.3 Representasi Model

Representasi model dilakukan dengan membuat model dari data yang masih berbentuk

kata-kata agar dapat diolah dan dihitung. Representasi dilakukan dengan melakukan

perhitungan skor kata berdasarkan kamus lexicon dan kemudian memberi label kelas

sentimen berdasarkan skor yang ada. Skor sentimen dihitung berdasarkan jumlah kata

yang terdeteksi pada kamus lexicon.

a) Pelabelan Kelas Sentimen

Tahap berikutnya setelah mendapatkan skor terhadap sentimen adalah

melakukan pelabelan kelas sentimen. Pelabelan kelas sentimen dilakukan

dengan bantuan library VADER. VADER merupakan salah satu library yang

populer pada analisis sentimen (Vaish, 2018). Pelabelan dilakukan dengan

membagi data menjadi tiga kelas sentimen yaitu sentimen positif, sentimen

netral, dan sentimen negatif dengan ketentuan skor sebagai berikut (Hutto &

Gilbert, 2014) :

Sentimen Positif = >= 0,05

Sentimen Netral = > -0,05 dan < 0,05

Sentimen Negatif = <= -0,05

Kelas sentimen positif merupakan pernyataan yang mengandung ungkapan

pujian, rasa terimakasih, dan lain sebagainya. Adapun untuk kelas sentimen

netral tidak mengandung kata yang bersifat positif maupun negatif, atau yang

bersifat seimbang. Kelas sentimen negatif merupakan pernyataan yang bersifat

ketidakpuasan pengguna, penghinaan dan segala sesuatunya yang bersifat

negatif. Adapun hasil pelabelan kelas sentimen diperoleh jumlah data seperti

berikut :

Tabel 4.7 Hasil Pelabelan Kelas Sentimen berbasis Kamus Lexicon

Ulasan Skor Sentimen Kelas

great platform to have

group video calls

neg: 0.000 neu: 0.594

pos: 0.406

compound: 0.6249

Positif

This is very bad how can

you just show off symbol

neg: 0.378 neu: 0.622 Negatif

46

Ulasan Skor Sentimen Kelas

in participants worst app pos: 0.000

compound: -0.8357

Pada library VADER setiap kata dalam Bahasa Inggris memiliki bobotnya

tersendiri. Penentuan kelas sentimen berdasarkan hasil compound yang telah

didapatkan. Compound pada VADER merupakan sebuah metrik yang

menghitung jumlah semua rating lexicon yang telah dinormalisasi antara -1

(paling negatif paling ekstrim) dan +1 (paling positif paling ekstrim) (Hutto &

Gilbert, 2014).

Tabel 4.8 Perbandingan Jumlah Data pada Kelas Sentimen

Kelas Sentimen Jumlah Ulasan

Positif

Netral

55.413

18.784

Negatif 20.041

Berdasarkan Tabel 4.8, hasil pelabelan kelas sentimen menunjukkan bahwa

jumlah ulasan positif memiliki frekuensi yang lebih tinggi dibandingkan dengan

jumlah ulasan netral maupun negatif. Jumlah ulasan positif sebanyak 55.413

ulasan, ulasan netral sebanyak 18.784 dan ulasan negatif sebanyak 20.041

ulasan. Klasifikasi yang akan digunakan pada penelitian ini hanya data dengan

sentimen positif dan negatif. Sedangkan untuk sentimen netral tidak dimasukkan

ke dalam tahap klasifikasi dikarenakan pada penelitian ini berfokus mencari

permasalahan yang umumnya didapatkan dari ulasan negatif pengguna.

4.2.4 Pembagian Data Latih dan Data Uji

Didalam suatu dataset atau himpunan data terdapat dua jenis data, yaitu data training

dan data testing. Data training oleh algoritma klasifikasi digunakan untuk membangun

sebuah model data testing dan juga data training digunakan untuk perhitungan

probabilitas dari data berdasarkan data pembelajaran yang dilakukan (Wijayatun &

47

Nugroho, 2016). Data training merupakan data yang sebelumnya sudah ada sesuai

dengan fakta. Sedangkan data testing merupakan data yang akan atau sedang terjadi

dan dipergunakan sebagai bahan uji yang sebelumnya sudah didapatkan pada data

training (Wijayatun & Nugroho, 2016). Data ini digunakan untuk mengukur sejauh

mana klasifikasi berhasil melakukan klasifikasi dengan benar. Data yang akan

digunakan untuk data training dan data testing adalah data yang telah diberikan label

kelas.

Adapun pada penelitian ini dilakukan empat kali percobaan dengan perbandingan

antara data latih dan data uji yang berbeda, antara lain sebagai berikut :

1) Perbandingan data latih sebesar 60% dan data uji 40% :

Tabel 4.9 Pembagian Data Latih dan Data Uji 1

Klasifikasi Jumlah Data Latih Data Uji

Positif 55.413 33.248 22.165

Negatif 20.041 12.025 8.016

Total 75.454 45.273 30.181

Berdasarkan perbandingan 60% : 40%, dari total 75.454 ulasan berbahasa

Inggris digunakan 45.273 data latih dan 30.181 data uji.




Positif 55.413 38.789 16.624

Negatif 20.041 14.029 6.012

Total 75.454 52.818 22.636




48



Positif 55.413 44.330 11.083

Negatif 20.041 16.033 4.008

Total 75.454 60.363 15.091






Positif 55.413 47.101 8.312

Negatif 20.041 17.035 3.006

Total 75.454 64.136 11.318



4.1.2 Klasifikasi dengan Metode Naïve Bayes Classifier

Setelah dilakukan penentuan terkait data latih dan data uji selanjutnya dilakukan

klasifikasi dengan metode Naïve Bayes Classifier. Analisis Naïve Bayes Classifier

dilakukan dengan membuat confusion matrix agar dapat diketahui nilai akurasi, recall

dan presisi. Pada penelitian ini confusion matrix dibuat dengan menggunakan aplikasi

python 3.8.6. Berdasarkan pembagian data latih dan data uji yang berbeda, didapatkan

hasil confusion matrix dengan nilai akurasi, presisi, dan recall yang berbeda pula yang

dapat dilihat pada tabel berikut :

1. Data Latih 60% data Uji 40%

Tabel 4.13 Hasil Klasifikasi 1

Prediksi Aktual Class Precision

Negatif Positif

Negatif 3101 1112 92,35%

49

Positif 257 5530 83,26%

Class Recall 73,61% 95,56%

Akurasi 86,31%

Berdasarkan confusion matrix pada Tabel 4.13 dengan menggunakan metode Naïve

Bayes Classifier, diketahui bahwa prediksi ulasan negatif berjumlah 4213 ulasan. Dari

4213 prediksi ulasan negatif, terdapat kesesuaian bahwa ulasan negatif yang termasuk

aktual negatif adalah sebanyak 3101 data yang telah terklasifikasi dengan benar, dan

terdapat ketidaksesuaian karena kebenarannya ulasan adalah positif (aktual positif)

sebanyak 1112 ulasan. Sehingga pada prediksi negatif didapatkan Class Precision

sebanyak 92,35%. Pada prediksi positif diketahui terdapat 5787 ulasan dengan jumlah

kesesuaian bahwa ulasan yang aktual positif sebanyak 5530 yang telah terklasifikasi

dengan benar dan terdapat ketidaksesuaian atau dengan kata lain terdapat kesalahan

prediksi sebanyak 257 ulasan positif yang masuk dalam ulasan negatif. Sehingga

didapatkan nilai presisi untuk kelas positif sebesar 83,26%. Selanjutnya dari hasil

confusion matrix tersebut diperoleh tingkat akurasi sebesar 86,31%, yang artinya dari

10.000 data ulasan yang diuji, terdapat 8631 ulasan yang diklasifikasikan secara benar

oleh model Naïve Bayes Classifier. Sehingga error rate (100% - 86,31%) sebesar

13,69%.




Negatif Positif

Negatif 2337 831 91,83%

Positif 208 4124 83,23%


Akurasi 86,15%





50









7500 data ulasan yang diuji, terdapat 6461 ulasan yang diklasifikasikan secara benar


13,85%.




Negatif Positif

Negatif 1548 537 91,45%

Positif 148 2731 83,57%


Akurasi 86,30%














51


13,70%.




Negatif Positif

Negatif 1190 390 91,54%

Positif 110 2060 84,08%


Akurasi 86,67%















13,33%.

4.2.5 Visualisasi

Visualisasi dilakukan pada keseluruhan data, baik pada ulasan positif maupun ulasan

negatif. Tujuannya dilakukan visualisasi adalah untuk memperoleh informasi secara

menyeluruh mengenai aspek apa saja yang sering dibicarakan terkait performansi

52

aplikasi zoom cloud meetings melalui ulasan pengguna yang telah dilakukan proses text

preprocessing.

a. Bar Plot

Bar plot atau bar chart merupakan grafik yang berfungsi menunjukkan frekuensi atau

fraksi dari kategori data. Bar plot merupakan salah satu metode yang bertujuan untuk

memvisualisasikan data teks.

a. Ulasan Positif

Pada visualisasi ulasan positif menggunakan bar plot ini digunakan data ulasan

dari hasil text preprocessing dan data yang sudah dilakukan sorting

menggunakan tool ms.excel. Data ulasan positif diekstraksi berulang kali agar

mendapatkan kata yang paling sering digunakan oleh pengguna zoom,

selanjutnya visualisasi barplot diidentifikasi berdasarkan frekuensi kata pada

ulasan positif. Berikut merupakan hasil ekstraksi informasi berupa visualisasi

dalam bentuk bar plot berdasarkan ulasan positif pengguna zoom:

Berdasarkan Gambar 4.09 diketahui bahwa terdapat beberapa kata yang paling

sering muncul, dalam hal ini yang ditampilkan hanya 10 kata dengan frekuensi

terbanyak antara lain : kata “meeting” sebanyak 5441 kali, kata “class” sebanyak

Gambar 4.4 Bar Plot Ulasan Positif Gambar 4.9 Bar Plot Ulasan Positif

53

2878 kali, kata “video” sebanyak 2667 kali, kata “online” sebanyak 2494 kali,

kata “time” sebanyak 1483 kali kata “problem” sebanyak 1442 kali, kata “work”

sebanyak 1386 kali, kata “connect” sebanyak 1140 kali, kata “audio” sebanyak

985 kali, dan kata “update” sebanyak 945 kali.

b. Ulasan Negatif

Berdasarkan jumlah total ulasan pengguna zoom cloud meetings yaitu, sebanyak

96.122, diketahui bahwa sekitar 30% diantaranya termasuk dalam ulasan negatif

atau sebanyak 28.791 ulasan. Data ulasan negatif diekstraksi berulang kali agar

mendapatkan kata yang paling sering digunakan oleh pengguna zoom,

selanjutnya visualisasi barplot diidentifikasi berdasarkan frekuensi kata pada

ulasan negatif. Selain itu juga didasarkan pada relevansi kata dengan topik yang

mengacu pada ulasan negatif. Berikut adalah visualisasi hasil ekstraksi informasi

dalam bentuk bar plot yang didapatkan dari ulasan pengguna:

Berdasarkan Gambar 4.10 diketahui bahwa pada ulasan negatif terdapat

beberapa kata yang paling sering muncul, dalam hal ini 10 kata dengan frekuensi

terbanyak antara lain sebagai berikut: kata “problem” sebanyak 3030 kali kata,

“meeting” sebanyak 2369 kali, kata “video” sebanyak 1663 kali, kata “audio”

sebanyak 1328 kali, kata “connect” sebanyak 1272 kali, kata “class” sebanyak

Gambar 4.5 Bar Plot Ulasan Negatif Gambar 4.10 Bar Plot Ulasan Negatif

54

1250 kali, kata “time” sebanyak 1066 kali, kata “update” sebanyak 1000 kali

kata “quality” sebanyak 991 kali dan kata “work” sebanyak 981 kali.

4.2.6 Association Rule

Association rule dilakukan untuk mencari asosiasi antar kata yang paling sering muncul

secara bersamaan agar dapat memperkuat pencarian informasi dan dapat memprediksi

suatu penyebab permasalahan dari suatu topik pembicaraan. Asosiasi antar kata

dilakukan pada ulasan positif maupun ulasan negatif dengan bantuan tool python 3.8.6

dan Ms. Excel 2010.

a. Ulasan Positif

Berdasarkan Gambar 4.11 diperoleh asosiasi kata pada ulasan positif. Proses

ekstraksi informasi dengan asosiasi dilakukan secara berulang kali dengan cara

menyaring kata-kata yang memiliki hubungan dengan kata lain dan didasarkan pada

relevansi kata dengan topik yang dibahas.

Gambar 4.6 Asosiasi Kata Ulasan Positif Gambar 4.11 Asosiasi Kata Ulasan Positif

55

Berdasarkan asosiasi yang terkait dengan kata “meeting” diperoleh informasi

bahwa dari segi kegiatan meeting aplikasi zoom cloud meetings telah memiliki

performa yang baik, kualitas yang bagus baik itu dari audio, video, screen,dll dan

juga zoom dinilai baik ketika kita menjadi host ataupun peserta meeting sehingga

pengguna merekomendasi aplikasi ini untuk melakukan meeting.

Asosiasi yang terkait dengan kata “class” menunjukkan informasi bahwa aplikasi

zoom cloud meetings ini dinilai baik oleh pelajar karena dapat menghadiri kelas

secara daring khususnya di masa pandemi ini. Pengguna memberikan saran agar

durasi waktu untuk melakukan video tidak dibatasi bagi pengguna gratis.

Asosiasi yang terkait dengan kata “video” menunjukkan informasi bahwa menurut

pengguna aplikasi zoom cloud meetings ini merupakan aplikasi video conference

terbaik karena memiliki kualitas audio yang jernih, sharing video dengan kualitas

HD dan merupakan aplikasi yang direkomendasikan untuk melakukan meeting dan

kelas online. Pengguna menyarankan pihak zoom untuk menambahkan tidak hanya

opsi sembunyikan peserta non-video tetapi juga opsi di mana host dapat

menyembunyikan video peserta atau gambar profil agar tidak muncul.

Asosiasi yang terkait dengan kata “online” menunjukkan informasi bahwa zoom

cloud meetings dinilai baik untuk melakukan aktivitas daring selama masa pandemi

ini baik itu kegiatan akademis maupun kegiatan kerja. Pengguna menyarankan zoom

untuk segera memperbaiki masalah yang ada ketika melakukan kegiatan daring.

Asosiasi kata yang berkaitan dengan “problem” menunjukkan informasi bahwa

pengguna merasa ketika menjalankan aplikasi tidak mengalami permasalahan yang

begitu berarti ketika melakukan meeting. Terkadang pengguna juga mengalami

permasalahan kecil ketika melakukan meeting seperti gangguan jaringan yang

mengakibatkan menurunnya kualitas audio dan video. Selain itu, pengguna meminta

permasalahan-permasalahan yang ada pada zoom cloud meetings untuk segera

diperbaiki dan dicari solusinya.

Asosiasi kata yang berkaitan dengan “time” menunjukkan bahwa pengguna

merasa puas dengan adanya fitur real time pada aplikasi zoom dan pengguna merasa

senang dapat terhubung dengan temannya saat kelas online bahkan pengguna

merekomendasikan menggunakan aplikasi zoom cloud meetings untuk melakukan

kelas online. Adapun pengguna memberikan saran agar waktu/durasi meeting pada

zoom cloud meetings ini ditambah lebih dari 40 menit karena 40 menit merupakan

waktu yang terlalu sebentar menurut pengguna bahkan pengguna berharap bagi

pengguna gratisan juga dapat menikmati waktu meeting yang unlimited seperti

aplikasi video conference lainnya.

56

Asosiasi kata yang berkaitan dengan “work” menunjukkan informasi bahwa

pengguna menilai aplikasi ini berjalan dengan sangat baik ketika dioperasikan dan

aplikasi ini dinilai baik dan banyak digunakan untuk melakukan meeting kerja.

Asosiasi kata yang berkaitan dengan kata “connect” menunjukkan informasi

bahwa pengguna menilai untuk konek ke meeting di aplikasi zoom cloud meetings ini

terbilang sangat mudah, simpel dan cepat untuk terhubung. Untuk masalah koneksi

pengguna tidak mengalami masalah yang begitu berarti dan sebagian pengguna

masih ada yang merasakan masalah disconnect. Pengguna menyarankan agar ada

fitur notifikasi untuk connect ke meeting yang telah dijadwalkan dan akan dihadiri

dan berharap fitur ini dapat diterapkan bagi pengguna PC ataupun smartphone.

Asosiasi kata yang berkaitan dengan kata “audio” menunjukkan bahwa pengguna

merasa puas dengan kualitas audio yang dimiliki oleh zoom pada saat melakukan

video meeting. Beberapa pengguna tidak mengalami masalah pada audio dan

beberapa pengguna juga memberikan saran agar masalah-masalah pada audio untuk

segera diperbaiki.

Asosiasi kata yang berkaitan dengan kata “update” menunjukkan bahwa

pengguna merasa senang dan puas terhadap update terbaru dari zoom. Pengguna juga

mengharapkan untuk update berikutnya zoom menciptakan fitur baru yang menarik.

b. Ulasan Negatif

57

Gambar 4.12 Asosiasi Kata Ulasan Negatif

Berdasarkan Gambar 4.12 diperoleh asosiasi kata pada ulasan negatif. Proses

ekstraksi informasi dengan asosiasi dilakukan secara berulang kali dengan cara

menyaring kata-kata yang memiliki hubungan dengan kata lain dan didasarkan pada

relevansi kata dengan topik yang diulas.

Berdasarkan asosiasi yang terkait dengan kata “meeting” diperoleh informasi

bahwa pengguna beberapa kali gagal untuk join meeting padahal koneksi pengguna

bagus. Pada saat meeting terkadang terjadi disconnect secara tiba-tiba dan ini

mengganggu kegiatan daring pengguna, pengguna juga mengeluhkan suara yang

putus-putus dan video ngeblur saat meeting yang kemungkinan disebabkan oleh

faktor gangguan jaringan, gangguan jaringan juga dapat disebabkan karena faktor

cuaca. Maka dari itu, pengguna mengharapkan akan perbaikan segera untuk

permasalahan yang terjadi saat melakukan video meeting.

Kata-kata yang berasosiasi dengan kata “problem” menunjukkan informasi bahwa

pengguna mengalami permasalahan seperti masalah jaringan, audio, video, dll yang

dimana permasalahan ini mengganggu kenyamanan pengguna ketika melakukan

aktivitas daring seperti kelas online, kerja, dll. Pengguna berharap untuk update

berikutnya masalah yang dialami pengguna dapat segera diatasi dan dicari solusinya

secepat mungkin.

Kata-kata yang berasosiasi dengan kata “video” menunjukkan informasi bahwa

setelah melakukan update aplikasi pengguna mengalami masalah mengenai video

yang tidak dapat ditampilkan ke partisipan lain padahal video sudah dihidupkan.

Sejumlah pengguna menilai kualitas video yang ditampilkan tidak jelas/blur dan

tidak bagus.

Kata-kata yang berasosiasi dengan kata “class” menunjukkan informasi bahwa

pengguna tidak dapat menghadiri kelas online dikarenakan permasalahan koneksi

58

yang kurang mendukung, hal ini dikarenakan pengguna yang bertempat tinggal di

desa. Pengguna berharap untuk update selanjutnya, internet dengan low bandwidth

dapat join meeting saat kelas online supaya pengguna yang berstatus sebagai pelajar

tidak ketinggalan pelajaran.

Kata-kata yang berasosiasi dengan “work” menunjukkan informasi bahwa

pengguna merasa setelah melakukan update, aplikasi justru tidak dapat dijalankan

bahkan ada beberapa pengguna mengeluh akan aplikasi yang telah dilakukan update

justru ketika meeting mengalami masalah audio yang tidak dapat didengar peserta

lain dan video yang tidak muncul di layar peserta lain.

Kata-kata yang berasosiasi dengan “connect” menunjukkan informasi bahwa

pengguna mengeluh karena tidak dapat mengikuti aktivitas secara daring

dikarenakan jaringan koneksi internet yang kurang bagus, tetapi ada beberapa

pengguna yang mengeluh karena tidak bisa join meeting padahal koneksi internetnya

dalam kondisi bagus. Pengguna juga mengeluhkan akan koneksi yang kurang bagus

akan mempengaruhi kualitas video dan audio.

Kata-kata yang berasosiasi dengan “audio” menunjukkan informasi bahwa

kualitas audio ketika melakukan meeting tidak jernih dan masih terdapat noise.

Peserta lain terkadang tidak dapat mendengar apa yang dibicarakan oleh speaker

karena suara yang kurang jelas dan putus-putus, hal ini bisa jadi dikarenakan

gangguan jaringan, cuaca,dll.

Kata-kata yang berasosiasi dengan kata “update” menunjukkan informasi bahwa

pengguna menilai update terbaru dari zoom justru memakan banyak data storage di

HP. Pengguna juga merasa dengan melakukan update aplikasi justru timbul masalah

baru seperti masalah audio yang tidak muncul ketika melakukan screen share.

Pengguna juga menyarankan agar update berikutnya merupakan update yang efektif

seperti tidak memakan banyak storage HP dan memperbaiki bug dan masalah yang

sering terjadi baik pengguna PC ataupun HP.

Kata-kata yang berasosiasi dengan kata “time” menunjukkan bahwa pengguna

mengeluhkan akan keterbatasan waktu yang diterapkan zoom untuk melakukan video

meeting khususnya bagi pengguna gratis, beberapa pengguna juga mengalami

masalah connecting ke meeting dalam durasi yang lama dimana hal ini menurut

pengguna merupakan buang-buang waktu saja hanya untuk menunggu connecting.

59

Pengguna menyarankan agar durasi meeting bagi pengguna gratis tidak ada

batasan/unlimited seperti aplikasi video conference lainnya.

Kata-kata yang berasosiasi dengan kata “quality” menunjukkan bahwa pengguna

merasa kurang puas akan kualitas yang dimiliki oleh zoom, karena kualitas suara dan

video yang dianggap kurang bagus dan kurang jernih ketika melakukan meeting.

Pengguna sangat menyarankan zoom untuk segera memperbaiki masalah-masalah

seperti ini dan meningkatkan kualitas aplikasi khususnya pada fitur video dan audio..

4.2.7 Fishbone Diagram

Berdasarkan hasil ulasan negatif yang didapatkan dari data, maka dapat diperoleh

informasi mengenai masalah yang terjadi terkait dengan layanan aplikasi zoom cloud

meetings dan akar penyebab masalahnya yang dipresentasikan pada diagram fishbone

berikut:

60

Gambar 4.13 Diagram Fishbone Untuk Permasalahan Update

Gambar 4.14 Diagram Fishbone Untuk Permasalahan Durasi

61

Gambar 4.15 Diagram Fishbone Untuk Permasalahan Audio

Gambar 4.16 Diagram Fishbone Untuk Permasalahan Koneksi

62

Gambar 4.17 Diagram Fishbone Untuk Permasalahan Fitur Video

Gambar 4.18 Diagram Fishbone Untuk Permasalahan Meeting

63

Gambar 4.19 Diagram Fishbone Untuk Permasalahan Sistem

Berdasarkan analisa dengan diagram fishbone dapat diketahui bahwa untuk setiap kata

kunci yang terdapat dalam ulasan negatif merupakan penyebab permasalahan selama

penggunaan aplikasi. Permasalahan yang terdapat pada analisa diagram fishbone

didasarkan pada informasi yang didapatkan pada tahap klasifikasi, visualisasi dan

asosiasi yang telah dilakukan sebelumnya.

64

BAB V

ANALISIS DAN PEMBAHASAN

5.1 Gambaran Umum Persepsi Pengguna Zoom Cloud Meetings

Berdasarkan data ulasan dari pengguna zoom pada 14 Maret 2019 sampai dengan 20

November 2020, didapatkan ulasan sebanyak 96.122. Pada kurun waktu tersebut

diketahui bahwa ulasan terbanyak ada pada bulan Juli 2020 seperti yang dapat dilihat

pada Gambar 4.8 sebelumnya. Hal ini terjadi dikarenakan pada bulan Maret-Juli terjadi

lonjakan kenaikan jumlah unduhan aplikasi zoom dikarenakan setiap negara

memberlakukan sistem physical distancing dan Work From Home (WFH) untuk

mencegah penularan virus corona selama masa pandemi ini sehingga penggunaan

aplikasi layanan yang mendukung fitur video conference termasuk zoom cloud meetings

juga turut meningkat. Kemudian dari aspek rating, sebanyak 29.95% pengguna atau

28.791 pengguna memberikan rating 1 atau tidak bagus. Setelah dilakukan analisis

deskriptif untuk melihat gambaran umum dari pengguna zoom selanjutnya dilakukan

preprocessing data. Pada tahap preprocessing data ulasan yang awalnya berjumlah

96.122 kemudian berubah jumlahnya menjadi 95.177. ulasan. Banyaknya jumlah ulasan

yang berkurang ini disebabkan karena adanya ulasan yang hanya berupa emoticon atau

simbol, angka dan spasi sehingga data ini dianggap tidak penting dan dihilangkan ketika

dilakukan pembersihan data.

Pada ulasan yang mengandung pernyataan positif seperti ungkapan memuji,

ungkapan rasa terimakasih dan lain sebagainya dimasukkan ke dalam kategori sentimen

positif. Adapun untuk ulasan klasifikasi yang mengandung pernyataan negatif seperti

penghinaan, ketidakpuasan, dan sebagainya dimasukkan ke dalam kategori sentimen

negatif. Oleh karena itu hanya digunakan dua pelabelan yaitu sentimen positif dan

negatif. Berdasarkan hasil akhir pelabelan diperoleh informasi bahwa jumlah ulasan

sentimen positif memiliki frekuensi lebih besar dibanding sentimen negatif. Hal ini

ditunjukkan bahwa, dimana ulasan pada kelas sentimen positif berjumlah 73,44% atau

55.413 ulasan. Sedangkan 26,56% atau 20.041 ulasan termasuk sentimen negatif.

65

5.2 Hasil Klasifikasi Metode Naïve Bayes Classifier

Tahap awal klasifikasi yaitu dengan membagi jumlah data uji dan data latih. Pada

penelitian ini dilakukan perbandingan dengan persentase data latih dan data uji yang

berbeda sebanyak lima kali. Pembagian data pertama diawali dengan data latih 60%

(45.273 ulasan) dan data uji 40% (30.181 ulasan). Pada pembagian data latih dan data

uji yang pertama diketahui Class Precision negatif 92,35% sedangkan untuk kelas

positif sebesar 83,26%. Akurasi yang didapatkan adalah sebesar 86,31%.

Pembagian data kedua dilakukan dengan data latih 70% (52.818 ulasan) dan data uji

30% (22.636 ulasan). Pada pembagian data latih dan data uji yang kedua dihasilkan

Class Precision kelas negatif sebesar 91,83%sedangkan untuk kelas positif sebesar

83,23% dengan akurasi yang didapatkan lebih tinggi dibandingkan pembagian data

pertama, yaitu 86,15%.

Pembagian data ketiga dilakukan dengan data latih 80% (60.363 ulasan) dan data uji

20% (15.091 ulasan). Pada pembagian data latih dan data uji yang ketiga dihasilkan

Class Precision kelas negatif sebesar 91,45% sedangkan untuk kelas positif meningkat

menjadi 83,57%, dengan akurasi yang dihasilkan lebih tinggi dibandingkan pembagian

data pertama dan kedua, yaitu 86,30%.

Pembagian data keempat dilakukan dengan data latih 85% (64.136 ulasan) dan data

uji 15% (11.318 ulasan). Pada pembagian data latih dan data uji yang keempat

dihasilkan Class Precision kelas negatif sebesar 91,54% sedangkan untuk kelas positif

meningkat menjadi 84,08%, dengan akurasi yang dihasilkan lebih tinggi dibandingkan

tiga perbandingan data sebelumnya, yaitu 86,67%.

5.3 Hasil Association Rules

Berdasarkan visualisasi yang telah dilakukan pada ulasan positif di bab sebelumnya

dengan jumlah ulasan sebanyak 55.413 ulasan, didapatkan beberapa kata yang paling

sering muncul, yang kemudian dikerucutkan menjadi 10 kata dengan frekuensi

terbanyak antara lain : kata “meeting” sebanyak 5441 kali, kata “class” sebanyak 2878

kali, kata “video” sebanyak 2667 kali, kata “online” sebanyak 2494 kali, kata “time”

sebanyak 1483 kali kata “problem” sebanyak 1442 kali, kata “work” sebanyak 1386

kali, kata “connect” sebanyak 1140 kali, kata “audio” sebanyak 985 kali, dan kata

“update” sebanyak 945 kali.

66

Asosiasi kata pada ulasan positif dilakukan dengan melakukan ekstraksi informasi

secara berulang-ulang dan didasarkan pada relevansi kata dengan topik yang terkait.

Pada Gambar 4.13 menunjukkan bahwa asosiasi kata dilakukan pada kata “meeting”,

kata “class”, kata “video”, kata “online”, kata “problem”, kata “time”, kata “work”, kata

“connect”, kata “audio”, dan kata “update”.

Berdasarkan tahap association rule yang telah dilakukan diketahui bahwa dari segi

kegiatan meeting aplikasi zoom cloud meetings telah memiliki performa yang baik,

kualitas yang bagus baik itu dari audio, video, screen,dll dan juga zoom dinilai baik

ketika kita menjadi host ataupun peserta meeting sehingga pengguna merekomendasi

aplikasi ini untuk melakukan meeting. Aplikasi zoom cloud meetings ini dinilai baik

oleh pelajar karena dapat menghadiri kelas secara daring khususnya di masa pandemi

ini. Pengguna memberikan saran agar durasi waktu untuk melakukan video tidak

dibatasi bagi pengguna gratis. Menurut pengguna aplikasi zoom cloud meetings ini

merupakan aplikasi video conference terbaik karena memiliki kualitas audio yang

jernih, kualitas sharing video dengan kualitas HD dan merupakan aplikasi yang

direkomendasikan untuk melakukan meeting dan kelas online. Pengguna menyarankan

pihak zoom untuk menambahkan tidak hanya opsi sembunyikan peserta non-video tetapi

juga opsi di mana host dapat menyembunyikan video peserta atau gambar profil agar

tidak muncul. Pengguna merasa ketika menjalankan aplikasi tidak mengalami

permasalahan yang begitu berarti ketika melakukan meeting. Terkadang pengguna juga

mengalami permasalahan kecil ketika melakukan meeting seperti gangguan jaringan

yang mengakibatkan menurunnya kualitas audio dan video. Selain itu, pengguna

meminta permasalahan-permasalahan yang ada pada zoom cloud meetings untuk segera

diperbaiki dan dicari solusinya. Pengguna merasa puas dengan adanya fitur realtime

pada aplikasi zoom dan pengguna merasa senang dapat terhubung dengan temannya saat

kelas online bahkan pengguna merekomendasikan menggunakan aplikasi zoom cloud

meetings untuk melakukan kelas online. Adapun pengguna memberikan saran agar

waktu/durasi meeting pada zoom cloud meetings ini ditambah lebih dari 40 menit karena

40 menit merupakan waktu yang terlalu sebentar menurut pengguna bahkan pengguna

berharap bagi pengguna gratisan juga dapat menikmati waktu meeting yang unlimited

67

seperti aplikasi video conference lainnya. Pengguna menilai aplikasi ini berjalan dengan

sangat baik ketika dioperasikan dan aplikasi ini dinilai baik dan banyak digunakan

untuk melakukan meeting kerja. Pengguna menilai untuk terhubung ke meeting di

aplikasi zoom cloud meetings ini terbilang sangat mudah, simpel dan cepat untuk

terhubung. Untuk masalah koneksi pengguna tidak mengalami masalah yang begitu

berarti dan sebagian pengguna masih ada yang merasakan masalah disconnect.

Pengguna menyarankan agar ada fitur notifikasi untuk connect ke meeting yang telah

dijadwalkan dan akan dihadiri dan berharap fitur ini dapat diterapkan bagi pengguna PC

ataupun smartphone. Pengguna merasa puas dengan kualitas audio yang dimiliki oleh

zoom pada saat melakukan video meeting. Beberapa pengguna tidak mengalami masalah

pada audio dan beberapa pengguna juga memberikan saran agar masalah-masalah pada

audio untuk segera diperbaiki.

Berdasarkan 20.041 ulasan negatif diketahui bahwa terdapat 10 kata yang paling

banyak muncul seperti yang dapat dilihat pada Gambar 4.10. Kata yang paling banyak

muncul diantaranya: kata “problem” sebanyak 3030 kali kata, “meeting” sebanyak 2369

kali, kata “video” sebanyak 1663 kali, kata “audio” sebanyak 1328 kali, kata “connect”

sebanyak 1272 kali, kata “class” sebanyak 1250 kali, kata “time” sebanyak 1066 kali,

kata “update” sebanyak 1000 kali kata “quality” sebanyak 991 kali dan kata “work”

sebanyak 981 kali.

Asosiasi kata pada ulasan negatif dilakukan dengan melakukan ekstraksi informasi

secara berulang-ulang dan didasarkan pada relevansi kata dengan topik yang terkait.

Pada Gambar 4.14 didapatkan informasi bahwa asosiasi kata dilakukan pada kata

“meeting”, kata “problem”, kata “video”, kata “class”, kata “work”, kata “connect”, kata

“audio”, kata “quality”, kata “time”, dan kata “online”.

Pengguna mengalami beberapa kali gagal untuk join meeting padahal koneksi

pengguna bagus. Pada saat meeting terkadang terjadi disconnect secara tiba-tiba dan ini

mengganggu kegiatan daring pengguna, Maka dari itu, pengguna mengharapkan akan

perbaikan segera untuk permasalahan yang terjadi saat melakukan video meeting.

Pengguna mengalami permasalahan seperti masalah jaringan, audio, video, dll yang

dimana permasalahan ini mengganggu kenyamanan pengguna ketika melakukan

aktivitas daring seperti kelas online, kerja, dll. Pengguna berharap untuk update

berikutnya masalah yang dialami pengguna dapat segera diatasi dan dicari solusinya

secepat mungkin. Setelah aplikasi dilakukan update pengguna mengalami masalah

68

mengenai video yang tidak dapat ditampilkan ke partisipan lain padahal video sudah

dihidupkan. Sejumlah pengguna menilai kualitas video yang ditampilkan tidak

jelas/blur dan tidak bagus. Pengguna tidak dapat menghadiri kelas online dikarenakan

permasalahan koneksi yang kurang mendukung, hal ini dikarenakan pengguna yang

bertempat tinggal di desa. Pengguna berharap untuk update selanjutnya, internet dengan

low bandwidth dapat join meeting saat kelas online supaya pengguna yang berstatus

sebagai pelajar tidak ketinggalan pelajaran. Pengguna merasa aplikasi setelah dilakukan

update justru tidak dapat dijalankan, bahkan ada beberapa pengguna mengeluh akan

aplikasi yang sudah dilakukan update justru ketika meeting mengalami masalah audio

yang tidak dapat didengar peserta lain dan video yang tidak muncul di layar peserta lain.

Pengguna mengeluh karena tidak dapat mengikuti aktivitas secara daring dikarenakan

jaringan koneksi internet yang kurang bagus, tetapi ada beberapa pengguna yang

mengeluh karena tidak bisa join meeting padahal koneksi internetnya dalam kondisi

bagus. Pengguna juga mengeluhkan akan koneksi yang kurang bagus akan

mempengaruhi kualitas video dan audio.

Pengguna menilai update terbaru dari zoom justru memakan banyak data storage di

HP. Pengguna juga merasa dengan melakukan update aplikasi justru timbul masalah

baru seperti masalah audio yang tidak muncul ketika melakukan screen share.

Pengguna juga menyarankan agar update berikutnya merupakan update yang efektif

seperti tidak memakan banyak storage HP dan memperbaiki bug dan masalah yang

sering terjadi baik pengguna PC ataupun HP. Kualitas audio ketika melakukan meeting

tidak jernih dan masih terdapat noise. Peserta lain terkadang tidak dapat mendengar apa

yang dibicarakan oleh speaker karena suara yang kurang jelas dan putus-putus, hal ini

bisa jadi dikarenakan gangguan jaringan, cuaca,dll. Pengguna mengeluhkan akan

keterbatasan waktu yang diterapkan zoom untuk melakukan video meeting khususnya

bagi pengguna gratis, beberapa pengguna juga mengalami masalah connecting ke

meeting dalam durasi yang lama dimana hal ini menurut pengguna merupakan buang-

buang waktu saja hanya untuk menunggu connecting. Pengguna menyarankan agar

durasi meeting bagi pengguna gratis tidak ada batasan/unlimited seperti aplikasi video

conference lainnya. Pada saat aktivitas meeting dan kelas online, pengguna mengalami

permasalahan seperti crash, tidak bisa join meeting, dll sehingga mengakibatkan

pengguna tidak dapat berpartisipasi dalam aktivitas kelas online. Pengguna sangat

menyarankan zoom untuk segera memperbaiki masalah-masalah seperti ini.

69

5.4 Rencana Perbaikan Berdasarkan Diagram Fishbone

Berdasarkan diagram fishbone pada bab sebelumnya diketahui informasi yang menjadi

faktor permasalahan pada penggunaan aplikasi zoom cloud meetings dan penyebab

zoom mendapatkan ulasan negatif dan rating buruk dari penggunanya. Terdapat 6 aspek

yang digunakan yaitu product, process, people, place, price dan promotion. Langkah

selanjutnya yaitu menentukan rencana perbaikan yang didasarkan pada permasalahan

yang ada dan berdasarkan saran dari beberapa pengguna. Adapun rencana perbaikannya

juga bersifat umum dan tidak menjurus pada hal yang bersifat teknis dan dapat dilihat

rencana perbaikan masalah pada tabel berikut :

Tabel 5.1 Rencana Perbaikan Masalah

Aspek Permasalahan yang Terjadi Saran Perbaikan

Product Kualitas video yang

ditampilkan kurang jelas/masih

blur

Kualitas suara yang kurang

jelas/jernih

Setelah aplikasi diperbaharui, audio

pada aplikasi tidak dapat berfungsi

dengan baik

Setelah aplikasi diperbaharui timbul

bug baru

Belum adanya fitur record video

untuk pengguna HP

Belum terdapatnya fitur notifikasi

untuk melakukan update

bagi pengguna HP

Belum terdapatnya fitur countdown

timer ketika melakukan meeting

1. Maintenance aplikasi

untuk memperbaiki bug

2. Melakukan penambahan

fitur notifikasi update

bagi pengguna HP

3. Memperbaiki kualitas

suara yang masuk agar

meminimalisir noise

4. Menambah fitur record

video untuk pengguna HP

5. Memberikan fitur option

untuk menampilkan

kualitas video seperti

360p atau kualitas HD

720p

Process Pengguna mengalami kendala untuk

melakukan update pada aplikasi

Terjadi crash saat melakukan video meeting/conference

Video freeze saat melakukan meeting

Terjadi disconnect secara tiba-tiba

dan tanpa sebab

Suara host tidak dapat didengar oleh

peserta lain

Audio lag ketika peserta lain

melakukan screen sharing bagi

pengguna HP

1. Memperbaiki bug terkait

koneksi

2. Melakukan update untuk memperbaharui kualitas video

3. Melakukan update untuk memperbaharui kualitas audio dan memperbaiki

bug pada sistem audio

4. Meluncurkan versi terbaru guna menghilangkan bug yang terdapat pada versi sebelumnya dan memperbaiki masalah error

70

Aspek Permasalahan yang Terjadi Saran Perbaikan

People Pelayanan customer service yang

kurang memuaskan

1. Melakukan evaluasi

kinerja pada bagian

customer service

2. Bagian pelayanan

disarankan agar lebih

responsif terhadap

tanggapan penggunanya

terutama tanggapan yang

kritis dan pihak

perusahaan dapat cepat

memperbaiki kekurangan

yang ada pada

aplikasinya

Place System error

Proses connecting ke meeting

membutuhkan waktu yang lama

1. Sistem error umumnya

terjadi ketika ada update

pada aplikasi. Maka dari

itu, sebelum

meluncurkan versi

aplikasi terbaru pihak

developer lebih

memperhatikan dalam

tahap pengujian versi

hingga aplikasi tidak

terdeteksi error

2. Developer segera

memperbaiki server pada

aplikasi sehingga tidak

terjadi masalah terkait

connecting error atau

connecting buffering

Price Biaya upgrade untuk menjadi

pengguna pro tergolong mahal

1. Mempertimbangkan

kembali terhadap biaya

upgrade dan

memberikan potongan

harga upgrade bagi

penggunanya

Promotion Selain pengguna berbayar tidak

dapat menikmati durasi meeting

yang unlimited

1. Mempertimbangkan

kembali untuk

menerapkan kebijakan

bagi pengguna gratis

untuk dapat menikmati

durasi meeting yang unlimited atau durasi

lebih dari 60 menit

71

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil analisis dan pembahasan yang telah dilakukan pada bab sebelumnya,

maka dapat ditarik beberapa kesimpulan seperti berikut:

1. Berdasarkan ulasan yang telah dikumpulkan dapat diketahui bahwa mayoritas

pengguna Zoom Cloud Meetings mempunyai penilaian ataupun persepsi yang baik

terhadap aplikasi tersebut. Pada kurun waktu 14 Maret 2019 – 20 November 2020

didapatkan ulasan pengguna zoom pada laman web Google Play yaitu sebanyak

96.122 ulasan. Adapun pengguna paling banyak memberikan rating 5 dengan

persentase 48.99% atau sebanyak 47.086 pengguna. Setelah dilakukan

preprocessing diketahui ulasan yang dapat diolah sebanyak 1.843 yang kemudian

diperoleh jumlah ulasan positif sebanyak 62.896 ulasan (65,71%) dan ulasan

negatif sebanyak 32.821 ulasan (34,29%).

2. Berdasarkan klasifikasi yang telah dilakukan dengan metode Naïve Bayes

Classifier, yang dimana dengan menggunakan empat jenis perbandingan data latih

dan data uji. Diketahui bahwa dengan data latih dan data uji sebesar 85% : 15%

menghasilkan tingkat akurasi sebesar 86,67%.

3. Berdasarkan hasil asosiasi yang dilakukan, didapatkan informasi bahwa secara

umum penelitian ini membahas delapan hal yakni meeting, video, audio, class,

work, update, time dan connect. Pada asosiasi positif pengguna banyak membahas

mengenai kata“meeting”, “class”, “video”, “online”, “problem”, “time”, “work”,

“connect”, “audio”, dan “quality”. Sedangkan pada asosiasi negatif pengguna

sering membicarakan mengenai kata “meeting”, “problem”, “video”, “class”,

“work”, “connect”, “audio”, “update”, “time”, “online”.

4. Berdasarkan diagram fishbone didapatkan permasalahan yang didasarkan pada 6

faktor yaitu product, process, people, place, price dan promotion. Dari keenam

faktor tersebut diperoleh permasalahan sebanyak 18, antara lain : terjadi crash saat

melakukan video meeting/conference, belum adanya fitur record video untuk

72

pengguna HP, video freeze saat melakukan meeting, video yang ditampilkan kurang

jelas/blur, suara host tidak dapat didengar oleh peserta lain, kualitas suara yang

kurang jernih, terjadi disconnect secara tiba-tiba dan tanpa sebab, system error,

munculnya bug setelah update aplikasi, aplikasi tidak dapat dilakukan update,

belum ada notifikasi update bagi pengguna HP, pelayanan yang kurang

memuaskan, biaya upgrade untuk menjadi pengguna pro termasuk mahal, selain

pengguna berbayar tidak dapat menikmati durasi meeting yang unlimited, dan

proses connecting ke meeting dalam waktu yang lama.

6.2 Saran

Berdasarkan beberapa kesimpulan diatas, adapun saran yang dapat diberikan adalah

sebagai berikut :

1. Saran bagi pihak Zoom

Bagi pihak Zoom, hasil ekstraksi informasi dari ulasan-ulasan yang telah diberikan

oleh pengguna khususnya ulasan yang berbentuk negatif dapat dijadikan bahan

evaluasi kedepannya dalam hal peningkatan kepuasan pengguna dan memberikan

pelayanan semaksimal mungkin, serta untuk pengembangan pembaharuan aplikasi

dan fitur selanjutnya.

2. Saran untuk penelitian selanjutnya

Peneliti selanjutnya dapat mengembangkan penelitian dengan menggunakan lebih

dari satu bahasa dikarenakan penelitian ini masih dibatasi dengan hanya mengolah

ulasan berbahasa Inggris. Kemudian penelitian ini baru menggunakan satu algoritma

yaitu apriori, sehingga penelitian selanjutnya dapat dilakukan menggunakan

pendekatan association rule lainnya sebagai pembanding performa algoritma apriori

untuk menemukan asosiasi antar kata yang lebih akurat. Selain itu pada penelitian ini

hanya menganalisis satu aplikasi video conference, untuk penelitian selanjutnya

dapat membandingkan lebih dari satu aplikasi. Untuk penelitian selanjutnya

diharapkan dapat menerapkan metode lain atau teknik lain terhadap kata negasi agar

hasil yang didapatkan lebih akurat.

73

DAFTAR PUSTAKA

Adiyana, I., & Hakim, F. (2015). Implementasi Text mining pada Mesin Pencarian

Twitter untuk Menganalisis Topik-Topik terkait KPK dan Jokowi. Prosiding

Seminar Nasional Matematika dan Pendidikan Matematika UMS, (pp. 570-581).

APJII. (2020). Laporan Survei Internet APJII 2019 - 2020 [Q2]. (online):

https://apjii.or.id/survei2019x/download/yIzbeAuEsRU28Wm34BnTwtxGoqJ51

K (16 Januari 2021)

Appfollow. (2020). App Review Management & ASO Platform. (online):

https://appfollow.io/ (05 Januari 2021)

Aprianti, W., Hafizd, K., & Rizani, M. (2017). Implementasi Association Rules dengan

Algoritma Apriori pada Dataset Kemiskinan. J. Math. and Its Appl., XIV(2),

145-155.

Arifwidodo, B., & Ikhwan, S. (2019). Analisa Quality Of Service Layanan Video Call

Berbasis Internet Protocol Multi Media Subsystem Pada Jaringan Ip Versi 6.

Jurnal Nasional, 20(2), 95-104.

Arkhamsiagustinah. (2015). Perbandingan Metode Second-Order Fuzzy Time Series

Dari HSU dan CHEN Dalam Peramalan Produk Domestik Regional Bruto

(PDRB). Skripsi.

Azizah, N. (2019). Pengambilan Keputusan Seleksi Penerima Bantuan Rumah Tidak

Layak Huni (Rtlh) Penduduk Desa Kalianyar Dengan Menggunakan Algoritma

Naive Bayes. Skripsi, Universitas Pelita Bangsa.

Carracedo, P., Puertas, R., & Marti, L. (2020). Research Lines On The Impact Of The

COVID-19 Pandemic On Business. A Text Mining Analysis. Journal of

Business Research.

Chintalapudi, N., Battineni, G., Canio, M., Sagaro, G., & Amenta, F. (2020). Text

Mining with Sentiment Analysis on Seafarers’ Medical Documents.

International Journal of Information Management Data.

Dunham, M. (2003). Data Mining: Introductory And Advanced Topics. New Jersey:

Pearson Education.

74

Fanani. (2017). Klasifikasi Review Software Pada Google Play Menggunakan

Pendekatan. Skripsi. Universitas Gadjah Mada.

Fauziah, N. (2009). Aplikasi Fishbone Analysis dalam Meningkatkan Kualitas Produksi

Teh Pada PT Rumpun Sari Kemuning, Kabupaten Karanganyar. Skripsi.

Universitas Sebelas Maret.

Fauzy, M., Asror, I., & Wiharja K, R. (2016). Penerapan Metode Association Rule

Menggunakan Algoritma Apriori Pada Simulasi Prediksi Hujan Wilayah Kota

Bandung. Jurnal Ilmiah Teknologi Informasi Terapan, II(2).

Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters 27.8,

861–874.

Feldman, R., & Sanger, J. (2007). The Text Mining Handbook:Advanced Approaches to

Analyzing Unstructured Data. New York: Cambridge University Press.

Fikria, N. (2018). Analisis Klasifikasi Sentimen Review Aplikasi E-Ticketing

Menggunakan Metode Support Vector Machine Dan Asosiasi. Skripsi.

GooglePlay. (2020). details: Zoom Cloud Meetings. (online):

https://play.google.com/store/apps/details?id=us.zoom.videomeetings&hl=en&g

l=US (31 Desember 2020)

Gough, M. (2006). Video Conferencing Over IP. Canada: Syngress Publishing.

Han, J., & Kamber, M. (2006). Data Mining : Concepts and Techniques Second

Edition. San Fransisco: Morgan Kauffman.

Hansen, & Mowen. (2001). Akuntansi Manajemen Biaya Jilid 2. Jakarta: Erlangga.

Hansen, & Mowen. (2006). Akuntansi Manajemen 1. Jakarta: Salemba Empat.

Herjanto, E. (2007). Manajemen Operasi. Jakarta: PT.Gramedia Widia Sarana.

Herlinawati, N., Yuliani, Y., Faizah, S., Gata, W., & Samudi. (2020). Analisis Sentimen

Zoom Cloud Meetings Di Play Store Menggunakan Naïve Bayes dan Support

Vector Machine. Journal of Computer Engineering System and Science, V(02).

Herryawan, K. (2009). Modul Pelatihan Teknisi JARDIKNAS dan SIM Keuangan.

Video Conference.

Hutto, C., & Gilbert, E. (2014). VADER: A Parsimonious Rule-based Model for

Sentiment Analysis of Social Media Text. Proceedings of the Eighth

International AAAI Conference on Weblogs and Social Media.

Institute, S. (2010). Getting Started with SAS® Text Miner 4.2. North Carolina: SAS

Publishing.

75

Interbrand. (2020). Best Global Brand 2020. (online):

https://interbrand.com/newsroom/interbrand-reveals-2020-best-global-brands-

report/ (20 Desember 2020)

Josi, A., Abdillah, L., & Suryayusra. (2014). Penerapan Teknik Web Scraping Pada

Mesin Pencari Artikel Ilmiah. Jurnal Sistem Informasi, V(2), 159-164.

Juliasari, N., & Sitompul, J. C. (2012). Aplikasi Search Engine dengan Metode Depth

First Search (DFS). BIT Numerical Mathematics, 9.

Karch. (2019). What is Google Play? Retrieved from http://lifewire.com/what-isgoogle-

play-891616720.html

Karyadi, S., Yasin, H., & Mukid, M. (2016). Analisis Kecenderungan Informasi Dengan

Menggunakan Metode Text Mining. Jurnal Gaussian, V(4), 763-770.

Kiran, D. (2016). Total Quality Management 1st Edition: Key Concepts and Case

Studies. Oxford: Butterworth-Heinemann.

Kotler, P., & Amstrong, G. (1996). Dasar-Dasar Pemasaran (5th ed.). Jakarta:

Intermedia.

Kurniasari, S. (2018). Implementasi SVM dan Asosiasi Untuk Sentiment Analysis Data

Ulasan The Phoenix Hotel Yogyakarta Pada Situs Tripadvisor. Skripsi.

Liker, J. K. (2014). Der Toyota Weg (9.Edition ed.). Munich, Germany: FinanzBuch

Verlag.

Liu, L., Chunfang, & Zhouyang. (2013). Analysis of Customer Satisfaction from

Chinese Reviews using Opinion Mining. 6th IEEE International Conference on

Software Engineering and Service Science (ICSESS).

Ma'arif, M. (2016). Integrasi Laman Web Tentang Pariwisata DIY. Jurnal Informatikan

dan komputer, IX(1).

Manning, C. D., Raghavan, P., & Schütze, H. (2009). An Introduction to Information

Retrieval – Online Edition. Cambridge: Cambridge University Press.

Mercubuana Jakarta, M. T. (2011). Metode Quality Function Deployment?? Apa Sich?

(online):https://www.kompasiana.com/muslimah/5500daaf813311f51bfa7bb7/m

etode-quality-function-deployment-apa-sich (28 Desember 2020)

Mu-Hee, S., Soo-Yeon, L., Seong-Bae, P., Dong-Jin, K., & Sang-Jo, L. (2006).

Ontology-based automatic classification of web documents. Applied Soft

Computing Technologies: The Challenge of Complexity, 483-493.

http://lifewire.com/what-isgoogle-

http://www.kompasiana.com/muslimah/5500daaf813311f51bfa7bb7/m

http://www.kompasiana.com/muslimah/5500daaf813311f51bfa7bb7/m

76

Novienstinawati. (2008). Analisa Implementasi Layanan Video Conference Berbasis

Web. Skripsi.

Nurdiansyah, D. (2013). Implementasi Video Conference Pada Jaringan HSUPA (High

Speed Uplink Packet Access) Dengan Media IPv6 Menggunakan Simulator

OPNET Modeler v.14.5. Universitas Brawijaya.

Pradana, M. (2020). Penggunaan Fitur Wordcloud dan Document Term Matrix Dalam

Text Mining. Jurnal Ilmiah Informatika, VIII(1).

Priyanto, A., & Ma'arif, M. (2018). Implementasi Web Scraping dan Text Mining untuk

Akuisisi dan Kategorisasi Informasi Laman Web Tentang Hidroponik.

Indonesian Journal of Information Systems (IJIS), I(1).

Putri, D. (2016). Implementasi Inferensi Fuzzy Mamdani Untuk Keperluan Sistem

Rekomendasi Berita Berbasis Konten. Skripsi. UGM Yogyakarta: Program Studi

Ilmu Komputer FMIPA.

Rozi, I. F., Pramono, S. H., & Dahlan, E. A. (2012). Implementasi Opinion Mining

(Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi.

Jurnal EECCIS, VI(1).

SAS Institute. (2010). Getting Started With SAS® Text Miner 4.2. North Carolina: SAS

Publishing.

Statqo Analytics. (2020). Press Release (Per 30 Maret 2020 – Edisi ke 2) Analisis

Digital Terkait Dampak Pandemi COVID-19. (online):

https://www.statqoanalytics.com/post/press-release-per-30-maret-2020-edisi-ke-

2-analisis-digital-terkait-dampak-pandemi-covid-19 (15 Desember 2020)

Tan, P., Steinbach, M., & Karpatne, A. (2006). Introduction To Data Mining. USA:

Addison-Wesley.

Tanaka, M., & Okutomi, M. (2014). A Novel Inference of a Restricted Boltzmann

Machine. 22nd International Conference on Pattern Recognition, (pp. 1526-

1531).

Titania, B. (2020). Penerapan Metode Text Mining Dan Social Network Analysis Pada

Jejaring Sosial Twitter. Skripsi. Universitas Islam Indonesia

Turban, E., & King, D. (2002). Electronic Commerce 2002 – A Managerial Perspective

(Second edition). New York: Prentice Hall.

Turland, M. (2010). Php | Architect’s Guide to Web Scraping . Los Angeles: Marco

Tabini & Associates, Inc.

http://www.statqoanalytics.com/post/press-release-per-30-maret-2020-edisi-ke-

http://www.statqoanalytics.com/post/press-release-per-30-maret-2020-edisi-ke-

77

Ulwan, M. N. (2016). Pattern Recognition pada Unstructured Data Teks Menggunakan

Support Vector Machine dan Association. Skripsi. Universitas Gajah Mada.

Yogyakarta: Program Studi Statistik FMIPA.

Vaish, R. (2018). VADER and Sentiment Analysis — Python. (online):

https://medium.com/@rahulvaish/vader-and-sentiment-analysis-python-

eae70ecef454 (09 Februari 2021)

Valibia, K. G. (2018). Zoom. (online): UC,Riverside:

https://sitelicense.ucr.edu/files/zoom_for_instructors.pdf (10 September 2020)

Wati, R. (2016). Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis

Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes.

Evolusi: Jurnal Sains dan Manajemen, IV(1).

Wijayatun, P. R., & Nugroho. (2016). Prediksi Rating Film Menggunakan Metode

Naive Bayes. Jurnal Teknik Elektro (ISSN 1411-0059), 60-63.

Zhang, Y., Chen, M., & Liu, L. (2015). A Review on Text Mining. International

Journal on Software Engineering and Service Science .

Zoom. (2020). Zoom Brand Guide. (online):

https://zoom.us/docs/doc/Zoom%20Brand%20Guide.pdf (21 Januari 2021)

https://medium.com/%40rahulvaish/vader-and-sentiment-analysis-python-

78

LAMPIRAN

Lampiran 1. Script preprocessing

#import library yang dibutuhkan

import numpy as np

import pandas as pd

import string

import re

df=pd.read_excel('Data Review.xlsx', usecols=['Rating', 'Review'])

df['Rating']=df['Rating'].astype('str')

df1=df.apply(lambda x: x.str.replace( r'[^\w\s]', '').str.lower()).replace(['rating', ''],

np.nan, regex=True)

df1= df1.dropna().reset_index(drop=True)

79

Lampiran 2. Script Pelabelan dan Pembobotan


import numpy as np

import pandas as pd

import nltk

import string

import re

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer

analyser = SentimentIntensityAnalyzer()

df=pd.read_excel('reviews zoom fix.xlsx', usecols=['Rating', 'Review'])

df['Rating']=df['Rating'].astype('str')

df1=df.apply(lambda x: x.str.replace( r'[^\w\s]', '').str.lower()).replace(['rating', ''],

np.nan, regex=True)

df1= df1.dropna().reset_index(drop=True)

names = df1['Review'].tolist()

a = []

for sentence in names:

score = analyser.polarity_scores(sentence)

a.append(score)

dataFrame=pd.DataFrame(a)

c= dataFrame.drop(columns=['neg', 'neu', 'pos'])

d = pd.concat([df1, c], axis = 1)

#untuk ulasan positif

d['score']= d['compound'].apply(lambda x: 1 if x >= 0.05 else 0)

g = d[d['lol'].isin([0]) == False]

g.to_excel('Ulasan Positif.xlsx')

#untuk ulasan negatif

d['score']= d['compound'].apply(lambda x: 1 if x <= -0.05 else 0)

g = d[d['lol'].isin([0]) == False]

g.to_excel('Ulasan Negatif.xlsx')

80

Lampiran 3. Script Klasifikasi dengan Menggunakan Naïve Bayes Classifier

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn.model_selection import train_test_split

from sklearn.metrics import classification_report

from sklearn.metrics import confusion_matrix

gnb = MultinomialNB()

cvec = CountVectorizer()

# splitting dataframe by row index

df_1 = d.iloc[:25000,:]

df_2 = d.iloc[25001:,:]

ccd = df_1['Review'].tolist()

txt_vec = cvec.fit_transform(ccd).toarray()

txt_vec.shape

label = df_1['score']

features = txt_vec

Jika:

# Perbandingan data latih sebesar 60% dan data uji 40% :

X_train, X_test, y_train, y_test = train_test_split(features, label, test_size=0.40,

random_state=42)



random_state=42)



random_state=42)



random_state=42)

gnb.fit(X_train, y_train)

y_pred1 = gnb.predict(X_test)

y_pred1

print("=== Classification Report ===")

print(classification_report(y_test, y_pred1, digits=4))

print(confusion_matrix(y_test, y_pred1))

81

Lampiran 4. Script Association Rule (Ulasan Positif)


import pandas as pd

import numpy as np

import nltk

import re

from nltk.corpus import stopwords

from nltk.tokenize import word_tokenize

df = pd.read_excel('Ulasan Positif.xlsx')

df=df.dropna().reset_index(drop=True)

df = df.replace('connecting','connect', regex=True).replace('connection','connect',

regex=True).replace('classes','class', regex=True).replace('problems','problem',

regex=True).replace('meetings','meeting', regex=True).replace('working','work',

regex=True).replace('audios','audio', regex=True).replace('videos','video',

regex=True).replace('using','use', regex=True)

def tokenize(txt):

tokens=re.split('\W+', txt)

return tokens

df['Tokenized'] = df['Review'].apply(lambda x: tokenize(x))

stopwords_english = stopwords.words('english')

stop_words = ['good', 'easy', 'also', 'great', 'best', 'use', 'excellent', 'like', 'helpful',

'love', 'please', 'much', 'app', 'zoom', 'ok', 'amazing', 'one', 'thanks',

'really', 'get', 'nice', 'many', 'always', 'thank', 'bad', 'useful',

'super', 'awesome', ',', '.', '', 'properly']+ list(stopwords_english)

def remove_stopwords(txt_tokenized):

txt_clean = [word for word in txt_tokenized if word not in stop_words]

return txt_clean

df['Stopword'] = df['Tokenized'].apply(lambda x: remove_stopwords(x))

df = df['Stopword']

from mlxtend.preprocessing import TransactionEncoder

from mlxtend.frequent_patterns import apriori

from mlxtend.frequent_patterns import association_rules

te = TransactionEncoder()

te_ary = te.fit(df).transform(df)

df1 = pd.DataFrame(te_ary, columns = te.columns_)

82

frequent_itemsets = apriori(df1, min_support = 0.002, use_colnames=True)

frequent_itemsets

res = association_rules(frequent_itemsets, metric='lift', min_threshold=1)

res

res1=res[['antecedents', 'consequents', 'support', 'confidence', 'lift']]

res1

res1.to_excel('AR Positif.xlsx')

83

Lampiran 5. Script Association Rule (Ulasan Negatif


import pandas as pd

import numpy as np

import nltk

import re

from nltk.corpus import stopwords

from nltk.tokenize import word_tokenize

df = pd.read_excel('Ulasan Negatif.xlsx')

df=df.dropna().reset_index(drop=True)

df = df.replace('connecting','connect', regex=True).replace('connection','connect',

regex=True).replace('classes','class', regex=True).replace('problems','problem',

regex=True).replace('meetings','meeting', regex=True).replace('working','work',

regex=True).replace('audios','audio', regex=True).replace('videos','video',

regex=True).replace('using','use', regex=True)

def tokenize(txt):

tokens=re.split('\W+', txt)

return tokens

df['Tokenized'] = df['Review'].apply(lambda x: tokenize(x))

stopwords_english = stopwords.words('english')

stop_words = ['good', 'worst', 'bad', 'please', 'use', 'even', 'like',

'ever', 'also', 'much', 'app', 'zoom', 't', 'hai', '1',

'star', 'get', 'nice', 'many', 'always', 'experience',

'hate', 'every', ',', '.', '', 'properly']+ list(stopwords_english)

def remove_stopwords(txt_tokenized):

txt_clean = [word for word in txt_tokenized if word not in stop_words]

return txt_clean

df['Stopword'] = df['Tokenized'].apply(lambda x: remove_stopwords(x))

df = df['Stopword']

from mlxtend.preprocessing import TransactionEncoder

from mlxtend.frequent_patterns import apriori

from mlxtend.frequent_patterns import association_rules

te = TransactionEncoder()

te_ary = te.fit(df).transform(df)

df1 = pd.DataFrame(te_ary, columns = te.columns_)

84

frequent_itemsets = apriori(df1, min_support = 0.004, use_colnames=True)

frequent_itemsets

res = association_rules(frequent_itemsets, metric='lift', min_threshold=1)

res

res1=res[['antecedents', 'consequents', 'support', 'confidence', 'lift']]

res1

res1.to_excel('AR Negatif.xlsx')