31
Sentiment Analysis- R- Twitter Oleh: Ike Kurniati M.Kom

Sentiment analysis

Embed Size (px)

Citation preview

Page 1: Sentiment analysis

Sentiment Analysis- R-Twitter

Oleh:IkeKurniati M.Kom

Page 2: Sentiment analysis

1.Kebutuhan Sentiment Analysis2.Text Mining untuk Sentiment Analysis3.Pengolahan kata Text Mining menggunakan Machine

Learning4.Studi Kasus Sentiment Analysis

Overview

Page 3: Sentiment analysis

Sentiment Analisis

Goals:Audiencememahami arti,kebutuhan,tujuan dan ruang lingkup dari SentimentAnalysis

Page 4: Sentiment analysis

SocialMedia

BerbagiInformasi

Opini Publik

PeranPengawasan

• Meningkatnya penggunaan social media di masyarakat, berdampakpada bertambahnya peranberbagi infromasi di ruangpublic, yang selanjutnyamenyebabkan berkembangnyaopini publik.

• Kemudian hal tersebutdimanfaatkan menggunakanmetoda tertentu untuk tujuanpengawasan terhadap suatuobjek.

Kebutuhan Sentiment Analysis

Page 5: Sentiment analysis

SentimenAnalisis adalah jenis natural language yaitu pengolahan kata untuk melacak mood masyarakat tentang

produk atau topik tertentu. Analisis sentimen, disebut opinion mining.

Definisi Sentiment Analysis

(G.Vinodhini, M.Chandrasekaran 2012)

Page 6: Sentiment analysis

Keyword

Text Mining

Visual

Text sebagai Objekyang di proses menggunakan MetodaText Mining danhasilnya dalamrepresentasi Visual.

Ruang Lingkup

Page 7: Sentiment analysis

MenemukanKata kunci

10Destinasi Wisata yangdiprioritaskanoleh Kemenpar

PilkadaDKI Jakarta

Jadwal Ganjil Genap

Pemilihan Key Word

Page 8: Sentiment analysis

Pemilihah Sumber data Untuk sentiment. Pemilihan harusberdasar pada kegunaansosmed.

•Adafasilitas Repostyangmemilikiistilah Reshared, jadi kita langsungbisa mengutip sebuah statusdariteman yangada pada circlekita.Ini mirip seperti Retweet diTwitter•-Atur statusStatus yangkita buatbisa diatur apakah itu tidak bolehdishare kembali atau tidak bolehdikomentari.

G+

•mediabisnis onlinemelalui jaringanpertemanan yangtelah dimiliki.

• -Upload gambar mudah,dan bisa dibuatalbumfoto.

• -Terdapataplikasichatyangmembuatpanggunayangsedangonlinebisachatdengantemannyayangsedangonlinejuga.

• -Pengguna bisa membuat/bergabungdengan groupkesukaan/hobi/bisnis/pertemanan yangmemungkinkan pembagian informasi lebihspesifik,mudah, dan tepat sasaran.

Facebook

•Menjangkau tidak hanya antara teman,tetapi komunikasi antara artis dengan fans-nya juga menjadi lebih mudah.

• -Komunikasi ditwitterterjadi sangat cepat.Sering terjadi berita-berita terupdate,seperti terjadinya suatu bencana misalnya,lebih dahulu didapatkan infonya melaluitwitter.

• -Terdapat fitur trendingtopicyangmemungkinkan kita untuk mengetahui apasaja yangsedang inatau happeningdibicarakan oleh parapengguna twitter.

• -Dapatmemasarkanproduksecarageratis.

Twitter

•Memperindah foto kita•bisa menshare video•memasarkan produk atauberjualan online

Instagram

•sharingapa saja yangkita mau,maupun itu lagu,curhatan, foto,tempat/lokasi kita berada.•Pathbersifat privasi,tidak sepertifacebook dan twitter•Pathmemiliki 8FreeFilter Lensesutk mempercantik foto/video

Path

http://suckrockers.blogspot.co.id/2013/12/sosial-media-beserta-kelebihan-dan.html

Pemilihan Sumber Data (Sosmed)

Page 9: Sentiment analysis

Text Mining untuk Sentiment Analysis

Goals:Audiencemengerti dan memahami apa yang

dimassud dengan tText Mining

Page 10: Sentiment analysis

Statistic

Artificial Intelligence

Pattern Recognition

Basis Data

Akar Ilmu

Page 11: Sentiment analysis

• Komputational• Visualisasi

Statistika

• MachineLearning

ArtificialIntelleigence

• Asosiasi• Sekuensial

PatternRecognition

• BasisData

BasisData

Definisi Text Mining

Text mining mengacu pada pencarian informasi, pertambangan data, mesin-learning, statistik, dan komputasi linguistic terhadap informasi yang disimpan sebagai teks(Bridge, C 2011).

Page 12: Sentiment analysis

Proses Text Mining

Data Teks Tokenisaisi

Sentimen Positif

Algoritma Machine Learning

Sentimen Negatif

End

Input Proses Output

Twitter data

Autentifikasi berdasarkan Token akun

Ekstrak berdasarkan

filter

Data Preparation

Visualisasi sentimen

analisis dalam Bentuk grafik

Page 13: Sentiment analysis

WEB Mining

•mengekstraksi katakunci yangterkandung pada dokumen web.Isidatawebantara laindapat berupateks,citra,audio,video,metadata,dan hyperlink.

WebContentMining

•struktur linkdari hyperlink•Membangun rangkuman websitedanhalaman web.•Salahsatu manfaatnya adlahuntuk menentukan pagerank padasuatu halaman web

WebStructureMining

•teknikuntukmengenaliperilakupelanggandanstrukturwebmelaluiinformasiyangdiperolehdarilog,clickstream,cookies,danquery

WebUsageMining

Page 14: Sentiment analysis

Pengolahan Text Miningmenggunakan Machine-Learning

Goals:Audiencemengetahui konsep Machine–Learning,Tugas,Carakerja dan AlgoritmaMachineLearning

Page 15: Sentiment analysis

Definisi “Machine Learning”

TomMitchel,1998

T:Task:Tugas;P:Performance:Nilaihasilkerja;E:Experience:Pengalaman

komputerdikatakanmelakukanlearning apabiladalammengerjakantugasT,hasilkerjanyaPsemakinbaik

denganbertambahnyapengalamanE

Page 16: Sentiment analysis

TugasSederhana Tugasrumit

Capaian yangdiinginkan Jelas Jelas

Uraian capaian Dapatdirinci Sulit dirinci

Cara mencapai Prosedurrumus

MemperkirakanCoba-coba

Sifatcapaian eksak Kira-kira

Cara dikomputer Pemrograman,algoritmakonvensional

Machinelearning

Tugas Sederhana & Tugas Rumit

Page 17: Sentiment analysis

Tugas Sederhana VS TugasRumit– Kelulusan Siswa

– Profit/Lost

– Suku Bunga Deposito

– Menentukan kadar gula dalam darah

– Prediksi harga saham

– Menentukan kalimat positif dannegatif

– Keindahan Gunung Bromo sangatmempesona

– Penduduk disekitar taman nasionalgunung bromo baik dan ramah

– Fasilitas dibukit pananjakan kurangmemadai

– Gunung Bromo banjir pengunjung

– Fasilitas ditempat itu tidak jelek

– Keindahan bukit mandalika selamaini tidak banyak yangtau

Page 18: Sentiment analysis

– Regresi

Input kontinyu/diskrit, output kontinyu, dengan targetspesifik

– Klasifikasi

Input kontinyu/diskrit, outputdiskrit, dengan target spesifik– Clustering

Input kontinyu/diskrit, outputdiskrit, dengan target terbuka

Jenis Tugas Machine-Learning

Page 19: Sentiment analysis

– Supervisedlearning

manusiamemberiseperangkatcontohhasilyangbenar,komputermenggunakancontohtersebutuntukmenemukanhasilbagidatamasukanlain

– Unsupervisedlearning

manusiatidakcampurtanganmemberikanjawabanyangbenar,komputerdibiarkanmenemukansendiripoladalamdatamasukan

– Reinforcedlearning

Mesinmencobalangkah-langkahdanmendapatumpanbalikpositifataunegatifpadasetiaplangkahtersebut

Jenis Cara Kerja Machine-Learning

Page 20: Sentiment analysis

– NaiveBayesian

Metodesederhanauntukklasifikasidenganjumlahdatasedikit,bertumpupadastatistikaprobabilitas

– SVM(Supportvectormachines)

klasifikasidengandatabesar&kompleksitastinggi,denganbanyakparametermasukan.Carakerjanyapersamaanjalurpemisahmatematisantarkelompokdata,denganmargingarispemisahsebesarmungkin

– Neuralnetwork

Klasifikasiuntukhalyangrumit

Algoritma Machine-Learning

Page 21: Sentiment analysis

R Package SentimentTimothy Jurka

Page 22: Sentiment analysis

R- Package Sentiment (classify)

R menyediakan library sentiment dalam R package yang dibuat oleh Timothy Jurka. Dalam package sentiment iniberfungsi dua fungsi yaitu classify_emotion danclassify_polarity.• classify_emotion. Fungsi ini membantumengklasifikasikan emotion kedalam beberapa klasifikasiyaitu: anger, fear, joy, sadness and supprise.

• classify_polarity. Mengkasifikasikan kedalam responpositive, negative dan neutral.

Page 23: Sentiment analysis

teknik analisis sentimen dapat diklasifikasikan ke dalam dua kategori:

• Lexicon based: Teknik ini bergantung pada kamus kata yangdijelaskan dengan orientasi, digambarkan sebagai polaritaspositive, negative dan netral. Metode ini memberikan hasil presisitinggi selama leksikon digunakan memiliki cakupan yang baik darikata-kata yang dihadapi dalam teks yang dianalisis.

• Learning Based: Teknik ini memerlukan pelatihan classifier dengancontoh polaritas dikenal disajikan sebagai teks diklasifikasikan kedalam kelas yang positif, negatif dan netral.

Teknik Analisis Sentiment

Page 24: Sentiment analysis

R- Package Sentiment

Classify_polarity.RClassify_emotion.RSubjectivity.csv.gzEmotion.csv.gz

Page 25: Sentiment analysis

Sentimen Analisis Menggunakan Text Mining Social Media Twitter sebagai

Controling Pasar Pariwisata Indonesia

Goals:Audienceturut berpartisipasi aktifdalamStudi Kasus

Page 26: Sentiment analysis

Identifikasi Masalah

MenentukanTopik Pilihan

MenentukanKeyords

MenentukanSumber datauntuk sentimen

Page 27: Sentiment analysis

TwitterNaïvebayes

Visualisasi

Data social media twitter dengan filter 10destinasi wisata yang akan diprioritaskanyaitu:

1. Danau Toba,2. Tanjung Kelayang,3. Kepulauan Seribu,4. Tanjung Lesung,5. Borobudur6. Tamana Nasional Bromo-Tengger-

Semeru,7. Mandalika,8. Wakataobi,9. Labuan Bajo dan10.Pulau Morotai.

Ruang Lingkup Studi Kasus

Page 28: Sentiment analysis

1. API2. Autentification3. Akuisisi Data4. Sentiment

Kebutuhan

Page 29: Sentiment analysis

MengapaDigunakan R ??

– R adalah bahasa pemrograman dan perangkat lunak untukanalisis statistikadan grafik

– Kode sumbernya tersedia secara bebas di bawah Lisensi PublikUmum GNU, dan versi biner prekompilasinya tersedia untuk berbagaisistemoperasi

– R menggunakan antarmuka baris perintah,

– R menyediakan berbagai teknik statistika (permodelan linier dannonlinier, uji statistik klasik, analisis deret waktu, klasifikasi,klasterisasi, dan sebagainya)

Tool

Page 30: Sentiment analysis

https://cran.r-project.org/web/packages/twitteR/twitteR.pdf

https://cran.r-project.org/web/packages/Rfacebook/Rfacebook.pdf

Reference Page

https://cran.r-project.org/web/packages/Rlinkedin/Rlinkedin.pdf

http://kbroman.org/pkg_primer/pages/build.html

Page 31: Sentiment analysis

SELESAI