Upload
valentina-porcu
View
221
Download
2
Embed Size (px)
DESCRIPTION
Alcuni esempi e strumenti su come è possibile estrarre i commenti degli utenti per l'analisi di sentiment e la buzz analysis. Ulteriori informazioni sul sito www.semioanalysis.com
Citation preview
Sentiment Analysis:come estrarre dati e commenti degli
utenti da articoli e social network
Valentina Porcu [email protected]
Aggiornamento - 1 Ottobre 2014
L’estrazione dei commenti per:
• analizzare l’interesse intorno a un soggetto o a un marchio
• variazioni dell’interesse nel tempo (ad esempio in seguito a una notizia)
• opinione dei commentatori riguardo al brand/soggetto in esame
Per questo motivo si parla di
sentiment analysis cosa gli utenti pensano di un prodotto/servizio/candidato
buzz analysis monitorare l’interesse nei confronti di un brand
Creare una base dati di commenti degli utenti
1. l’intervallo di tempo da analizzare
2. le pagine dei social network o siti che contengono le conversazioni
3. estrarre i dati
Copiare i dati a mano?
É più veloce utilizzare le tecniche per
l’estrazione automatica di dati
o
web scraping
Se sapete programmare
Esistono vari strumenti e librerie su più linguaggi di programmazione:
Scrapy
Portia
Gemme di Ruby (Scrubit, Scrapi)
Librerie di Python (BeautifulSoup, Urllib2)
Quelle di PHP (Curl)
Se non sapete programmare
Gli strumenti automatici, ad esempio:
Mozenda
Heritrix
Import.io
FMiner
Outwit
Wire
Utilizzi: le lead lists
vengono utilizzati soprattutto per le cosiddette lead lists, delle liste di contatti comprensivi di email e telefoni
“confezionate” per i motivi più svariati, dalla creazione di mailing list alle analisi di benchmark o sui competitors
A noi, in questo caso, interessa estrarre i commenti degli utenti
esistono vari modi per gestire i commenti degli utenti dal punto di vista di un sito web
quindi non è automatico utilizzare sempre lo stesso strumento
Ad esempio, Outwit, anche in versione gratuita, può essere utilizzato per i siti che gestiscono i commenti sulla normale pagina html
Oppure Import.io può essere utilizzato in modalità crawler o extractor per estrarre i commenti ai prodotti di Amazon
Per estrarre le conversazioni dalle pagine pubbliche di Facebook, ad esempio, possiamo usare Datatool
O, infine, potete utilizzare il Comment Extractor per estrarre i commenti dagli articoli con Disqus, da Amazon, dalle pagine pubbliche di Facebook, da IMDB o da
Youtube
copiando il link che vi interessa
e incollandolo nel Comment Extractor
I file di output sono solitamente in formato xls, csv o json, quasi tutti gestibili con excel
Oltre ai commenti sui siti uno degli strumenti più importanti per la sentiment:
…è senza dubbio
Cosa analizzare su Twitter
Testi
Numero di retweet
Numero di preferiti
Risposte
Gli strumenti per estrarre i dati da Twitter
Sono per la maggior parte a pagamento, e forniscono delle prime analisi dati
Qualche esempio:
Datasift
Tweetarchivist
Oppure…per raccogliere i dati (senza analisi) si può usare
Twitter Scraper
Scopri come utilizzare Comment Extractor e Twitter Scraper
http://www.semioanalysis.com/downloads/
…puoi anche scaricare le demo dei software
Se l’argomento ti interessa puoi trovarmi qui
www.semioanalysis.com
Grazie!
Valentina