Upload
m-luz-congosto
View
3.394
Download
0
Embed Size (px)
DESCRIPTION
Análisis de las elecciones generales en España del 20 de noviembre de 2011
Citation preview
Elecciones 20N en Twitter
6-Julio-2012 M. Luz Congosto / Pablo Aragón 1
ÍNDICE
Twitter en campañas electorales
Estado del arte de predicción electoral
Caso de estudio: elecciones 20N-2011
Conclusiones
6-Julio-2012 M. Luz Congosto / Pablo Aragón 2
Twitter en campañas electorales
6-Julio-2012 M. Luz Congosto / Pablo Aragón 3
Comunicación Sonda de opinión
Minería de datos Predicción
Estado del arte de predicción electoral
(Tumasjan, 2010) elecciones parlamento alemán 2009. Método contar menciones 1,65% MAE (Mean Absolute Error)
(Jungherr, 2011) del parlamento alemán 2009 (Conover D. , 2010) analizó las elecciones del US del 2010 (Gayo-Avello D. , 2011) analizó las elecciones de presidenciales de
US en 2008 (Tjong, 2012) elecciones al senado de Holanda 2011 (Skoric, 2012) elecciones de Singapur 2011 (Bermingham et al., 2011) elecciones generales irlandesas 2011 (Panagiotis, 2011) elecciones de US de 2010
6-Julio-2012 M. Luz Congosto / Pablo Aragón 4
Caso de estudio: elecciones 20N-2011
Metodología
Twitter como canal de comunicación
Twitter como sonda de opinión
Twitter como red de conexiones
Twitter como fuente de predicción de resultados 6-Julio-2012 M. Luz Congosto / Pablo Aragón 5
Caso de estudio: elecciones 20N-2011
Metodología– Dataset 1: Monitorizó los partidos nacionales desde el 08/10/11
hasta el 22/11/11 mediante el streaming API de Twittter desde la Universidad Carlos III obteniendo 2.973.110 tweets de 441.795 usuarios diferentes
– Dataset 2: Capturó los mensajes de los partidos que tienen representación parlamentaria, del 9-10-2011 al 24-11-2011 utilizando un proceso periódico de descarga del timeline de un conjunto de perfiles y el streaming API de Twitter desde la Fundació Barcelona Media, obteniendo 2.279.250 tweets de 442.014 usuarios diferentes
6-Julio-2012 M. Luz Congosto / Pablo Aragón 6
Twitter como canal de campañaCandidato vs. Partido
6-Julio-2012 M. Luz Congosto / Pablo Aragón 7
Rajoy
RubalcabaCayoLara
PSOE PP
UpyD Equo
Seguidores inicio campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 8
Acumulado de tweets campaña 20N (Dataset-1)
Actividad de las cuentas Twitter
Twitter como canal de campaña
6-Julio-2012 M. Luz Congosto / Pablo Aragón 9
Acumulado de nuevos seguidores campaña 20N (Dataset-1)
Adquisición de nuevos seguidores
Twitter como canal de campaña
6-Julio-2012 M. Luz Congosto / Pablo Aragón 10
Campaña 20N (Dataset-1)
Correlación nuevos seguidores / menciones únicas
Twitter como canal de campaña
6-Julio-2012 M. Luz Congosto / Pablo Aragón 11
Tweets por día de la campaña 20N (Dataset-1)
Participación de los ciudadanos
Twitter como sonda de opinión
6-Julio-2012 M. Luz Congosto / Pablo Aragón 12
Valencia por día de la campaña 20N (Dataset-2)
Medida de emotividad (valencia)
Twitter como sonda de opinión
6-Julio-2012 M. Luz Congosto / Pablo Aragón 13
Dominancia por día de la campaña 20N (Dataset-2)
Medida de emotividad (dominancia)
Twitter como sonda de opinión
6-Julio-2012 M. Luz Congosto / Pablo Aragón 14
Mapa de menciones de sitios Web en la campaña 20N (Dataset-1)Imagen interactiva: http://barriblog.com/taller/javascript/protovis/sites_20N.html
Difusión de enlaces
Twitter como sonda de opinión
Política.El País
El País
Público
El mundo
EuropaPress
ABC
6-Julio-2012 M. Luz Congosto / Pablo Aragón 15
Mapa de RTs de la campaña 20N (Dataset-2)
Comunidades de usuarios
Twitter como red de conexiones
6-Julio-2012 M. Luz Congosto / Pablo Aragón 16
Cómputo menciones campaña 20N (Dataset-1)
Menciones vs. Resultados
Twitter como fuente de predicción de resultados
Menciones totales (nombre + @usuario + #hashtag) MAE=1,66%
6-Julio-2012 M. Luz Congosto / Pablo Aragón 17
Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)
Polaridad política vs. Resultados
Twitter como fuente de predicción de resultados
Usuarios en general MAE: 5,00%
6-Julio-2012 M. Luz Congosto / Pablo Aragón 18
Polaridad política vs. Resultados
Twitter como fuente de predicción de resultados
Hombres (61,38%) MAE: 6,49% Mujeres (38,62%) MAE: 3,88%
Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)
Conclusiones
Con las medidas basadas en el cómputo de menciones se ha obtenido un buen resultado, no obstante:
Los resultados dependen de muchos factores como: el entorno socio-cultural de las elecciones, el periodo de la muestra, los eventos de campaña, la recogida de datos en Twitter, los partidos analizados y la forma de cómputo
La validación de este método para predicción requeriría sistematizar todos los pasos y comprobar si los resultados son similares para otras elecciones en diferentes entornos
6-Julio-2012 M. Luz Congosto / Pablo Aragón 19
Conclusiones
Con las medidas basadas en la polaridad política ha obtenido un peor resultado, habrá que tener en cuenta para mejorar los algoritmos de predicción: 1.Demografía: Los usuarios de Twitter son jóvenes y en un alto porcentaje con estudios superiores.
2.Opinión oculta: No todos los usuarios manifiestan sus preferencias políticas
3.Sobreopinión: En contraposición al punto anterior, los simpatizantes de algunos partidos opinan activamente
Sigue…
6-Julio-2012 M. Luz Congosto / Pablo Aragón 20
Conclusiones
Continúa: 4.Entidades vs. Personas: Es difícil distinguir en Twitter una entidad de una persona
5.Anonimato vs. “Identidad real”: Los usuarios con identidad real son más propensos a la opinión oculta
6.Hombres vs. Mujeres: Se ha detectado diferencia de comportamiento según género. Los hombres son más propensos a ocultar su opinión o a sobreopinar que las mujeres
6-Julio-2012 M. Luz Congosto / Pablo Aragón 21