Elecciones 20N en twitter

Elecciones 20N en Twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 1

ÍNDICE

Twitter en campañas electorales

Estado del arte de predicción electoral

Caso de estudio: elecciones 20N-2011

Conclusiones


Twitter en campañas electorales


Comunicación Sonda de opinión

Minería de datos Predicción

Estado del arte de predicción electoral

(Tumasjan, 2010) elecciones parlamento alemán 2009. Método contar menciones 1,65% MAE (Mean Absolute Error)

(Jungherr, 2011) del parlamento alemán 2009 (Conover D. , 2010) analizó las elecciones del US del 2010 (Gayo-Avello D. , 2011) analizó las elecciones de presidenciales de

US en 2008 (Tjong, 2012) elecciones al senado de Holanda 2011 (Skoric, 2012) elecciones de Singapur 2011 (Bermingham et al., 2011) elecciones generales irlandesas 2011 (Panagiotis, 2011) elecciones de US de 2010



Metodología

Twitter como canal de comunicación

Twitter como sonda de opinión

Twitter como red de conexiones

Twitter como fuente de predicción de resultados 6-Julio-2012 M. Luz Congosto / Pablo Aragón 5


Metodología– Dataset 1: Monitorizó los partidos nacionales desde el 08/10/11

hasta el 22/11/11 mediante el streaming API de Twittter desde la Universidad Carlos III obteniendo 2.973.110 tweets de 441.795 usuarios diferentes

– Dataset 2: Capturó los mensajes de los partidos que tienen representación parlamentaria, del 9-10-2011 al 24-11-2011 utilizando un proceso periódico de descarga del timeline de un conjunto de perfiles y el streaming API de Twitter desde la Fundació Barcelona Media, obteniendo 2.279.250 tweets de 442.014 usuarios diferentes


Twitter como canal de campañaCandidato vs. Partido


Rajoy

RubalcabaCayoLara

PSOE PP

UpyD Equo

Seguidores inicio campaña 20N (Dataset-1)


Acumulado de tweets campaña 20N (Dataset-1)

Actividad de las cuentas Twitter

Twitter como canal de campaña


Acumulado de nuevos seguidores campaña 20N (Dataset-1)

Adquisición de nuevos seguidores



Campaña 20N (Dataset-1)

Correlación nuevos seguidores / menciones únicas



Tweets por día de la campaña 20N (Dataset-1)

Participación de los ciudadanos



Valencia por día de la campaña 20N (Dataset-2)

Medida de emotividad (valencia)



Dominancia por día de la campaña 20N (Dataset-2)

Medida de emotividad (dominancia)



Mapa de menciones de sitios Web en la campaña 20N (Dataset-1)Imagen interactiva: http://barriblog.com/taller/javascript/protovis/sites_20N.html

Difusión de enlaces


Política.El País

El País

Público

El mundo

EuropaPress

ABC

http://barriblog.com/taller/javascript/protovis/sites_20N.html


Mapa de RTs de la campaña 20N (Dataset-2)

Comunidades de usuarios

Twitter como red de conexiones


Cómputo menciones campaña 20N (Dataset-1)

Menciones vs. Resultados

Twitter como fuente de predicción de resultados

Menciones totales (nombre + @usuario + #hashtag) MAE=1,66%


Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)

Polaridad política vs. Resultados


Usuarios en general MAE: 5,00%


Polaridad política vs. Resultados


Hombres (61,38%) MAE: 6,49% Mujeres (38,62%) MAE: 3,88%

Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)

Conclusiones

Con las medidas basadas en el cómputo de menciones se ha obtenido un buen resultado, no obstante:

Los resultados dependen de muchos factores como: el entorno socio-cultural de las elecciones, el periodo de la muestra, los eventos de campaña, la recogida de datos en Twitter, los partidos analizados y la forma de cómputo

La validación de este método para predicción requeriría sistematizar todos los pasos y comprobar si los resultados son similares para otras elecciones en diferentes entornos


Conclusiones

Con las medidas basadas en la polaridad política ha obtenido un peor resultado, habrá que tener en cuenta para mejorar los algoritmos de predicción: 1.Demografía: Los usuarios de Twitter son jóvenes y en un alto porcentaje con estudios superiores.

2.Opinión oculta: No todos los usuarios manifiestan sus preferencias políticas

3.Sobreopinión: En contraposición al punto anterior, los simpatizantes de algunos partidos opinan activamente

Sigue…


Conclusiones

Continúa: 4.Entidades vs. Personas: Es difícil distinguir en Twitter una entidad de una persona

5.Anonimato vs. “Identidad real”: Los usuarios con identidad real son más propensos a la opinión oculta

6.Hombres vs. Mujeres: Se ha detectado diferencia de comportamiento según género. Los hombres son más propensos a ocultar su opinión o a sobreopinar que las mujeres


Technology

Elecciones 20N en twitter