17
Analyse des programmes électoraux de la présidentielle 2012 avec le package « tm » François Guillem [email protected]

Campagne presidentielle

Embed Size (px)

Citation preview

Analyse des programmes électorauxde la présidentielle 2012 avec le package « tm »François [email protected]

Qui sont ces gens ???

• Je sais que la politique, c’est vachement important

• Mais en tant que statisticien freelance, je n’ai pas de temps à y consacrer !

Veille de marché

Autoformation

Réseautage

Peut-on utiliser des méthodes statistiques pour mieux comprendre le programme de chaque candidat ?

• J’ai scanné les programmes de chaque candidat

• Puis je les a converti en texte avec un logiciel d’OCR

• Enfin, je les ai importé dans R avec le package « tm »

• Code et données disponibles sur github

Démarche• On transforme chaque document en vecteur

numérique avec les fonctions du package tm

• On peut ensuite utiliser les méthodes descriptives classiques :

• Clustering hiérarchique ascendant

• Analyse en composante principale

Comment ces résultats varient si on ajoute les programmes du deuxième tour ?

Les données et le code sont disponibles sur github :https://github.com/cuche27/campagnePresidentielle

N’hésitez pas à cloner le projet, le partager et y contribuer !