Upload
capcom
View
907
Download
1
Embed Size (px)
DESCRIPTION
L'analyse des données massives, autrement appelée Big Data, commence à toucher les collectivités et les acteurs publics. Quelles sont les formes et les opportunités offertes par ce nouveau phénomène ? Deux témoignages permettront de comprendre ce que peut apporter concrètement le Big Data. On en soulignera également les limites : des voix s'élèvent pour faire valoir la protection des données personnelles, une vraie responsabilité pour les acteurs publics. Marc Cervennansky, Chef de projet numérique à la CU Bordeaux Benjamin Teitgen, Responsable de la communication digitale de la ville de Besançon Joël Rubino, Président ApiCube
Citation preview
Carrefour numérique n°4!
Comment aborder l'ère du Big Data ?!
SESSION ANIMÉE PAR
– Benjamin Teitgen – Marc Cervennansky – Joël Rubino
25e Forum de la communication publique et territoriale !La Rochelle 10, 11 & 12 décembre!
Agenda
Big Data ? Exemples d’usage
• Etude 4G • Incidents Trocadéro • Empreinte Sociale Toulouse
Q&R
Big Data
« La Donnée est le nouveau Pétrole »
Clive Humby, 2006
Big Data: Les 3V
Le Volume est l’un des éléments clés dans la définiPon du Big Data, et il est sans doute le moins important des trois éléments…
La Vitesse évoque la rapidité de changement des données et la rapidité avec laquelle elle doit être uPlisée pour créer de la valeur.
La Variété fait référence aux différents types de données et de fichiers uPlisés pour une analyse exhausPve. Exemples: Vidéo, texte, images, données géo-‐localisées,…
Volume Vitesse Variété
Big Data: pour quoi faire ?
Volume
350 Milliards de lectures compteurs par an
12 Terabytes de Tweets créés chaque jour
Vitesse
500 Millions d’appels téléphoniques enregistrés par jour
5 Millions de transactions par seconde
Variété
80% Croissance
Images, Vidéo, Documents
100 Millions De cameras vidéo dans le monde
Prévision de la consommation électrique
Analyse du sentiment sur un produit
Prévention des désabonnements
Identifier la fraude potentielle
Amélioration de la satisfaction client
Surveillance d’évènements
Un univers digital en expansion
INSI
GH
TS
ACT
ION
S
90% des données publiques créées depuis le début de l’humanité et accessibles légalement ont été créées ces 2 dernières années (Source IBM)
Explosion exponentielle de la quantité de données. Nous ne sommes qu’au début d’un phénomène d’ampleur. Focus sur la valeur pas sur la donnée
Depuis Adam et Eve jusqu’en 2011
2012 - 2013
90%
Un univers digital en expansion
INSI
GH
TS
ACT
ION
S
75% des données actuellement disponibles sont générées par des humains (Source Cisco)
La multiplicité des objets connectés à internet va permettre de nouveaux usages Quels usages pour quel client / service dans un monde hyper connecté ?
Machines
Humains
75%
Empreintes digitale Humaine
500 millions d’uPlisateurs 400 Millions de tweets par jour en 2012
4 milliards d’heures de vidéos vues et commentées ou « likées » chaque mois
1 milliard d’uPlisateurs, 3,2 milliards de « Like » chaque jour en 2012
Toujours plus de données
BLACKSOCKS: RFID Chaussedes CommunicaPon entre chaque chaussede et l’applicaPon ‘the Sock Sorter sur iPhone . Permet un appairage facile ainsi que la commande de nouvelles paires chausedes.
Toujours plus de données
VITALITY: Pilulier connecté A l’intérieur du couvercle, une puce électronique surveille les ouvertures de la boite à pilules et envoi un signal qui sera relayé sur votre applicaPon iphone ou celle de votre infirmière
Toujours plus de données
SCENETAP: Grace à une applicaPon disponible sur smartphone, Scenetap vous permet de savoir, à distance, combien de personnes sont présentes, le raPo hommes / femmes et l’âge moyen.
Toujours plus de données
GOOGLECAR Voiture sans conducteur « Nous analysons et prédisons le monde 20 fois par seconde » Levandowski, Google
Un univers digital en expansion
INSI
GH
TS
ACT
ION
S
Actuellement, moins de 1% des données actuellement disponibles dans le monde sont analysées (Source EMC)
Acquérir et stocker des données c’est bien utiliser ces données pour mieux connaître vos clients, prospects concurrents c’est mieux. Démarrez avec des questions pas avec des données
Données analysées
Données non analysées
+99%
Espaces de communication
INSI
GH
TS
Mai
tris
é
Espace maitrisé: Communication institutionnelle Marque -> clients
Site Corporate Publicité
Espace subi: Expression totalement libre et incontrôlée
Sites Concurrents Presse en ligne Forum de discussions Instagram Tripadvisor Twitter Facebook Google …
Subi
s
Espace semi-maitrisé: Modération du dialogue entre la marque et ses clients
Page Facebook Blog Corporate S.A.V. Compte Twitter Chaine Youtube …
Sem
i-M
aitr
isé
Sémantique et sentiments
…. « Hier soir, de passage par La Rochelle, j’ai diné à « La grande marche » avec mon épouse. Ce restaurant vaut le détour, mais la carte des vins n’est pas terrible »….
Homme marié qui parle
Opinion positive sur la marque Opinion négative sur le produit
Iden4fica4on du lieu
Iden4fica4on de la marque « La grande marche »
Iden4fica4on du temps
Découvrir des usages
Kraft a désiré savoir comment son produit était utilisé, en dehors des traditionnels toasts, sans lancer une étude de marché de plusieurs mois. 1,5 milliards de blogs, forums et autres sites de discussions ont été analysés afin de mieux comprendre les usages réels Cette étude a permis ainsi de découvrir que le produit était en réalité utilisé avec du fromage, de la tomate, mais aussi des sushis … Une campagne a été lancée à partir de ces « insights » et donnant à la marque une nouvelle vie.
1,5 milliards de
sites analysés
Utilisation produit
Nouvelle campagne
Trocadero
18
Surveillance Twider des événements Trocadéro
AnPciper des débordements liés à la remise du trophée des champions au PSG.
• 48h avant la remise du trophée – Paramétrage de l’applicaPon Livecatch autour d’un champ lexical se rapportant à l’événement. – Mot clefs: PSG, Trophée, Trocadéro,…
• ObservaPon et confirmaPon – DétecPon immédiate des premiers messages laissant présager des débordements potenPels. – Les mots « zbeul » (bordel) et « TweetLoc » (RDV) sont détectés et rajoutés dans le champ
lexical d’observaPon
• Pendant l’événement – DétecPon de messages et de photos confirmant les troubles et l’idenPté des auteurs (BouPque
PSG, BouPque Abercrombie & Fitch, Echafaudage Trocadéro,…) – Analyse et cartographie des différents écosystèmes en présence (Lynx vs Ultra vs CRS)
• Après l’événement – Remise d’un rapport d’analyse détaillé des événements et debrieffing – Surveillance pro acPve du match PSG-‐Brest (semaine suivante,
dernier match au Parc des Princes)
Avant et pendant les débordements
Toulouse Métropole: +700 000 habitants, 37 communes, 460 km²
• Stratégie: – Toulouse Métropole a la convicPon que les Médias Sociaux
doivent être le fer de lance de sa stratégie de communicaPon.
• Problème: – Le disposiPf actuel est principalement réacPf sur la base des
besoins entrants et d’un radar arPsanal – Difficulté à écouter des flux d’informaPon en dehors des
médias majeurs – IntervenPons sur requête et donc pas forcément
représentaPves des besoins du plus grand nombre – PriorisaPon des contenus éditoriaux à créer et améliorer – Difficulté à détecter les sujets émergents avant qu’ils ne
deviennent majeurs – Incapacité à prévenir d’éventuelles crises
Toulouse Métropole: +700 000 habitants, 37 communes, 460 km²
Smarter Analysis: Ecouter les Toulousains pour mieux les servir
• Les équipes d’Apicube ont développé à 4tre expérimental un modèle de données qui analyse les grandes thémaPques importantes pour la ville, comme les transports, la sécurité ou la culture.
• Plus d’1,6 millions de documents ont servi de base à la 1ère analyse, le modèle étant maintenant défini et opPmisé il pourrait être alimenté en conPnu et temps réel, au fil de l’appariPon de nouvelles données et servir à de nouvelles analyses.
• Un rapport comprenant des synthèses qualitaPves et quanPtaPves sur chaque grand thème a été transmis à la DirecPon de la CommunicaPon afin d’adapter leurs acPons sur la base de ces informaPons, améliorant ainsi l’efficacité globale de leur travail et du service aux citoyens.
23
METHODOLOGIE DE L’ETUDE
OU
TILS
A
NA
LYSE
SMA (Social Media Analytics) traite un large volume de données issues du web. La technologie sémantique traite et analyse les conversations selon un modèle prédéterminé.
Ce modèle d’analyse a été paramétré afin de faire ressortir toutes les discussions autour de l’univers de la metropole Toulousaine en réduisant au maximum les conversations « polluantes »
AXE
S D
’ÉTU
DE L’étude analytique va croiser 3
dimensions: Types: Grandes Thématiques Concepts: Segmentation des thématiques principales (Bus, Metro, Tramway,…) Hotwords: Sujets transverses et non spécifiques à une des 4 marques (Ville, quartier, …)
Modèle analytique partiel de la ville de Toulouse
Ecouter pour mieux communiquer
Ecouter pour mieux communiquer
Ecouter pour mieux communiquer
Ecouter pour mieux communiquer
Avant / Après
• L‘affaire Merah a maximisé la sensaPon d’insécurité • Après dépolluPon du modèle on retrouve une
sensaPon d‘insécurité comparable aux autres grandes métropoles Française et en deçà de métropoles telles que Paris/Marseille/Lyon.
• En bâPssant le modèle de données, nous avons pu constater que la thémaPque sécuritaire est écrasante pour les Toulousains qui ressentent la ville comme peu sûre. (79.559 Documents,74%)
– Pour Toulouse Métropole, ce senPment est un réel enjeux car le besoin de sécurité est fondamental pour la populaPon. L’insécurité a une influence l’économie, la créaPon d’entreprise, la natalité, le dynamisme culturel, la santé, etc...
– En analysant les informaPons disponibles, on constate une prédominance d’affaires naPonales, de délinquance ou de terrorisme, qui n’ont pas de corrélaPon directe avec Toulouse.
– Toulouse acquiert une visibilité mondiale sur le sujet et un matraquage médiaPque quoPdien s’abat sur les habitants pendant plusieurs mois.
Toulouse La sensation d’insécurité au centre des débats – 1/2
• En géolocalisant par quarPer les expressions des Toulousains – Le senPment d’insécurité est
globalement homogène – Les quarPers pourtant généralement
considérés comme «difficiles», ne sont pas différents
• Analyse par « Media Set » spécifique (c.a.d. par typologies de sources d’informaPon) – La PQR, principal média local, traite énormément la thémaPque sécuritaire, venant
indirectement renforcer la percepPon négaPve de la populaPon.
Toulouse La sensation d’insécurité au centre des débats – 1/2
ElecPon Municipale Paris 2014
2014