36
Carrefour numérique n°4 Comment aborder l'ère du Big Data ? SESSION ANIMÉE PAR Benjamin Teitgen Marc Cervennansky Joël Rubino 25 e Forum de la communication publique et territoriale La Rochelle 10, 11 & 12 décembre

CapCom13: CN4: Comment aborder l'ère du Big Data ?

  • Upload
    capcom

  • View
    907

  • Download
    1

Embed Size (px)

DESCRIPTION

L'analyse des données massives, autrement appelée Big Data, commence à toucher les collectivités et les acteurs publics. Quelles sont les formes et les opportunités offertes par ce nouveau phénomène ? Deux témoignages permettront de comprendre ce que peut apporter concrètement le Big Data. On en soulignera également les limites : des voix s'élèvent pour faire valoir la protection des données personnelles, une vraie responsabilité pour les acteurs publics. Marc Cervennansky, Chef de projet numérique à la CU Bordeaux Benjamin Teitgen, Responsable de la communication digitale de la ville de Besançon Joël Rubino, Président ApiCube

Citation preview

Page 1: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Carrefour numérique n°4!

Comment aborder l'ère du Big Data ?!

SESSION  ANIMÉE  PAR  

–  Benjamin  Teitgen  –  Marc  Cervennansky  –  Joël  Rubino  

25e Forum de la communication publique et territoriale !La Rochelle 10, 11 & 12 décembre!

Page 2: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Agenda

Big Data ? Exemples d’usage

•  Etude 4G •  Incidents Trocadéro •  Empreinte Sociale Toulouse

Q&R

Page 3: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Big Data

«  La  Donnée  est  le  nouveau  Pétrole  »  

Clive  Humby,  2006  

Page 4: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Big Data: Les 3V

Le  Volume  est  l’un  des  éléments  clés  dans  la  définiPon  du  Big  Data,  et  il  est  sans  doute  le  moins  important  des  trois  éléments…  

La  Vitesse  évoque  la  rapidité  de  changement  des  données  et  la  rapidité  avec  laquelle  elle  doit  être  uPlisée  pour  créer  de  la  valeur.      

La  Variété  fait  référence  aux  différents  types  de  données  et  de  fichiers  uPlisés  pour  une  analyse  exhausPve.  Exemples:  Vidéo,  texte,  images,  données  géo-­‐localisées,…    

Volume Vitesse Variété

Page 5: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Big Data: pour quoi faire ?

Volume

350 Milliards de lectures compteurs par an

12 Terabytes de Tweets créés chaque jour

Vitesse

500 Millions d’appels téléphoniques enregistrés par jour

5 Millions de transactions par seconde

Variété

80% Croissance

Images, Vidéo, Documents

100 Millions De cameras vidéo dans le monde

Prévision de la consommation électrique

Analyse du sentiment sur un produit

Prévention des désabonnements

Identifier la fraude potentielle

Amélioration de la satisfaction client

Surveillance d’évènements

Page 6: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Un univers digital en expansion

INSI

GH

TS

ACT

ION

S

90% des données publiques créées depuis le début de l’humanité et accessibles légalement ont été créées ces 2 dernières années (Source IBM)

Explosion exponentielle de la quantité de données. Nous ne sommes qu’au début d’un phénomène d’ampleur. Focus sur la valeur pas sur la donnée

Depuis Adam et Eve jusqu’en 2011

2012 - 2013

90%  

Page 7: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Un univers digital en expansion

INSI

GH

TS

ACT

ION

S

75% des données actuellement disponibles sont générées par des humains (Source Cisco)

La multiplicité des objets connectés à internet va permettre de nouveaux usages Quels usages pour quel client / service dans un monde hyper connecté ?

Machines

Humains

75%  

Page 8: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Empreintes digitale Humaine

500  millions  d’uPlisateurs    400  Millions  de  tweets  par  jour  en  2012  

4  milliards  d’heures  de  vidéos  vues  et  commentées  ou  «  likées  »  chaque  mois  

1  milliard  d’uPlisateurs,    3,2  milliards  de  «  Like  »  chaque  jour  en  2012  

Page 9: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Toujours plus de données

BLACKSOCKS:      RFID  Chaussedes    CommunicaPon  entre  chaque  chaussede  et  l’applicaPon  ‘the  Sock  Sorter  sur    iPhone  .    Permet  un  appairage  facile  ainsi  que  la  commande  de  nouvelles  paires  chausedes.  

Page 10: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Toujours plus de données

VITALITY:      Pilulier  connecté    A  l’intérieur  du  couvercle,  une  puce  électronique    surveille  les  ouvertures  de  la  boite  à  pilules  et  envoi  un  signal  qui  sera  relayé  sur  votre  applicaPon  iphone  ou  celle  de  votre  infirmière  

Page 11: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Toujours plus de données

SCENETAP:      Grace  à  une  applicaPon  disponible  sur  smartphone,  Scenetap  vous  permet  de  savoir,  à  distance,    combien  de  personnes  sont  présentes,  le  raPo  hommes  /  femmes    et  l’âge  moyen.    

Page 12: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Toujours plus de données

GOOGLECAR    Voiture  sans  conducteur    «  Nous  analysons  et  prédisons  le  monde  20  fois  par  seconde  »    Levandowski,  Google  

 

Page 13: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Un univers digital en expansion

INSI

GH

TS

ACT

ION

S

Actuellement, moins de 1% des données actuellement disponibles dans le monde sont analysées (Source EMC)

Acquérir et stocker des données c’est bien utiliser ces données pour mieux connaître vos clients, prospects concurrents c’est mieux. Démarrez avec des questions pas avec des données

Données  analysées

Données non analysées

+99%  

Page 14: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Espaces de communication

INSI

GH

TS

Mai

tris

é

Espace maitrisé: Communication institutionnelle Marque -> clients

Site Corporate Publicité

Espace subi: Expression totalement libre et incontrôlée

Sites Concurrents Presse en ligne Forum de discussions Instagram Tripadvisor Twitter Facebook Google …

Subi

s

Espace semi-maitrisé: Modération du dialogue entre la marque et ses clients

Page Facebook Blog Corporate S.A.V. Compte Twitter Chaine Youtube …

Sem

i-M

aitr

isé

Page 15: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Sémantique et sentiments

…. « Hier soir, de passage par La Rochelle, j’ai diné à « La grande marche » avec mon épouse. Ce restaurant vaut le détour, mais la carte des vins n’est pas terrible »….

Homme  marié  qui  parle  

Opinion positive sur la marque Opinion négative sur le produit

Iden4fica4on  du  lieu  

Iden4fica4on  de  la  marque  «  La  grande  marche  »  

Iden4fica4on  du  temps  

Page 16: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Découvrir des usages

Kraft a désiré savoir comment son produit était utilisé, en dehors des traditionnels toasts, sans lancer une étude de marché de plusieurs mois. 1,5 milliards de blogs, forums et autres sites de discussions ont été analysés afin de mieux comprendre les usages réels Cette étude a permis ainsi de découvrir que le produit était en réalité utilisé avec du fromage, de la tomate, mais aussi des sushis … Une campagne a été lancée à partir de ces « insights » et donnant à la marque une nouvelle vie.

1,5 milliards de

sites analysés

Utilisation produit

Nouvelle campagne

Page 17: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Trocadero  

Page 18: CapCom13: CN4: Comment aborder l'ère du Big Data ?

18  

Surveillance  Twider  des  événements  Trocadéro  

AnPciper  des  débordements  liés  à  la  remise  du  trophée  des  champions  au  PSG.  

•  48h  avant  la  remise  du  trophée  –  Paramétrage  de  l’applicaPon  Livecatch  autour  d’un  champ  lexical  se  rapportant  à  l’événement.  –  Mot  clefs:  PSG,  Trophée,  Trocadéro,…  

•  ObservaPon  et  confirmaPon    –  DétecPon  immédiate  des  premiers  messages  laissant  présager  des  débordements  potenPels.  –  Les  mots  «  zbeul  »  (bordel)  et  «  TweetLoc  »  (RDV)  sont  détectés  et  rajoutés  dans  le  champ  

lexical  d’observaPon  

•  Pendant  l’événement  –  DétecPon  de  messages  et  de  photos  confirmant  les  troubles  et  l’idenPté  des  auteurs  (BouPque  

PSG,  BouPque  Abercrombie  &  Fitch,  Echafaudage  Trocadéro,…)  –  Analyse  et  cartographie  des  différents  écosystèmes  en  présence  (Lynx  vs  Ultra  vs  CRS)  

•  Après  l’événement  –  Remise  d’un  rapport  d’analyse  détaillé  des  événements  et  debrieffing    –  Surveillance  pro  acPve  du  match  PSG-­‐Brest  (semaine  suivante,    

dernier  match  au  Parc  des  Princes)  

Page 19: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Avant et pendant les débordements  

Page 20: CapCom13: CN4: Comment aborder l'ère du Big Data ?
Page 21: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Toulouse  Métropole:    +700  000  habitants,  37  communes,  460  km²  

Page 22: CapCom13: CN4: Comment aborder l'ère du Big Data ?

•  Stratégie:    –  Toulouse  Métropole  a  la  convicPon  que  les  Médias  Sociaux  

doivent  être  le  fer  de  lance  de  sa  stratégie  de  communicaPon.  

•  Problème:    –  Le  disposiPf  actuel  est  principalement  réacPf  sur  la  base  des  

besoins  entrants  et  d’un  radar  arPsanal  –  Difficulté  à  écouter  des  flux  d’informaPon  en  dehors  des  

médias  majeurs  –  IntervenPons  sur  requête  et  donc  pas  forcément  

représentaPves  des  besoins  du  plus  grand  nombre  –  PriorisaPon  des  contenus  éditoriaux  à  créer  et  améliorer  –  Difficulté  à  détecter  les  sujets  émergents  avant  qu’ils  ne  

deviennent  majeurs  –  Incapacité  à  prévenir  d’éventuelles  crises  

Toulouse  Métropole:    +700  000  habitants,  37  communes,  460  km²  

Page 23: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Smarter  Analysis:  Ecouter  les  Toulousains  pour  mieux  les  servir  

•  Les  équipes  d’Apicube  ont  développé  à  4tre  expérimental  un  modèle  de  données  qui  analyse  les  grandes  thémaPques  importantes  pour  la  ville,  comme  les  transports,  la  sécurité  ou  la  culture.  

•  Plus  d’1,6  millions  de  documents  ont  servi  de  base  à  la  1ère  analyse,  le  modèle  étant  maintenant  défini  et  opPmisé  il  pourrait  être  alimenté  en  conPnu  et  temps  réel,  au  fil  de  l’appariPon  de  nouvelles  données  et  servir  à  de  nouvelles  analyses.  

•  Un  rapport  comprenant  des  synthèses  qualitaPves  et  quanPtaPves  sur  chaque  grand  thème  a  été  transmis  à  la  DirecPon  de  la  CommunicaPon  afin  d’adapter  leurs  acPons  sur  la  base  de  ces  informaPons,  améliorant  ainsi  l’efficacité  globale  de  leur  travail  et  du  service  aux  citoyens.  

23  

Page 24: CapCom13: CN4: Comment aborder l'ère du Big Data ?

METHODOLOGIE DE L’ETUDE

OU

TILS

A

NA

LYSE

SMA (Social Media Analytics) traite un large volume de données issues du web. La technologie sémantique traite et analyse les conversations selon un modèle prédéterminé.

Ce modèle d’analyse a été paramétré afin de faire ressortir toutes les discussions autour de l’univers de la metropole Toulousaine en réduisant au maximum les conversations « polluantes »

AXE

S D

’ÉTU

DE L’étude analytique va croiser 3

dimensions: Types: Grandes Thématiques Concepts: Segmentation des thématiques principales (Bus, Metro, Tramway,…) Hotwords: Sujets transverses et non spécifiques à une des 4 marques (Ville, quartier, …)

Page 25: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Modèle analytique partiel de la ville de Toulouse

Page 26: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Ecouter pour mieux communiquer

Page 27: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Ecouter pour mieux communiquer

Page 28: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Ecouter pour mieux communiquer

Page 29: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Ecouter pour mieux communiquer

Page 30: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Pinterest

Page 31: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Avant / Après

Page 32: CapCom13: CN4: Comment aborder l'ère du Big Data ?

•  L‘affaire  Merah  a  maximisé  la  sensaPon  d’insécurité  •  Après  dépolluPon  du  modèle  on  retrouve  une  

sensaPon  d‘insécurité  comparable  aux  autres  grandes  métropoles  Française  et  en  deçà  de  métropoles  telles  que  Paris/Marseille/Lyon.  

•  En  bâPssant  le  modèle  de  données,  nous  avons  pu  constater  que  la  thémaPque  sécuritaire  est  écrasante  pour  les  Toulousains  qui  ressentent  la  ville  comme  peu  sûre.  (79.559  Documents,74%)  

–  Pour  Toulouse  Métropole,  ce  senPment  est  un  réel  enjeux  car  le  besoin  de  sécurité  est  fondamental  pour  la  populaPon.  L’insécurité  a  une  influence  l’économie,  la  créaPon  d’entreprise,  la  natalité,  le  dynamisme  culturel,  la  santé,  etc...  

–  En  analysant  les  informaPons  disponibles,  on  constate  une  prédominance  d’affaires  naPonales,  de  délinquance  ou  de  terrorisme,  qui  n’ont  pas  de  corrélaPon  directe  avec  Toulouse.  

–  Toulouse  acquiert  une  visibilité  mondiale  sur  le  sujet  et  un  matraquage  médiaPque  quoPdien  s’abat  sur  les  habitants  pendant  plusieurs  mois.    

Toulouse La sensation d’insécurité au centre des débats – 1/2

Page 33: CapCom13: CN4: Comment aborder l'ère du Big Data ?

•  En  géolocalisant  par  quarPer  les    expressions  des  Toulousains  –  Le  senPment  d’insécurité  est    

globalement  homogène  –  Les  quarPers  pourtant  généralement    

considérés  comme  «difficiles»,  ne  sont    pas  différents  

•  Analyse  par    «  Media  Set  »  spécifique    (c.a.d.  par  typologies  de  sources  d’informaPon)  –  La  PQR,  principal  média  local,  traite  énormément  la  thémaPque  sécuritaire,  venant  

indirectement  renforcer  la  percepPon  négaPve  de  la  populaPon.  

Toulouse La sensation d’insécurité au centre des débats – 1/2

Page 34: CapCom13: CN4: Comment aborder l'ère du Big Data ?

ElecPon  Municipale  Paris  2014  

Page 35: CapCom13: CN4: Comment aborder l'ère du Big Data ?

2014

Page 36: CapCom13: CN4: Comment aborder l'ère du Big Data ?

Joël  Rubino  CEO  Apicube    

Mail:    [email protected]  

 

Q  &  A