Upload
ashraf-grioute
View
698
Download
1
Embed Size (px)
Citation preview
1
Offre « Data Science »
Fournir les moyens de valoriser les données de l’entreprise
2
1. Présentation EXL Group
2. Le Big Data en bref
3. Quelques projets Big Data
4. Notre vision Data Science
5. Notre offre
6. Nos références
EXL GROUP - Tout droits réservés
3
Présentation EXL Group
1.1 EXL Group : un groupe aux expertises multiples
300collaborateurs
5 agences régionales
Un multi-spécialiste du système d’Informations, créé en 2008
(M€)
2011
13,5
2012
21
2013
28
34
2014
150Comptes actifs
EXL GROUP - Tout droits réservés
4
Le Big Data en bref
2.1 De nouveaux moyens pour valoriser vos données
Des données internes/externes, structurée/non structurées
Variété
Volume
Vitesse
Une offre logicielle vaste et innovante, Open source/acteurs BI historiques
De nouveaux besoins métier
EXL GROUP - Tout droits réservés
5
Le Big Data en bref
2.2 Une évolution apportée sur 3 axes majeurs
Données : Enrichissement des données exploitées
Stockage : Optimisation des processus et traitements existants, réduction des coûts
Analyse : Fiabilisation et amélioration des indicateurs calculés et des modèles développés
Structurées et homogènes Sources internes Volumétrie contrôlée
Non structurées et hétérogènes Sources externes Volumétrie scalable
BI Classique Big Data
Entrepôt de données (Datawarehouse) Serveurs physiques internes Modélisation en étoile ou en flocon
Statistiques descriptives Requêtage par ligne/individu Algorithmes prédictifs développés par
des « Data Analyst »
Distribué sur un cluster Hadoop (HDFS) Cloud computing Traitement parallèle : MapReduce
Statistiques inférentielles Requêtage par colonne/objet Nouveaux algorithmes développés par des
« Data Scientist »
EXL GROUP - Tout droits réservés
6
Le Big Data en bref
2.3 Traiter diverses problématiques à travers la Data Science
Marketing Contrôle DSI
Energie
Données de compteurs nouvelle génération et facteurs climatiques
pour prédire les consommations en temps réel
Données de réseaux sociaux afin de prévoir les pics de
consommation évènementiels
Bénéficier du calcul distribué pour optimiser les temps de traitement
TransportsDonnées de capteurs, bornes Wifi et traces GSM pour une meilleure
connaissance du trafic
Données vidéo pour la lutte contre la fraude
Réduire les coûts en stockant sur une même plateforme tous types
de données
Banques & Assurances
Un meilleur profiling des clients : fidélisation et rétention via
l’analyse des retours clients (sms, mails, forums, …)
Analyser les comportement clientssur le net afin d’identifier les
risques de Fraude, découverts, …
Requêter et traiter rapidement des volumes importants de données
transactionnelles
Télécom
Données des réseaux sociauxpour proposer aux clients de
nouvelles offres optimales : one to one marketing
Analyser et mettre à jour les données CRM en temps réel
Ces exemples ne représentent pas une liste exhaustive. L’imagination est le plus
grand incubateur de projets Big Data !!
EXL GROUP - Tout droits réservés
7
Quelques projets Big Data
3.1 BANQUE ASSURANCE : Crédit Mutuel ARKEA
• Lutte anti-blanchiment : 6 mois d'historique traité en moins de 20 secondes
• Ratios de solvabilité : le traitement prenait 48 Heures sur un échantillon de clients
Résultat sur toute la base, en moins de 15 minutes
• Analyse des zones de saisie libre dans les formulaires
• Prospection ciblée : l’analyse des logs, parcours web … croisée avec la détention
Assurer la promotion des produits / services vers les bons prospects
• Banque de détail : usuellement l'historique des comptes était de 3 à 5 mois
Historique pour tous les clients depuis mai 2001 (des milliards de données)
EXL GROUP - Tout droits réservés
8
Quelques projets Big Data
3.2 TRANSPORT et LOGISTIQUE : Port d’Hambourg
• Des ponts mobiles adaptés au trafic : l’ouverture des ponts dépendait d’un
calendrier fixe inadapté au trafic réel
Ouverture uniquement lorsque les navires passent
• Identification des défauts ou des pannes : la réparation rapide ou même
préventive permet d’éviter le ralentissement de l'activité
• Police et douane : le poids des charges prévu comparé au réel permet de
détecter le transport de marchandises illégales
• Service aux utilisateurs : les données de localisation permettent d’informer les
utilisateurs des retards, des espaces de stationnement disponibles …
EXL GROUP - Tout droits réservés
9
Quelques projets Big Data
3.3 Ils ont également fait appel au Big Data
• Energie : Les compteurs Linky
Des compteurs nouvelle génération avec des relevés de consommation
réelle transmis toutes les 15 minutes
Des courbes de charge actualisées en quasi-temps réel
Optimisation des coûts et des volumes achetés par rapport au consommé
• Loisirs et Multimédia :
La plateforme de vidéos en continu « Netflix » a développé un algorithme
prédictif pour suggérer aux utilisateurs des films et séries adaptées
Lors de la coupe du monde 2014, l’équipe nationale d’Allemagne a placé
des capteurs sur ses joueurs afin d’optimiser leur entraînement
EXL GROUP - Tout droits réservés
10
Notre vision Data Science4.1 Enrichir le patrimoine de données existant
Exploiter de nouveaux types de données internes/externes, structurées/non structurées
Réseaux sociaux
Média
Objets / capteurs connectés
Mails
Pages Web
Opendata
Pourquoi ?
•Contrôler les données en
téléchargement libre
•Maîtriser la communication
externe à l’entreprise
•Améliorer les indicateurs et
modèles existants : scoring,
détection de fraude, …
•Optimiser ses offres : one-to-
one marketing, profiling
temps réel, …
Comment ?
• Identifier et contractualiser :
Réseaux sociaux, start-up,
data brokers, opérateurs
mobiles …
•Qualifier : statistiques
descriptives ou inférentielles,
corrélations, valeurs
aberrantes, panels, …
• Stocker : identifier scénarios
pour un stockage industriel
(Hadoop, serveur classique,
Cloud, …)
EXL GROUP - Tout droits réservés
11
Notre vision Data Science4.2 Scalabilité et temps réel
Bénéficier de la force d’une architecture Big Data, via sa capacité à allier le stockage physiqueparallèle des données à leur traitement parallèle en mémoire
Pourquoi ?
• Etre indépendant du volume
et de la structure des
données
•Calculer des indicateurs en
temps réel
•Réduire les temps de
requêtes et de traitement de
données volumineuses :
transactions fines, historique
important …
•Mutualiser les coûts de
stockage et d’exploitation
Comment ?
• Identifier l’apport du
MapReduce : algorithmes et
traitements à paralléliser
•Définir les fréquences
souhaitées et réalisables de
rafraîchissement des
indicateurs
• Lister des applications
pouvant être mutualisées
Cluster Hadoop
EXL GROUP - Tout droits réservés
12
Notre vision Data Science4.3 De nouveaux moyens pour explorer et analyser la donnée
Une offre logicielle Open source ou fournie par les éditeurs historiques, pour développer depuissants algorithmes
Pourquoi ?
•Algorithmes classiques Data
mining : Adaptation et
optimisation
•Machine learning : des
algorithmes puissants
adaptés au calcul distribué
•Nouveaux algorithmes : pour
de nouveaux types de
données
Comment ?
•Classification descriptive :
ACP, ACM, ACF, CAH, K-
means, Kohonen, …
• Prévision : ARIMA, lissage
exponentiel, régression
logistique et linéaire
•Machine learning : réseaux de
neurone (perceptron),
Bootstrap, algorithmes
génétiques, …
•Optimisation combinatoire,
théorie des graphes
•Analyse de sentiments (SNA),
web analytics, texte mining,
taxonomie automatisée, …
EXL GROUP - Tout droits réservés
13
Notre vision Data Science4.4 Une approche innovante orientée métier
Au travers de son offre Data Science, EXL GROUP vous accompagne dans
l’exploitation et la valorisation de vos données via le déploiement de projets Big Data
d’un point de vue métier :
Le Big Data ne se restreint pas à l’exploitation de gros volumes de données ou
à une plateforme Hadoop
Identifier des traitements et modèles à optimiser grâce au Big Data
Faire évoluer des projets existants en projets Big Data
Mettre en place de nouveaux algorithmes efficaces, exploitables en mode
industriel
Mettre à disposition des profils alliant des compétences en : mathématiques
appliquées, programmation et technologies Hadoop
EXL GROUP - Tout droits réservés
14
Notre offre
5.1 Des connaissances mathématiques associées à une expertise technique
R, SAS, SPSS, Python
MapReduce
Java, C++, …
Algorithmique Programmation
EXL group vous accompagne lors de vos projets Big Data avec des équipes de
« Data Scientists » alliant l’expertise technique aux connaissances
mathématiques, dans un écosystème Hadoop
Classification, Prévision, Machine
learning, Optimisation combinatoire,
Théorie des graphes, Analyse de
sentiments, Web analytics, Taxonomie
automatisée, Analyse sémantique, Text
mining, …
Hadoop
Statistiques : Spark, Mahout, RHadoop
Requêteurs : Hive, Impala, Pig, Sqoop
Bases NoSQL : HBase, Cassandra,MongoDB, Oracle NoSQL, …
EXL GROUP - Tout droits réservés
15
Notre offre
5.2 Une démarche projet en mode itératif
Initier une démarche Big Data
Assistance à la mise en œuvre
Déploiement et formation
• Disposez-vous de données
suffisantes pour couvrir tout
votre périmètre d’analyse ?
• Quels sont les processus et
modèles existants
susceptibles d’être optimisés
?
• Quelles sont les applications
pouvant être mutualisées
grâce à une infrastructure
Big Data ?
• Quelles données pour
enrichir votre patrimoine et
comment les récolter ?
• Comment exploiter, qualifier
et maîtriser ses données ?
• Quelle est la meilleure
solution pour explorer et
restituer les résultats ?
• Comment industrialiser la
récolte de données ?
• Quels algorithmes peuvent
être déployés ?
• Quels utilisateurs à former et
sur quel périmètre ?
EXL GROUP vous accompagne pour valoriser vos données, identifier de nouvelles sources et lesexploiter via la mise en place d’algorithmes performants dans une démarche itérative :
EXL GROUP - Tout droits réservés
Pilotage de projet
16
Notre offre
5.3 Initier une démarche Big Data
Initier une démarcheAssistance à la mise
en œuvre
Déploiement et formation
• Identification du potentiel Big Data dans l’entreprise
•Cadrage d’un projet BigData identifié
De 1 à 5 ateliers, selon le
niveau de maturité du
besoin, avec les thèmes :
•Prise de contexte et
présentation Data Science
•Processus métier
•Architecture SI
•Datamining
• Focus sur un ou plusieurs
projets
•Compte-rendu des différents ateliers
•Note de cadrage
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
17
Notre offre
5.4 Assistance à la mise en œuvre
Initier une démarcheAssistance à la mise
en œuvre
Déploiement et formation
•Collecte et qualification de nouvelles sources
•Réalisation de POC
•Préparation de Hackathon
•Benchmark de solutions
•Benchmark de modèles
Collecte :
•Contractualisation de
fournisseurs
•Définition de la solution
• Suivi et qualification des
résultats : statistiques,
restitutions, …
POC et Hackathon :
•Définition du périmètre et de
jeux de données anonymisés
•Comparaison des résultats
Benchmarks :
•Modélisation
•Programmation sous R, SAS, …
•Rapports : potentiel des données, comparaison avec l’existant, …
•Datavisualisation
•Spécifications fonctionnelles
•Programmes développés
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
18
Notre offre
5.5 Déploiement, formation et pilotage
Initier une démarcheAssistance à la mise
en œuvre
Déploiement et formation
• Industrialisation de la
collecte de données
• Industrialisation
d’algorithmes prédictifs
•Conduite du changement
• Formation des utilisateurs
•Assistance des directions
métiers et SI dans le suivi
et la gouvernance
•Développement et sélection d’algorithme
•Cadrage de la solution industrielle
•Définition de la stratégie de déploiement
•Assurer l’autonomie des utilisateurs
•Documentation des modèles
•Cahier des charges
•Stratégie et plan de formation
•Supports de formation
•Supports et compte-rendu d’instances projet
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
19
Nos références
6.1 Nos références Data Science
CAP’TN : Qualification, restitution et industrialisation de la récolte de données issues de capteurs
innovants et d’objets connectés.
COMOB : Accompagnement AMOA pour la récolte de données et la définition d’une solution
industrielle cible sur un cluster Hadoop (Distribution Hortonworks), dans le cadre de la mise en place
d’un outil de data visualisation et pilotage temps-réel.
POC : Accompagnement de la DSI de l’infrastructure pour le POC d’un projet Big Data en
partenariat avec la direction de l’innovation (stockage et traitement de photographies des voies aucentimètre près prises par un train à chaque passage – solution MAP-R).
Portail Culture Versailles : projet de recherche fédérée parmi 1 million de fiches provenant de SI
différents (Bibliothèque, Musée, Archives et site portail)http://versailles.demo4u.net
ONISEP : Assistance à maitrise d’ouvrage pour un projet de création d’un entrepôt de données
sémantique (Web Sémantique)
PRESSTALIS : Réalisation d’une base de connaissance
EXL GROUP : Réalisation d’un Wiki avec une recherche instantanée
Open Data : Conception d’une application d’exposition de la donnée en open data
EXL GROUP - Tout droits réservés