Upload
insurancemarketing
View
569
Download
1
Embed Size (px)
DESCRIPTION
Présentation du directeur de l'ESILV des vertus du big data sur la gestion du risque de fraude. Cette méthode permettant de trouver le pépin dans une multitude de données est transposable pour trouver la pépite dans une masse de données. Autrement dit, big data et fraude & big data et marketing ciblé sont comparables en termes de méthodes.
Citation preview
Big Data et Détection des Fraudes
Jean Rohmer
ESILV
Cherche l’Aiguille dans la Botte de Foin … … ou fabriquer la Botte de Foin Frauduleux ?
• Types d’informations: • Structurées
• Non Structurées
• Multicanal / Hétérogènes
• Types de traitements: • Statistiques
• Analytiques
• Manuels
• S’apparente aux activités de • Renseignement Militaire ou de Sûreté Nationale
• Détection des signaux faibles
statistiques analytiques humaines
str
uctu
rees
no
n s
tru
ctu
rées
mu
ltic
an
al
GOOGLE !!!
BI, DATA
MINING EXCEL !!!
TEXT & OPINION
MINING
FUSION
D’INFORMATIONS COURRIEL !!!
Des fraudes un peu partout
Clustering
non supervisé
Qui se ressemble s’assemble:
Fraudes roses, fraudes vertes …
Clustering
supervisé
Exemples de
Fraudes roses
(fournis par des
experts)
Apprentissage
automatique de
« l’équation fraude
rose »
Résultat de
l’application de
l’équation « fraude
rose » à analyser
par des experts
STATISTIQUES
ANALYTIQUE
Comprendre finement (via des experts) le contexte
et les articulations des fraudes roses
L’exprimer sous forme de graphe sémantique
Rechercher toutes les parties du graphe qui
correspondent
: Outil SVIVOT Contextor
1
2
3 Interpretation of Semantic Networks by:
•Ad Hoc Graphical representation
•Human Inference (training)
•Automatic Inference (rules)
•Graph Clustering (not illustrated here)
0
4
REFERENCES:
-- Une liste d’outils:
http://www.kdnuggets.com/solutions/fraud-detection.html
-- sur les signaux faibles :
http://www.res-systemica.org/afscet/resSystemica/Paris05/rohmer.pdf
-- IDELIANCE (Outil sémantique open source de l’ESILV)
-- Mon blog: http://plexus-logos-calx.blogspot.fr/