9
Big Data et Détection des Fraudes Jean Rohmer ESILV

Jean Rohmer Big data & risque de fraude

Embed Size (px)

DESCRIPTION

Présentation du directeur de l'ESILV des vertus du big data sur la gestion du risque de fraude. Cette méthode permettant de trouver le pépin dans une multitude de données est transposable pour trouver la pépite dans une masse de données. Autrement dit, big data et fraude & big data et marketing ciblé sont comparables en termes de méthodes.

Citation preview

Page 1: Jean Rohmer Big data & risque de fraude

Big Data et Détection des Fraudes

Jean Rohmer

ESILV

Page 2: Jean Rohmer Big data & risque de fraude

Cherche l’Aiguille dans la Botte de Foin … … ou fabriquer la Botte de Foin Frauduleux ?

• Types d’informations: • Structurées

• Non Structurées

• Multicanal / Hétérogènes

• Types de traitements: • Statistiques

• Analytiques

• Manuels

• S’apparente aux activités de • Renseignement Militaire ou de Sûreté Nationale

• Détection des signaux faibles

Page 3: Jean Rohmer Big data & risque de fraude

statistiques analytiques humaines

str

uctu

rees

no

n s

tru

ctu

rées

mu

ltic

an

al

GOOGLE !!!

BI, DATA

MINING EXCEL !!!

TEXT & OPINION

MINING

FUSION

D’INFORMATIONS COURRIEL !!!

Page 4: Jean Rohmer Big data & risque de fraude

Des fraudes un peu partout

Clustering

non supervisé

Qui se ressemble s’assemble:

Fraudes roses, fraudes vertes …

Clustering

supervisé

Exemples de

Fraudes roses

(fournis par des

experts)

Apprentissage

automatique de

« l’équation fraude

rose »

Résultat de

l’application de

l’équation « fraude

rose » à analyser

par des experts

STATISTIQUES

Page 5: Jean Rohmer Big data & risque de fraude

ANALYTIQUE

Comprendre finement (via des experts) le contexte

et les articulations des fraudes roses

L’exprimer sous forme de graphe sémantique

Rechercher toutes les parties du graphe qui

correspondent

: Outil SVIVOT Contextor

Page 6: Jean Rohmer Big data & risque de fraude

1

2

3 Interpretation of Semantic Networks by:

•Ad Hoc Graphical representation

•Human Inference (training)

•Automatic Inference (rules)

•Graph Clustering (not illustrated here)

0

4

Page 7: Jean Rohmer Big data & risque de fraude
Page 8: Jean Rohmer Big data & risque de fraude