Transcript
Page 1: Jean Rohmer Big data & risque de fraude

Big Data et Détection des Fraudes

Jean Rohmer

ESILV

Page 2: Jean Rohmer Big data & risque de fraude

Cherche l’Aiguille dans la Botte de Foin … … ou fabriquer la Botte de Foin Frauduleux ?

• Types d’informations: • Structurées

• Non Structurées

• Multicanal / Hétérogènes

• Types de traitements: • Statistiques

• Analytiques

• Manuels

• S’apparente aux activités de • Renseignement Militaire ou de Sûreté Nationale

• Détection des signaux faibles

Page 3: Jean Rohmer Big data & risque de fraude

statistiques analytiques humaines

str

uctu

rees

no

n s

tru

ctu

rées

mu

ltic

an

al

GOOGLE !!!

BI, DATA

MINING EXCEL !!!

TEXT & OPINION

MINING

FUSION

D’INFORMATIONS COURRIEL !!!

Page 4: Jean Rohmer Big data & risque de fraude

Des fraudes un peu partout

Clustering

non supervisé

Qui se ressemble s’assemble:

Fraudes roses, fraudes vertes …

Clustering

supervisé

Exemples de

Fraudes roses

(fournis par des

experts)

Apprentissage

automatique de

« l’équation fraude

rose »

Résultat de

l’application de

l’équation « fraude

rose » à analyser

par des experts

STATISTIQUES

Page 5: Jean Rohmer Big data & risque de fraude

ANALYTIQUE

Comprendre finement (via des experts) le contexte

et les articulations des fraudes roses

L’exprimer sous forme de graphe sémantique

Rechercher toutes les parties du graphe qui

correspondent

: Outil SVIVOT Contextor

Page 6: Jean Rohmer Big data & risque de fraude

1

2

3 Interpretation of Semantic Networks by:

•Ad Hoc Graphical representation

•Human Inference (training)

•Automatic Inference (rules)

•Graph Clustering (not illustrated here)

0

4

Page 7: Jean Rohmer Big data & risque de fraude
Page 8: Jean Rohmer Big data & risque de fraude

Recommended