39
Comment l’intelligence artificielle réinvente la fouille de texte Documation – Data Information Forum 2016 William Lesguillier – Product manager offre Valorisation des Contenus

Comment l’intelligence artificielle réinvente la fouille de texte

  • Upload
    antidot

  • View
    2.324

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Comment l’intelligence artificielle réinvente la fouille de texte

Comment l’intelligence artificielle réinvente la fouille de texte

Documation – Data Information Forum 2016William Lesguillier – Product manager offre Valorisation des Contenus

Page 2: Comment l’intelligence artificielle réinvente la fouille de texte

2

Antidot – Qui sommes-nous ?● Editeur de logiciels

● Moteurs de recherche| enrichissement des données● Depuis 1999 | Paris, Lyon, Aix-en-Provence● 47 collaborateurs, +150 clients

● Mission : délivrer à nos clients des solutions hautement configurables et innovantes qui créent de la valeur à partir de leurs données et augmentent leur performance opérationnelle

Page 3: Comment l’intelligence artificielle réinvente la fouille de texte

3

Parmi nos clients● Production de contenus

● Industrie

● E-Commerce

● Santé

Page 4: Comment l’intelligence artificielle réinvente la fouille de texte

4

Qu’est-ce que le Machine Learning●Définition : faculté donnée à

un ordinateur d’apprendre un comportement à partir d’exemples

●Discipline scientifique : l’Intelligence Artificielle (IA)●Mais fondée sur une approche probabiliste, par

opposition aux approches par règles

Page 5: Comment l’intelligence artificielle réinvente la fouille de texte

5

Re-re-renaissance de l’IA●Après une histoire mouvementée,

l’Intelligence Artificielle est de retour sur le devant de la scène

●Deux facteurs techniques principaux :●Le développement de la puissance de calcul●La disponibilités accrues des données

●Et surtout : des applications directes

Page 6: Comment l’intelligence artificielle réinvente la fouille de texte

6

L’événement qui change toutWilliam Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired this author’s most famous novel.

Page 7: Comment l’intelligence artificielle réinvente la fouille de texte

7

L’événement qui change tout●Puissance de calcul : 100 servers●Données disponibles : 200 millions de

pages

Page 8: Comment l’intelligence artificielle réinvente la fouille de texte

8

L’événement qui change tout

Page 9: Comment l’intelligence artificielle réinvente la fouille de texte

9

ML : illustrations des principesDire si un logement se trouve à New York ou San Francisco

Altitude des logements

Concept d’attribut

Crédit : http://www.r2d3.us

Page 10: Comment l’intelligence artificielle réinvente la fouille de texte

10

ML : illustrations des principesDire si un logement se trouve à New York ou San Francisco

Concept de modèle

d’entrainement

Page 11: Comment l’intelligence artificielle réinvente la fouille de texte

11Données d’entrainement

Données de test

ML : illustrations des principesDire si une maison se trouve à New York ou San Francisco

Concept de surentrainement

Page 12: Comment l’intelligence artificielle réinvente la fouille de texte

12

Qu’est-ce que le Deep Learning ?●Se base sur les algorithmes de réseaux de

neurones●Très adapté pour la reconnaissances de

signaux : analyse d’images photo ou vidéo, reconnaissance sonore, reconnaissance vocale…

●Avènement grâce à la puissance des GPU (Graphic Computing Units) très adaptés à ce type de calcul

Page 13: Comment l’intelligence artificielle réinvente la fouille de texte

13

Approche par couches d’attributs

Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm

Page 14: Comment l’intelligence artificielle réinvente la fouille de texte

14

Reconnaissance de texte

Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm

Page 15: Comment l’intelligence artificielle réinvente la fouille de texte

15

Détection de piétons

Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc

Page 16: Comment l’intelligence artificielle réinvente la fouille de texte

16

Approches combinées

+ =

Page 17: Comment l’intelligence artificielle réinvente la fouille de texte

17

Approches combinées

Page 18: Comment l’intelligence artificielle réinvente la fouille de texte

18

Machine Learning : pour quoi faire ?●Reconnaissance du

texte (y compris manuscrit) et de la voix

●Traduction automatique

●Text mining●Aide à la recherche

d’information

●Assistants personnels●Assistance au

diagnostic médical●Smart cities●Sécurité informatique●Voiture autonome●Robotique●…

Page 19: Comment l’intelligence artificielle réinvente la fouille de texte

19

Le Machine Learning chez Antidot

Enrich Access

SearchSemantic &

ComplexText mining Graph &

Linked Data

Page 20: Comment l’intelligence artificielle réinvente la fouille de texte

20

Classification automatique de texte

Droit de la familleDroit fiscalDroit pénal

Page 21: Comment l’intelligence artificielle réinvente la fouille de texte

21

Classification sur rechercheisidore.fr

Page 22: Comment l’intelligence artificielle réinvente la fouille de texte

22

Classification automatique

Page 23: Comment l’intelligence artificielle réinvente la fouille de texte

23

Classifier à partir d’un corpus catégorisé

Page 24: Comment l’intelligence artificielle réinvente la fouille de texte

24

Ou d’un corpus non catégorisé

Page 25: Comment l’intelligence artificielle réinvente la fouille de texte

25

Classification automatique

Page 26: Comment l’intelligence artificielle réinvente la fouille de texte

26

Atelier d’entrainement

Page 27: Comment l’intelligence artificielle réinvente la fouille de texte

27

Atelier d’entrainement

Page 28: Comment l’intelligence artificielle réinvente la fouille de texte

28

Atelier d’entrainement

Page 29: Comment l’intelligence artificielle réinvente la fouille de texte

29

Boucle d’amélioration continue

Page 30: Comment l’intelligence artificielle réinvente la fouille de texte

30

Page 31: Comment l’intelligence artificielle réinvente la fouille de texte

31

Mesurer la qualité des résultats

Page 32: Comment l’intelligence artificielle réinvente la fouille de texte

32

Mesurer la qualité des résultats

Page 33: Comment l’intelligence artificielle réinvente la fouille de texte

33

Précision inégalée

Page 34: Comment l’intelligence artificielle réinvente la fouille de texte

34

Extraction d’entités nommées

Page 35: Comment l’intelligence artificielle réinvente la fouille de texte

35

Extraction d’entités

Page 36: Comment l’intelligence artificielle réinvente la fouille de texte

36

Les avantages du ML pour le text mining

Page 37: Comment l’intelligence artificielle réinvente la fouille de texte

37

Nos autres rendez-vous Documation●Démonstration Content Classifier

●Speed Demo sur le stand de Sollan aujourd’hui de 12h30 à 12h45

●Conférence avec Spark Archives●Demain à 10h30

●Notre stand D23

Page 38: Comment l’intelligence artificielle réinvente la fouille de texte

38

Sources et ressources● Wikipedia : Histoire de l’intelligence artificielle● TEDx: Ken Jennings, « Watson, Jeopardy and me, the obsolete know-it-all »● TechRepublic :

IBM Watson: The inside story of how the Jeopardy-winning supercomputer was born, and what it wants to do next

● A visual introduction to machine learning● Wired : Google’s Artificial Brain Learns to Find Cat Videos● IBM : machine learning applications● Le Monde : série d’articles de Morgane Tual sur l’intelligence artificielle● Yann LeCun : leçon inaugurale au Collège de France● Yann LeCun, Marc'Aurelio Ranzato : Deep Learning tutorial● Olivier Ezratty : série de billets de blog sur l’IA● Tastehit.com : Google DeepMind's AlphaGo: How it works

Page 39: Comment l’intelligence artificielle réinvente la fouille de texte

Merci de votre attentionA vos questions !

@[email protected]