Comment l’intelligence artificielle réinvente la fouille de texte

  • View
    2.324

  • Download
    2

  • Category

    Internet

Preview:

Citation preview

Comment l’intelligence artificielle réinvente la fouille de texte

Documation – Data Information Forum 2016William Lesguillier – Product manager offre Valorisation des Contenus

2

Antidot – Qui sommes-nous ?● Editeur de logiciels

● Moteurs de recherche| enrichissement des données● Depuis 1999 | Paris, Lyon, Aix-en-Provence● 47 collaborateurs, +150 clients

● Mission : délivrer à nos clients des solutions hautement configurables et innovantes qui créent de la valeur à partir de leurs données et augmentent leur performance opérationnelle

3

Parmi nos clients● Production de contenus

● Industrie

● E-Commerce

● Santé

4

Qu’est-ce que le Machine Learning●Définition : faculté donnée à

un ordinateur d’apprendre un comportement à partir d’exemples

●Discipline scientifique : l’Intelligence Artificielle (IA)●Mais fondée sur une approche probabiliste, par

opposition aux approches par règles

5

Re-re-renaissance de l’IA●Après une histoire mouvementée,

l’Intelligence Artificielle est de retour sur le devant de la scène

●Deux facteurs techniques principaux :●Le développement de la puissance de calcul●La disponibilités accrues des données

●Et surtout : des applications directes

6

L’événement qui change toutWilliam Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired this author’s most famous novel.

7

L’événement qui change tout●Puissance de calcul : 100 servers●Données disponibles : 200 millions de

pages

8

L’événement qui change tout

9

ML : illustrations des principesDire si un logement se trouve à New York ou San Francisco

Altitude des logements

Concept d’attribut

Crédit : http://www.r2d3.us

10

ML : illustrations des principesDire si un logement se trouve à New York ou San Francisco

Concept de modèle

d’entrainement

11Données d’entrainement

Données de test

ML : illustrations des principesDire si une maison se trouve à New York ou San Francisco

Concept de surentrainement

12

Qu’est-ce que le Deep Learning ?●Se base sur les algorithmes de réseaux de

neurones●Très adapté pour la reconnaissances de

signaux : analyse d’images photo ou vidéo, reconnaissance sonore, reconnaissance vocale…

●Avènement grâce à la puissance des GPU (Graphic Computing Units) très adaptés à ce type de calcul

13

Approche par couches d’attributs

Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm

14

Reconnaissance de texte

Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm

15

Détection de piétons

Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc

16

Approches combinées

+ =

17

Approches combinées

18

Machine Learning : pour quoi faire ?●Reconnaissance du

texte (y compris manuscrit) et de la voix

●Traduction automatique

●Text mining●Aide à la recherche

d’information

●Assistants personnels●Assistance au

diagnostic médical●Smart cities●Sécurité informatique●Voiture autonome●Robotique●…

19

Le Machine Learning chez Antidot

Enrich Access

SearchSemantic &

ComplexText mining Graph &

Linked Data

20

Classification automatique de texte

Droit de la familleDroit fiscalDroit pénal

21

Classification sur rechercheisidore.fr

22

Classification automatique

23

Classifier à partir d’un corpus catégorisé

24

Ou d’un corpus non catégorisé

25

Classification automatique

26

Atelier d’entrainement

27

Atelier d’entrainement

28

Atelier d’entrainement

29

Boucle d’amélioration continue

30

31

Mesurer la qualité des résultats

32

Mesurer la qualité des résultats

33

Précision inégalée

34

Extraction d’entités nommées

35

Extraction d’entités

36

Les avantages du ML pour le text mining

37

Nos autres rendez-vous Documation●Démonstration Content Classifier

●Speed Demo sur le stand de Sollan aujourd’hui de 12h30 à 12h45

●Conférence avec Spark Archives●Demain à 10h30

●Notre stand D23

38

Sources et ressources● Wikipedia : Histoire de l’intelligence artificielle● TEDx: Ken Jennings, « Watson, Jeopardy and me, the obsolete know-it-all »● TechRepublic :

IBM Watson: The inside story of how the Jeopardy-winning supercomputer was born, and what it wants to do next

● A visual introduction to machine learning● Wired : Google’s Artificial Brain Learns to Find Cat Videos● IBM : machine learning applications● Le Monde : série d’articles de Morgane Tual sur l’intelligence artificielle● Yann LeCun : leçon inaugurale au Collège de France● Yann LeCun, Marc'Aurelio Ranzato : Deep Learning tutorial● Olivier Ezratty : série de billets de blog sur l’IA● Tastehit.com : Google DeepMind's AlphaGo: How it works

Merci de votre attentionA vos questions !

@AntidotNetinfo@antidot.net

Recommended