Upload
microsoft-developpeurs
View
591
Download
3
Embed Size (px)
DESCRIPTION
L'extraction automatique de métadonnées au service de l'enrichissement sémantique de SharePoint
Citation preview
Daniel Mayer, VP Marketing [email protected]
Structurez, Gérez, Valorisez Vos Contenus Non Structurés Enrichissement sémantique de SharePoint
Stand 21
Copyright © 2013 TEMIS - All Rights Reserved - Slide 2
Agenda
Enrichissement sémantique
• Découverte par l’exemple
• Interactions avec SharePoint : vue d’ensemble
• Applications / Proposition de valeur
Intégrations SharePoint (2010, 2013)
• Principes & Fonctions clé
• Intégration spécifique Archivage d’Email
En savoir plus sur Luxid®
• Vue d’ensemble de la plateforme
Questions-Réponses
Copyright © 2013 TEMIS - All Rights Reserved - Slide 3
Pionnier de l’Enrichissement de Contenu depuis 2000
70
Copyright © 2013 TEMIS - All Rights Reserved - Slide 5
x2 tous les deux ans
Source : IDC Digital Universe studies
Menace et Opportunité Contenu produit et géré en entreprise
80% de non structuré
Copyright © 2013 TEMIS - All Rights Reserved - Slide 6
Structurer les contenus non structurés pour mieux les gérer et mieux les valoriser
Copyright © 2013 TEMIS - All Rights Reserved - Slide 7
Le 10 Mai Microsoft a acheté Skype pour $8 milliards.
Relations
Acquisition Acheteur Microsoft
Cible Skype
Montant $8 milliards
Date 10 Mai
Le 10 Mai Microsoft a acheté Skype pour $8 milliards.
Roles
Attributs
Comment structurer ? Extraire automatiquement les informations métier
Termes
Prép Verbe Propre Prep Un Propre Card. Propre Num Num
Compagnie Action Compagnie Prep Expr. Monétaire Date
Entités
Prép
Copyright © 2013 TEMIS - All Rights Reserved - Slide 8
Comment structurer ?
We report a 52 year-old man presenting an acute hair loss induced by carbamazepine (CBZ) in concentration of 8.6 microg/ml.
Extraire automatiquement les informations métier
Relations
We report a 52 year-old man presenting an acute hair loss induced by carbamazepine (CBZ) in concentration of 8.6 microg/ml.
Verb Patient Verb Symptom Verb Dosage information Subj
Entités
Drug Name
Termes
Pro Verb Num Art N-P Noun Verb Art Adj Nn Nn Verb Pp PropNn Pp Noun Pp Num Unit Abbr
Attributs
Rôles
Effet Secondaire Symptôme Chute de cheveux
Cause Carbamazepine
Dosage 8.6 mg/ml
Patient homme de 52 ans
Copyright © 2013 TEMIS - All Rights Reserved - Slide 9
Quelles informations métier ?
Personnes
• Clients, Collaborateurs, Rattachement à votre annuaire
Organisations
• Filiales, Services, Fournisseurs, Compétiteurs, Partenaires
Références internes
• Projet, contrat, client, zone géographique, marché, etc…
Noms de vos produits ou services
• Taxonomie produit, accessoires, options, etc…
Terminologie et Catégories métier
• Vocabulaires techniques
• Catégories documentaires
A vous de le décider…quelques exemples
Copyright © 2013 TEMIS - All Rights Reserved - Slide 10
HTC Strikes Back Against Apple – Wall Street Journal - NIRAJ SHETH May 13th 2010 - HTC Corp., the maker of several phones that run on Google Inc.'s Android platform, filed a complaint against Apple Inc. alleging patent infringement, a move that follows an intellectual-property suit that the iPhone maker filed against HTC two months ago. HTC's complaint with the U.S. International Trade Commission alleges that Apple has violated five patents held by the Taiwan-based electronics manufacturer and asks the trade court to stop Apple from selling the iPhone, the iPad and iPod in the U.S. Apple in March filed complaints with the ITC, and in a federal court in Delaware, outlining a total of 20 patents related to touch-screen technology and mobile computing that it alleges HTC infringed. In its filing, HTC cites patents related to power consumption in smartphones and how cellphones dial contacts from an address book. Some of the patents cited by Apple in its suit also relate to power usage, but it wasn't immediately clear how similar those claims are to HTC's. "We are taking this action against Apple to protect our intellectual property, our industry partners, and most importantly our customers that use HTC phones," HTC's North American vice president, Jason Mackenzie, said in a written statement. In another sign of the growing legal pressure on Google and its Android partners, HTC recently announced a licensing deal with Microsoft Corp., which said it believes that HTC's Android phones infringes on a range of Microsoft patents including user interfaces. The share of Android-based smartphones in the U.S. grew to 28% in the first quarter, according to research firm NPD, for the first time edging out the iPhone's 21% share.
filed complaints with the ITC
filed a complaint against Apple Inc. alleging patent infringement
Relations Procès
ITC
recently announced a licensing deal with
HTC
Licences
American vice president ‘s North HTC
RH
Comment structurer ? Enrichir les métadonnées
HTC
Apple Google
US International Trade Commission
Microsoft Corp
iPhone iPad iPod
Jason Mackenzie
NIRAJ SHETH
Android
smartphones cellphones
user interfaces
power usage
HTC Apple Google
Microsoft Corp. NPD
Compagnies
US International Trade Commission
Organisations
Personnes Niraj Sheth
iPhone iPad iPod
Produits
Technologies Android smartphones
power usage user interfaces
The share of Android-based smartphones in the U.S. grew to 28% in the first quarter
Part de Marché
Jason Mackenzie
NPD
Apple
Copyright © 2013 TEMIS - All Rights Reserved - Slide 11
Enrichissement Sémantique & SharePoint
SharePoint accorde de l’importance aux métadonnées…
• Hébergement et gestion des métadonnées dans les colonnes
Où est le lien ?
Copyright © 2013 TEMIS - All Rights Reserved - Slide 12
Enrichissement Sémantique & SharePoint
SharePoint accorde de l’importance aux métadonnées…
… mais elles doivent être contribuées manuellement or la contribution manuelle est inefficace
• Consommatrice de Temps
• Peu profonde
• Incohérente
Où est le lien ?
Copyright © 2013 TEMIS - All Rights Reserved - Slide 13
Enrichissement Sémantique & SharePoint
SharePoint accorde de l’importance aux métadonnées…
… mais elles doivent être contribuées manuellement or la contribution manuelle est inefficace
L’Enrichissement de Contenu automatisé complémente SharePoint en produisant des métadonnées de manière
• Productive
• Profonde
• Cohérente
Où est le lien ?
Copyright © 2013 TEMIS - All Rights Reserved - Slide 14
Diagramme de Flux Luxid® for SharePoint
AP
I du
Mo
teu
r D
e R
ech
erc
he
Index De
Recherche
Index De
Recherche
Search-based Applications
Recherche Analyse
Visualisation Facettes
Recommendations
Insertion
Indexation Des Métadonnées
Extraction Des Métadonnées
Enrichissement des métadonnées
Enrichissement des interfaces
Luxid® Annotation
Factory
Copyright © 2013 TEMIS - All Rights Reserved - Slide 15
Co
uch
e D
iffu
sio
n
Co
uch
e A
pp
licat
ive
Co
uch
e D
on
née
s
Architecture Globale Les métadonnées enrichissent la couche applicative
AP
I du
Mo
teu
r D
e R
ech
erc
he
Personnalisation Profils
Fonctions Collaboratives
Luxid® Annotation
Factory
Index De
Recherche
Index De
Recherche
Annuaires Réseaux Virtuels
Processus Métier
Formulaires
Contrôle d’Accès Gestion des Droits
Search-based Applications
Recherche Analyse
Visualisation Facettes
Recommendations
Processus De Gestion
Documentaire
Copyright © 2013 TEMIS - All Rights Reserved - Slide 16
Proposition de Valeur
Gérer
Valoriser
Structurer
Facettes
Liens Documents
Similaires
Search-Based Applications
Déploiement de Taxonomies D’Entreprise
Alimentation des bases de Connaissance
Audit Documentaire
• Recherches plus rapides et plus efficaces
• Contextualisation et Mise en Perspective
• Analyse métier
• Productivité des utilisateurs
• Satisfaction et Adoption du SI
• Facilite la montée en charge
• Aide à réduire les risques
• Aide à optimiser les coûts
• Informe les décisions
• Profondeur
• Dimension Métier
Résultats Plus Pertinents
Production Fiable et Efficace de Métadonnées
Analyse De L’Usage
Automatisation des Processus Archivage Migration
• Minimisation de l’effort de contribution des utilisateurs
• Cohérence
Business Intelligence
Enrichie
Copyright © 2013 TEMIS - All Rights Reserved - Slide 17
Exemples de cas d’usage Valoriser
Global Partage de l’information Plan de classement sur la base d’une taxonomie métier (Client, Segment, Canal, Produit, Technologie, Région, Type de Document)
• Recherches plus rapides et plus efficaces • Création de Bases de Connaissances • Contextualisation / Mise en perspective avec l’actualité et les savoirs internes • Accélération de la diffusion de l’information • Valorisation du patrimoine visuel
DRH Cartographie de l’expertise Analyse des CVs et docs de travail Extraction des thèmes d’expertise
• Identification des experts par thème • Enrichissement annuaires / espaces collaboratifs • Mise en évidence des réseaux de collaboration
Produit Voix du client Catégorisation des appels client (type d’incident, Produit, Segment, Région)
• Optimiser la gestion des centres d’appels • Identifier les sources d’insatisfaction • Optimiser les produits et services • Déclencher des alertes produit
R&D Découverte Scientifique Analyse de la littérature scientifique, des brevets, des rapports internes
• Bâtir et maintenir des états de l’art par discipline • Identifier les axes de recherche prometteurs
Copyright © 2013 TEMIS - All Rights Reserved - Slide 18
Exemples de cas d’usage Gérer
DSI Optimisation de la gestion de contenu Plan de classement sur la base d’une taxonomie métier (Typologie Documentaire, Typologie informationnelle)
• Capacité à monter en charge • Automatisation des flux docutaires par règles • Optimisation du contrôle d’accès • Aide à la migration et la fusion de systèmes documentaires
DSI - Direction Juridique
Optimisation de l’archivage Plan de classement sur la base d’une taxonomie métier (Typologie Documentaire, Typologie informationnelle)
• Identifier les contenus réglementés, engageants ou probatoires • Minimiser les risques réglementaires / juridiques • Optimiser les coûts
DSI Optimisation du SI Analyser les contenus Analyser les usages Visualiser & suivre les évolutions
• Analyse et démontrer la valeur / le service rendu • Optimiser les coûts • Optimiser les investissements
Copyright © 2013 TEMIS - All Rights Reserved - Slide 19
Intégration avec SharePoint
L’intégration elle-même
Exemple d’usage en contexte ‘search’
Exemple d’usage en contexte ‘archivage de mails’
Copyright © 2013 TEMIS - All Rights Reserved - Slide 20
Intégration Luxid® for SharePoint
Interfaçage Luxid® - SharePoint par Web Services
• Appel manuel ou en arrière plan par SharePoint
• Luxid® lit chaque document et en extrait les métadonnées
Libère les métadonnées du moteur de recherche
• Stockées dans les colonnes SharePoint
• Exploitables par toutes les applications
• Y compris par le moteur de recherche sans en être captives
Les opérations manuelles sont également stockées
• Des extractions successives préservent les modifications
• Permet le ré-enrichissement massif (reprise d’archives…)
Principes et mécanismes clé
Copyright © 2013 TEMIS - All Rights Reserved - Slide 21
Luxid® for SharePoint 2010
Une colonne dédiée héberge chaque type de métadonnée
Stockage dans les Colonnes
Copyright © 2013 TEMIS - All Rights Reserved - Slide 22
Luxid® for SharePoint 2010
Les métadonnées produites restent accessibles aux utilisateurs
Accès aux Métadonnées
Copyright © 2013 TEMIS - All Rights Reserved - Slide 23
Luxid® for SharePoint 2010
Modification
Retrait
Ajout
Accès aux Métadonnées
Copyright © 2013 TEMIS - All Rights Reserved - Slide 24
Luxid® for SharePoint 2010
Pour chaque type de métadonnée une seconde colonne préserve les modifications manuelles des utilisateurs
Historique des modifications manuelles
Copyright © 2013 TEMIS - All Rights Reserved - Slide 25
SharePoint 2010
Search Center Standard
Copyright © 2013 TEMIS - All Rights Reserved - Slide 26
SharePoint 2010
Met en avant les métadonnées ‘techniques’
• User ID de l’auteur
• Date de modification
• Lieu de stockage
• Type de fichier
Search Center Standard
Copyright © 2013 TEMIS - All Rights Reserved - Slide 27
Luxid® for SharePoint 2010 Impact de la Sémantique : Search Center Enrichi
Copyright © 2013 TEMIS - All Rights Reserved - Slide 28
Luxid® for SharePoint 2010
Les facettes mettent en valeur les métadonnées ‘métier’
• Ciblage des résultats les plus pertinents
• Les métadonnées ‘techniques’ sont préservées
Impact de la Sémantique : Search Center Enrichi
Copyright © 2013 TEMIS - All Rights Reserved - Slide 29
Luxid® for SharePoint 2010
Le cartouche de chaque document fait apparaître l’ensemble des métadonnées
• Les Entités cliquables permettent d’affiner la recherche
Impact de la Sémantique : Search Center Enrichi
Copyright © 2013 TEMIS - All Rights Reserved - Slide 30
Luxid® for SharePoint 2010
Les facettes permettent la navigation hiérarchique
Impact de la Sémantique : Search Center Enrichi
Copyright © 2013 TEMIS - All Rights Reserved - Slide 31
Intégration avec
Copyright © 2013 TEMIS - All Rights Reserved - Slide 32
Enjeux
Les emails sont un type de contenu critique
• 75% des documents stockés et envoyés par mail
• 4.5 GB de mails reçus et envoyés par an et par utilisateur
• Les emails engagent la responsabilité de l’organisation
• Les emails peuvent servir de preuve
Trois questions
• Que doit-on archiver ?
• Comment maîtriser les risques associés ?
• Comment optimiser l’utilisation des informations archivées ?
Archivage d’emails
Copyright © 2013 TEMIS - All Rights Reserved - Slide 33
Archivage d’emails à vocation probatoire Sémantique & archivage intelligent
Accès, Partage, Diffusion Collaboration Luxid®
Annotation Factory
Intégrité, Pérennité, Sécurité, Traçabilité
Copyright © 2013 TEMIS - All Rights Reserved - Slide 34
Archivage d’emails à vocation probatoire Emission et Réception
La sémantique
• Qualifie la criticité d’un email
• Permet d’automatiser son versement dans le SAE Easyfolder
Copyright © 2013 TEMIS - All Rights Reserved - Slide 35
Archivage d’emails à vocation probatoire E-Discovery
L’enrichissement sémantique permet d’optimiser l’accès aux emails sensibles
Copyright © 2013 TEMIS - All Rights Reserved - Slide 36
Luxid for SharePoint 2013
Disponibilité en Q1 2013
Copyright © 2013 TEMIS - All Rights Reserved - Slide 37
Copyright © 2013 TEMIS - All Rights Reserved - Slide 38
Content Enrichment Platform
Content Enrichment Studio
Annotation Factory
Skill Cartridge® Library
Copyright © 2013 TEMIS - All Rights Reserved - Slide 39
Robustesse
• APIs et Web Services
• UIMA : standard, ouvert, scalable
• 20 langues
Puissance d’extraction
• Entités
• Relations
• Catégories
Large gamme de techniques
• Taxonomies & Thesaurus
• Raisonnement morpho-syntaxique
• Statistiques / Apprentissage
• Anglais
• Français
• Allemand
• Néerlandais
• Italien
• Espagnol
• Portugais
• Tchèque
• Russe
• Hongrois
• Polonais
• Grec
• Suédois
• Danois
• Norvégien
• Finlandais
• Chinois
• Japonais
• Coréen
• Arabe
Content Enrichment Platform
Copyright © 2013 TEMIS - All Rights Reserved - Slide 40
Catégories D’Actualité
Personnes Sociétés Lieux
Relations D’affaires
TM360°
Competitive Intelligence
IPTC Entités Chimiques
Entités Relations Biologiques
Entités
Relations Médicales
BER
MER
CER
Militaires Politiques Strategiques
Events
Opinions Sentiment
Opinion
Mining
RTF STF …
Skill Cartridge® Library
Copyright © 2013 TEMIS - All Rights Reserved - Slide 41
Skill Cartridge® sur base Taxonomique
Knowledge Editor
Skill Cartridge® sur base de Raisonnt morpho-syntaxique
Skill Cartridge® Builder
Skill Cartridge® de catégorisation (Développement & Qualité)
Categorization Workbench
Contrôle Qualité
Annotation Workbench
Content Enrichment Platform
Copyright © 2013 TEMIS - All Rights Reserved - Slide 42
Copyright © 2013 TEMIS - All Rights Reserved - Slide 43
Conclusion
De nouveaux usages pour une technologie éprouvée
• Structurer le non-structuré
• Gérer pour éviter l’infobésité
• Valoriser l’information
Luxid® : une plateforme puissante et robuste
• En production depuis 7 ans
• Large gamme de techniques d’extraction d’information, multilingues, fortement personnalisables
• Disponible dans SharePoint 2010 et bientôt 2013
Un SI intelligent apporte de la valeur à toute l’entreprise
• Accès à l’Information plus pertinent et plus rapide
• Gestion de Contenu et Gouvernance de l’Information optimisés
Enrichissez votre contenu dès aujourd’hui !