Upload
arissa
View
36
Download
0
Embed Size (px)
DESCRIPTION
Soutenance de projet de fin d'études. Développement et intégration des techniques de Data Mining pour une plate-forme de coopération. Équipe de recherche : ECOO – LORIA Responsable de l’équipe : M. Claude Godart - PowerPoint PPT Presentation
Citation preview
Développement et intégration des techniques de Data Mining pour une plate-forme de
coopération
Soutenance de projet de fin d'études
Équipe de recherche : ECOO – LORIA Responsable de l’équipe : M. Claude Godart
Réalisé par : Khaled Gaaloul Encadreurs : M. François Charoy M. Noureddine Ellouze
Soutenance PFE Juin 2004 2
Plan• Introduction et problématique
• État de l’art
Présentation de SGW Bonita
Introduction à l’approche Workflow Mining
• Mise en œuvre
Développement de l’outil pour la collecte de traces d’exécution greffé
à Bonita
Développement du Parseur XML pour les statistiques de Workflow
Mining
• Conclusion et perspectives
Introduction & Problématique
Soutenance PFE Juin 2004 4
• Besoin de coopération
Face à la mondialisation, l’économie a subi une
métamorphose (e.g. fusion de groupe, externalisation de
services, extension d’entreprises, etc.).
Les conséquences étaient le déploiement de nouveaux
concepts et d’outils technologiques pour les entreprises.
La nécessité de mécanismes supportant l’interconnexion et
la coopération des applications.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 5
• Procédés d’entreprises et coopération
Département 3
Département 2Département 1
Département 4
Entreprise Mère
Filiale 1 Filiale 2 Filiale 3
Intra entreprise
Inter entreprises
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 6
• Les Workflows comme outil de coopération (1)
« Outil décisionnel coopératif ayant pour paramètres un
nombre de personne limité devant accomplir en un
temps limité des tâches articulées autour d'une
procédure définie tout en ayant un objectif commun » Workflow Management Consortium 2001.
Domaine d’application : co-ingénierie et/ou co-
conception.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 7
• Les Workflows comme outil de coopération (2)
Faciliter la coordination entre les participants à
un projet coopératif.
Gérer des procédés d’entreprise.
Optimiser et automatiser les procédés
d’entreprises.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 8
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
•Phases du Workflow
Analyse du procédéAnalyse du procédéConception et Conception et Définition du Définition du procédéprocédé
Définition du procédéDéfinition du procédéInstantiation etInstantiation etcontrôle ducontrôle duprocédéprocédé
Service d’exécution du WorkflowService d’exécution du Workflow
Outils et applicationsOutils et applications
Interaction avec les Interaction avec les utilisateurs et les utilisateurs et les applicationsapplications
Soutenance PFE Juin 2004 9
• Divergence entre modélisation et implémentation (1)
Constats d’erreurs de conception sur les modèles de workflows
lors de leur exécution.
Le plus souvent les modèles restent loin du souhait de
l’utilisateur : les modèles de workflow manquent d’automatisme et
de performance.
L’approche classique de modélisation attache peu d’importance à
la phase d’exécution.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 10
• Divergence entre modélisation et implémentation (2)
Divergence d’interprétation lors de l’exécutions d’une
instance de workflow.
Les connaissances utilisées pour la modélisation et la
conception restent tacites.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 11
• Nécessité d’une nouvelle approche pour la modélisation de workflows
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Phase de diagnostique
Phase de diagnostique
Connaissances explicites
Connaissances explicites
Réalisation de modèles de workflows compatibles
et complets
Réalisation de modèles de workflows compatibles
et complets
Soutenance PFE Juin 2004 12
État de l’art
Soutenance PFE Juin 2004 13
• Les workflows coopératifs
Solution pour des modèles rigides de workflows.
Offre plus de flexibilité et d’interaction.
Possibilité de communication et d’interaction entre les
différentes tâches du procédé du workflow.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Édition Modification
Edition Revue Modification
Édition Revue
Modification
Procédé
Exécution
(1)
(2) Anticipating
Anticipable
Executing
Revue
Modèle classique
Modèle coopératif
Soutenance PFE Juin 2004 14
• Bonita : un workflow coopératif
Bonita est un Système de Gestion de Worflow
coopératif (SGW), conforme aux
caractéristiques de WfMC (Workflow
managemenet Consortium).
Bonita est un SGW conçu pour indiquer,
exécuter, surveiller et coordonner les flux
d’organismes du travail.
L’originalité de Bonita réside dans un moteur
d'exécution qui est basé sur le nouveau modèle
d'anticipation d'activité proposé par l'équipe
ECOO.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 15
• Architecture de Bonita (1)
Le composant de modélisation assurent la
modélisation ainsi que la visualisation de
processus de workflow.
Le composant d’exécution est responsable de
la phase d’exécution, il est chargé de La gestion
des données flexibles permettant aux activités
de permuter des données d'une manière
optimum.
Le développement du moteur de workflow est
centré sur la plate-forme J2EE fournissant un
environnement plus flexible et plus portatif pour
des applications réparties.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 16
• Architecture de Bonita (2)
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 17
• Data Mining : fouille de données
Le data mining est le successeur des statistiques.
Son but est de réaliser des «modèles» compacts et
compréhensibles rendant compte des relations liant la
description d'une situation à un résultat.
Ils offrent des techniques pour la construction du dit modèle
de manière automatique.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 18
• Data Mining Vs Statistiques
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 19
• Avantage de Data Mining
Les modèles exprimés par le data mining sont:
Descriptif et explicatif : il éclaire la situation en «vous disant
où regarder ».
Prédictif : obtenir une estimation du résultat à attendre pour un
modèle ayant de nouveaux paramètres.
Les techniques de data mining construisent ces modèles de
manière automatique et en un temps optimum.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 20
• L’approche Workflow Mining
L’approche Workflow Mining hérite des techniques
de data mining.
Elle désigne l’ensemble des techniques pour la
découverte de modèles de workflows.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 21
Mise en oeuvre
Soutenance PFE Juin 2004 22
• Objectifs
Développement et intégration d’un outil de collecte de
traces d’exécution d’une instance de workflow greffé au
SGW Bonita.
Conception d’un parseur XML pour le filtrage et
l’extraction de statistiques nécessaires à l’approche du
workflow mining adoptée.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 23
• L’outil de collecte de traces (1)
But : enregistrer dans des fichiers logs de
type XML des évènements qui vont se
produire lors de l’instanciation et de
l’exécution d’un projet workflow au sein de
Bonita.
Source : le service de messagerie JMS
intégré dans Bonita assure un échange
d’informations et de messages relatant à
l’exécution d’un projet workflow.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 24
• L’outil de collecte de traces (2)
Exécution d’activités dans un projet workflow
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 25
• L’outil de collecte de traces (3)
Serveur de messagerie dans Bonita
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 26
• Conception de l’outil de collecte de traces
L’outil de collecte de trace est un
d’espion greffé à Bonita.
Le développement de cet outil va se
baser sur l’API JMS.
Le mode choisi pour répondre à ces
besoins est le mode
publication/abonnement de JMS.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 27
• LogListener : outil de collecte de traces
LogListener va écouter les messages (évènements)
échangés entre Bonita et l’utilisateur connecté.
Les évènements contiennent le nom de l’utilisateur, le
nom du projet, les noms des activités, leurs états, et le
temps d’exécution.
A chaque instanciation de workflow, le LogListener
produit un fichier XML identifié par le nom du projet et
sa date d’accès.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 28
• LogListener : L’approche conceptuelle
Utilisation du patron de conception singleton.
Nécessiter de créer un objet qui devra posséder
durant tout le programme une instance unique.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 29
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
•Déroulement de la collecte de traces
Soutenance PFE Juin 2004 30
• Structure d’un fichier XML
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 31
• Le parseur XML : Définition
Effectuer une analyse lexicale pour chaque fichier XML
généré par l’outil LogListener.
Extraire des données sur les activités, leur nombre
d’occurrence, la liste des activités qui les précèdent et celles
qui les suivent.
Générer des fichiers XML contenant ces
données.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 32
• Le parseur XML : Architecture
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 33
• Le parseur XML : Étapes de réalisation (1)
Étape 1 : Définir une classe « activityStatistic »
dont le rôle est de mettre à jour l’opération de
filtrage du fichier XML grâce aux méthodes
Getters() et Setters() appliquées à ses attributs.
Étape 2 : Définir une classe « ParserXML » pour
le parcours du répertoire des fichiers XML afin
d’extraire les données (nom, occurrence,
activités précédentes, activités suivantes).
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 34
• Le parseur XML : Étapes de réalisation (2)
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
activityStatic+taskName : String+taskOccurence : int+previousActivity : Object+fwActivity : Object
+activityStatic()+getName() : String+setName()+getOccurence() : int+setOccurence+updateOccurence()+getPreviousActivity() : Object+setPreviousActivity()+getFwActivity() : Object+setFwActivity()+result() : String
ParserXML+inputdataDirectory : String+outputData : String+Activity : Object+window : int
+readXMLDirectory()+readXMLFile()
Soutenance PFE Juin 2004 35
• Le parseur XML : Étapes de réalisation (3)
3ème étape : l’utilisation de l’outil ANT pour faciliter le
déploiement du parseur XML.
- Définition du fichier build.xml pour faciliter les tâches de
déploiement.
- Définitions des targets du build.xml nécessaires à la
compilation et l’exécution de l’outil du filtrage.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 36
• Le parseur XML : Build.xml
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 37
• Le parseur XML : Déploiement avec ANT
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 38
• Le parseur XML : Résultats
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 39
• Démonstration (1)
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 40
• Démonstration (2)
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 41
• Démonstration (3)
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 42
Conclusion et Perspectives
Soutenance PFE Juin 2004 43
• Conclusion (1)
La programmation n’est plus une affaire d’alignement de
lignes de codes.
Une analyse minutieuse du problème est primordiale pour
une bonne conception.
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 44
• Conclusion (2)
Le bilan s’avère positif:
Scientifique:
Découverte de milieu de recherche scientifique.
Mise en application de connaissances théoriques.
Association dans un projet en cours.
Relation étroite avec des projets industriels.
Humain
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 45
• Perspectives
Une première étape de l'approche du workflow mining.
L’optimisation et le raffinement des statistiques extraites
pour l’approche adoptée.
L’implantation de l'algorithme de découverte de patrons de
workflows utilisant ces données
Introduction & Problématique
État de l’art Mise en oeuvreConclusion et perspectives
Soutenance PFE Juin 2004 46
Merci de votre attention.