Chapitre 6 Analyse Conceptuelle Cours2

Embed Size (px)

Citation preview

UE8 Mthode MERISE: Analyse conceptuelle des donnes

M.Bizon___________________________________________________________________________

Chapitre 6 L'ANALYSE CONCEPTUELLE DES DONNEES : Les concepts de base.

PLAN DU COURS

I- Principes gnraux de la conceptualisationII- Le dictionnaire des donnes

A.Les diffrentes catgories d'informations.

1.Distinction entre informations calcules, non calcules et de commande.

2.La notion d'information lmentaire

3.Le principe de pertinence.B.laboration du dictionnaire des donnes1.Recensement des donnes.

2.Prsentation du dictionnaire des donnes complet ou brut

3.Prsentation du dictionnaire des donnes lmentaires de base ou rduit.

III- Les dpendances fonctionnelles (D.F.).

A. Dfinitions1.Notion de dpendance fonctionnelle.

2.Formes particulires de dpendances fonctionnelles.

B.Modes de reprsentations.

Chapitre 6: L'ANALYSE CONCEPTUELLE DES DONNEES : Les concepts de base.

I- Principes gnraux de la conceptualisationLa mthode Merise (acronyme signifiant Mthode d'tude et de Ralisation Informatique par les Sous-Ensembles ou pour les Systmes d'Entreprises.) dfinit trois niveaux de description du systme dinformation:

Conceptuel

Organisationnel

PhysiqueLa reprsentation distincte des donnes et des traitements selon les 3 niveaux voqus, conduit l'laboration de six modles.

NIVEAUXA- DONNEESB- TRAITEMENTS

CONCEPTUELSchma Conceptuel de Donnes (Schma Conceptuel des traitements (

ORGANISATIONNELSchma Organisationnel de Donnes (Schma Organisationnel des Traitements (

PHYSIQUESchma Physique de donnes (Schma Physique des Traitement (

Lanalyse, le plus souvent confie une SSII, est ralise par une ou deux quipes qui travaillent sur les DONNEES et les TRAITEMENTS en parallle.Cette premire approche de lanalyse sera consacre aux DONNEES

NIVEAUXA- DONNEESOBJECTIFSOUTILS

CONCEPTUELSchma Conceptuel de Donnes (Analyse des donnes existantes et futuresDictionnaire de donnes rduit

Analyse des dpendances fonctionnelles entre les donnes du Dictionnaire des donnes Matrice des dpendances fonctionnelles

OU

Couverture minimale

OU Graphe des dpendances fonctionnelles

OU Structure daccs thorique (SAT)

Formalisation graphique des dpendances fonctionnellesSchma Conceptuel des donnes (Notions dobjet, dassociation, de cardinalits)

II- Le dictionnaire des donnes

La premire tape, dans la construction d'une base de donnes, consiste runir tous les documents reprsentatifs des donnes que l'on souhaite modliser. Le terme "documents" doit tre ici pris dans un sens large. Il peut s'agir en effet soit de documents papier, soit de documents magntiques (enregistrement d'entretiens, disque ou disquette informatique)... soit de tout autre support utilisable pour conserver des informations.

A.Les diffrentes catgories d'informations.

Pour la dfinition de la structure des donnes, trois aspects doivent tre examins :

1- la distinction entre informations calcules et non calcules,

2- la notion d'information lmentaire,

3- la notion de donne pertinente.

1.Distinction entre informations calcules, non calcules et de commande.

* Informations rsultantes ou calcules.

Elles sont obtenues par l'application d'un calcul arithmtique ou logique d'autres informations qui sont des oprandes.

Ex : le "total brut" d'une facture est une rubrique calcule.

* Informations non calcules (donnes de base).

Ces informations non calcules constituent la base du Schma des donnes.

Ex : Le nom d'un salari, les conditions de rglement d'un fournisseur, le titre d'un livre...

* Informations de commande : Rgle de gestion.

Les informations de commande correspondent la dfinition des oprations de calcul permettant de passer des donnes de base aux rsultats. Elles s'expriment sous forme de REGLES DE GESTION et entrent dans la dfinition des traitements.

Ex : Si le solde dbiteur date de plus de 3 mois, classer le client en catgorie "dbiteur surveiller" est une rgle de gestion.

2.La notion d'information lmentaire

Une DONNEE ELEMENTAIRE est une donne non dcomposable ; les caractres qui la constituent sont systmatiquement utiliss ensemble.

Ex : "Adresse-client" comprend un numro de rue, un nom de voie, un code postal et un nom de ville. Si dans toutes les utilisations envisages, ces diffrentes rubriques sont toujours simultanment prsentes on peut considrer qu'il s'agit d'une donne lmentaire.

"Code postal" peut ne pas tre considr comme une donne lmentaire si on l'utilise pour des tris par dpartement. Dans ce cas, il faut le dcomposer en deux donnes lmentaires :

( code dpartement

( code bureau distributeur.

3.Le principe de pertinence.

La prsence d'une donne dans la base de dfinitions n'est justifie que si cette donne est utile. La pertinence traduit le fait que l'information prsente un caractre d'utilit pour au moins un utilisateur.

La pertinence est toujours relative un ensemble d'utilisateurs et un ensemble de traitements envisags.B.laboration du dictionnaire des donnes

La structure des donnes va tre construite partir d'un ensemble de dfinitions constitu par les DONNEES ELEMENTAIRES DE BASE (NON CALCULEES).

1.Recensement des donnes.

Pendant tout le travail de conception du systme d'information, il est indispensable de recenser toutes les donnes (actuelles et futures) voques dans le domaine.

Chaque donne sera :

1- identifie par un nom de donne (codfac, datdeb..)

2- dfinie par un type (calcule ou non calcule)

3- caractrise par un domaine de dfinition (numrique, alphabtique, entre 0 et 31, de 1 365...)

4- associe une rgle de gestion s'il s'agit d'une donne calcule.

Ex : Recensement des donnes en fonction des documents

DONNEES RECENSEESDOCUMENTS D'ORIGINE

BON CDEFACTBON LIV..

Nom clientXXX

Ref. clientX

Adresse de livraisonXX

N transporteurX

Code articleXXX

Qt commandeX

Qt livreXX

Prix unitaire H.T.X

2.Prsentation du dictionnaire des donnes complet ou brut

A partir du travail de recensement des donnes, on complte progressivement le dictionnaire des donnes. On peut adopter la prsentation suivante :

Ex : Extrait du dictionnaire des donnes de l'entreprise "LOCATION S.A.".

A chaque donne calcule correspond une rgle de gestion :

ainsi R1 dfinit Montant = PuHT * Qt livre

R2 dfinit Montant_HT = Montant -Escompte - Remise

Nom

de la donneSignificationLongueurFormatType(E,CA, CONC)Observations

NOMCLINom du client30AE

PRENOMCLIPrnom du client20AE

5me colonne: TYPE

Une donne peut tre soit:

- lmentaire (E)

- calcule (C)

- concatne (CONC)

Une donne calcule est laboutissement doprations (multiplication, division, addition, soustraction) faites sur des donnes lmentaires.

Exemple: MONTANT_HT

donne calcule (Prix_Brut * Quantit)

Un donne concatne est obtenue par adjonction de donnes lmentaires.

Exemple: ADRESSE

donne concatne

6me colonne: OBSERVATIONS

Cest une explication supplmentaire pour certaines donnes.

Lexplication peut concerner un calcul, un format ou les diffrentes valeurs que peut prendre une donne.

Exemple: ADRESSE : RUE + VILLE + CODE_POSTAL

Exemple : PaiementOui/Non

Exemple : Date_livraisonjj/mm/aa

Le dictionnaire des donnes est dit complet car il contient des donnes calcules et des donnes non calcules. Ce document est indispensable dans la conduite des projets car, rgulirement, il protge contre les oublis ou les erreurs.

Ce dictionnaire est contrl ; en particulier on limine :

1 Les synonymes : Deux donnes en apparence ne sont qu'une seule et mme donne.

Ex :DATCON ET DATEMI (que l'on a trouv sur certains documents) correspondent tous les deux la date d'mission des contrats. On dcide de supprimer DATEMI car cette redondance est inutile.

2 Les polysmes : A un libell (un nom de donnes) ne doit correspondre qu'une seule donne.

Ex : Si la rflexion on veut distinguer la date du contrat de la date de dbut de location, il faudra viter de dsigner ces deux dates par le mme nom "DATCON" et crer un autre nom de donne.

3.Prsentation du dictionnaire des donnes lmentaires de base ou rduit.

Le dictionnaire des donnes complet prsente un inconvnient, il est REDONDANT. En effet, si l'on connat les donnes lmentaires de base et les rgles de gestion, il est possible de reconstituer, par le calcul, ces donnes calcules. Par consquent, la construction du Schma conceptuel de donnes se fait partir des seules donnes lmentaires de base qui dfinissent le dictionnaire des donnes rduit.

Il faut procder l'puration des donnes.

Exemple de dictionnaire de donnes rduit :

Le dictionnaire des donnes rduit aux seules donnes lmentaires de base reprsente l'ensemble de dfinition sur lequel va tre construit le S.C.D.III- Les dpendances fonctionnelles (D.F.).

A.Dfinitions

1.Notion de dpendance fonctionnelle.

Def: On dit qu'il existe une dpendance fonctionnelle entre un attribut A1 et un attribut A2, on note A1 -> A2, si connaissant une valeur de A1 on ne peut lui associer qu'une seule valeur de A2. On dit aussi que A1 dtermine A2. A1 est la source de la dpendance fonctionnelle et A2 le but.

Ex : Le numro d'un client dtermine fonctionnellement son nom ; connaissant le numro d'inscription on connat un seul nom correspondant.

Au numro "456" correspond le nom "LEGRAND".

L'inverse n'est pas forcment en dpendance fonctionnelle (homonymes).

On note ainsi la DEPENDANCE FONCTIONNELLE :

SOURCE -----------------------------> BUT

NUMCLI --------------------------> NOMCLI

(Source de D.F.) (But de D.F.)

La dpendance fonctionnelle prsente deux proprits intressantes :

* LA REFLEXIVITE.

A ---------------------------------> A

* LA TRANSITIVITE.

Si A ------------------------------> B

et B - -----------------------------> C

alors A ----------------------------> C

2.Formes particulires de dpendances fonctionnelles.

* DEPENDANCE FONCTIONNELLE A PARTIE GAUCHE COMPOSEE : DFPGC

La source d'une dpendance fonctionnelle peut tre compose de plusieurs rubriques ou proprits ; une telle dpendance fonctionnelle est dite partie gauche compose (DFPGC).

Ex :

(NumFact, Code_produit) --------------> Qt_facture

Signifie que la valeur de la qauntit facture dans une facture dpend simultanment du Numro de la facture et du code du rpoduit.

(Code client, rfrence produit) ----------------> prix unitaire du produit

Ne sera une DFPGC que si le prix unitaire du produit est diffrent selon les clients (facturation " la tte du client").

Il est conseill de noter entre parenthses les proprits source de la dpendance fonctionnelle :

(a,b) ----------------------------------------> c

* DEPENDANCE FONCTIONNELLE ELEMENTAIRE ou SIMPLEUne dpendance fonctionnelle a ----------------> b est lmentaire s'il n'existe pas un sous-ensemble a' de a tel que l'on ait a' -------------> b.

Par consquent, toute D.F. une seule rubrique source est, par dfinition, lmentaire.

Par contre, dans le cas d'une DFPGC, la dpendance fonctionnelle peut tre lmentaire ou non.

Ex : (Numro de facture, code produit) --------------> Quantit produit

est une DFPGC lmentaire car la connaissance du seul numro de facture ou du seul code produit ne dterminera pas la valeur de "quantit produit" ; il n'existe pas de sous-ensemble de la source assurant la dpendance fonctionnelle de mme but.

(Numro facture, Code produit) -------------> Nom produit

est une DFPGC non lmentaire car la seule connaissance du code produit (sous-ensemble de la source) dtermine le "Nom produit".

* DEPENDANCE FONCTIONNELLE DIRECTE.

Soit lexemple

A1 -> A2, A3, A4

A3 -> A4

A1, A5 -> A6

Pour supprimer les redondances sur un ensemble de DF il faut liminer les attributs qui peuvent tre obtenu par transitivit.A1 -> A2, A3, A4A3 -> A4

A1, A5 -> A6

LA NORMALISATION REPOSE SUR LA RECHERCHE DES D.F. ELEMENTAIRES ET DIRECTES.

* Dpendance fonctionnelle forte et dpendance fonctionnelle faible.

Une dpendance fonctionnelle entre deux donnes X et Y est forte si une valeur de X ne correspond qu'une et une seule valeur de Y.

Exemple 1:N produit ( Libell produit

est une DF forte.

La majorit des dpendances fonctionnelles correspond des dpendances fonctionnelles fortes.

Exemple 2:N Facture ( N client :

est une DF forte (car un N de facture correspond un et un seul N de client).

Une dpendance fonctionnelle entre deux donnes X et Y est faible si une valeur de X ne correspond au plus qu'une valeur de Y (il peut ne pas y avoir de valeur de Y correspondante).

Exemple :Ref Produit ( Code_client

est une DF faible (en effet, si telle Rfrence de produit existe par exemple :

A238 , il se peut qu'il n'y ait pas de client l'ayant dj achet).B.Modes de reprsentations.

Pour reprsenter les D.F. dans un ensemble de donnes, on peut utiliser plusieurs modes de reprsentation :

- La couverture minimale

- Le graphe des dpendances fonctionnelles- La structure daccs thorique

- La matrice des dpendances fonctionnelles

La couverture minimale

Elle consiste reprsenter toutes les dpendances fonctionnelles lmentaires et directes qui existent entre les donnes du dictionnaire rduit.

Matrice des dpendances fonctionnelles.

* Principe de la matrice complte.

Les diffrentes proprits recenses dans le dictionnaire des donnes sont rpertories en lignes et rptes par des numros identiques en colonnes. On a donc au dpart une matrice carre.

En ligne se trouvent les donnes BUTS de dpendance fonctionnelle ; en colonne sont indiques les donnes SOURCES de dpendance fonctionnelle ; le 1 l'intersection de la ligne et de la colonne indique la dpendance entre la donne source et la donne but.

Ex : MATRICE COMPLETE

SOURCES DE D.F.

BUTS12345678N

1 - NClient*1

2 - Nom_client1*

3 - Prnom_client1*

4- Numro_facture.*(1)

5- Date_Facture1*

6- Code produit*(1)

7- Libell_produit1*

8- Quantit_facture*1

*

N- 4+6*

SOURCES DE D.F.

BUTS146N

1 - NClient*1

2 - Nom_client1

3 - Prnom_client1

4- Numro_facture.*(1)

5- Date_Facture1

6- Code produit*(1)

7- Libell_produit1

8- Quantit_facture1

*

N- 4+6*

L'extrait de matrice ci-dessus dcrit la dpendance fonctionnelle :

NClient ---------------------------> Nom_client.

REMARQUES :

1- En raison de la proprit de REFLEXIVITE, la premire diagonale de la matrice comportera toujours des 1. Ces 1 peuvent tre omis dans la plupart des cas.

2- La matrice initiale, pour la recherche des dpendances fonctionnelles, est une matrice carre dans la plupart des cas, de nombreuses proprits ne sont pas sources de dpendance fonctionnelle ; le nombre de colonnes sera donc rduit dans la matrice simplifie. Il est conseill d'examiner systmatiquement la matrice complte.

3- L'analyse du problme peut faire apparatre des dpendances fonctionnelles partie gauche compose. Il y a lieu dans ce cas de rajouter des colonnes la matrice (source supplmentaire) ; des fins de contrle, on rajoute galement en ligne le groupe de proprits, source de la dpendance fonctionnelle (DFPGC).

* Exemple de matrice des dpendances fonctionnelles.

La dmarche est la suivante :

1- Pour remplir la matrice, il faut d'abord crire les N lignes correspondant aux N proprits dcrites dans le dictionnaire des donnes.

2- Ensuite, on procde par colonne. Chaque proprit est envisage systmatiquement en tant que source potentielle de D.F. On note alors, dans la colonne, un 1 sur chaque ligne pour laquelle la donne est but de dpendance fonctionnelle. Toutes les dpendances fonctionnelles partie gauche simple sont ainsi mises en vidence.

3- Certaines donnes peuvent alors apparatre comme n'tant, provisoirement, le but d'aucune dpendance fonctionnelle dj recense.

Il faut alors vrifier si elles ne sont pas le but d'une dpendance fonctionnelle partie gauche compose. Si oui, on ajoute une colonne supplmentaire o l'on fait apparatre la nouvelle source. On note l'en-tte de colonne avec l'ensemble des numros des rubriques sources. On rpte cet ensemble en ligne de la matrice.

Graphe des dpendances fonctionnelles.

* Principe.

Les dpendances fonctionnelles entre les diffrentes rubriques sont dcrites par une flche allant de la donne source vers chaque donne but.

La racine du graphe est constitue par la proprit qui n'est but d'aucune dpendance fonctionnelle.

CONCLUSION : Graphe et matrice des dpendances fonctionnelles constituent deux modes de reprsentation complmentaire.

Dmarche de structuration des donnesLa structuration des donnes du dictionnaire des donnes s'effectue en 5 tapes :

1. Dtermination de la liste des DF simples

2. Prise en compte des attributs non classs dans l'tape 1 et dtermination des DF composes

3. Elimination des transitivits du schma des DF

4. Construction, partir des DF simples, des entits de la base de donnes

5. Construction, partir des DF composes, des associations de la base de donnes

Polysme : Mot ou expression qui a plusieurs sens (ex : Griffe : pour un animal ou pour un couturier).

DCG1 Page n2