FACULTE DES SCIENCES ET SCIENCES APPLIQUES …

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE LARBI BEN MHIDI

OUM EL BOUAGHI

FACULTE DES SCIENCES ET SCIENCES APPLIQUES

DEPARTEMENT GENIE ELECTRIQUE

MÉMOIRE DE FIN D'ETUDE

EN VUE DE L'OBTENTION DU DIPLOME DE

MASTER 02 EN INFORMATIQUE INDUSTRIELLE

Thème

REALISE PAR :

@ Dreibine Mahieddine.

ENCADRE PAR:

@ Mr Mendaci Khaled.

Promotion -2013/2014-

Remerciements

De prime à bord, je tiens à exprimer nos gratitudes et présenter

nos chaleureux remerciements à :

• Notre Dieu Tout Puissant pour nous avoir donné la force, la santé et la résistance pour persévérer dans nos études.

• Mr Khaled Mendaci mon encadreur, qui n’a pas cessé de me prodiguer ses conseils et qui a épargné un grand effort pour contribuer à la réussite de mon travail.

• A tout mes enseignants de l’université Larbi Ben M’hidi d’Oum El Bouaghi (Pôle universitaire d’Ain El Beida).

• Notre Institut qui nous a donné l'occasion d'acquérir une spécialisationexceptionnelle.

Toute personne ayant contribué de près ou de loin à l’élaboration de ce modeste travail.

Dédicace

Je dédie cet humble travail à mes parents

et à toute ma famille ainsi qu’à tous les

enseignants et mes collègues de la faculté SSA

(Pôle universitaire d’Ain El Beida).

i

Table des matières

Liste des figures ........................................................................................................................... iii

Notation......................................................................................................................................... v

Introduction générale .................................................................................................................... 2

CHAPITRE I Généralités sur le diagnostic

I.1 Introduction ............................................................................................................................. 4

I.2 Formulation du problème ........................................................................................................ 4

I.3 Terminologie et définitions ..................................................................................................... 5

I.4 Les différents types de défaut .................................................................................................. 7

I.5 Classification des défauts ........................................................................................................ 7

I.5.1 Emplacement ................................................................................................................. 7

I.5.2 Modélisation .................................................................................................................. 8

I.5.3 Caractéristiques temporelles .......................................................................................... 9

I.6 Surveillance et diagnostic ........................................................................................................ 9

I.7 Diagnostic .............................................................................................................................. 10

I.7.1 Détection de défaut ..................................................................................................... 10

I.7.2 Localisation de défaut ......................................................................................................... 11

I.7.3 Identification de défaut ....................................................................................................... 11

I.7.4 Prise de décision ......................................................................................................... 11

I.8 Critères de performance d'un système de diagnostic ............................................................. 11

I.9 Différentes méthodes de diagnostic ....................................................................................... 11

I.9.1 Méthodes externes, ou méthodes « sans modèle »........................................................... 12

I.9.2 Méthodes internes, ou méthodes « avec modèle » ........................................................... 13

I.10 Conclusion ........................................................................................................................... 18

CHAPITRE II Analyse en Composantes Principales

II.1 Introduction .......................................................................................................................... 20

II.2 Principe de l’analyse en composantes principales ............................................................... 21

II.3 Identification du modèle ACP .............................................................................................. 23

II.3.1 Estimation des paramètres du modèle .............................................................................. 23

II.3.2 Détermination de la structure du modèle ......................................................................... 23

II.4 Les exemples de simulation ................................................................................................. 25

II.4.1 Exemple (II.1) ............................................................................................................ 25

II.4.2 Exemple (II.2) ............................................................................................................ 27

II.5 Conclusion ............................................................................................................................ 31

ii

CHAPITRE III Analyse en Composantes Principales non Linéaires

III.1 Introduction ......................................................................................................................... 33

III.2 Modélisation par ACPNL ................................................................................................... 34

III.2.1 Modèle ACPNL basé sur la transformation non linéaire ............................................. 34

III.2.2 Approximation linéaire définie par morceaux ............................................................... 34

III.2.3 Modèle ACPNL basé sur les réseaux de neurones artificiels ...................................... 35

III.3 Approche neuronale de l’ACPNL ....................................................................................... 35

III.4 Exemple de simulation ........................................................................................................ 37

III.4.1 Exemple (III.1) .......................................................................................................... 37

III.5 Conclusion .......................................................................................................................... 39

CHAPITRE IV Détection et localisation de défauts par Analyse en Composantes Principales

IV.1 Introduction......................................................................................................................... 41

IV.2 Détection de défauts par ACP............................................................................................. 41

IV.2.1 Génération de résidus par estimation d’état ................................................................... 41

IV.3 Les exemples de simulation ................................................................................................ 43

IV.3.1 Exemple (IV.1) ......................................................................................................... 43

IV.3.2 Exemple (IV.2) ......................................................................................................... 44

IV.4 Localisation de défauts par ACP ........................................................................................ 45

IV.4.1 Localisation par calcul des contributions ....................................................................... 45

IV.5 Conclusion .......................................................................................................................... 46

CHAPITRE V Application pour diagnostic avec ACP

V. Introduction ............................................................................................................................ 48

V.1 Application ........................................................................................................................... 50

Conclusion générale .................................................................................................................... 54

Liste des figures

iii

Liste des figures

Fig I.1: Principe du diagnostic des systèmes commandés. ............................................................. 5

Fig I.2: La cause principale d’une panne. ....................................................................................... 6

Fig I.3: Défauts d’un système industriel. ........................................................................................ 8

Fig I.4: les défauts selon leur représentation ................................................................................... 8

Fig I.5: Répartition des défauts selon le comportement temporel ................................................... 9

Fig I.6: Modules d’une procédure de surveillance. ......................................................................... 9

Fig I.7: Les différentes étapes des diagnostiques industriels ........................................................ 10

Fig I.8: Schéma représentant la redondance matérielle ................................................................. 12

Fig I.9: Les étapes de diagnostic à base de modèles ..................................................................... 14

Fig I.10: La génération de résidus. ................................................................................................ 16

Fig I.11: Estimation de paramètres. .............................................................................................. 17

Fig I.12: Approche de l’espace de parité dans un format entrée-sortie. ........................................ 18

Fig I.13: schéma fonctionnel d’un observateur générateur de résidu. .......................................... 18

Fig II.1 : Estimation de données par la première CP. ................................................................... 27

Fig II.2 : Sélection du nombre de CPs à retenir. ........................................................................... 27

Fig.II.3 : Evolution des variables x1, x5 et x7 ............................................................................... 28

Fig II.4: Evolution des composantes principales. ......................................................................... 29

Fig II.5: Pourcentage de la variance totale. ................................................................................... 30

Fig II.6: Erreur de validation. ........................................................................................................ 30

Fig II.7: La moyenne des valeurs propres. .................................................................................... 30

Fig II.8 : validation du modèle de huit variables........................................................................... 31

Fig II.9 : validation du modèle «la variable x1». .......................................................................... 31

Fig III.1 : Transformation linéaire. ................................................................................................ 33

Fig III.2 : Transformation non linéaire. ......................................................................................... 33

Fig III.3 : Principe du modèle ACP. .............................................................................................. 33

Fig III.4 : Réseau à cinq couches pour l’extraction d’une seule composante principale non linéaire ...... 36

Liste des figures

iv

Fig III.5 : Estimation linéaire et non linéaire par la première CP. ................................................ 38

Fig III.6: Pourcentage de la variance totale. .................................................................................. 39

Fig IV.1 : Evolution de l’erreur quadratique de prédiction ACP et ACPNL. ............................... 44

Fig IV.2 : Evolution ACP et ACPNL de l’SPE filtré. ................................................................... 44

Fig IV.3 : Localisation par la méthode de contribution ACP et ACPNL. ..................................... 45

Fig V.1 : Processus traditionnel de traitement de l'eau potable .................................................... 48

Fig V.2 : Evolution des variables eau brute. ................................................................................. 50

Fig V.3 : Pourcentage de la variance totale. .................................................................................. 50

Fig V.4 : Erreur de validation. ....................................................................................................... 50

Fig V.5 : La statistique SPE et SPE filtré de l’ACP linéaire. ........................................................ 51

Fig V.6 : Contribution des variables ACP. .................................................................................... 51

Fig V.7 : La statistique SPE et SPE filtré de l’ACP non linéaire .................................................. 51

Fig V.8 : Contribution des variables ACPNL. .............................................................................. 52

Notation

v

Notation

´ÎÂN mX Matrice de données représentant le fonctionnement normal du système.

X Estimation de X par le modèle ACP.

C Matrice représente le modèle ACP.

´SÎÂm m

Matrice de covariance de X.

N Nombre d’echantillons mesurées.

m Nombre de variables à surveiller.

Nombre de composantes retenues dans le modèle ACP (dimension de

l’espace réduit).

k Indice du temps.

2js Variance de la jeme variable.

ÎÂmx Nouveau vecteur de mesure.

x Estimation du vecteur x par le modèle ACP.

ÎÂmix Nouveau vecteur de mesure dont la ième composante est reconstruit.

ix La ième composante du vecteur x.

x Vecteur moyen de x.

( ) 1-ÎÂi mx Le vecteur x sans la ième composante.

´ÎÂm mP Matrice des vecteurs propres de

ˆ ´ÎÂmP Matrice des premiers vecteurs propres de

( )´ -ÎÂ ( )( )´ -( )ÎÂm mP Matrice des -m derniers vecteurs propres de

n mt ´ÎÂ Matrice des composants principale.

t Vecteurs des premières composantes principales.

t Vecteur des -m dernières composantes principales.

li ième valeur propre de

ip ième vecteur propre de correspondant à li

e Espérance mathématique.

iz Valeur reconstruite de la mesure ix .

ri Variance de l’erreur de reconstruction de la ième variable.

xi ieme ligne d’une matrice unitaire (direction de défauts).

ie Erreur d’estimation sur la ième variable.

e Vecteur des erreurs d’estimation.

e Vecteur d’erreur filtré.

b Facteur d’oubli pour le filtrage des résidus.

L Matrice diagonale des vecteurs propres.

Notation

vi

2d Seuil de confiance de l’indicateur SPE.

2( )j kh Indice de validité des capteurs.

ACP Analyse en Composantes Principales.

CPs Composantes Principales.

PCV Pourcentage Cumulé de la Variance.

PRESS Validation croisée.

MLP Multi-Layer Perceptron.

SPE Critère de l’Erreur quadratique de prédiction.

EWMA Exponentially Weighted Moving Average.

ACPNL Analyse en Composantes Principales Non Linéaire.

Introduction générale

2

Introduction générale

En réponse aux besoins de l’industrie, beaucoup d’effort est fourni pour trouver des

nouveaux outils technologiques pour la surveillance et le contrôle des procédés, parmi lesquels

on citera les techniques basées sur les statistiques SPC (Statistical Process Control). Parmi les

développements particuliers dans ce domaine, on citera les progrès réalisés dans les méthodes

statistiques multi variées pour la surveillance des systèmes (Multivariate Statistical Process

Monitoring Techniques), qui sont devenues de plus en plus des techniques populaires utilisées

pour l’étude des ensembles de données compliqués, en fournissant une analyse lorsqu’il y a

plusieurs variables dépendants et/ou indépendants, tous avec des degrés de corrélation différents

de un à un.

Par ailleurs les procédures de control uni-variées sont très utilisées en industries mais elles

sont inadéquates lorsqu’elles sont utilisées pour contrôler des processus qui sont de nature multi

variées.

Les méthodes statistiques multi variées pour le control des systèmes MSPC (Multivariate

Statistical Process Control) sont utilisées avec grand succès, principalement dû à l’adoption des

techniques d’analyses puissantes comme l’analyse en composante principale PCA, qui ne

nécessite pas des connaissances préalables sur les mécanismes des processus.

Le travail présenté dans ce mémoire consiste à présenter la problématique du diagnostic

des systèmes, l’étude de l’Analyse en Composante Principale dans ses deux versions linéaire et

non-linéaire et l’application des techniques étudiés sur des systèmes pour la détection et la

localisation de défauts.

Le premier chapitre la formulation du problème de diagnostic des systèmes est présenté

avec les différentes techniques utilisées dans ce domaine.

Le deuxième chapitre présente l’analyse en composante principale ACP dans sa version

linéaire avec l’aspect théorique et des exemples.

Le chapitre trois présente l’analyse en composante principale dans sa version non linéaires

ACPNL avec l’aspect théorique en particuliers celle basé sur un réseau de neurone auto

associatif avec étranglement et des exemples sont présentés.

Le quatrième chapitre, l’utilisation de l’ACP dans ces deux versions dans la détection et la

localisation des défauts est traitée.

Le cinquième chapitre nous avons tenté d’appliquer les approches présentées sur un

procédé réel de traitement des eaux potables. A la fin une conclusion est inscrite avec des

perspectives.

Chapitre I Généralités sur le diagnostic

4

Sommaire

I.1. Introduction ....................................................................................................................................... 4

I.2. Formulation du problème ................................................................................................................. 4

I.3. Terminologie et définitions ............................................................................................................... 5

I.4. Les différents types de défaut ........................................................................................................... 7

I.5. Classification des défauts .................................................................................................................. 7

I.6. Surveillance et diagnostic ................................................................................................................. 9

I.7. Diagnostic ......................................................................................................................................... 10

I.8. Critères de performance d'un système de diagnostic ................................................................... 11

I.9. Différentes méthodes de diagnostic ............................................................................................... 11

I.10. Conclusion ...................................................................................................................................... 18

I.1. Introduction

En raison d’une modernisation incessante des outils de production, les systèmes industriels

deviennent de plus en plus complexes. En parallèle, la fiabilité, disponibilité, sûreté de

fonctionnement sans oublier la protection de l’environnement sont devenue vraiment des

nécessaires pour les entreprises actuelles, et ça justifie la nécessité de la mise en œuvre des

systèmes de diagnostic qui sont apparus et développés dans le but d’améliorer les points

précédents.

Dans ce contexte, de nombreuses approches sont développées, en vue de la détection de

défaillances et du diagnostic, par les différentes communautés de recherche en automatique. Les

méthodes se différencient par rapport au type de connaissance a priori sur le processus qu’elles

nécessitent. Ainsi, elles peuvent être classées, de façon générale, comme des méthodes :

relationnelles, à base de modèles et des méthodes à base de données historiques [1]. Nous

présentons dans ce chapitre tous les concepts de base utilisés le diagnostic à savoir la

surveillance, la défaillance..., et les relations entre ces concepts, avec une classification des

techniques de diagnostic selon la nature de la connaissance disponible sur le système à surveiller.

I.2. Formulation du problème

Le problème de la conception des algorithmes de diagnostic peut se formuler comme suit :

en utilisant les données disponibles (en ligne ou hors ligne), et la connaissance que l'on a du

système, il s'agit de produire des décisions les meilleurs possibles relatives à l'état de santé du

système. Les données disponibles sont les valeurs des variables mesurées (signaux) et des


5

Détection des défaut

Localisation et identification des

défaut

Décision et proposition d’actions

Processus CapteurContrôleur

PerturbationDéfauts

EntréesAcquisition

Mesures

Modèle de

diagnostique

paramètres connus du système (sorties, valeurs des consignes mesurées, entrées calculées,

paramètres nominaux).

Fig I.1: Principe du diagnostic des systèmes commandés.

Un processus industriel est constitué d’un système réglé par un contrôleur dans le but

d’améliorer ses performances. Dans ce cas, les variables connues sont les sorties du contrôleur et

les mesures des sorties fournies par les capteurs. (La figure I.1) illustre la synthèse du module de

diagnostic due à la présence non seulement des défauts mais aussi des perturbations, en présence

d’un contrôleur. Ces deux paramètres non contrôlées et généralement non mesurables affectent

l’évolution du système et dégradent ses performances.

I.3. Terminologie et définitions

Avant d’aller plus loin, il convient de définir ce qu’est un défaut, une défaillance, une

panne, un état de fonctionnement normal,…, les principaux termes utilisés en diagnostic des

systèmes.

I.3.1. Fonctionnement normal d’un système

Un système est dit dans un état de fonctionnement normal lorsque les variables

caractérisant (variables d’état, variables de sortie, variables d’entrée, paramètres du système)

demeurent au voisinage de leurs valeurs nominales. Le système est dit défaillant dans le cas

contraire [2].

I.3.2. Défaut (Fault )

Le concept de défaut est fondamental dans les opérations de surveillance pour la conduite

et la maintenance des procédés industriels. On appelle défaut tout écart entre la caractéristique


6

Défaut Défaillance Panne

observée sur le dispositif et la caractéristique théorique. Cet écart est statistiquement nul en

l’absence de défaut. Les défauts peuvent apparaître au niveau des capteurs, des actionneurs ou

au niveau du processus lui-même [2].

I.3.3. Défaillance (Failure)

Une défaillance est l’altération ou la cessation de l’aptitude d’un ensemble à accomplir sa

ou ses fonctions requises avec les performances définies dans les spécifications techniques. Une

défaillance est un dysfonctionnement du système, le processus présente alors un fonctionnement

inacceptable du point de vue performance. Il est clair qu’une défaillance implique l’apparition

d’un défaut puisqu’il existe un écart entre la caractéristique mesurée et la caractéristique

théorique. Par contre, un défaut n’implique pas nécessairement une défaillance puisque le

diapositif peut très bien continuer à assurer sa fonction principale [2].

I.3.4. Panne (Break-down)

Une panne est l’inaptitude d’un dispositif à accomplir une fonction requise. Une panne

résulte toujours d’une défaillance et donc d’un défaut :

Fig I.2: La cause principale d’une panne.

Dans le cadre de la maintenance préventive conditionnelle, il est clair que le diagnostic

doit permettre de détecter et de localiser un défaut avant que celui-ci ne conduise à une

défaillance ou à une panne qui entrainerait l’arrêt du système [2].

I.3.5. Perturbation (Disturbance)

Entrée du système physique qui n’est pas une commande. Autrement dit, c’est une entrée

non contrôlée [3].

I.3.6. Résidu (Residual)

Un indicateur de défauts basé sur la différence entre les mesures théoriques estimées [1].

I.3.7. Symptôme analytique (Analytical Symptom)

Un changement dans les caractéristiques nominales d’une quantité observable provoqué

par un défaut [1].


7

I.4. Les différents types de défaut

Les défauts affectant un système, sont classés selon leur emplacement, leur modélisation,

leurs caractéristiques temporelles .Les défauts peuvent être purement ou progressifs dans le cas

du vieillissement ou de l'usure (défauts évolutifs) et classés par ordre de gravité.

I.4.1. Défaut déclaré

Un défaut déclaré apparaît de façon spontanée et se manifeste souvent par un biais pouvant

avoir diverses origines comme une panne de capteur ou d'actionneur. Dans ce cas l'organe en

question ne répond plus aux excitations du phénomène physique auquel il est soumis. Ceci peut

être dû à un encrassement, ou à un état détérioré d'un composant du système.

I.4.2. Défaut naissant

Un défaut naissant apparaît de manière progressive et d’amplitude croissante. Il se présente

sous la forme de dérives souvent dues au vieillissement ou à l'usure.

I.4.3. Défaut ponctuel

Un défaut ponctuel ou passager se caractérise par une durée brève et un écart significatif

par rapport à la moyenne locale.

I.4.4. Panne catastrophique

Une panne catastrophique entraîne un arrêt du système.

I.5. Classification des défauts

Les défauts affectent un système, ils sont classés selon leur emplacement, leur

modélisation, leurs caractéristiques temporelles.

I.5.1. Emplacement

Les défauts sont des événements qui apparaissent à différents endroits du système. Dans la

littérature, les défauts sont classés en fonction de leur localisation, d’où on peut distinguer :

a) Les défauts actionneurs

Les défauts actionneurs qui agissent au niveau de la partie opérative et détériorent le signal

d’entrée du système. Ils représentent une perte totale (défaillance) ou partielle d’un actionneur

agissant sur le système. Les défauts actionneurs partiels sont des actions qui réagissent de

manière similaire au régime nominal mais en partie seulement, c’est-à-dire avec une certaine


8

Défaut internes

(sur composant du processus)

Défaut

Actionneurs

Défaut

Capteur

Actionneurs Capteurs

Entrées inconnues (perturbation, bruit de mesure …)

Processus

dégradation dans leur action sur le système (perte de puissance d’un moteur, fuite dans un

vérin,...).

b) Les défauts capteurs

Les défauts capteurs ce sont la cause d’une mauvaise image de l’état physique du système.

Un défaut capteur partiel produit un signal avec plus ou moins d’adéquation avec la valeur vraie

de la variable à mesurer. Ceci peut se traduire par une réduction de la valeur affichée par rapport

à la valeur vraie, ou de la présence d’un biais ou de bruit accru empêchant une bonne lecture. Un

défaut capteur total produit une valeur qui n’est pas en rapport avec la grandeur à mesurer.

Fig I.3: Défauts d’un système industriel.

c) Les défauts composants ou systèmes

Les défauts composants ou processus ils proviennent du processus lui-même; bien souvent

les défauts n’appartenant pas à un défaut capteur ou actionneur sont classés de manière arbitraire

dans cette catégorie. Mais, un défaut composant résulte de la casse ou de l’altération d’un

composant du système réduisant les capacités de celui-ci à effectuer une tâche. En pratique, ceci

revient à considérer une modification des caractéristiques du système proprement (problème

mécanique).

I.5.2. Modélisation

En plus, suivant la manière dont les défauts sont modélisés, ils sont classés en additif et

multiplicatif, comme représenté sur (La figure I.4).

Défaut additif Défaut multiplicatif

Fig.I.4: les défauts selon leur représentation.


9

Module d'acquisition

de données

Module de perception

ou générateur

Module de détection

de défauts

Module de localisation

de défauts

Module de prise de

décision

Module d'identification

de défauts

I.5.3. Caractéristiques temporelles

Les défauts sont classés également selon leurs caractéristiques temporelles (La figure I.5)

comme brusque, progressif et intermittent. Les défauts brusques (biais) se produisent

instantanément souvent à cause de dommages matériels. Habituellement ils sont très graves car

ils affectent les performances et/ou la stabilité du système commandé. Les défauts progressifs

(dérives) représentent les changements lents des valeurs mesurées. Souvent dus au

vieillissement, Ils sont plus difficiles à détecter en raison de leur dynamique lente, mais sont

également moins graves. Les défauts intermittents (valeurs aberrantes) sont des défauts qui

apparaissent et disparaissent à plusieurs reprises, par exemple à cause d'un câblage partiellement

endommagé.

Biais Dérive Valeur aberrante

Fig I.5: Répartition des défauts selon le comportement temporel.

I.6. Surveillance et diagnostic

Des anomalies peuvent être dues à une dégradation d’une partie de l’installation qui se

traduit par la présence d’un défaut ou d’une défaillance (une panne dans un cas extrême) ou à

une réaction peu habituelle du système physique (soumis par exemple à une perturbation). Le

module de diagnostic doit donc permettre dans un premier temps de vérifier s’il s’agit d’une

réaction normale ou d’un défaut. Ensuite, de manière simple, il a pour objectif de déterminer les

composants en défaut au sein du système physique.

Le diagnostic s’inscrit en réalité dans une procédure plus complète désignée sous le nom

de surveillance, nécessitant la mise en œuvre des différents modules présentés dans

l’organigramme de (La figure I.6) [4,5]. De plus, il s’effectue en réalisant trois tâches bien

distinctes : la détection, la localisation et l’identification des défauts.

Fig I.6: Modules d’une procédure de surveillance.


10

Détection

Identification de la cause

Localisation

Arrêt du

processus et

maintenance

Continuation en

mode dégradé et

en surveillance

Continuation

normale

Mesures et

observation

f =0

f ≤ ε

Entrées

Non

Oui

Non

Processus industriel

Oui

I.7. Diagnostic

Un diagnostic est l’identification de la (ou des) cause (s) probables d’un(ou des) défaut(s)

survenue(s) ou encourue(s) dans un système à l’aide d’un raisonnement logique fondé sur des

observations recueillies sur ce même système par inspection, par contrôle où par tests,

[AFNOR].

La structure générale d’une procédure de diagnostic et ses étapes est représentée sur (La

figure I.7) où le module de diagnostic est alimenté par toutes les informations disponibles sur le

système. Ces informations incluent les mesures des variables et toute autre information pouvant

être utile pour le diagnostic. Le module de diagnostic traite les observations et produit une liste

de défauts possibles pouvant affecter le système au cours du temps.

Il aide donc à surveiller un procédé complexe et par conséquent à prendre une décision

pour effectuer une reprise de la commande si possible.

Fig I.7: Les différentes étapes des diagnostiques industriels.

(f : défaut, ε : seuil défaut)

I.7.1. Détection de défaut

Premier niveau du diagnostic consiste à prendre une décision binaire : soit le système

fonctionne correctement, soit un défaut s'est produit. Le résultat de la procédure de détection est

une alarme signifiant que le fonctionnement réel du système ne concorde plus avec le modèle de

fonctionnement sain [6].


11

I.7.2. Localisation de défaut

Deuxième niveau du diagnostic, déclenché par une procédure de détection, consistant à

déterminer de manière plus approfondie les composants défaillants : capteur, actionneur,

processus ou unité de commande [7].

I.7.3. Identification de défaut

L'identification d'un défaut est le fait d'estimer l'amplitude et l'évolution temporelle du

défaut afin d'expliquer au mieux le comportement du système. Cette partie d'identification du

défaut est la dernière phase de la procédure de diagnostic [8].

I.7.4. Prise de décision

Une fois le fonctionnement incorrect du système constaté, il est primordial d'agir de façon

à maintenir les performances souhaitées ou à limiter les dégradations sur le système réel. Cette

prise de décision permet de choisir entre plusieurs options comme arrêter le système pour faire

de la maintenance ou accepter un fonctionnement dégradé. Il peut encore s'agir, quand cela est

possible, de reconfigurer ou de réorganiser le système. Le rôle de la reconfiguration est de

s'affranchir des conséquences du défaut pour conserver les performances initiales lorsque cela est

possible ou encore d'assurer un fonctionnement dégradé du système si celui-ci est tolérable par

exemple en utilisant une redondance software ou hardware.

I.8. Critères de performance d'un système de diagnostic

Quelque auteurs dans la littérature ont résumé les critères que doit garantir une méthode de

diagnostic dans les points suivantes [6]:

þ Le diagnostic doit être facile à implémenter,

þ Le nombre de capteurs nécessaire pour le diagnostic doit être minimal,

þ Le diagnostic doit être prédictif,

þ Le diagnostic doit être réalisable en temps réel,

þ Le diagnostic doit être concevable algorithmiquement.

I.9. Différentes méthodes de diagnostic

Dans ce paragraphe, on présente différentes méthodes utilisées en diagnostic de systèmes

physiques, le domaine était très vaste, des choix arbitraires ont été faits. Le but n’est donc pas de

faire une synthèse exhaustive de l’existant, mais de montrer la richesse des possibilités qui

s’offrent au concepteur de système de diagnostic. En effet, différents types d’algorithmes de

détection dédies aux systèmes physiques ont été conçus par les chercheurs.


12

Capteur 1

Capteur 2

X(t) Mésure 1

Mésure 2

I.9.1. Méthodes externes, ou méthodes « sans modèle »

Le diagnostic sans modèle, nommé par fois diagnostic externe. Ces méthodes ont été

développées pour pouvoir étudier efficacement la dynamique d’un système pour lequel le

modèle mathématique est difficile à établir voir même inexistant.

Ä Vérification de seuils atteint

Les mesures sont comparées à des seuils critiques définis par avance. Le fait de dépasser

cette limite présente des dangers quant à l'utilisation du processus ; le système est mis en défaut.

Ä Mise en place de capteurs dédiés

Ces capteurs peuvent être soit des détecteurs vérifiant de manière simple si les valeurs

critiques sont atteintes ou non (par exemple, température limite ou pression).

Ä La redondance matérielle

La redondance matérielle consiste en la mise en place d'une série de capteurs mesurant la

même grandeur physique sur un même organe du système. Les comparaisons par différence des

mesures des capteurs deux à deux forment alors les résidus. Si un des capteurs est défaillant, il

est alors détecté et isolé facilement [9].

Fig. I.8: Schéma représentant la redondance matérielle.

Ä Les systèmes experts

L'approche par systèmes experts est différente des méthodes précédentes, dans le sens où

elle vise à évaluer les symptômes obtenus par la détection matérielle ou logicielle. Le système

expert se compose habituellement d'une combinaison de règles logiques du genre :


13

Ä L'analyse en composantes principales – ACP

L'analyse en composantes principales (ACP) est une technique descriptive permettant

d'étudier les relations qui existent entre les variables, sans tenir compte, a priori, d’un quelconque

modèle. Le but de l’ACP est d'identifier la structure de dépendance entre des observations multi-

variables afin d'obtenir une description ou une représentation compacte de ces dernières.

L'analyse en composante principale peut être vue comme une technique de projection

orthogonale linéaire qui projette les observations multidimensionnelles représentées dans un

espace de dimension m (m est le nombre de variables observées) dans un sous-espace de

dimension inférieure l < m en maximisant la variance des projections. Le calcul de distances par

rapport à ces axes sert d'outil de détection de valeurs aberrantes. Dans ce sens, l'ACP peut être

considérée comme une technique de minimisation de l'erreur quadratique d'estimation.

I.9.2. Méthodes internes, ou méthodes « avec modèle »

Les méthodes internes nécessitent une connaissance approfondis du système étudié, afin de

le représenter analytiquement [10] sous forme d’un modèle quantitatif et/ou qualitatif (modèle de

connaissance).

Les modèles de représentation «les modèles de comportement » ou modèles qualitatif

décrivent le comportement global du système, c’est-à-dire la relation entre ses entrées et ses

sorties. Les paramètres de ces modèles ont généralement peu de sens physique, ils sont donc

difficiles à interpréter pour le diagnostic. Mais ils ont l’avantage d’être assez simples à mettre en

œuvre, et surtout, ils permettent de modéliser des systèmes très complexes, même si tous les

processus internes ne sont pas connus de façon détaillée.

Ä Redondance analytique

Les méthodes analytiques qui font appel à une connaissance du système constitué par la

formulation explicite d’un modèle analytique du système. Dans ce cas, on compare le

comportement réel du processus (caractérisé par les données prélevées) au comportement

théorique fourni par le modèle analytique.

L’architecture générale du système de diagnostic à base de redondance analytique pour la

détection et la localisation de défaillances de capteurs, sachant qu’on ne s’intéresse qu’à des

défaillances d’instrumentation (capteurs ou actionneurs).

Premièrement, on compare les observations avec les connaissances sur le comportement

normal du système contenues dans un modèle afin de vérifier leur cohérence. Le résultat de cette

comparaison est contenu dans un ensemble de signaux appelés "signaux indicateurs de défauts"

ou résidus. La phase de génération de ces signaux indicateurs (résidus) de défauts joue donc un


14

Procédé

Modèle

Génération

de résidus

Evaluation

des résidus

Localisation

des défauts

Détection Localisation et Identification

Résidud sRésidus Défaff utDéfaut Amplitut de

des défaff uts

Amplitude

des défauts

rôle primordial dans toute procédure de diagnostic puisque conditionne la qualité du système de

surveillance.

I.9.2.1. Modèle

Un modèle est une représentation formalisée d’un phénomène.

Une fois le modèle mis au point, une phase de validation expérimentale est nécessaire

avant de l’exploiter. Le diagnostic consiste ensuite à comparer un certain nombre de valeurs

numériques issues du modèle, à des données mesurées sur le système. Toute différence entre les

observations et les prédictions déduites du modèle sont interprétées comme la présence d’un ou

de plusieurs défauts. Pour cela, une première phase consiste à déterminer les grandeurs sensibles

aux défauts. Ces grandeurs, appelés résidus, sont proches d’une valeur de référence généralement

nulle si le système ne présente pas de défaut, et s’écartent de cette valeur dès qu’un défaut

apparaît.

Une décision est ensuite prise sur la présence ou non d’un défaut, à partir de l’´évaluation

de ces résidus. Si un défaut est détecté, il est ensuite localisé et identifié. On peut noter que seule

une modélisation du comportement « correct » du système est nécessaire pour la détection des

défauts. En revanche, pour la tâche de localisation et d’identification, une connaissance à priori

sur les types des dysfonctionnements pouvant affecter le système est indispensable.

Fig. I.9: Les étapes de diagnostic à base de modèles.

I.9.2.1.1. Modèle d’état ou représentation interne

Une large classe de systèmes à la propriété de pouvoir être décrite par un nombre fini de

grandeurs appelées variables d’état. Ces variables permettent de déterminer les évolutions

futures du système à partir des états initiaux et des grandeurs externes d’entrée. Une

représentation d’état ou modèle d’état est un ensemble fini n d’équations différentielles du

premier ordre et p équations algébriques, reliant des grandeurs scalaires, divisées en variables

internes (ou variables d’état) et en variables externes comprenant les grandeurs d’entrée et de

sortie. D’une manière générale, la représentation d'état d'un système est :


15

Ä Modèle non linéaire

L'écriture de la représentation d'état d'un système dynamique non linéaire suppose définis

dans les conditions nominales est donne par:

x( t ) f ( x,u,w )

y( t ) h( x,u,v )

=ìí

=î

x( t ) f ( x (I.1)

Où la variable t représente le temps, nxÎÂ le vecteur d'état,

muÎÂ le vecteur de commande,

pyÎÂ le vecteur de mesure, nwÎÂ et

pvÎÂ les vecteurs de bruits d'état et de mesure

respectivement, f et h sont les fonctions non-linéaires correspondant respectivement à l'équation

dynamique de l'état et à l'équation de mesures.

Ä Modèle linéaire

La représentation d'état des systèmes dynamique linéaires qui sont supposés défini dans les

conditions nominales est de la forme:

f ( x,u,w ) Ax( t ) Bu( t ) w( t )

h( x,u,v ) Cx( t ) Du( t ) v( t )

= + +ìí

= + +î (I.2)

Avec t, x, u, y, w et v définis comme pour le système (I.1), et où nAÎÂ désigne la matrice d'état

ou d’évolution, n mB ´ÎÂ est la matrice de commande,

p nC ´ÎÂ est la matrice de sortie ou de

mesures et p mD ´ÎÂ est la matrice de transmission directe des commandes sur les sorties.

I.9.2.2. Procédure de diagnostic à base de modèle

Le diagnostic à base de modèle est largement interprété dans la littérature. Il faut intervenir

les trois principes de base que sont la génération de résidus, la détection et la localisation.

La structure générale de la plupart des méthodes utilisant des modèles mathématiques se

fonde sur l'idée de la redondance analytique. Contrairement à la redondance physique ou

matérielle, où les mesures de différents capteurs sont comparées, les mesures issues des capteurs

sont comparées aux valeurs des variables respectives obtenues de manière analytique.

De tels calculs utilisent les mesures à l'instant courant t et/ou passées et le modèle

mathématique. L'idée peut être étendue à la comparaison de quantités calculées uniquement de

manière analytique, chacune étant obtenue par un calcul différent. Dans les deux cas, les

différences résultantes sont appelées des résidus.

I.9.2.2.1. Génération de résidus

La première étape d'un système de surveillance à base de modèle consiste à générer des

indicateurs de défauts. Ils contiennent des informations sur les anomalies ou dysfonctionnements


16

Systeme

Génération de

signale indicateurs

Détection et

Localisation/Identification

SortiesEntrées

Diagnostic

Stratégie de

décisionModèle

du système à surveiller. Le principe est de mesurer l'écart entre les mesures des signaux du

procédé, et la valeur théorique fournie par le modèle dans des conditions de fonctionnement

nominal. La génération de résidus est un problème crucial pour les systèmes de diagnostic.

Un résidu est un signal indicateur de défauts. Il reflète la cohérence des données mesurées

vis-à-vis le modèle comportemental du système [11]. Il est défini par une relation de consistance

ou un filtre qui relie les entrées et les sorties du processus (La figure I.10).

Fig. I.10: La génération de résidus.

Le résidu est un vecteur dont la dimension dépend à la fois de la méthode utilisée pour sa

génération et du système étudié. En pratique, on génère des résidus ayant une moyenne nulle en

fonctionnement normal et différents de zéro en fonctionnement défaillant.

nidddfr pi ,...,2,1),...,,( 21 ==

D’une façon plus générale, on cherche toujours à calculer un vecteur de résidus ( )r t ayant

les propriétés suivantes:

ý ( ) 0r t = quand ( ) 0f t = , état normal.

ý ( ) 0r t ¹ quand ( ) 0f t ¹ , la détection du défaut (f : entrée défaut).

ý ( ) 0ir t ¹ et ( ) 0jr t = pour i j¹ quand ( ) 0if t ¹ et ( ) 0jf t = , la localisation du défaut ( )if t .

I.9.2.2.2 Evaluation des résidus (génération de fonctions de décision)

Le rôle de cette étape est de détecter et d'isoler les défauts. On peut noter que dans nombre

d'algorithmes, l'étape de détection de défauts est implicite dans l'étape d'isolation, alors que dans

d'autres, ces fonctions sont réalisées séquentiellement. Il s'agit en fait d'analyser les résidus

précédemment formés de manière à établir le diagnostic, c'est-à-dire à détecter et à isoler le

défaut. Les fonctions de décision ainsi générées utilisent la logique binaire (absence ou présence

de défaut).

Dans le cas des résidus structurés, les tests d'hypothèses (par exemple, tester le résidu par

rapport à un seuil de détection) peuvent être réalisés sur chaque résidu pris séparément. Le

résultat est une valeur booléenne, qui selon les hypothèses choisies pourra, par exemple, être


17

Procédé

Estimation des

paramètres

Calcul des

paramètresDécision

PerturbationsDéfaut

u y

Diagnostic

égale à "1" si le test est vérifié et à "0" sinon. La combinaison des différents tests permet la

définition d'un code ou signature expérimentale du défaut.

Ainsi dans le cas des résidus structurés, on obtient les tables de codage ( ou des signatures

théoriques) suivantes ("1" : résidu sensible au défaut ; "0" : résidu insensible au défaut) :

Résidus Défaut Résidus Défaut

d1 d2 d3 d1 d2 d3

r1 0 1 1 r1 1 0 0

r2 1 0 1 r2 0 1 0

r3 1 1 0 r3 0 0 1

Table.I.1. Résidus généralisés Table.I.2. Résidus dédiés

Une condition minimale pour l'isolation des défauts est que tous les codes soient distincts.

Alors, on parlera d'isolation faible.

La localisation des défauts est basée sur la comparaison, à chaque instant, de la signature de

défaut expérimentale avec les différentes signatures théoriques. L’hypothèse de défaut la plus

vraisemblable est désignée par la signature de défaut théorique la plus proche de la signature

expérimentale.

I.9.2.3. Les différentes méthodes de diagnostic à base de modèle

Trois méthodes principales de diagnostic à base de modèle sont utilisées :

A) Estimation paramétrique

L’approche d’estimation paramétrique mesure l’influence des défauts sur les paramètres et

non plus, comme précédemment, sur les variables du système physique. Le principe consiste à

estimer en continu des paramètres du procédé en utilisant les mesures d’entrée/sortie et en

l’évaluation de la distance qui les sépare des valeurs de référence de l’état normal du procédé

(La figure I.11).

Fig.I.11: Estimation de paramètres.


18

Sytème physique

Modèle

Défaut

Entrées

inconnues

MésuresEntrées

Résidus+

-

Système physique

Observateurs

Mésures

Résidus+

-

Entrées

B) Espace de parité

La méthode de l’espace de parité a été une des premières méthodes employées à des fins de

FDI (Fault Detection and Isolation) [12]. Les relations de parité utilisent la redondance directe

au moyen de relations algébriques statistiques liant les différents signaux ou la redondance

temporelle issue de l’utilisation de relations dynamiques. Le terme ‘parité’ a été emprunté au

vocabulaire employé pour les systèmes logiques, cette méthode repose sur le principe de la

vérification de la consistance existante entre les entrées et les sorties du système surveillé (La

figure I.12).

Fig.I.12: Approche de l’espace de parité dans un format entrée-sortie.

C) Observateurs

La génération de résidus à l’aide d’une estimation d’état consiste à reconstruire l’état ou,

plus généralement, la sortie du processus à l’aide d’observateurs et à utiliser l’erreur d’estimation

comme résidu (La figure I.13). Cette méthode s’est beaucoup développée car elle donne lieu à la

conception de génération de résidus flexibles.

Fig.I.13: schéma fonctionnel d’un observateur générateur de résidu.

I.10. Conclusion

Dans ce chapitre, nous avons présenté des généralités sur la procédure de diagnostic qui

permettra de détecter les défauts. Tout d'abord, l’intérêt du diagnostic dans le domaine industriel

a été abordé. En effet, en considérant le diagnostic comme une composition de trois modules: la

détection, la localisation et l’identification. Dès lors, une terminologie appropriée au diagnostic a

été présentée afin de définir et de délimiter chaque terme et chaque notion utilisée dans ce

premier chapitre. Il est ainsi clair que la diversité apparente des méthodes proposées dans la

littérature pour réaliser le diagnostic des systèmes dynamiques présente des points

incontournables.

Chapitre II Analyse en Composantes Principales

20

Sommaire

II.1 Introduction ..................................................................................................................................... 20

II.2 Principe de l’analyse en composantes principales ........................................................................ 21

II.3 Identification du modèle ACP ........................................................................................................ 23

II.4 Les Exemples de simulation ............................................................................................................ 25

II.5 Conclusion ........................................................................................................................................ 31

II.1 Introduction

Dans le domaine du diagnostic, des méthodes basées sur le concept de redondance de

l’information ont été développées. Leur principe repose généralement sur un test de cohérence

entre un comportement observé du processus fourni par des capteurs et un comportement prévu

fourni par une représentation mathématique du processus.

Les méthodes de redondance analytique nécessitent un modèle du système à surveiller. Ce

modèle comprend un certain nombre de paramètres dont les valeurs sont supposées connues lors

du fonctionnement normal.

L’analyse en composantes principales (ACP) est une technique descriptive permettant

d’étudier les relations qui existent entre les variables, sans tenir compte, a priori, d’une

quelconque structure [13]. Le but de l’ACP est d’identifier la structure de dépendance entre des

observations multi-variables afin d’obtenir une description ou une représentation compacte de

ces dernières.

L’ACP permet de générer un modèle du processus basé sur la connaissance issue du

système sans avoir une forme explicite d’un modèle entrées/sorties. Ainsi, elle permet

d’exploiter toutes les relations linéaires qui peuvent exister entre les différentes variables. Dans

ce travail nous allons étudier ce modèle particulier pour le diagnostic.

Mathématiquement l’ACP est une technique de projection orthogonale linéaire qui projette

les observations multidimensionnelles représentées dans un sous-espace de dimension m (m est

le nombre de variables observées) dans un sous-espace de dimension inférieure (ℓ< m) en

maximisant la variance des projections.

L’estimation des paramètres du modèle ACP est effectuée par calcul des valeurs et

vecteurs propres de la matrice de corrélation des données. Cependant, pour la détermination de

la structure du modèle, il faut déterminer le nombre de composantes à retenir dans ce modèle.

Pour cette raison, plusieurs critères de sélection du nombre de composantes seront présentés.


21

II.2 Principe de l’analyse en composantes principales

En pratique, pour la modélisation d’un processus en utilisant l’analyse en composantes

principales, les mesures des variables du processus représentant tous les modes en

fonctionnement normal de ce dernier sont collectés dans une matrice Xb. Soit m le nombre de

variables et N le nombre d’observations de chaque variable. ´ÎÂb N mX est donnée par :

(1) (1) . . . . (1)1 2

(2) (2) . . . . (2)1 2

. . . . . . .

. . . . . . .

( ) ( ) . . . . ( )1 2

æ öç ÷ç ÷ç ÷= ç ÷ç ÷ç ÷è ø

x x xm

x x xmb

X

x N x N x Nm

(II.1)

Où x1(1) représente la mesure de la première variable du premier instant de mesure. Au

préalable, afin de rendre le résultat indépendant des unités utilisées pour chaque variable, un

prétraitement indispensable consiste à centrer et réduire les variables. Chaque colonne Xj de la

nouvelle matrice centrée est donnée par :

bj j

jj

X MX

s

-= (II.2)

Une fois que les données ont été centrées réduit, la matrice de corrélation de données,

peut être calculé comme :

1

1S=

-TX X

N (II.3)

L’expression analytique de l’analyse en composantes principales du vecteur de données x :

Tt xP= (II.4)

Où PT représente la matrice de projection optimale des données au sens de l’analyse en

composantes principales.

La variance de la projection, νar{t}, s’identifie à sa valeur quadratique :

{ } { }( ){ } { }( )( ){ }{ }

{ } { }

2 2

2 1

T T

T T T

Ti i i i i

var t t t t

P x x P

P xx P P P

var t t p p ,i ,...,ml

= e - = e

= e

= e = S

= e = S = =

(II.5)


22

Rappelons que tout vecteur de données x peut être représenté par la combinaison linéaire

des m vecteurs propres pi (i = 1,..., m) de la matrice de covariance , pondérés par les

composantes principales ti = piTx. Pour l’estimation d’un vecteur de données x à partir de son

vecteur de composantes principaux associés t, il suffit pour cela de multiplier à droite chacun des

membres de l’équation (II.5) par P, il en découle :

1

m

i ii

x Pt t p=

= =å (II.6)

Il est donc possible de réduire la dimension de la représentation des données en ne retenant

de l’expression (II.6) que les termes tjpj (j = 1,…..ℓ) associés aux plus grandes valeurs propres

λj. L’estimation x d’un vecteur de données x est alors décrite par l’expression réduite :

( )1

ˆ Ti i jj

i

x t p pp x=

= =å åå ått (II.7)

La perte d’information induite par la réduction de dimension de représentation de chaque

vecteur de données x est mesurée par la différence entre ses représentations exactes (II.6) et

approchée (II.7) :

1

ˆm

i ii

e x x t p=

= - =å (II.8)

Les (m - ℓ) composantes principales ti (i = ℓ + 1,……, m) à partir desquelles l’erreur

d’estimation e est évaluée, sont associées aux plus faibles valeurs propres ¸λℓ+1,….., λm. Il est par

conséquent bien évident que la compression de données préserve d’autant mieux l’information

qu’elles véhiculent que ces valeurs propres sont de faibles valeurs. La somme des (m - ℓ) valeurs

propres minimales quantifie par ailleurs la perte d’information :

{ } { }1

mT

ii

e e var t= +

e = å {1= +

å (II.9)

Ainsi, le vecteur de données x peut être exprimé sous la forme :

ˆx x e= + (II.10)

Dans la suite nous allons représenter la matrice des premiers vecteurs propres par P , d’où

ˆˆ Tt P x= (II.11)


23

Où t est le vecteur des premières composantes principales et

ˆx C x= où ˆ ˆ ˆTC P P= (II.12)

Ainsi, l’erreur quadratique d’estimation est donnée par :

TSPE e e= (II.13)

Généralement, la procédure d’identification de modèles, consiste, après le choix d’une

classe de modèle, à choisir une structure fixe puis à estimer les paramètres du modèle et enfin à

valider ce modèle. Dans le cas de l’ACP, l’estimation des paramètres du modèle revient en fait à

un calcul de valeurs et vecteurs propres. Cependant le choix de la structure demande d’autres

calcules pour le choix du nombre des CPs comme nous le verrons par la suite.

II.3 Identification du modèle ACP

II.3.1 Estimation des paramètres du modèle

L’estimation des paramètres du modèle ACP se résume en une estimation des valeurs et

vecteurs propres de la matrice de corrélation . Une décomposition de cette dernière permet

d’écrire :

1

mT T

i i ii

P P p pl=

S = L = å (II.14)

Où ip est le emei vecteur propre de et

il est la valeur propre correspondante.

S’il existe q relations linéaires entre les colonnes de X, on aura q valeurs propres nulles et

la matrice X peut être représentée par les premières ( )m q- = composantes principales

correspondant aux valeurs propres non nulles. Toutefois, les valeurs propres égales à zéro sont

rarement rencontrées en pratique (relations quasi-linéaires, bruits,...). Donc, il est nécessaire de

déterminer le nombre représentant le nombre de vecteurs propres correspondant aux valeurs

propres dominantes.

II.3.2 Détermination de la structure du modèle

La phase la plus importante dans l’identification d’un modèle par ACP, c’est bien le choix

de nombre de composantes à retenir. De nombreuses règles sont proposées dans la littérature

pour déterminer le nombre de composantes à retenir [14].


24

Dans le cadre de l’application de l’ACP au diagnostic, la fiabilité de la procédure de

détection et localisation par ACP dépend les CPs retenus. Si peu de composantes sont utilisées,

on risque de perdre des informations contenues dans les données de départ en projetant certaines

variables dans le sous-espace des résidus et donc avoir des erreurs de modélisation qui entachent

les résidus ce qui provoque des fausses alarmes.

Si par contre beaucoup de composantes sont utilisées, il y a le risque d’avoir des

composantes retenues (les composantes correspondantes aux valeurs propres les plus faibles

parmi celles retenues dans le modèle) qui sont porteuses de bruit ce qui est indésirable. De plus il

y a risque de non détection des défauts, si certaines variables sont projetées dans le sous-espace

des composantes principales alors qu’elles doivent être projetées dans le sous-espace résiduel.

Dernièrement, [15] ont proposé une technique basée sur la variance de l’erreur de

reconstruction des mesures, ce critère permet de prendre en compte la notion de redondance

entre les variables. (Voir Annexe A)

II.3.2.1 Critères Heuristiques

Ä Pourcentage cumulé de la variance totale (PCV)

Cette méthode consiste à cumulé les portions de variance des mesures de processus étudier

jusqu’à un pourcentage de variance totale choisi préalablement. Le pourcentage de variance

expliquée par les ℓ premières composantes est donné par :

( ) 1

1

100

jj

m

jj

PCV

l

l

=

=

æ öç ÷ç ÷

= %ç ÷ç ÷ç ÷è ø

å

å

ö÷löö

) ç j=100ç jç

jçç j

ççç (II.15)

La variance du bruit étant inconnue a priori, la décision basée seulement sur le pourcentage

de la variance expliquée est un peu arbitraire. Sa capacité à fournir le nombre correct de

composantes principales dépendra fortement du rapport signal sur bruit.

Ä Moyenne des valeurs propres

Des règles empiriques peuvent également guider l’utilisateur. Une de ces règles consiste à

ne prendre en considération que les composantes pour lesquelles la valeur propre est supérieure à

la moyenne arithmétique de toutes les valeurs propres. En particulier, si on travaille sur les

données centrées réduites, cela revient à négliger les composantes dont la variance est inférieure


25

à l’unité1

1( trace( ) )m

S = . Dans le cas du modèle ACP calculé à partir de la matrice de

covariance , la moyenne arithmétique des valeurs propres est donnée par 1

( trace( ))m

S .

II.3.2.2 Critère de validation croisé

L'objectif de l'analyse en composant principal est de construire un modèle qui doit être

employée pour le diagnostic d’un système, le critère suggéré pour identifier le nombre approprié

de composantes est la validation croisée. La validation croisée est une technique très populaire et

simple mais comportant de nombreux calculs. La base de cette méthode est d’estimer les

mesures d’un ensemble de données de validation à partir d’un modèle qui a été calculé à partir

d’un ensemble de données d’identification et de comparer ces estimations avec les valeurs

mesurées.

La minimisation d’une quantité PRESS qui représente la somme des carrés des erreurs

entre les données observées et celle estimées par le modèle obtenu à partir d’un jeu

d’identification différent.

( ) ( ) ( ) ( )2

1 1

1 N m

iik i

ˆPRESS x k x kNm = =

æ ö= -ç ÷è ø

åå ) ( )k x) ( )) ( )k x) ( )kk) ( )k x( )) 1 N m

k i

) 1

Nmå (II.16)

Ø Algorithme de la validation croisée

1. diviser les données en un jeu d’identification et un jeu de validation,

2. réaliser une ACP avec composantes ( = 1,…., m) sur le jeu d’identification et calculer

les critères correspondant sur le jeu de validation PRESS(1),…, PRESS(m),

3. la ème composante pour laquelle le minimum de PRESS apparaît sera la dernière

composante à retenir et sera le nombre de composantes principales retenu.

II.4 Les exemples de simulation

II.4.1 Exemple (II.1)

Pour illustrer ce qui a été dit jusqu’à présent sur l’ACPL, nous présentons ici un exemple

simple de simulation. On considère un système linéaire représenté par deux variables qui sont

décrites par les équations suivantes :

1 1

2 2

4x u

x u

m

m

= +

= +


26

Où μi est un bruis aléatoire distribue dans l’intervalle [-0.1 0.1], u [-1 1] représente une

variable aléatoire uniforme.

La matrice de variance-covariance des variables est donnée par :

0.4994 0.4968

0.4968 0.4994

æ öS = ç ÷

è ø

La décomposition en valeurs singulières de la matrice de corrélation donne :

· La matrice diagonale des valeurs propres dans l’ordre descendant:

0.9962 0

0 0.0026D

æ ö= ç ÷è ø

· La matrice des vecteurs propres associés à chaque une des valeurs propres dans son

ordre descendant :

0.7071 0.7071

0.7071 0.7071P

æ ö= ç ÷è

-

- ø-

Les composantes principales sont données par :

1 1 2

2 1 2

0.7071 0.7071

0.7071 0.7071

t x x

t x x

= - +

= - -

Le tableau suivant contient les valeurs propres et leur variance ainsi leur PCV :

CPs VPrp V% PCV%

1 0.9962 99.7431 99.8017

2 0.0026 0.2569 100

(La figure II.1) représente la distribution d’informations (données) d’entrée. La droite en

noire représente l’estimation des données originelles par le modèle ACP caractérisé par la

première composante principale (correspondante au premier vecteur propre associé à la plus

grande valeur propre, (La figure II.2 (a)) de la matrice de variance-covariance), c’est-à-dire, on

ne doit conserver que la première composante principale pour l’estimation des variables

originelles, parce qu’elle porte l’information significative permettant d’expliquer les différentes

variables (99.8% de variance expliquée par cette composante (La figure II.2 (b)).


27

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

x1

x2

données originales

1 ère CL

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 20

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1(a)

valeur propres

moyenne

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 299.7

99.75

99.8

99.85

99.9

99.95

100

composantes principales

pourc

enta

ge d

e la v

ariance t

ota

le

(b)

Fig II.1 : Estimation de données par la première CP.

Fig II.2 : Sélection du nombre de CPs à retenir.

II.4.2 Exemple (II.2)

Nous disposons de 8 variables représentant un système statique et qui sont décrites par les

équations suivantes :

1 1 1

2 1 2

3 1 3

4 2 4

5 2 5

6 2 6

7 1 2 7

8 1 2 8

3 2

x u

x u

x u

x u

x u

x u

x u u

x u u

+

+

= + e

= + e

= + e

= + e

= + e

= + e

= + e

= + e

(II.17)

Où les bruits de mesure i sont des bruits aléatoires uniformément réparties entre -0,05 et +0,05,

u1 et u2 sont des signaux en forme de sinusoïdale dont les amplitudes et les durées changent de

manière aléatoire.

Les mesures simulées des variables x1, x5 et x7 sont données, à titre indicatif, sur (La figure II.3).


28

0 50 100 150 200 250 300 350 400 450 500-4

-2

0

2

4

# échantillons

x1

Evolution des variables

0 50 100 150 200 250 300 350 400 450 500-2

-1

0

1

2

# échantillons

x5

0 50 100 150 200 250 300 350 400 450 500-4

-2

0

2

4

# échantillons

x7

Fig.II.3 : Evolution des variables x1, x5 et x7.

La matrice de corrélation des variables est donnée par :

0.4944 0.4391 0.4455 -0.0080 -0.0207 -0.0241 0.3210 -0.0241

0.4391 0.4911 0.4426 -0.0002 -0.0100 -0.0156 0.3243 -0.0156

0.4455 0.4426 0.5019 -0.0154 -0.0

S =

301 -0.0303 0.3157 -0.0303

-0.0080 -0.0002 -0.0154 0.5083 0.4759 0.4688 0.3403 0.4688

-0.0207 -0.0100 -0.0301 0.4759 0.4938 0.4649 0.3264 0.4649

-0.0241 -0.0156 -0.0303 0.4688 0.4649 0.4961 0.3225 0.4961

0.3210 0.3243 0.3157 0.3403 0.3264 0.3225 0.4835 0.3225

-0.0241 -0.0156 -0.0303 0.4688 0.4649 0.4961 0.3225 0.4961

æ öç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷è ø

Les matrices des valeurs et vecteurs propres ‘D’ et ‘P’ respectivement sont données par :

0.0000 0 0 0 0 0 0 0

0 0.0127 0 0 0 0 0 0

0 0 0.0245 0 0

D =

0 0 0

0 0 0 0.0501 0 0 0 0

0 0 0 0 0.0533 0 0 0

0 0 0 0 0 0.0551 0 0

0 0 0 0 0 0 1.5672 0

0 0 0 0 0 0 0 2.2025



29

0 50 100 150 200 250 300 350 400 450 500-5

0

5

10x 10

-15

# échantillons

t 1

0 50 100 150 200 250 300 350 400 450 500-1

-0.5

0

0.5

# échantillons

t 2

0 50 100 150 200 250 300 350 400 450 500-1

0

1

# échantillons

t 3

0 50 100 150 200 250 300 350 400 450 500-1

0

1

# échantillons

t 4

0 50 100 150 200 250 300 350 400 450 500-1

0

1

2

# échantillons

t 5

0 50 100 150 200 250 300 350 400 450 500-1

0

1

# échantillons

t 6

0 50 100 150 200 250 300 350 400 450 500-5

0

5

# échantillons

t 7

0 50 100 150 200 250 300 350 400 450 500-5

0

5

# échantillons

t 8

-0.0000 -0.2383 0.0098 -0.2994 0.7516 0.0338 -0.5231 0.1173

-0.0000 -0.2026 -0.0623 -0.2494 -0.5162 -0.5856 -0.5176 0.1249

-0.0000 -0.1884 0.0671 0.4578 -

P =

0.2912 0.6110 -0.5291 0.1108

0.0000 -0.2419 -0.6540 0.4614 0.1606 -0.2225 0.1512 0.4502

0.0000 -0.2208 0.7484 0.2990 0.0965 -0.2664 0.1639 0.4411

0.7071 -0.0789 -0.0424 -0.4051 -0.1491 0.2798 0.1707 0.4452

0.0000 0.8643 0.0032 0.0903 0.0652 -0.0740 -0.2656 0.4057

-0.7071 -0.0789 -0.0424 -0.4051 -0.1491 0.2798 0.1707 0.4452



1 1 2 3 4 5 6 7 8

2 1 2 3 4 5 6 7 8

3 1 2 3 4 5

0 0000 0 0000 0 0000 0 0000 0 0000 0 7071 0 0000 0 7071

0 2383 0 2026 0 1884 0 2419 0 2208 0 0789 0 8643 0 0789

0 0098 0 0623 0 0671 0 6540 0 7484 0

t . x . x . x . x . x . x . x . x

t . x . x . x . x . x . x . x . x

t . x . x . x . x . x .

= - - - + + + + -

= - - - - - - + -

= - + - + - 6 7 8

4 1 2 3 4 5 6 7 8

5 1 2 3 4 5 6 7 8

6 1 2

0424 0 0032 0 0424

0 2994 0 2494 0 4578 0 4614 0 2990 0 4051 0 0903 0 4051

0 7516 0 5162 0 2912 0 1606 0 0965 0 1491 0 0652 0 1491

0 0338 0 5856 0 6110

x . x . x

t . x . x . x . x . x . x . x . x

t . x . x . x . x . x . x . x . x

t . x . x .

+ -

= - - + + + - + -

= - - + + - + -

= - + 3 4 5 6 7 8

7 1 2 3 4 5 6 7 8

8 1 2 3 4 5 6 7 8

0 2225 0 2664 0 2798 0 0740 0 2798

0 5231 0 5176 0 5291 0 1512 0 1639 0 1707 0 2656 0 1707

0 1173 0 1249 0 1108 0 4502 0 4411 0 4452 0 4057 0 4452

x . x . x . x . x . x

t . x . x . x . x . x . x . x . x

t . x . x . x . x . x . x . x . x

- - + - +

= - - - + + + - +

= + + + + + + +

Ainsi, on peut tracer l’évolution des composantes principales 1 8t , ,t1 8t1 81 8 de cet exemple.

A partir de (La figure II.4), on remarque que les composantes 1 6t , ,t1 6t1 61 6 ne représentent que

du bruit alors que les deux derniers composants sont porteurs d’information et sont corrélées

avec les variables originelles. Nous allons par la suite montrer par différent critère que le nombre

de composante principale est égal à ℓ=2.

Fig II.4: Evolution des composantes principales.


30

1 2 3 4 5 6 7 855

60

65

70

75

80

85

90

95

100


pour

cent

age

de la

var

ianc

e to

tale

1 2 3 4 5 6 7 80

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45


erre

ur d

e va

lidat

ion

1 2 3 4 5 6 7 80

0.5

1

1.5

2

2.5

valeur propres

moyenne

II.4.2.1 Détermination de la structure du modèle

Ä Pourcentage cumulé de la variance totale(PCV) :

Ici on choisit les composantes dont pourcentage cumulé soit supérieure ou égale 95% dans

notre cas en prend deux composantes.

Fig II.5: Pourcentage de la variance totale.

Ä Critère de validation croisé

Ici on a divisé le jeu de donnée en deux parties une pour la construction du modèle et

l’autre pour la validation, le nombre de composantes a retenu correspond à celui qui donne une

erreur PRESS ≤ 0.05 dans notre cas =2.

Fig II.6: Erreur de validation.

Ä Moyenne des valeurs propres

Ce critère consiste à ne prendre en compte que les composantes pour lesquelles la valeur

propre est supérieure à la moyenne arithmétique de toutes les valeurs propres. Ce qui signifie ℓ=2.

Fig II.7: La moyenne des valeurs propres.


31

0 50 100 150 200 250 300 350 400 450 500-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

# échantillons

variable x1

variable x1est

0 50 100 150 200 250 300 350 400 450 500-5

0

5

# échantillons

x1 &

x1est

0 50 100 150 200 250 300 350 400 450 500-5

0

5

# échantillons

x2 &

x2est

0 50 100 150 200 250 300 350 400 450 500-4

-2

0

2

# échantillons

x3 &

x3est

0 50 100 150 200 250 300 350 400 450 500-2

0

2

# échantillons

x4 &

x4est

0 50 100 150 200 250 300 350 400 450 500-4

-2

0

2

# échantillons

x5 &

x5est

0 50 100 150 200 250 300 350 400 450 500-2

0

2

# échantillons

x6 &

x6est

0 50 100 150 200 250 300 350 400 450 500-4

-2

0

2

# échantillons

x7 &

x7est

0 50 100 150 200 250 300 350 400 450 500-2

0

2

# échantillonsx

8 &

x8est

II.4.2.2 Validation du modèle

Fig II.8 : validation du modèle de huit variables.

Fig II.9 : validation du modèle «la variable x1».

II.5 Conclusion

Dans ce chapitre nous avons présenté le principe de l’analyse en composantes principales

linéaires. L’idée de base de l’ACP est de réduire la dimension de la matrice des données, en

retenant le plus possible les variations présentes dans le jeu de données de départ. Cette

réduction ne sera possible que si les variables initiales ne sont pas indépendantes et ont des

coefficients de corrélation entre elles non nuls. Ces variables initiales sont transformées en de

nouvelles variables, appelées composantes principales. Elles sont obtenues par combinaisons

linéaires des précédentes et sont ordonnées et non corrélées entre elles.

Chapitre III Analyse en Composantes Principales non Linéaires

33

1x

2x2x

1x

nT ´Î Â

Modèle de compression

Projection (Extraction)Modèle de décompression

Projection inverse (Génération)

ℓm ℓ m

ˆ n mX ´ÎÂn mX ´ÎÂ

Sommaire

III.1 Introduction ................................................................................................................................... 33

III.2 Modélisation par ACPNL ............................................................................................................. 34

III.3 Approche neuronale de l’ACPNL ................................................................................................ 35

III.4 Exemple de simulation .................................................................................................................. 37

III.5 Conclusion ...................................................................................................................................... 39

III.1 Introduction

Dans l’industrie, la plupart des systèmes physiques ont des comportements non linéaires et

alors la propriété de linéarité de l’ACP linéaire, (La figure III.1), pose toujours le problème de

l’inaptitude de cette méthode à représenter les données non linéaires, puisqu’il s’agit d’une

projection linéaire et seules les dépendances linéaires entre les variables peuvent être révélées.

Fig III.1 : Transformation linéaire. Fig III.2 : Transformation non linéaire.

L’ACP non linéaire (ACPNL) est une extension dont l’objectif est d’extraire à la fois les

relations linéaires et non linéaires. Cette généralisation est effectuée par une projection des

données sur des courbes au lieu des droites, (La figure III.2). (La figure III.3) montre le principe

du modèle ACP général, que ce soit linéaire ou non linéaire. Dans le cas non linéaire :

n mX ´ÎÂ la matrice de données nT ´ÎÂ matrice de composantes principales avec ( )T X= F

et représente une fonction non linéaire équivalente à la matrice de vecteurs propres « P » de

l’ACP linéaire.

Fig III.3 : Principe du modèle ACP.


34

ˆ n mX ´ÎÂ la génération de la matrice de données avec ( )X T= Y représente la fonction

non linéaire de reconstruction ou de génération. Et alors la matrice de données X peut être

représentée par l’estimation X plus l’erreur d’estimation (matrice résiduelle) XX :

( )ˆX X X T E= + = Y +( )( )Y( )X T( ) (III.1)

III.2 Modélisation par ACPNL

Les méthodes de modélisation par l’analyse en composantes principales non linéaire

peuvent être scindées en trois catégories :

III.2.1 Modèle ACPNL basé sur la transformation non linéaire

Réalise la transformation des données par une fonction de projection non linéaire proposée.

Ä ACP généralisée

Proposé par Gnanadesikan [16] est l’une des premières extensions non linéaire de l’ACP

linéaire, où comme on a déjà vu dans le deuxième chapitre, la transformation de l’ensemble de

données originelles est donnée par :

1

k

j j ij jj

T P x p x=

= = å (III.2)

L’ACP généralisée est basée sur le remplacement de xj par ( )j xY dans cette équation, on

obtient alors :

( )1

k

j ij jj

T p x=

= Yå (III.3)

Où k est la dimension de ( )xY pas forcément égale à la dimension de x.

Alors, l’ACP généralisé réalise une projection non linéaire de x où est la fonction de

projection non linéaire [17].

III.2.2 Approximation linéaire définie par morceaux

Un modèle d’approximation linéaire définie par morceaux, réalise une ACP linéaire dans

des domaines locaux de l’espace original de données, et totalement réalise une ACPNL dans

l’espace de données.

Ü Courbes principales

Proposée par Hastie [18] ; cette approche résume la distribution de données dans l’espace

de représentation multidimensionnel autour d’une courbe polygonal monodimensionnel dite


35

courbe principale en minimisant la distance entre les point de données et leurs projections sur

cette courbe, il faut noter qu’il est difficile de construire plus de deux composantes principales

par l’utilisation de cette méthode[17].

Ü ACP locale

Proposée par Kambhalta & al [19], le principe de ce modèle non linéaire est de diviser

l’espace original en plusieurs sous-domaines autrement dit, cette approche appréhende le

comportement non linéaire d’un système par un ensemble de modèles locaux (ACP linéaires)

caractérisant le fonctionnement du système dans différentes zones de fonctionnement.

Dans le cas de ce modèle, en plus de l’identification des modèles locaux, il faut déterminer

le nombre de ces modèles ainsi que le nombre de composantes principales à retenir dans chaque

modèle, L’inconvénient majeur de cette approche est qu’il n’y a pas de méthode systématique

permettant de choisir les ACP locales.

III.2.3 Modèle ACPNL basé sur les réseaux de neurones artificiels

Dans la section suivante, seront exposés l’algorithme d’ACPNL à base de réseaux de

neurones à cinq couches (MLPs). Il faut noter aussi qu’il y a d’autres approches (modèles)

neuronales de l’analyse en composantes principales non linéaire tel que ACPNL par optimisation

des entrées du réseau (Input Training network), les réseaux à trois couches et courbes principales

et les réseaux de fonctions à base radiale (RBF) et chaque un de ces modèles a ses propriétés et

ses inconvénients, dans ce travail on ne s’intéresse qu’au ACPNL basé sur MLP à cinq couches.

III.3 Approche neuronale de l’ACPNL

L’approche non linéaire basée sur les réseaux de neurones artificiels « RNAs » utilise un

perceptron multicouche « MLP » avec une topologie auto-associative constitué de cinq couches

avec une couche d’étranglement (bottleneck layer) [20]:

Le MLP est un modèle d’une plus grande capacité de calcul. Sa structure est composée

d’une couche d’entrée, une couche de sortie, et d’une ou plusieurs couches intermédiaires dites

couchent cachées.

Un neurone d’une couche inférieure ne peut être relié qu’à des neurones des couches

suivantes. Il faut noter que ce modèle utilise une règle d’apprentissage par rétro propagation.

En général, les neurones du Perceptron multicouche sont animés par une fonction

d’activation non linéaire (au moins dans une des couches). Le choix classique pour cette fonction

est la fonction sigmoïde que ce soit log-sigmoïdale :

( ) 1

1 xx

ej

-=

+ (III.4)


36

x( )xh

u

( )uhx

Ou tangente-sigmoïdale : ( )2

2 2

2 11

1 1

x

x x

ex

e ej

-

- --

= - =+ +

(III.5)

Fig III.4 : Réseau à cinq couches pour l’extraction d’une seule composante principale non

linéaire

Pour effectuer l’ACPNL, et pour une seule composante principale non linéaire (La figure

III.4), une fonction de transfert G1 réalise une projection du vecteur x d’entrée de dimension m,

vers la première couche cachée (couche de réduction), cette projection est représentée par la

formule suivante :

( )( ) ( ) ( )( ) ( )1 1(1 )

1

mx x xx x

iij jj ri

h G V x b G v x b==

æ ö= + = +ç ÷ç ÷

è øå1 1)j r(1 )(1 ) G1 1(1 )(1 )(1 G1 1 (III.6)

ü ( ) r mV x ´ÎÂ est la matrice des poids.

ü b(x)

est le vecteur contenant les r paramètres de biais.

ü r est le nombre de neurones dans la première couche cachée.

Une deuxième fonction de transfert G2 réalise la projection de données de la première

couche cachée, vers la couche cachée d’étranglement contenant un seul neurone qui représente la

composante principale t :

( ) ( ) ( )( ) ( ) ( ) ( )2

1

rx xx x x x

j jj

t G w h b w h b=

= + = +å (III.7)

Ensuite, la fonction non linéaire G3 projette les données à partir de t vers la dernière

couche cachée h(t)

(couche de reconstruction), et cette projection est représentée par :

( ) ( )( ) ( ) ( )( ) ( )3 3(1 )

t t tt tj jj r

jh G W t b G w t b=

æ ö= + = +ç ÷

è ø3 3)j r(1 )(1 ) G3 3(1 )(1 ) GG3 3 (III.8)

La dernière fonction de transfert G4 projette les données à partir de h(t)

vers le vecteur de

sortie x de dimension m :

( ) ( ) ( ) ( )( ) ( ) ( )4

1

ˆr

t t tt t ti ij j i

i j

x G V h b v h b=

æ ö= + = +ç ÷è ø

å (III.9)


37

La fonction coût2

Ê x x= - doit être minimisée pour trouver les valeurs optimales de :

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), , , , , , , .x x x x t t t tV b w b w b V b

Une fois la structure générale définie, il reste à déterminer la structure précise du modèle

neuronale (architecture du réseau). Pour cela, il faut déterminer le nombre de couche caché

nécessaire et le nombre de neurones dans chaque couche cachée. Pour la détermination du

nombre de couches cachées , Funahashi et Cybenko [21,22] ont montré que toute fonction

continue peut être approximé par un réseau de neurones à trois couches utilisant une fonction

d’activation sigmoïdale pour les neurones de la couche cachée et une fonction d’activation

linéaire pour les neurones de la couche de sortie.

Le nombre de neurones dans la couche cachée est généralement déterminé en effectuant

une validation croisé sur un jeu de validation. Il existe des algorithmes permette de construire

itérativement la couche cachée, le contrôle de la croissance du réseau est effectué par une

validation croisé. La procédure d’apprentissage est détaillée dans l’annexe A.

III.4 Exemple de simulation

III.4.1 Exemple (III.1)

Pour illustrer ce qui a été dit jusqu’à présent sur l’ACPNL, nous présentons ici un

deuxième exemple simple de simulation. Si on applique l’ACP linéaire sur un jeu de données

non linéaire représenté par trois variables qui sont décrites par les équations suivantes:

( )( )

1 1

2 2

3 3

sin

cos

x u

x u

x u

p m

p m

m

= +

= +

= +

Où im est un bruis aléatoire distribue dans l’intervalle [-0.1 0.1] et u [-1 1] représente une

variable uniforme.

La matrice de variance-covariance des variables est donnée par :

0.4994 0.0007 0.3821

0.0007 0.4994 0.0018

0.3821 0.0018 0.4994

æ öç ÷S = ç ÷ç ÷è ø

-

-

La décomposition en valeurs singulières de la matrice de corrélation donne :

· La matrice diagonale des valeurs propres dans l’ordre descendant:


38

-1.5-1

-0.50

0.51

1.5

-1.5-1

-0.50

0.51

1.5-1.5

-1

-0.5

0

0.5

1

1.5

x1x2

x3

données originales

1 ère CNL

1 ère CL

0.8814 0 0

0 0.4994 0

0 0 0.1173

D

æ öç ÷= ç ÷ç ÷è ø

· La matrice des vecteurs propres associés à chaque une des valeurs propres dans

son ordre descendant :

0.7071 0.0047 0.7071

0.0021 1 .0000 0.0046

0.7071 0.0017 0.7071

P

æ öç

-÷= ç

çè ø-

÷÷


1 1 2 3

2 1 2 3

2 1 2 3

0.7071 0.0047 0.7071

0.0021 1.0000 0.0046

0.7071 0.8950 0.7071

t x x x

t x x x

t x x x

= - +

= + +

= + -

Le tableau suivant contient les valeurs propres et leur variance ainsi leur PCV :

On trouve les résultats représenté sur (la figure III.5), la droite en vert dans représente

l’estimation des données originelles par le modèle ACP linéaire, on remarque que cette

composante n’explique que 44,4% d’informations ce qui conduit au plus de 50% perte

d’informations, et ça montre bien l’inefficacité de l’ACP linéaire sur les données non linéaire.

Par contre dans le cas où on applique un modèle ACPNL pour faire l’estimation des

données, ce qui est représenté par la courbe en noire dans la même figure.

Fig III.5 : Estimation linéaire et non linéaire par la première CP.

CPs VPrp V% PCV%

1 0.8814 58.9607 58.9607

2 0.4994 33.3331 92.2938

3 0.1173 7.7062 100


39

1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 355

60

65

70

75

80

85

90

95

100


pourc

enta

ge d

e la v

ariance t

ota

le

Fig III.6: Pourcentage de la variance totale.

On remarque que la première composante principale non linéaire est suffisante pour

expliquer la plupart d’informations (98,2% de variance).

III.5 Conclusion

L’analyse en composantes principales non linéaire a été développée pour traiter les

données des comportements non linéaires, où l’ACP linéaire ne peut pas représenter les données

non linéaires.

Les approches neuronales semblent plus intéressantes pour la modélisation des systèmes

non linéaires. Le réseau le plus utilisé pour le calcul de l’ACPNL est un réseau à cinq couches,

couche d’entrée, couche de sortie et trois couches cachées où la deuxième représente la couche

d’étranglement qui permet de donner les CPs non linéaire à extraire, et malgré la base théorique

solide de ces approches neuronales, le choix du réseau appartient souvent à l’utilisateur car il

n’existe pas de guide approprié et reconnu.

Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales

41

Sommaire

IV.1 Introduction ...................................................................................................................................... 41

IV.2 Détection de défauts par ACP ......................................................................................................... 41

IV.3 Les exemples de simulation ............................................................................................................. 43

IV.4 Localisation de défauts par ACP .................................................................................................... 45

IV.5 Conclusion ........................................................................................................................................ 46

IV.1 Introduction

Les méthodes de détection et de localisation de défauts reposant sur l’analyse en

composantes principales linéaires (ACP) ont reçu une attention particulière et ont été largement

utilisées pour la surveillance des processus industriels [23]. Le principe de cette approche est

d’utiliser l’analyse en composantes principales pour modéliser le comportement du processus en

fonctionnement normal et les défauts sont alors détectés en comparant le comportement observé

et celui donné par le modèle ACP. La plupart des méthodes récentes utilisent l’erreur

quadratique de prédiction SPE et la statistique de Hotteling T2 pour la détection de défauts sur les

mesures.

Pour la détection des défauts sur les mesures, un indice sera utilisé dans cette section, le

SPE (Squared Prediction Error). La statistique SPE dépend de toutes les variables à surveiller.

IV.2 Détection de défauts par ACP

Généralement, la phase de détection de défaut dans le cas du diagnostic à base de modèle

analytique est liée à l’étape de génération de résidus qui a pour but de générer, à partir d’un

modèle de bon fonctionnement du processus et des mesures disponibles, des signaux révélateurs

de la présence de défauts, appelés résidus. A partir de l’analyse de ces résidus, l’étape de prise de

décision doit alors indiquer si un défaut est présent ou non.

IV.2.1 Génération de résidus par estimation d’état

Dans le cas de l’analyse en composantes principales on retrouve le même principe.

Concernant l’approche par estimation d’état, les résidus sont obtenus par un test de cohérence

entre l’estimation et les mesures.

La présence d’un défaut affectant l’une des variables provoque un changement dans les

corrélations entre les variables indiquant une situation inhabituelle car les relations entre les

variables ne sont plus vérifiées. Dans ce cas, la projection du vecteur de mesures dans le sous-

espace des résidus va croître par rapport à sa valeur dans les conditions normales. Pour détecter


42

un tel changement dans les corrélations entre les variables, l’ACP utilise généralement, la

statistique SPE [24] et la statistique.

Dans cette section, nous allons présenter les différents indices de détection utilisés avec

l’ACP ainsi que les limitations de ces derniers et la solution que nous proposons pour résoudre le

problème de détection en utilisant l’analyse en composantes principales.

1 1

ˆ

= == =å åå åT T

i i i ii i

X T p Xp p (IV.1)

IV.2.1.1 Statistique SPE

Une statistique typique pour détecter ces conditions anormales est la statistique SPE,

appelée aussi Q (Squared Prediction Error) qui est donnée par l’équation :

( ) ( ) ( )TQ k e k e k= (IV.2)

où ( )e k est l'erreur d'estimation. Généralement sous les conditions normales de fonctionnement,

la mesure est dans son espace statistique, et lorsque une erreur se produit sur cette mesure, elle

n’est plus dans cet espace ce qui cause une augmentation considérable dans le SPE (statistique

Q dans un certain seuil de confiance dépassant la « limite supérieure de contrôle »

(UCL: Upper Control Limit) 2

ad .

Ä Le processus est considéré en fonctionnement normal (absence de défaut) à l’instant k si:

2( )SPE t ad£

Ä Le processus est considéré dans un état défaillant (présence d'un défaut) à l’instant k si :

2( )SPE t ad>

Le seuil de contrôle 2

ad est déterminé par apprentissage, ou la distribution de la statistique

Q peut être approximée par [25]:

2

hQ ga c (IV.3)

Soit 1

mi

i jj

q l= +

= å1

i j1= +

i ji j pour i= 1, 2, 3 et λj est la jeme

valeur propre de la matrice Σ.

Le seuil est approximé par [25] :

0

1

22 2 0 2 0 0

12

1 1

2 ( 1)1

hc h h haa

q qd qq q

é ù-ê ú= + +ê úë û

Où

2

1

( 1)1

21

2

1

1 30 2 2

2 2

21 et

3 2

hoh ho oe

o

h c

h

q

qq

qa

q q

q q

-- -

é ùæ öê úç ÷ê úè øë û= - = (IV.4)

ca est la limite au seuil de confiance (1-α) dans le cas d’une distribution normale. Il faut noter

que ce résultat est donné sous les conditions suivantes :


43

Ä le vecteur des échantillons x suit une distribution normale multi variable,

Ä une approximation est effectuée pour calculer le seuil ad2 du SPE.

Box [26] a antérieurement montré que :

2

1

gqq

= , 21

2

hqq

= (IV.5)

Alors : 2 2

,hgXa ad = (IV.6)

Plus récemment, Nomikos et MacGregor [25] ont démontré que les deux approximations

données par les équations (IV.4) et (IV.5) sont équivalentes où le poids g et le degré de liberté h

peuvent être estimés aussi par les moments : moyenne m et variance v correspondantes du SPE

[27] :

2

vg

m= ,

22mh

v= (IV.7)

Par conséquence, la limite supérieure de contrôle peut être calculée comme suit :

22 2

1

2( )

2

v m

m va ad c -= (IV.8)

IV.2.1.2 Filtrage EWMA pour la détection

Pour améliorer la qualité de la détection et réduire le taux de fausses alarmes, le filtre

EWMA (Exponentially Weighted Moving Average) peut être appliqué aux résidus. L’expression

générale de ce filtre appliqué aux résidus est donnée par :

( ) ( ) ( 1) ( )b b= - - +e k I e k e k (IV.9)

où β est une matrice diagonale dont les éléments sont les facteurs d’oubli pour les résidus, I est

une matrice identité et (0) 0=e , est un facteur d’oubli 0 < < 1.

b g= I (IV.10)

On obtient ainsi le SPE filtrés :

( ) ( ) ( )TSPE k e k e k= (IV.11)

Le SPE permet de réduire les fausses alarmes mais il introduit un certain retard à la détection.

IV.3 Les exemples de simulation

IV.3.1 Exemple (IV.1)

On prendre l’exemple (II.2), où nous avons construit le modèle ACP linéaire avec deux

composantes, et dans le cas de l’ACPNL l’architecture du réseau choisit est [8-2-1-2-8] avec des


44

0 100 200 300 400 5000

0.5

1

1.5

2

2.5

# Echantillons

(ACPNL)

SPE

da2

0 100 200 300 400 5000

0.5

1

1.5

2

2.5

# Echantillons

(ACPNL)

SPEf iltré

da2

0 100 200 300 400 5000

0.5

1

1.5

2

2.5

3

# échantillons

(ACP)

SPE

da2

0 100 200 300 400 5000

0.2

0.4

0.6

0.8

1

1.2

1.4

# échantillons

(ACP)

SPEf iltré

da2

fonctions non-linéaires log-sigmoïdale dans les couches cachées , une partie des données est

utilisée pour l’apprentissage du réseau et l’autre pour la validation c.à.d. le diagnostic.

Ici nous allons introduire un défaut sur la variable x4 entre les instant 100 et 200 (La figure

IV.1) représente le SPE par le cas de l’ACP et l’ACPNL respectivement.

Fig IV.1 : Evolution de l’erreur quadratique de prédiction ACP et ACPNL.

On remarque qu’on a un dépassement du seuil à des instant ou les défauts n’est pas encore

présent sur tout pour le cas de l’ACP et pour ACPNL il y a quelque fausse alarme. Pour éliminer

ce problème on présente le concept de SPE filtré.


Soit à reprendre l’exemple précèdent ou nous allons évaluer le SPE filtré

Fig IV.2 : Evolution ACP et ACPNL de l’SPE filtré avec simulation de défaut à partir de 100.

Ici nous illustrons la détection avec SPE filtré (La figure IV.2) pour les cas de l’ACP et

l’ACPNL où l’instant de détection est presque à l’instant d’apparition du défaut.


45

1 2 3 4 5 6 7 80

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

variables

Contr

ibution a

u S

PE

(ACPNL)

1 2 3 4 5 6 7 80

0.05

0.1

0.15

0.2

0.25

0.3

0.35

variables

(ACP)

IV.4 Localisation de défauts par ACP

Lorsqu’un défaut est détecté, il est nécessaire d’identifier la ou les variables qui sont en

cause: C’est la localisation de défauts. Pour réaliser cette tâche, plusieurs méthodes ont été

développées dans la littérature. Concernant la localisation de défauts par l’analyse en

composantes principales, on retrouve trois approches :

ü L’approche par calcule des contributions.

ü L’approche par structuration des résidus [28]. Cette approche s’inspire des méthodes de

diagnostic utilisant la redondance analytique.

ü approche utilisant le principe de reconstruction [29]. Dans cette approche chaque capteur

est supposé en défaut et reconstruit en utilisant le modèle ACP déjà calculé et les mesures des

autres capteurs.

IV.4.1 Localisation par calcul des contributions

Une approche largement utilisée consiste à calculer les contributions des variables à

l’indice de détection, et la variable ayant la plus forte contribution à l’instant de détection est la

variable affectée.

Ü La contribution au critère SPE [30]:

( ) ( ) ( )2 2ˆ( ) ( ) ( )SPE

i i i icont k e k x k x k= = - (IV.12)

xi (k) est le ieme

élément du vecteur de mesures x à l’instant k donnée.


Nous allons évaluer les contributions des différents variables à l’instant de détection pour

l’exemple précedent :

Fig IV.3: Localisation par la méthode de contribution ACP et ACPNL.


46

La figure IV.3 illustre le tracé des contributions des différents variables à l’indice SPE

pour les deux cas ACP et ACPNL. On remarque que la variable x4 est celle qui contribue plus

dans l’indice SPE donc c’est la variable défaillante.

IV.5 Conclusion

Ce chapitre a été consacré à la présentation des techniques de détection et de localisation

de défaut dans le cadre d’une procédure de diagnostic utilisant l’analyse en composantes dans

ces deux versions linéaire et non linéaire.

Les indices de détection le utilisé dans le cadre de l’ACP est dans notre travail la

statistiques SPE l’erreur quadratique d’estimation, et le critère de localisation des défauts, est

celui par calcul de contribution. Un filtre EWMA est utilisé pour éliminer les fausses alarmes et

alors pour améliorer la détection et l’identification des défauts de capteurs.

Chapitre V Application pour diagnostic avec ACP

48

Coagulation

Coagulation

-Floculation Décantation Filtration

Désinfection

Finale

Eau traitée

Réservoire

Désinfection

Preliminaire

· Turbidité

· PH

· Conductivité

· Temperature

· Oxygen dissoue

Paramètres

de l’Eau

Brute

Eau

Pompée

V. Introduction

Une eau propre est nécessaire à la vie. L’eau douce ne représente que 3 % de l’eau de notre

planète et environ 10 % seulement de cette réserve peuvent être exploités de façon rentable.

Actuellement, d’après une estimation internationale, plus d’un milliard de personnes dans le

monde vivent sans avoir accès à une eau potable propre. Ce n’est pas sans raison que l’eau est

considérée comme la matière première la plus importante, sans elle, la vie comme nous le savon

cesserait d'exister.

Dans un procédé typique de traitement de l'eau potable, l'eau brute provenant de diverses

sources est acheminée par des pipelines où il est traité chimiquement, filtrée et désinfectée [31].

Le traitement de l'eau potable fournit de multiples barrières pour protéger la santé publique

en éliminant les micro-organismes et les produits chimiques qui peuvent causer des maladies aux

consommateurs. L'élimination de la turbidité et la couleur pour produire de l'eau qui est

esthétiquement acceptable pour les consommateurs est un élément très important du traitement

de l'eau [32]. Une grande partie de la difficulté dans la modélisation des procédés de traitement

de l'eau peut être liée aux interactions complexes entre de nombreux facteurs de qualité de l'eau

qui influent, et de nombreuses réactions chimiques et physiques ainsi, dans la modélisation du

procédés de traitement de l'eau , le défi majeur est d'établir les relations non linéaires entre les

entrées et les sorties de chaque procédés [33] [34].

Le procédé traditionnel de traitement de l'eau potable qui a l'eau de surface comprend

généralement quatre processus importants: floculation, décantation, filtration, désinfection et qui

est principalement utilisé pour éliminer la turbidité et à stériliser.

L’unité de traitement de l'eau étudiée dans notre cas est celle Oued el Othmania qui se

trouve dans l'est de l'Algérie, son schéma synoptique simplifié est représenté sur la figure V.1.

Fig V.1 : Processus traditionnel de traitement de l'eau potable


49

Cette unité fonctionne avec une capacité de production de 260.000 m3 d'eau par jour et

est responsable de l'approvisionnement en d’eau potable de haute qualité à de nombreux citoyens

à et autour de Constantine ville. Ce type de processus étudié est connu pour avoir de nombreux

paramètres de qualité à prendre en considération tels que la Turbidité (NTU), PH, Conductivité

(µs / cm), Température (C0) et O2 de l'oxygène dissous (mg / l).

L'eau brute contient des particules en suspension qui doivent être éliminés pour produire

de l'eau propre à des fins de consommation, en particulier les particules colloïdales qui ne

peuvent pas être éliminés par une simple filtration ou clarification, pour cette raison un

traitement chimique est nécessaire en ajoutant des produits chimiques spéciaux appelés

coagulants.

Les paramètres de l'eau à l'entrée sont mesurés et essais de floculation sont réalisés assez

fréquemment (Jar test), ce qui conduit à estimer le taux de dosage optimal à partir des données

brutes de la qualité de l'eau qui a été démontré expérimentalement pour être non linéairement

corrélées.

Lorsque les données de qualité et de dosage sont recueillies et intégrées, en plus de la

commande de dosage automatique en ligne pour le système de prédiction et d'ajustement, il est

alors essentiel à réagir à temps avec le dosage du coagulant le plus optimal, surtout lors de la

forte turbidité de l'eau brute [35], et de comprendre la différence entre le moment où les variables

de processus sont en contrôle statistique et quand ils sont hors contrôle.

Le travail que nous allons présenter consiste à appliquer les techniques de diagnostic

présentées avant. Pour réduire la probabilité d’erreur opérationnelle et réduire le cout des additifs

chimiques.

Les données utilisées dans la présente section contient: paramètres de l'eau brute:

Turbidité (NTU), PH, Conductivité (µs / cm), Température (C0) et O2 de l'Oxygène dissous

(mg / l), donc au total nous avons cinq mesures de capteurs à utiliser. Les mesures sont

échantillonnées par une unité de supervision et d'acquisition de données SCADA (Supervisory

Control And Data Acquisition). Les données sur l'eau brute couvrent une période de 816 jours

représentant des périodes différentes, de sorte que le jeu de données complet a été utilisé pour

construire et développer les modèles. La figure V.2 illustre l'évolution des variables dans l’état

normal. Les données dans l'intervalle [451-750] ont été utilisés pour créer un défaut à

l'échantillon 150.


50

1 1.5 2 2.5 3 3.5 4 4.5 550

60

70

80

90

100

110


pourc

enta

ge d

e la v

ariance t

ota

le

1 1.5 2 2.5 3 3.5 4 4.5 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7


err

eur

de v

alidation

0 200 400 600 800 10000

20

40

# échantillons

turb

idité(N

TU

)

0 200 400 600 800 10006

8

10

# échantillons

PH

0 200 400 600 800 10000

1000

2000

# échantillons

conductivité(µ

s/c

m)

0 200 400 600 800 10000

20

40

# échantillons

tem

pera

ture

(°C

)

0 200 400 600 800 10000

5

10

# échantillons

Oxygen d

issoue (

mg/l)

Fig V.2 : Evolution des variables eau brute.

V.1 Application

Maintenant nous allons appliquer un modèle ACP sur les données, nous avons utilisé

deux critères pourcentage de la variance totale et erreur de validation où le nombre de

composantes retenu =2. Dans le cas de l’ACPNL l’architecture du réseau choisit est [5-4-2-4-5]

avec des fonctions non-linéaires tangente-sigmoïdale dans les couches cachées. Pour les limites

d’avertissement et d’action, le seuil prédéfini de signification est choisi : 0.05a = .

Fig V.3 : Pourcentage de la variance totale. Fig V.4 : Erreur de validation.


51

1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

variables

Contr

ibution a

u S

PE

: in

sta

nt

de d

éte

ction

0 50 100 150 200 250 3000

0.5

1

1.5

2

2.5

3

3.5

4

4.5

# Echantillons

(ACPNL)

SPE

da2

0 50 100 150 200 250 3000

0.5

1

1.5

2

2.5

3

3.5

4

4.5

# Echantillons

SPEf iltré

da2

0 50 100 150 200 250 3000

0.5

1

1.5

2

2.5

3

3.5

4

# échantillons

SPE

da2

0 50 100 150 200 250 3000

0.5

1

1.5

2

2.5

3

3.5

4

# échantillons

SPEf iltré

da2

Fig V.5 : La statistique SPE et SPE filtré de l’ACP linéaire.

Les figures V.5 montrent le SPE et le SPE filtré ou nous remarquons un problème dans

l’instant de détection. La figure suivante illustre les contributions des différents variables à

l’instant 150.

Fig V.6 : Contribution des variables ACP.

La figure V.7 montre le SPE et le SPE filtré et la figure V.8 montre le tracé des

contributions dans le cas de l’ACPNL.

Fig V.7 : La statistique SPE et SPE filtré de l’ACP non linéaire avec un défaut à partir de

l’échantillon 150.


52

1 2 3 4 50

0.5

1

1.5

2

2.5

3

3.5

4

4.5

variables

Contr

ibution a

u S

PE

Fig V.8 : Contribution des variables ACPNL.

On peut remarquer que dans le cas de l’ACP linéaire, on ne peut pas détecter le défaut

dans le cas du SPE et dans le cas du SPE filtré (La figure V.5) on a un problème dans l’instant de

détection et qui mène à une localisation erronée (La figure V.6) ce qui n’est pas le cas dans

l’ACPNL ou la détection est bonne sauf pour le SPE ou nous avons une fausse alarme mais

celle-ci est éliminer avec le SPE filtré (La figure V.7). Le tracé des contributions (La figure V.8)

indique que le deuxième capteur (capteur du PH de l’eau brute) est en défaillance.

Conclusion générale

54

Conclusion générale

Dans ce mémoire, on a essayé de passer en revue les techniques de diagnostic les plus

importantes parmi plusieurs et déférentes classifications proposées par les chercheurs dans ce

domaine. Nous avons vu dans le premier chapitre, que le diagnostic dépend d’une représentation

du système, et cette représentation peut être physique, à base de règles relationnelles, ou à base

de données (mesures) disponibles sur le système.

L’ACP est l’une des méthodes de diagnostic à base de données, et comme on peut le

remarquer, elle est une technique de statistique descriptive dont le principe est simple mais qui

met en œuvre des calculs numériques importants, pour cette raison elle n’a pu se développer

qu’avec l’apparition des ordinateurs.

Dans notre travail, on a utilisé l’ACP pour détecter et localiser les défauts de capteur.

Généralement le principe de cette technique est la réduction de la dimensionnalité d’une base de

données avec la perte du moins d’information possible, pour faciliter l’analyse, cette méthode

permet d’identifier les relations entre les variables du système afin de trouver un modèle prévu

de bon fonctionnement aide par la suite à détecter et localiser les défauts de capteurs par

génération des indicateurs de défauts (résidu), en comparant le comportement donné par les

variables mesurées et le comportement donnée par le modèle ACP prévu. Un indicateur des

anomalies, la statique de l’erreur quadratique SPE, est décrit pour la d´détection.

Concernant la localisation où l’isolation des capteurs défaillants, nous avons présenté la

méthode de localisation par calcul de contribution à l’indice de détection .

L’approche standard présentée de l’ACP traite seulement des données linéaires, et alors

on ne peut pas obtenir une représentation compacte des données réelles non-linéaires par

l’utilisation de cette version. Dans notre troisième chapitre, on a expliqué le principe de ACPNL,

qui est une extension non linéaire de l’ACP dont l’objectif est d’extraire à la fois les relations

linéaires et non linéaires entre les variables du système, ainsi nous avons parlé brièvement et

généralement sur les méthodes de modélisation en ACPNL et particulièrement sur le modèle

neuronal le plus utilisé dans le domaine de diagnostic, le réseau à cinq couches. Et en fin, et pour

bien comprendre le principe de méthodes présentées, on a proposé des exemples simples de

simulation et une application basée sur des données réelles.

Les résultats et la discussion de l’application de l’analyse en composantes principales sur

un procédé de traitement d’eau potable afin de détecter et localiser les défauts de capteurs, ont

fait l’objet du dernier chapitre de cette étude, ou nous avons démontré l’efficacité des techniques

étudiées. Comme travail futur, on envisage d’introduire d’autre approches de détection et

localisation de défaut spécialement la statistique de Hotteling T² et la structuration des résidus,

aussi introduire le concept de reconstruction de mesure pour la correction des défauts.

Annexe

A.1 Apprentissage du réseau

L’apprentissage est une phase du développement d’un réseau de neurones durant laquelle

le comportement du réseau est modifié jusqu’à l’obtention du comportement désiré.

Pour les « MLPs », l’algorithme de rétro-propagation peut traiter le problème de

comment modifier le poids pour les connexions qui ne sont pas en relation avec un neurone de

sortie, cet algorithme et comme tous les algorithmes d’apprentissage des réseaux de neurones

repose sur la minimisation de l’écart entre les réponses réelles du réseau et ses réponses désirées

où les poids sont initialisés aléatoirement avant l’apprentissage puis modifiés itérativement

jusqu’à l’obtention d’un compromis satisfaisant entre la précision de l’approximation sur

l’ensemble d’apprentissage et la précision de l’approximation sur l’ensemble de validation.

L’erreur totale pour tous les neurones du réseau est donnée par :

1

1( )

N

k

E E kN =

= å (A.1)

Pour minimiser cette erreur, on calcule son gradient par rapport à chaque poids puis on modifie

les poids selon une stratégie de descente en gradient :

Ew w

wh+ -

-¶

= -¶

(A.2)

Où η est le pas d’apprentissage 0.1 1h< < .

( ) ( )2

1

1ˆ( ) ( )

2

m

i ii

E k x k x k=

= -å (A.3)

La minimisation de l’erreur quadratique E(k) par rapport aux poids

( )tjiv

est donnée par :

( ) ( )( )

( )( ) ( )

ˆ

ˆ

it t

iij ji

E k E k x k

x kv v

¶ ¶ ¶=

¶¶ ¶ (A. 4)

Et la modification des poids

( )tjiv

est donnée par :

( )( )

( )

tji t

ji

E kv

vh

¶D = -

¶ (A. 5)

La même chose pour les couches intermédiaires :

( ) ( )( )

( ) ( )

( ) ( ) ( )

ˆ

ˆ

tji

t t tij j j

hE k E k x k

x kw h w

¶¶ ¶ ¶=

¶¶ ¶ ¶ (A. 6)

Et la modification des poids

( )tjw

est donnée par :

Annexe

( )( )

( )

tj t

j

E kw

wh

¶D = -

¶ (A. 7)

( ) ( )( ) ( )x xj j

E k E k t

tw w

¶ ¶ ¶=

¶¶ ¶ (A. 8)

( )( )

( )

xj x

j

E kw

wh

¶D = -

¶ (A. 9)

Finalement, le gradient de E(k) par rapport aux poids

( )xijv

est donné par :

( ) ( ) ( )

( ) ( ) ( )

xj

x x xij j ij

hE k E k t

tv h v

¶¶ ¶ ¶=

¶¶ ¶ ¶ (A.10)

( )( )

( )

tij x

ij

E kv

vh

¶D = -

¶ (A.11)

Il est important de souligner que le problème de la sélection de l’ordre des composantes

principales à retenir peut être résolu en adoptant une stratégie d’apprentissage séquentiel. Dans

une première étape, en ayant qu’un seul neurone (CP) dans la couche d’étranglement, et après

l’évaluation de l’erreur de reconstruction E on peut procéder à l’extraction d’une 2eme

composante non linéaire. Cette opération peut être répéter jusqu’à l’obtention d’une erreur

d’estimation inférieure un certain seuil choisi a priori.

Annexe

x( )xh

u

( )uhx

x(x )h

1u

1(u )

h

x

e( e )h

2u

2(u )

h

e

x x

-

+

e

B.1 Algorithme séquentiel (Fig B.1)

1. Projeter les données X dans un espace de dimension des composantes principales en

utilisant une structure de réseau à cinq couches.

2. Apprendre le réseau et estimer X par projection inverse.

3. Calculer l’erreur d’estimation Ê X X= - . Répéter les étapes 1 et 2 en prenant la matrice E

à la place de X jusqu’à ce qu’un pourcentage de la variance de X soit capturé.

Fig B.1 : Extraction séquentielle des composantes principales non linéaires.

B.2 Algorithme parallèle (Fig B.2)

1. Projeter les données X dans un espace de dimension des composantes principales en

utilisant une structure de réseau à cinq couches.

2. Apprendre le réseau et estimer X par projection inverse.

Les deux algorithmes ont leurs avantage et inconvénients. L’avantage principal de l’algorithme

parallèlement est qu’il est plus rapide à apprendre en le comparant à l’algorithme séquence : pour

composantes, un seuil réseau de neurones est nécessaire dans le cas parallèle, alors qu’il faut

réseaux dans le cas séquentiel. L’inconvénient de l’algorithme parallèle réside dans la première

étape. Cette étape suppose que le nombre des CPs doit être connu a priori.

Fig B.2 : Extraction simultanée des composantes principales non linéaires.

Annexe

C.1 Indice de validité des capteurs (SVI) :

Après la détection de la présence d’un défaut, on effectue la reconstruction de toutes les

variables à partir de l’instant de détection, et on calcule l’indice de détection. Par exemple si on

détecte un défaut à l’instant de temps k, SPEj(k) représente l’indice de détection de la jeme

variable reconstruite.

La localisation est effectuée par la comparaison de l’indice de détection avant et après la

reconstruction. Cette comparaison est appelée indice de validité ηj(k) où :

( )( )

( )

jj

SPE kk

SPE kh = (C.1)

Cet indice est toujours inférieur ou égale à 1 [ ]( )0 1h Î parce que l’indice de détection

SPE(k) est toujours supérieur ou égale à SPEj(k). Si le jeme

capteur est défaillant, l’indice de

validité de ce capteur doit être descendant vers le zéro.

Notons que l’équivalence filtrées de ce critère donné par :

2 ( )( ) 1

( )

jj

SPE kk

SPE kh = < (C.2)

Bibliographie

[1] Thèse Doctorat, Gaouaui Mohammed, Diagnostic par reconnaissance des formes :

application à la machine asynchrone, Université Mouloud Mammeri de Tizi-ouzou,

2012.

[2] Thèse Doctorat, Zahi Sabeh, Diagnostic à base de modèle : application à un moteur

diesel suralimenté à injection directe, 2006.

[3] Thèse Doctorat, Nati Slimani Boukhalfa, Synthése d’observateur non linéaires :

application au daignostic de défauts, Université Mouloud Mammeri de Tizi-ouzou.

[4] Brunet M., Jaume D., Labarrere M., Rault A., Verge M., « Détection et diagnostic de

pannes-Approche par modélisation», Traité des nouvelles technologies, série

Diagnostic et Maintenance, Hermèse, Paris 1990.

[5] Maintenance prédictive d’un entraînement électrique par identification paramétrique.

Diagnostic et sûreté de fonctionnement, Vol. 3, N° 1, p 69-95, 1993.

[6] A. PHILIPPOT, «contribution au diagnostic décentralisé des systèmes a événements

discrets: application aux systèmes manufacturiers». Thèse Présentée pour obtenir le

grade de Docteur de l’Université de Reims Champagne Ardenne. Soutenue

publiquement le 18 juillet 2006.

[7] P.M. FRANK, «Enhancement of robustness in observer based fault detection»,

Int.J.of Cont., 59, 1994, p. 955-981.

[8] R. J. PATTON et J. CHEN, «Observer-based fault detection and isolation:

Robustness and applied», Control Engineering Practice, Vol. 5 (5), pp. 671-682,1997.

[9] M.COMBACAU, P.BERRUET, F.CHARBONNAUD, A.KHATAB, «Réflexions sur

la terminologie: Surveillance – Supervision», Groupement pour la Recherche en

Productique, Systèmes de Production Sûrs de Fonctionnent,

http:/www.laas.fr/~combacau/SPSF/ sursup.html, 03 mars 2000.

[10] G.ZWINGELSTEIN, «Diagnostic des défaillances», Traité des Nouvelles

Technologies, er-i.e. Diagnostic et Maintenance, Hermès, 1995.

[11] Abdelkader AKHENAK, «Conception d’observateurs non linéaires par approche

multimodale: application au diagnostic ; Thèse présentée et soutenue publiquement le

16 décembre 2004 pour l’obtention du Doctorat de l’Institut National Polytechnique

de Lorraine.

[12] B.DARKHOVSKI, M.STAROSWIECKI, «Theoretic Approach to Decision in FDI»,

IEEE Transactions on automatic control, Vol. 48, N°5, 2003.

Bibliographie

[13] Diamantaras K. I., Kung S. Y. (1996). Principal component neural networks. Theory

and applications. John Wiley & Sons.

[14] Valle S., Weihua L., and Qin S. J. (1999). Selection of the number of principal

components: The variance of the reconstruction error criterion with a comparison to

other methods. Industrial & Engineering Chemistry Research, vol. 38, pp. 4389-4401.

[15] Qin S. J. and Dunia R. (1998). Determining the number of principal components for

best reconstruction. Proc. of the 5-th IFAC Symposium on Dynamics and Control of

process Systems, pp. 359-364, Corfu, Greece.

[16] Z. Shijian and X.Yongmao : Multivariate statistical process monitoring usin robust

NLPCA,Tsinghai science and technology ISSN, Vol 10,N 5, PP 582-586, China

2005.

[17] R.Saegusa and S. Hashimoto: Pattern recognition using a nonlinear PCA, GVIP 05

conferance , Egypt 2005.

[18] T. Hastie and W.Stuetzle : Principal curves, Journal of the Americal Statistical

Association, Vol.84, 1989.

[19] N. Kambhalta: Dimension reduction by local principal component analysis, Neural

Computation, Vol.9, pp.1493-1516, 1997.

[20] M. Kramer : Nonlinear principal component using autoassosiative neural network,

AIChE journal, vol.37, N.2, 1991.

[21] Funahashi K. (1989). On the approximate realization of continuous mappings by

neural networks. Neural Networks, vol. 2, pp. 183-192.

[22] Cybenko G. (1989). Approximation by superposition od sigmoidal function.

Mathematics of Control Signal and Systems, vol. 2, pp.303-314.

[23] Tong H. and Bluck D. (1998). An inndustrial application of principal component test

to fault detection and identification. 3rd IFACWorkshop on On-line Fault Detection

and Supervision in the Chemical Process Industries, Lyon, France.

[24] Jackson J. E., Mudholkar G. S.(1979). Control procedures for residuals associated

with principal component analysis. Technometrics, vol. 21, N±3.

[25] Nomikos P. and MacGregor J. (1995). Multivariate SPC Charts for Monitoring Batch

Processes. Technometrics, vol. 37, N± 1, pp. 41-59.

[26] Box G. E. P. (1954). Some theorems on quadratique forms applied in the study of

analysis of variance problems: Effect of inequality of variance in one-way

classification. The Annals of Mathematical Statistics, vol. 25, pp. 290-302.

Bibliographie

[27] Tibshirani R. (1992). Principal curves revisited. Statistics and computation, vol. 2, pp.

183-190.

[28] Harkat M.F., Mourot G., Ragot J. (2000). Sensor failure detection of air quality

monitoring network. IFAC Symposium on Fault Detection, Supervision and Safety

for Technical Processes, SAFEPROCESS’2000, Budapest, Hungary, June 14-16.

[29] Qin, S. J. andWeihua L. (1999). Detection, identification and reconstruction of faulty

sensors with maximized sensitivity. AIChE Journal, vol. 45, N± 9, pp. 1963-1976.

[30] Thèse, Harkat Mohamed-Faouzi, Détection et Localisation de Défauts par Analyse en

Composantes Principales, Centre de Recherche en Automatique de Nancy, 2003.

[31] J.-J. Qin, M. H. Oo, K. A. Kekre, F. Knops, and P. Miller, “Impact of coagulation ph

on enhanced removal of natural organic matter in treatment of reservoir water,”

Separation and Purification Technology, vol. 49, no. 3, pp. 295–298, 2006.

[32] H. R. Maier, N. Morgan, and C. W. Chow, “Use of artificial neural networks for

predicting optimal alum doses and treated water quality parameters,” Environmental

Modelling & Software, vol. 19, no. 5, pp. 485–494, 2004.

[33] G.-D. Wu and S.-L. Lo, “Predicting real-time coagulant dosage in water treatment by

artificial neural networks and adaptive network- based fuzzy inference system,”

Engineering Applications of Artificial Intelligence, vol. 21, no. 8, pp. 1189–1195,

2008.

[34] N. Valentin, T. Denoeux, and F. Fotoohi, “A hybrid neural network based system for

optimization of coagulant dosing in water treatment plant,” in Proceeding of

international joint conference on neural networks (IJCNN’99), Washington, 1999.

[35] C.-L. Chen and P.-L. Hou, “Fuzzy model identification and control system design for

coagulation chemical dosing of potable water,” Water Science & Technology: Water

Supply, vol. 6 no 3, pp. 97–104, 2006.

Résumé

Dans ce travail, nous avons étudié le diagnostic des systèmes à base de

l’Analyse en Composantes Principales qui est une technique de control statistique

multi-varié.

Nous avons introduit en premier les différentes notions et définitions liées

aux diagnostics des systèmes, puis la présentation de l’ACP dans ces deux

versions linéaires et Non linéaires (ACPNL) à base d’un réseau de neurones auto

associatif à étranglement (Bottleneck) pour la détection et la localisation des

défauts. Des exemples de simulations sont présentés, et pour vérifier l’efficacité

des techniques étudiées, une base de données réelle d’une station de traitement

d’eau potable est prise comme exemple.

Mots clés : Diagnostic, Control Statistique Multi-varié, ACP, ACPNL, Détection

et Localisation des Défauts

Documents

FACULTE DES SCIENCES ET SCIENCES APPLIQUES …