Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE LARBI BEN MHIDI
OUM EL BOUAGHI
FACULTE DES SCIENCES ET SCIENCES APPLIQUES
DEPARTEMENT GENIE ELECTRIQUE
MÉMOIRE DE FIN D'ETUDE
EN VUE DE L'OBTENTION DU DIPLOME DE
MASTER 02 EN INFORMATIQUE INDUSTRIELLE
Thème
REALISE PAR :
@ Dreibine Mahieddine.
ENCADRE PAR:
@ Mr Mendaci Khaled.
Promotion -2013/2014-
Remerciements
De prime à bord, je tiens à exprimer nos gratitudes et présenter
nos chaleureux remerciements à :
• Notre Dieu Tout Puissant pour nous avoir donné la force, la santé et la résistance pour persévérer dans nos études.
• Mr Khaled Mendaci mon encadreur, qui n’a pas cessé de me prodiguer ses conseils et qui a épargné un grand effort pour contribuer à la réussite de mon travail.
• A tout mes enseignants de l’université Larbi Ben M’hidi d’Oum El Bouaghi (Pôle universitaire d’Ain El Beida).
• Notre Institut qui nous a donné l'occasion d'acquérir une spécialisationexceptionnelle.
Toute personne ayant contribué de près ou de loin à l’élaboration de ce modeste travail.
Dédicace
Je dédie cet humble travail à mes parents
et à toute ma famille ainsi qu’à tous les
enseignants et mes collègues de la faculté SSA
(Pôle universitaire d’Ain El Beida).
i
Table des matières
Liste des figures ........................................................................................................................... iii
Notation......................................................................................................................................... v
Introduction générale .................................................................................................................... 2
CHAPITRE I Généralités sur le diagnostic
I.1 Introduction ............................................................................................................................. 4
I.2 Formulation du problème ........................................................................................................ 4
I.3 Terminologie et définitions ..................................................................................................... 5
I.4 Les différents types de défaut .................................................................................................. 7
I.5 Classification des défauts ........................................................................................................ 7
I.5.1 Emplacement ................................................................................................................. 7
I.5.2 Modélisation .................................................................................................................. 8
I.5.3 Caractéristiques temporelles .......................................................................................... 9
I.6 Surveillance et diagnostic ........................................................................................................ 9
I.7 Diagnostic .............................................................................................................................. 10
I.7.1 Détection de défaut ..................................................................................................... 10
I.7.2 Localisation de défaut ......................................................................................................... 11
I.7.3 Identification de défaut ....................................................................................................... 11
I.7.4 Prise de décision ......................................................................................................... 11
I.8 Critères de performance d'un système de diagnostic ............................................................. 11
I.9 Différentes méthodes de diagnostic ....................................................................................... 11
I.9.1 Méthodes externes, ou méthodes « sans modèle »........................................................... 12
I.9.2 Méthodes internes, ou méthodes « avec modèle » ........................................................... 13
I.10 Conclusion ........................................................................................................................... 18
CHAPITRE II Analyse en Composantes Principales
II.1 Introduction .......................................................................................................................... 20
II.2 Principe de l’analyse en composantes principales ............................................................... 21
II.3 Identification du modèle ACP .............................................................................................. 23
II.3.1 Estimation des paramètres du modèle .............................................................................. 23
II.3.2 Détermination de la structure du modèle ......................................................................... 23
II.4 Les exemples de simulation ................................................................................................. 25
II.4.1 Exemple (II.1) ............................................................................................................ 25
II.4.2 Exemple (II.2) ............................................................................................................ 27
II.5 Conclusion ............................................................................................................................ 31
ii
CHAPITRE III Analyse en Composantes Principales non Linéaires
III.1 Introduction ......................................................................................................................... 33
III.2 Modélisation par ACPNL ................................................................................................... 34
III.2.1 Modèle ACPNL basé sur la transformation non linéaire ............................................. 34
III.2.2 Approximation linéaire définie par morceaux ............................................................... 34
III.2.3 Modèle ACPNL basé sur les réseaux de neurones artificiels ...................................... 35
III.3 Approche neuronale de l’ACPNL ....................................................................................... 35
III.4 Exemple de simulation ........................................................................................................ 37
III.4.1 Exemple (III.1) .......................................................................................................... 37
III.5 Conclusion .......................................................................................................................... 39
CHAPITRE IV Détection et localisation de défauts par Analyse en Composantes Principales
IV.1 Introduction......................................................................................................................... 41
IV.2 Détection de défauts par ACP............................................................................................. 41
IV.2.1 Génération de résidus par estimation d’état ................................................................... 41
IV.3 Les exemples de simulation ................................................................................................ 43
IV.3.1 Exemple (IV.1) ......................................................................................................... 43
IV.3.2 Exemple (IV.2) ......................................................................................................... 44
IV.4 Localisation de défauts par ACP ........................................................................................ 45
IV.4.1 Localisation par calcul des contributions ....................................................................... 45
IV.5 Conclusion .......................................................................................................................... 46
CHAPITRE V Application pour diagnostic avec ACP
V. Introduction ............................................................................................................................ 48
V.1 Application ........................................................................................................................... 50
Conclusion générale .................................................................................................................... 54
Liste des figures
iii
Liste des figures
Fig I.1: Principe du diagnostic des systèmes commandés. ............................................................. 5
Fig I.2: La cause principale d’une panne. ....................................................................................... 6
Fig I.3: Défauts d’un système industriel. ........................................................................................ 8
Fig I.4: les défauts selon leur représentation ................................................................................... 8
Fig I.5: Répartition des défauts selon le comportement temporel ................................................... 9
Fig I.6: Modules d’une procédure de surveillance. ......................................................................... 9
Fig I.7: Les différentes étapes des diagnostiques industriels ........................................................ 10
Fig I.8: Schéma représentant la redondance matérielle ................................................................. 12
Fig I.9: Les étapes de diagnostic à base de modèles ..................................................................... 14
Fig I.10: La génération de résidus. ................................................................................................ 16
Fig I.11: Estimation de paramètres. .............................................................................................. 17
Fig I.12: Approche de l’espace de parité dans un format entrée-sortie. ........................................ 18
Fig I.13: schéma fonctionnel d’un observateur générateur de résidu. .......................................... 18
Fig II.1 : Estimation de données par la première CP. ................................................................... 27
Fig II.2 : Sélection du nombre de CPs à retenir. ........................................................................... 27
Fig.II.3 : Evolution des variables x1, x5 et x7 ............................................................................... 28
Fig II.4: Evolution des composantes principales. ......................................................................... 29
Fig II.5: Pourcentage de la variance totale. ................................................................................... 30
Fig II.6: Erreur de validation. ........................................................................................................ 30
Fig II.7: La moyenne des valeurs propres. .................................................................................... 30
Fig II.8 : validation du modèle de huit variables........................................................................... 31
Fig II.9 : validation du modèle «la variable x1». .......................................................................... 31
Fig III.1 : Transformation linéaire. ................................................................................................ 33
Fig III.2 : Transformation non linéaire. ......................................................................................... 33
Fig III.3 : Principe du modèle ACP. .............................................................................................. 33
Fig III.4 : Réseau à cinq couches pour l’extraction d’une seule composante principale non linéaire ...... 36
Liste des figures
iv
Fig III.5 : Estimation linéaire et non linéaire par la première CP. ................................................ 38
Fig III.6: Pourcentage de la variance totale. .................................................................................. 39
Fig IV.1 : Evolution de l’erreur quadratique de prédiction ACP et ACPNL. ............................... 44
Fig IV.2 : Evolution ACP et ACPNL de l’SPE filtré. ................................................................... 44
Fig IV.3 : Localisation par la méthode de contribution ACP et ACPNL. ..................................... 45
Fig V.1 : Processus traditionnel de traitement de l'eau potable .................................................... 48
Fig V.2 : Evolution des variables eau brute. ................................................................................. 50
Fig V.3 : Pourcentage de la variance totale. .................................................................................. 50
Fig V.4 : Erreur de validation. ....................................................................................................... 50
Fig V.5 : La statistique SPE et SPE filtré de l’ACP linéaire. ........................................................ 51
Fig V.6 : Contribution des variables ACP. .................................................................................... 51
Fig V.7 : La statistique SPE et SPE filtré de l’ACP non linéaire .................................................. 51
Fig V.8 : Contribution des variables ACPNL. .............................................................................. 52
Notation
v
Notation
´ÎÂN mX Matrice de données représentant le fonctionnement normal du système.
X Estimation de X par le modèle ACP.
C Matrice représente le modèle ACP.
´SÎÂm m
Matrice de covariance de X.
N Nombre d’echantillons mesurées.
m Nombre de variables à surveiller.
Nombre de composantes retenues dans le modèle ACP (dimension de
l’espace réduit).
k Indice du temps.
2js Variance de la jeme variable.
ÎÂmx Nouveau vecteur de mesure.
x Estimation du vecteur x par le modèle ACP.
ÎÂmix Nouveau vecteur de mesure dont la ième composante est reconstruit.
ix La ième composante du vecteur x.
x Vecteur moyen de x.
( ) 1-ÎÂi mx Le vecteur x sans la ième composante.
´ÎÂm mP Matrice des vecteurs propres de
ˆ ´ÎÂmP Matrice des premiers vecteurs propres de
( )´ -ÎÂ ( )( )´ -( )ÎÂm mP Matrice des -m derniers vecteurs propres de
n mt ´ÎÂ Matrice des composants principale.
t Vecteurs des premières composantes principales.
t Vecteur des -m dernières composantes principales.
li ième valeur propre de
ip ième vecteur propre de correspondant à li
e Espérance mathématique.
iz Valeur reconstruite de la mesure ix .
ri Variance de l’erreur de reconstruction de la ième variable.
xi ieme ligne d’une matrice unitaire (direction de défauts).
ie Erreur d’estimation sur la ième variable.
e Vecteur des erreurs d’estimation.
e Vecteur d’erreur filtré.
b Facteur d’oubli pour le filtrage des résidus.
L Matrice diagonale des vecteurs propres.
Notation
vi
2d Seuil de confiance de l’indicateur SPE.
2( )j kh Indice de validité des capteurs.
ACP Analyse en Composantes Principales.
CPs Composantes Principales.
PCV Pourcentage Cumulé de la Variance.
PRESS Validation croisée.
MLP Multi-Layer Perceptron.
SPE Critère de l’Erreur quadratique de prédiction.
EWMA Exponentially Weighted Moving Average.
ACPNL Analyse en Composantes Principales Non Linéaire.
Introduction générale
2
Introduction générale
En réponse aux besoins de l’industrie, beaucoup d’effort est fourni pour trouver des
nouveaux outils technologiques pour la surveillance et le contrôle des procédés, parmi lesquels
on citera les techniques basées sur les statistiques SPC (Statistical Process Control). Parmi les
développements particuliers dans ce domaine, on citera les progrès réalisés dans les méthodes
statistiques multi variées pour la surveillance des systèmes (Multivariate Statistical Process
Monitoring Techniques), qui sont devenues de plus en plus des techniques populaires utilisées
pour l’étude des ensembles de données compliqués, en fournissant une analyse lorsqu’il y a
plusieurs variables dépendants et/ou indépendants, tous avec des degrés de corrélation différents
de un à un.
Par ailleurs les procédures de control uni-variées sont très utilisées en industries mais elles
sont inadéquates lorsqu’elles sont utilisées pour contrôler des processus qui sont de nature multi
variées.
Les méthodes statistiques multi variées pour le control des systèmes MSPC (Multivariate
Statistical Process Control) sont utilisées avec grand succès, principalement dû à l’adoption des
techniques d’analyses puissantes comme l’analyse en composante principale PCA, qui ne
nécessite pas des connaissances préalables sur les mécanismes des processus.
Le travail présenté dans ce mémoire consiste à présenter la problématique du diagnostic
des systèmes, l’étude de l’Analyse en Composante Principale dans ses deux versions linéaire et
non-linéaire et l’application des techniques étudiés sur des systèmes pour la détection et la
localisation de défauts.
Le premier chapitre la formulation du problème de diagnostic des systèmes est présenté
avec les différentes techniques utilisées dans ce domaine.
Le deuxième chapitre présente l’analyse en composante principale ACP dans sa version
linéaire avec l’aspect théorique et des exemples.
Le chapitre trois présente l’analyse en composante principale dans sa version non linéaires
ACPNL avec l’aspect théorique en particuliers celle basé sur un réseau de neurone auto
associatif avec étranglement et des exemples sont présentés.
Le quatrième chapitre, l’utilisation de l’ACP dans ces deux versions dans la détection et la
localisation des défauts est traitée.
Le cinquième chapitre nous avons tenté d’appliquer les approches présentées sur un
procédé réel de traitement des eaux potables. A la fin une conclusion est inscrite avec des
perspectives.
Chapitre I Généralités sur le diagnostic
4
Sommaire
I.1. Introduction ....................................................................................................................................... 4
I.2. Formulation du problème ................................................................................................................. 4
I.3. Terminologie et définitions ............................................................................................................... 5
I.4. Les différents types de défaut ........................................................................................................... 7
I.5. Classification des défauts .................................................................................................................. 7
I.6. Surveillance et diagnostic ................................................................................................................. 9
I.7. Diagnostic ......................................................................................................................................... 10
I.8. Critères de performance d'un système de diagnostic ................................................................... 11
I.9. Différentes méthodes de diagnostic ............................................................................................... 11
I.10. Conclusion ...................................................................................................................................... 18
I.1. Introduction
En raison d’une modernisation incessante des outils de production, les systèmes industriels
deviennent de plus en plus complexes. En parallèle, la fiabilité, disponibilité, sûreté de
fonctionnement sans oublier la protection de l’environnement sont devenue vraiment des
nécessaires pour les entreprises actuelles, et ça justifie la nécessité de la mise en œuvre des
systèmes de diagnostic qui sont apparus et développés dans le but d’améliorer les points
précédents.
Dans ce contexte, de nombreuses approches sont développées, en vue de la détection de
défaillances et du diagnostic, par les différentes communautés de recherche en automatique. Les
méthodes se différencient par rapport au type de connaissance a priori sur le processus qu’elles
nécessitent. Ainsi, elles peuvent être classées, de façon générale, comme des méthodes :
relationnelles, à base de modèles et des méthodes à base de données historiques [1]. Nous
présentons dans ce chapitre tous les concepts de base utilisés le diagnostic à savoir la
surveillance, la défaillance..., et les relations entre ces concepts, avec une classification des
techniques de diagnostic selon la nature de la connaissance disponible sur le système à surveiller.
I.2. Formulation du problème
Le problème de la conception des algorithmes de diagnostic peut se formuler comme suit :
en utilisant les données disponibles (en ligne ou hors ligne), et la connaissance que l'on a du
système, il s'agit de produire des décisions les meilleurs possibles relatives à l'état de santé du
système. Les données disponibles sont les valeurs des variables mesurées (signaux) et des
Chapitre I Généralités sur le diagnostic
5
Détection des défaut
Localisation et identification des
défaut
Décision et proposition d’actions
Processus CapteurContrôleur
PerturbationDéfauts
EntréesAcquisition
Mesures
Modèle de
diagnostique
paramètres connus du système (sorties, valeurs des consignes mesurées, entrées calculées,
paramètres nominaux).
Fig I.1: Principe du diagnostic des systèmes commandés.
Un processus industriel est constitué d’un système réglé par un contrôleur dans le but
d’améliorer ses performances. Dans ce cas, les variables connues sont les sorties du contrôleur et
les mesures des sorties fournies par les capteurs. (La figure I.1) illustre la synthèse du module de
diagnostic due à la présence non seulement des défauts mais aussi des perturbations, en présence
d’un contrôleur. Ces deux paramètres non contrôlées et généralement non mesurables affectent
l’évolution du système et dégradent ses performances.
I.3. Terminologie et définitions
Avant d’aller plus loin, il convient de définir ce qu’est un défaut, une défaillance, une
panne, un état de fonctionnement normal,…, les principaux termes utilisés en diagnostic des
systèmes.
I.3.1. Fonctionnement normal d’un système
Un système est dit dans un état de fonctionnement normal lorsque les variables
caractérisant (variables d’état, variables de sortie, variables d’entrée, paramètres du système)
demeurent au voisinage de leurs valeurs nominales. Le système est dit défaillant dans le cas
contraire [2].
I.3.2. Défaut (Fault )
Le concept de défaut est fondamental dans les opérations de surveillance pour la conduite
et la maintenance des procédés industriels. On appelle défaut tout écart entre la caractéristique
Chapitre I Généralités sur le diagnostic
6
Défaut Défaillance Panne
observée sur le dispositif et la caractéristique théorique. Cet écart est statistiquement nul en
l’absence de défaut. Les défauts peuvent apparaître au niveau des capteurs, des actionneurs ou
au niveau du processus lui-même [2].
I.3.3. Défaillance (Failure)
Une défaillance est l’altération ou la cessation de l’aptitude d’un ensemble à accomplir sa
ou ses fonctions requises avec les performances définies dans les spécifications techniques. Une
défaillance est un dysfonctionnement du système, le processus présente alors un fonctionnement
inacceptable du point de vue performance. Il est clair qu’une défaillance implique l’apparition
d’un défaut puisqu’il existe un écart entre la caractéristique mesurée et la caractéristique
théorique. Par contre, un défaut n’implique pas nécessairement une défaillance puisque le
diapositif peut très bien continuer à assurer sa fonction principale [2].
I.3.4. Panne (Break-down)
Une panne est l’inaptitude d’un dispositif à accomplir une fonction requise. Une panne
résulte toujours d’une défaillance et donc d’un défaut :
Fig I.2: La cause principale d’une panne.
Dans le cadre de la maintenance préventive conditionnelle, il est clair que le diagnostic
doit permettre de détecter et de localiser un défaut avant que celui-ci ne conduise à une
défaillance ou à une panne qui entrainerait l’arrêt du système [2].
I.3.5. Perturbation (Disturbance)
Entrée du système physique qui n’est pas une commande. Autrement dit, c’est une entrée
non contrôlée [3].
I.3.6. Résidu (Residual)
Un indicateur de défauts basé sur la différence entre les mesures théoriques estimées [1].
I.3.7. Symptôme analytique (Analytical Symptom)
Un changement dans les caractéristiques nominales d’une quantité observable provoqué
par un défaut [1].
Chapitre I Généralités sur le diagnostic
7
I.4. Les différents types de défaut
Les défauts affectant un système, sont classés selon leur emplacement, leur modélisation,
leurs caractéristiques temporelles .Les défauts peuvent être purement ou progressifs dans le cas
du vieillissement ou de l'usure (défauts évolutifs) et classés par ordre de gravité.
I.4.1. Défaut déclaré
Un défaut déclaré apparaît de façon spontanée et se manifeste souvent par un biais pouvant
avoir diverses origines comme une panne de capteur ou d'actionneur. Dans ce cas l'organe en
question ne répond plus aux excitations du phénomène physique auquel il est soumis. Ceci peut
être dû à un encrassement, ou à un état détérioré d'un composant du système.
I.4.2. Défaut naissant
Un défaut naissant apparaît de manière progressive et d’amplitude croissante. Il se présente
sous la forme de dérives souvent dues au vieillissement ou à l'usure.
I.4.3. Défaut ponctuel
Un défaut ponctuel ou passager se caractérise par une durée brève et un écart significatif
par rapport à la moyenne locale.
I.4.4. Panne catastrophique
Une panne catastrophique entraîne un arrêt du système.
I.5. Classification des défauts
Les défauts affectent un système, ils sont classés selon leur emplacement, leur
modélisation, leurs caractéristiques temporelles.
I.5.1. Emplacement
Les défauts sont des événements qui apparaissent à différents endroits du système. Dans la
littérature, les défauts sont classés en fonction de leur localisation, d’où on peut distinguer :
a) Les défauts actionneurs
Les défauts actionneurs qui agissent au niveau de la partie opérative et détériorent le signal
d’entrée du système. Ils représentent une perte totale (défaillance) ou partielle d’un actionneur
agissant sur le système. Les défauts actionneurs partiels sont des actions qui réagissent de
manière similaire au régime nominal mais en partie seulement, c’est-à-dire avec une certaine
Chapitre I Généralités sur le diagnostic
8
Défaut internes
(sur composant du processus)
Défaut
Actionneurs
Défaut
Capteur
Actionneurs Capteurs
Entrées inconnues (perturbation, bruit de mesure …)
Processus
dégradation dans leur action sur le système (perte de puissance d’un moteur, fuite dans un
vérin,...).
b) Les défauts capteurs
Les défauts capteurs ce sont la cause d’une mauvaise image de l’état physique du système.
Un défaut capteur partiel produit un signal avec plus ou moins d’adéquation avec la valeur vraie
de la variable à mesurer. Ceci peut se traduire par une réduction de la valeur affichée par rapport
à la valeur vraie, ou de la présence d’un biais ou de bruit accru empêchant une bonne lecture. Un
défaut capteur total produit une valeur qui n’est pas en rapport avec la grandeur à mesurer.
Fig I.3: Défauts d’un système industriel.
c) Les défauts composants ou systèmes
Les défauts composants ou processus ils proviennent du processus lui-même; bien souvent
les défauts n’appartenant pas à un défaut capteur ou actionneur sont classés de manière arbitraire
dans cette catégorie. Mais, un défaut composant résulte de la casse ou de l’altération d’un
composant du système réduisant les capacités de celui-ci à effectuer une tâche. En pratique, ceci
revient à considérer une modification des caractéristiques du système proprement (problème
mécanique).
I.5.2. Modélisation
En plus, suivant la manière dont les défauts sont modélisés, ils sont classés en additif et
multiplicatif, comme représenté sur (La figure I.4).
Défaut additif Défaut multiplicatif
Fig.I.4: les défauts selon leur représentation.
Chapitre I Généralités sur le diagnostic
9
Module d'acquisition
de données
Module de perception
ou générateur
Module de détection
de défauts
Module de localisation
de défauts
Module de prise de
décision
Module d'identification
de défauts
I.5.3. Caractéristiques temporelles
Les défauts sont classés également selon leurs caractéristiques temporelles (La figure I.5)
comme brusque, progressif et intermittent. Les défauts brusques (biais) se produisent
instantanément souvent à cause de dommages matériels. Habituellement ils sont très graves car
ils affectent les performances et/ou la stabilité du système commandé. Les défauts progressifs
(dérives) représentent les changements lents des valeurs mesurées. Souvent dus au
vieillissement, Ils sont plus difficiles à détecter en raison de leur dynamique lente, mais sont
également moins graves. Les défauts intermittents (valeurs aberrantes) sont des défauts qui
apparaissent et disparaissent à plusieurs reprises, par exemple à cause d'un câblage partiellement
endommagé.
Biais Dérive Valeur aberrante
Fig I.5: Répartition des défauts selon le comportement temporel.
I.6. Surveillance et diagnostic
Des anomalies peuvent être dues à une dégradation d’une partie de l’installation qui se
traduit par la présence d’un défaut ou d’une défaillance (une panne dans un cas extrême) ou à
une réaction peu habituelle du système physique (soumis par exemple à une perturbation). Le
module de diagnostic doit donc permettre dans un premier temps de vérifier s’il s’agit d’une
réaction normale ou d’un défaut. Ensuite, de manière simple, il a pour objectif de déterminer les
composants en défaut au sein du système physique.
Le diagnostic s’inscrit en réalité dans une procédure plus complète désignée sous le nom
de surveillance, nécessitant la mise en œuvre des différents modules présentés dans
l’organigramme de (La figure I.6) [4,5]. De plus, il s’effectue en réalisant trois tâches bien
distinctes : la détection, la localisation et l’identification des défauts.
Fig I.6: Modules d’une procédure de surveillance.
Chapitre I Généralités sur le diagnostic
10
Détection
Identification de la cause
Localisation
Arrêt du
processus et
maintenance
Continuation en
mode dégradé et
en surveillance
Continuation
normale
Mesures et
observation
f =0
f ≤ ε
Entrées
Non
Oui
Non
Processus industriel
Oui
I.7. Diagnostic
Un diagnostic est l’identification de la (ou des) cause (s) probables d’un(ou des) défaut(s)
survenue(s) ou encourue(s) dans un système à l’aide d’un raisonnement logique fondé sur des
observations recueillies sur ce même système par inspection, par contrôle où par tests,
[AFNOR].
La structure générale d’une procédure de diagnostic et ses étapes est représentée sur (La
figure I.7) où le module de diagnostic est alimenté par toutes les informations disponibles sur le
système. Ces informations incluent les mesures des variables et toute autre information pouvant
être utile pour le diagnostic. Le module de diagnostic traite les observations et produit une liste
de défauts possibles pouvant affecter le système au cours du temps.
Il aide donc à surveiller un procédé complexe et par conséquent à prendre une décision
pour effectuer une reprise de la commande si possible.
Fig I.7: Les différentes étapes des diagnostiques industriels.
(f : défaut, ε : seuil défaut)
I.7.1. Détection de défaut
Premier niveau du diagnostic consiste à prendre une décision binaire : soit le système
fonctionne correctement, soit un défaut s'est produit. Le résultat de la procédure de détection est
une alarme signifiant que le fonctionnement réel du système ne concorde plus avec le modèle de
fonctionnement sain [6].
Chapitre I Généralités sur le diagnostic
11
I.7.2. Localisation de défaut
Deuxième niveau du diagnostic, déclenché par une procédure de détection, consistant à
déterminer de manière plus approfondie les composants défaillants : capteur, actionneur,
processus ou unité de commande [7].
I.7.3. Identification de défaut
L'identification d'un défaut est le fait d'estimer l'amplitude et l'évolution temporelle du
défaut afin d'expliquer au mieux le comportement du système. Cette partie d'identification du
défaut est la dernière phase de la procédure de diagnostic [8].
I.7.4. Prise de décision
Une fois le fonctionnement incorrect du système constaté, il est primordial d'agir de façon
à maintenir les performances souhaitées ou à limiter les dégradations sur le système réel. Cette
prise de décision permet de choisir entre plusieurs options comme arrêter le système pour faire
de la maintenance ou accepter un fonctionnement dégradé. Il peut encore s'agir, quand cela est
possible, de reconfigurer ou de réorganiser le système. Le rôle de la reconfiguration est de
s'affranchir des conséquences du défaut pour conserver les performances initiales lorsque cela est
possible ou encore d'assurer un fonctionnement dégradé du système si celui-ci est tolérable par
exemple en utilisant une redondance software ou hardware.
I.8. Critères de performance d'un système de diagnostic
Quelque auteurs dans la littérature ont résumé les critères que doit garantir une méthode de
diagnostic dans les points suivantes [6]:
þ Le diagnostic doit être facile à implémenter,
þ Le nombre de capteurs nécessaire pour le diagnostic doit être minimal,
þ Le diagnostic doit être prédictif,
þ Le diagnostic doit être réalisable en temps réel,
þ Le diagnostic doit être concevable algorithmiquement.
I.9. Différentes méthodes de diagnostic
Dans ce paragraphe, on présente différentes méthodes utilisées en diagnostic de systèmes
physiques, le domaine était très vaste, des choix arbitraires ont été faits. Le but n’est donc pas de
faire une synthèse exhaustive de l’existant, mais de montrer la richesse des possibilités qui
s’offrent au concepteur de système de diagnostic. En effet, différents types d’algorithmes de
détection dédies aux systèmes physiques ont été conçus par les chercheurs.
Chapitre I Généralités sur le diagnostic
12
Capteur 1
Capteur 2
X(t) Mésure 1
Mésure 2
I.9.1. Méthodes externes, ou méthodes « sans modèle »
Le diagnostic sans modèle, nommé par fois diagnostic externe. Ces méthodes ont été
développées pour pouvoir étudier efficacement la dynamique d’un système pour lequel le
modèle mathématique est difficile à établir voir même inexistant.
Ä Vérification de seuils atteint
Les mesures sont comparées à des seuils critiques définis par avance. Le fait de dépasser
cette limite présente des dangers quant à l'utilisation du processus ; le système est mis en défaut.
Ä Mise en place de capteurs dédiés
Ces capteurs peuvent être soit des détecteurs vérifiant de manière simple si les valeurs
critiques sont atteintes ou non (par exemple, température limite ou pression).
Ä La redondance matérielle
La redondance matérielle consiste en la mise en place d'une série de capteurs mesurant la
même grandeur physique sur un même organe du système. Les comparaisons par différence des
mesures des capteurs deux à deux forment alors les résidus. Si un des capteurs est défaillant, il
est alors détecté et isolé facilement [9].
Fig. I.8: Schéma représentant la redondance matérielle.
Ä Les systèmes experts
L'approche par systèmes experts est différente des méthodes précédentes, dans le sens où
elle vise à évaluer les symptômes obtenus par la détection matérielle ou logicielle. Le système
expert se compose habituellement d'une combinaison de règles logiques du genre :
Chapitre I Généralités sur le diagnostic
13
Ä L'analyse en composantes principales – ACP
L'analyse en composantes principales (ACP) est une technique descriptive permettant
d'étudier les relations qui existent entre les variables, sans tenir compte, a priori, d’un quelconque
modèle. Le but de l’ACP est d'identifier la structure de dépendance entre des observations multi-
variables afin d'obtenir une description ou une représentation compacte de ces dernières.
L'analyse en composante principale peut être vue comme une technique de projection
orthogonale linéaire qui projette les observations multidimensionnelles représentées dans un
espace de dimension m (m est le nombre de variables observées) dans un sous-espace de
dimension inférieure l < m en maximisant la variance des projections. Le calcul de distances par
rapport à ces axes sert d'outil de détection de valeurs aberrantes. Dans ce sens, l'ACP peut être
considérée comme une technique de minimisation de l'erreur quadratique d'estimation.
I.9.2. Méthodes internes, ou méthodes « avec modèle »
Les méthodes internes nécessitent une connaissance approfondis du système étudié, afin de
le représenter analytiquement [10] sous forme d’un modèle quantitatif et/ou qualitatif (modèle de
connaissance).
Les modèles de représentation «les modèles de comportement » ou modèles qualitatif
décrivent le comportement global du système, c’est-à-dire la relation entre ses entrées et ses
sorties. Les paramètres de ces modèles ont généralement peu de sens physique, ils sont donc
difficiles à interpréter pour le diagnostic. Mais ils ont l’avantage d’être assez simples à mettre en
œuvre, et surtout, ils permettent de modéliser des systèmes très complexes, même si tous les
processus internes ne sont pas connus de façon détaillée.
Ä Redondance analytique
Les méthodes analytiques qui font appel à une connaissance du système constitué par la
formulation explicite d’un modèle analytique du système. Dans ce cas, on compare le
comportement réel du processus (caractérisé par les données prélevées) au comportement
théorique fourni par le modèle analytique.
L’architecture générale du système de diagnostic à base de redondance analytique pour la
détection et la localisation de défaillances de capteurs, sachant qu’on ne s’intéresse qu’à des
défaillances d’instrumentation (capteurs ou actionneurs).
Premièrement, on compare les observations avec les connaissances sur le comportement
normal du système contenues dans un modèle afin de vérifier leur cohérence. Le résultat de cette
comparaison est contenu dans un ensemble de signaux appelés "signaux indicateurs de défauts"
ou résidus. La phase de génération de ces signaux indicateurs (résidus) de défauts joue donc un
Chapitre I Généralités sur le diagnostic
14
Procédé
Modèle
Génération
de résidus
Evaluation
des résidus
Localisation
des défauts
Détection Localisation et Identification
Résidud sRésidus Défaff utDéfaut Amplitut de
des défaff uts
Amplitude
des défauts
rôle primordial dans toute procédure de diagnostic puisque conditionne la qualité du système de
surveillance.
I.9.2.1. Modèle
Un modèle est une représentation formalisée d’un phénomène.
Une fois le modèle mis au point, une phase de validation expérimentale est nécessaire
avant de l’exploiter. Le diagnostic consiste ensuite à comparer un certain nombre de valeurs
numériques issues du modèle, à des données mesurées sur le système. Toute différence entre les
observations et les prédictions déduites du modèle sont interprétées comme la présence d’un ou
de plusieurs défauts. Pour cela, une première phase consiste à déterminer les grandeurs sensibles
aux défauts. Ces grandeurs, appelés résidus, sont proches d’une valeur de référence généralement
nulle si le système ne présente pas de défaut, et s’écartent de cette valeur dès qu’un défaut
apparaît.
Une décision est ensuite prise sur la présence ou non d’un défaut, à partir de l’´évaluation
de ces résidus. Si un défaut est détecté, il est ensuite localisé et identifié. On peut noter que seule
une modélisation du comportement « correct » du système est nécessaire pour la détection des
défauts. En revanche, pour la tâche de localisation et d’identification, une connaissance à priori
sur les types des dysfonctionnements pouvant affecter le système est indispensable.
Fig. I.9: Les étapes de diagnostic à base de modèles.
I.9.2.1.1. Modèle d’état ou représentation interne
Une large classe de systèmes à la propriété de pouvoir être décrite par un nombre fini de
grandeurs appelées variables d’état. Ces variables permettent de déterminer les évolutions
futures du système à partir des états initiaux et des grandeurs externes d’entrée. Une
représentation d’état ou modèle d’état est un ensemble fini n d’équations différentielles du
premier ordre et p équations algébriques, reliant des grandeurs scalaires, divisées en variables
internes (ou variables d’état) et en variables externes comprenant les grandeurs d’entrée et de
sortie. D’une manière générale, la représentation d'état d'un système est :
Chapitre I Généralités sur le diagnostic
15
Ä Modèle non linéaire
L'écriture de la représentation d'état d'un système dynamique non linéaire suppose définis
dans les conditions nominales est donne par:
x( t ) f ( x,u,w )
y( t ) h( x,u,v )
=ìí
=î
x( t ) f ( x (I.1)
Où la variable t représente le temps, nxÎÂ le vecteur d'état,
muÎÂ le vecteur de commande,
pyÎÂ le vecteur de mesure, nwÎÂ et
pvÎÂ les vecteurs de bruits d'état et de mesure
respectivement, f et h sont les fonctions non-linéaires correspondant respectivement à l'équation
dynamique de l'état et à l'équation de mesures.
Ä Modèle linéaire
La représentation d'état des systèmes dynamique linéaires qui sont supposés défini dans les
conditions nominales est de la forme:
f ( x,u,w ) Ax( t ) Bu( t ) w( t )
h( x,u,v ) Cx( t ) Du( t ) v( t )
= + +ìí
= + +î (I.2)
Avec t, x, u, y, w et v définis comme pour le système (I.1), et où nAÎÂ désigne la matrice d'état
ou d’évolution, n mB ´ÎÂ est la matrice de commande,
p nC ´ÎÂ est la matrice de sortie ou de
mesures et p mD ´ÎÂ est la matrice de transmission directe des commandes sur les sorties.
I.9.2.2. Procédure de diagnostic à base de modèle
Le diagnostic à base de modèle est largement interprété dans la littérature. Il faut intervenir
les trois principes de base que sont la génération de résidus, la détection et la localisation.
La structure générale de la plupart des méthodes utilisant des modèles mathématiques se
fonde sur l'idée de la redondance analytique. Contrairement à la redondance physique ou
matérielle, où les mesures de différents capteurs sont comparées, les mesures issues des capteurs
sont comparées aux valeurs des variables respectives obtenues de manière analytique.
De tels calculs utilisent les mesures à l'instant courant t et/ou passées et le modèle
mathématique. L'idée peut être étendue à la comparaison de quantités calculées uniquement de
manière analytique, chacune étant obtenue par un calcul différent. Dans les deux cas, les
différences résultantes sont appelées des résidus.
I.9.2.2.1. Génération de résidus
La première étape d'un système de surveillance à base de modèle consiste à générer des
indicateurs de défauts. Ils contiennent des informations sur les anomalies ou dysfonctionnements
Chapitre I Généralités sur le diagnostic
16
Systeme
Génération de
signale indicateurs
Détection et
Localisation/Identification
SortiesEntrées
Diagnostic
Stratégie de
décisionModèle
du système à surveiller. Le principe est de mesurer l'écart entre les mesures des signaux du
procédé, et la valeur théorique fournie par le modèle dans des conditions de fonctionnement
nominal. La génération de résidus est un problème crucial pour les systèmes de diagnostic.
Un résidu est un signal indicateur de défauts. Il reflète la cohérence des données mesurées
vis-à-vis le modèle comportemental du système [11]. Il est défini par une relation de consistance
ou un filtre qui relie les entrées et les sorties du processus (La figure I.10).
Fig. I.10: La génération de résidus.
Le résidu est un vecteur dont la dimension dépend à la fois de la méthode utilisée pour sa
génération et du système étudié. En pratique, on génère des résidus ayant une moyenne nulle en
fonctionnement normal et différents de zéro en fonctionnement défaillant.
nidddfr pi ,...,2,1),...,,( 21 ==
D’une façon plus générale, on cherche toujours à calculer un vecteur de résidus ( )r t ayant
les propriétés suivantes:
ý ( ) 0r t = quand ( ) 0f t = , état normal.
ý ( ) 0r t ¹ quand ( ) 0f t ¹ , la détection du défaut (f : entrée défaut).
ý ( ) 0ir t ¹ et ( ) 0jr t = pour i j¹ quand ( ) 0if t ¹ et ( ) 0jf t = , la localisation du défaut ( )if t .
I.9.2.2.2 Evaluation des résidus (génération de fonctions de décision)
Le rôle de cette étape est de détecter et d'isoler les défauts. On peut noter que dans nombre
d'algorithmes, l'étape de détection de défauts est implicite dans l'étape d'isolation, alors que dans
d'autres, ces fonctions sont réalisées séquentiellement. Il s'agit en fait d'analyser les résidus
précédemment formés de manière à établir le diagnostic, c'est-à-dire à détecter et à isoler le
défaut. Les fonctions de décision ainsi générées utilisent la logique binaire (absence ou présence
de défaut).
Dans le cas des résidus structurés, les tests d'hypothèses (par exemple, tester le résidu par
rapport à un seuil de détection) peuvent être réalisés sur chaque résidu pris séparément. Le
résultat est une valeur booléenne, qui selon les hypothèses choisies pourra, par exemple, être
Chapitre I Généralités sur le diagnostic
17
Procédé
Estimation des
paramètres
Calcul des
paramètresDécision
PerturbationsDéfaut
u y
Diagnostic
égale à "1" si le test est vérifié et à "0" sinon. La combinaison des différents tests permet la
définition d'un code ou signature expérimentale du défaut.
Ainsi dans le cas des résidus structurés, on obtient les tables de codage ( ou des signatures
théoriques) suivantes ("1" : résidu sensible au défaut ; "0" : résidu insensible au défaut) :
Résidus Défaut Résidus Défaut
d1 d2 d3 d1 d2 d3
r1 0 1 1 r1 1 0 0
r2 1 0 1 r2 0 1 0
r3 1 1 0 r3 0 0 1
Table.I.1. Résidus généralisés Table.I.2. Résidus dédiés
Une condition minimale pour l'isolation des défauts est que tous les codes soient distincts.
Alors, on parlera d'isolation faible.
La localisation des défauts est basée sur la comparaison, à chaque instant, de la signature de
défaut expérimentale avec les différentes signatures théoriques. L’hypothèse de défaut la plus
vraisemblable est désignée par la signature de défaut théorique la plus proche de la signature
expérimentale.
I.9.2.3. Les différentes méthodes de diagnostic à base de modèle
Trois méthodes principales de diagnostic à base de modèle sont utilisées :
A) Estimation paramétrique
L’approche d’estimation paramétrique mesure l’influence des défauts sur les paramètres et
non plus, comme précédemment, sur les variables du système physique. Le principe consiste à
estimer en continu des paramètres du procédé en utilisant les mesures d’entrée/sortie et en
l’évaluation de la distance qui les sépare des valeurs de référence de l’état normal du procédé
(La figure I.11).
Fig.I.11: Estimation de paramètres.
Chapitre I Généralités sur le diagnostic
18
Sytème physique
Modèle
Défaut
Entrées
inconnues
MésuresEntrées
Résidus+
-
Système physique
Observateurs
Mésures
Résidus+
-
Entrées
B) Espace de parité
La méthode de l’espace de parité a été une des premières méthodes employées à des fins de
FDI (Fault Detection and Isolation) [12]. Les relations de parité utilisent la redondance directe
au moyen de relations algébriques statistiques liant les différents signaux ou la redondance
temporelle issue de l’utilisation de relations dynamiques. Le terme ‘parité’ a été emprunté au
vocabulaire employé pour les systèmes logiques, cette méthode repose sur le principe de la
vérification de la consistance existante entre les entrées et les sorties du système surveillé (La
figure I.12).
Fig.I.12: Approche de l’espace de parité dans un format entrée-sortie.
C) Observateurs
La génération de résidus à l’aide d’une estimation d’état consiste à reconstruire l’état ou,
plus généralement, la sortie du processus à l’aide d’observateurs et à utiliser l’erreur d’estimation
comme résidu (La figure I.13). Cette méthode s’est beaucoup développée car elle donne lieu à la
conception de génération de résidus flexibles.
Fig.I.13: schéma fonctionnel d’un observateur générateur de résidu.
I.10. Conclusion
Dans ce chapitre, nous avons présenté des généralités sur la procédure de diagnostic qui
permettra de détecter les défauts. Tout d'abord, l’intérêt du diagnostic dans le domaine industriel
a été abordé. En effet, en considérant le diagnostic comme une composition de trois modules: la
détection, la localisation et l’identification. Dès lors, une terminologie appropriée au diagnostic a
été présentée afin de définir et de délimiter chaque terme et chaque notion utilisée dans ce
premier chapitre. Il est ainsi clair que la diversité apparente des méthodes proposées dans la
littérature pour réaliser le diagnostic des systèmes dynamiques présente des points
incontournables.
Chapitre II Analyse en Composantes Principales
20
Sommaire
II.1 Introduction ..................................................................................................................................... 20
II.2 Principe de l’analyse en composantes principales ........................................................................ 21
II.3 Identification du modèle ACP ........................................................................................................ 23
II.4 Les Exemples de simulation ............................................................................................................ 25
II.5 Conclusion ........................................................................................................................................ 31
II.1 Introduction
Dans le domaine du diagnostic, des méthodes basées sur le concept de redondance de
l’information ont été développées. Leur principe repose généralement sur un test de cohérence
entre un comportement observé du processus fourni par des capteurs et un comportement prévu
fourni par une représentation mathématique du processus.
Les méthodes de redondance analytique nécessitent un modèle du système à surveiller. Ce
modèle comprend un certain nombre de paramètres dont les valeurs sont supposées connues lors
du fonctionnement normal.
L’analyse en composantes principales (ACP) est une technique descriptive permettant
d’étudier les relations qui existent entre les variables, sans tenir compte, a priori, d’une
quelconque structure [13]. Le but de l’ACP est d’identifier la structure de dépendance entre des
observations multi-variables afin d’obtenir une description ou une représentation compacte de
ces dernières.
L’ACP permet de générer un modèle du processus basé sur la connaissance issue du
système sans avoir une forme explicite d’un modèle entrées/sorties. Ainsi, elle permet
d’exploiter toutes les relations linéaires qui peuvent exister entre les différentes variables. Dans
ce travail nous allons étudier ce modèle particulier pour le diagnostic.
Mathématiquement l’ACP est une technique de projection orthogonale linéaire qui projette
les observations multidimensionnelles représentées dans un sous-espace de dimension m (m est
le nombre de variables observées) dans un sous-espace de dimension inférieure (ℓ< m) en
maximisant la variance des projections.
L’estimation des paramètres du modèle ACP est effectuée par calcul des valeurs et
vecteurs propres de la matrice de corrélation des données. Cependant, pour la détermination de
la structure du modèle, il faut déterminer le nombre de composantes à retenir dans ce modèle.
Pour cette raison, plusieurs critères de sélection du nombre de composantes seront présentés.
Chapitre II Analyse en Composantes Principales
21
II.2 Principe de l’analyse en composantes principales
En pratique, pour la modélisation d’un processus en utilisant l’analyse en composantes
principales, les mesures des variables du processus représentant tous les modes en
fonctionnement normal de ce dernier sont collectés dans une matrice Xb. Soit m le nombre de
variables et N le nombre d’observations de chaque variable. ´ÎÂb N mX est donnée par :
(1) (1) . . . . (1)1 2
(2) (2) . . . . (2)1 2
. . . . . . .
. . . . . . .
( ) ( ) . . . . ( )1 2
æ öç ÷ç ÷ç ÷= ç ÷ç ÷ç ÷è ø
x x xm
x x xmb
X
x N x N x Nm
(II.1)
Où x1(1) représente la mesure de la première variable du premier instant de mesure. Au
préalable, afin de rendre le résultat indépendant des unités utilisées pour chaque variable, un
prétraitement indispensable consiste à centrer et réduire les variables. Chaque colonne Xj de la
nouvelle matrice centrée est donnée par :
bj j
jj
X MX
s
-= (II.2)
Une fois que les données ont été centrées réduit, la matrice de corrélation de données,
peut être calculé comme :
1
1S=
-TX X
N (II.3)
L’expression analytique de l’analyse en composantes principales du vecteur de données x :
Tt xP= (II.4)
Où PT représente la matrice de projection optimale des données au sens de l’analyse en
composantes principales.
La variance de la projection, νar{t}, s’identifie à sa valeur quadratique :
{ } { }( ){ } { }( )( ){ }{ }
{ } { }
2 2
2 1
T T
T T T
Ti i i i i
var t t t t
P x x P
P xx P P P
var t t p p ,i ,...,ml
= e - = e
= e
= e = S
= e = S = =
(II.5)
Chapitre II Analyse en Composantes Principales
22
Rappelons que tout vecteur de données x peut être représenté par la combinaison linéaire
des m vecteurs propres pi (i = 1,..., m) de la matrice de covariance , pondérés par les
composantes principales ti = piTx. Pour l’estimation d’un vecteur de données x à partir de son
vecteur de composantes principaux associés t, il suffit pour cela de multiplier à droite chacun des
membres de l’équation (II.5) par P, il en découle :
1
m
i ii
x Pt t p=
= =å (II.6)
Il est donc possible de réduire la dimension de la représentation des données en ne retenant
de l’expression (II.6) que les termes tjpj (j = 1,…..ℓ) associés aux plus grandes valeurs propres
λj. L’estimation x d’un vecteur de données x est alors décrite par l’expression réduite :
( )1
ˆ Ti i jj
i
x t p pp x=
= =å åå ått (II.7)
La perte d’information induite par la réduction de dimension de représentation de chaque
vecteur de données x est mesurée par la différence entre ses représentations exactes (II.6) et
approchée (II.7) :
1
ˆm
i ii
e x x t p=
= - =å (II.8)
Les (m - ℓ) composantes principales ti (i = ℓ + 1,……, m) à partir desquelles l’erreur
d’estimation e est évaluée, sont associées aux plus faibles valeurs propres ¸λℓ+1,….., λm. Il est par
conséquent bien évident que la compression de données préserve d’autant mieux l’information
qu’elles véhiculent que ces valeurs propres sont de faibles valeurs. La somme des (m - ℓ) valeurs
propres minimales quantifie par ailleurs la perte d’information :
{ } { }1
mT
ii
e e var t= +
e = å {1= +
å (II.9)
Ainsi, le vecteur de données x peut être exprimé sous la forme :
ˆx x e= + (II.10)
Dans la suite nous allons représenter la matrice des premiers vecteurs propres par P , d’où
ˆˆ Tt P x= (II.11)
Chapitre II Analyse en Composantes Principales
23
Où t est le vecteur des premières composantes principales et
ˆx C x= où ˆ ˆ ˆTC P P= (II.12)
Ainsi, l’erreur quadratique d’estimation est donnée par :
TSPE e e= (II.13)
Généralement, la procédure d’identification de modèles, consiste, après le choix d’une
classe de modèle, à choisir une structure fixe puis à estimer les paramètres du modèle et enfin à
valider ce modèle. Dans le cas de l’ACP, l’estimation des paramètres du modèle revient en fait à
un calcul de valeurs et vecteurs propres. Cependant le choix de la structure demande d’autres
calcules pour le choix du nombre des CPs comme nous le verrons par la suite.
II.3 Identification du modèle ACP
II.3.1 Estimation des paramètres du modèle
L’estimation des paramètres du modèle ACP se résume en une estimation des valeurs et
vecteurs propres de la matrice de corrélation . Une décomposition de cette dernière permet
d’écrire :
1
mT T
i i ii
P P p pl=
S = L = å (II.14)
Où ip est le emei vecteur propre de et
il est la valeur propre correspondante.
S’il existe q relations linéaires entre les colonnes de X, on aura q valeurs propres nulles et
la matrice X peut être représentée par les premières ( )m q- = composantes principales
correspondant aux valeurs propres non nulles. Toutefois, les valeurs propres égales à zéro sont
rarement rencontrées en pratique (relations quasi-linéaires, bruits,...). Donc, il est nécessaire de
déterminer le nombre représentant le nombre de vecteurs propres correspondant aux valeurs
propres dominantes.
II.3.2 Détermination de la structure du modèle
La phase la plus importante dans l’identification d’un modèle par ACP, c’est bien le choix
de nombre de composantes à retenir. De nombreuses règles sont proposées dans la littérature
pour déterminer le nombre de composantes à retenir [14].
Chapitre II Analyse en Composantes Principales
24
Dans le cadre de l’application de l’ACP au diagnostic, la fiabilité de la procédure de
détection et localisation par ACP dépend les CPs retenus. Si peu de composantes sont utilisées,
on risque de perdre des informations contenues dans les données de départ en projetant certaines
variables dans le sous-espace des résidus et donc avoir des erreurs de modélisation qui entachent
les résidus ce qui provoque des fausses alarmes.
Si par contre beaucoup de composantes sont utilisées, il y a le risque d’avoir des
composantes retenues (les composantes correspondantes aux valeurs propres les plus faibles
parmi celles retenues dans le modèle) qui sont porteuses de bruit ce qui est indésirable. De plus il
y a risque de non détection des défauts, si certaines variables sont projetées dans le sous-espace
des composantes principales alors qu’elles doivent être projetées dans le sous-espace résiduel.
Dernièrement, [15] ont proposé une technique basée sur la variance de l’erreur de
reconstruction des mesures, ce critère permet de prendre en compte la notion de redondance
entre les variables. (Voir Annexe A)
II.3.2.1 Critères Heuristiques
Ä Pourcentage cumulé de la variance totale (PCV)
Cette méthode consiste à cumulé les portions de variance des mesures de processus étudier
jusqu’à un pourcentage de variance totale choisi préalablement. Le pourcentage de variance
expliquée par les ℓ premières composantes est donné par :
( ) 1
1
100
jj
m
jj
PCV
l
l
=
=
æ öç ÷ç ÷
= %ç ÷ç ÷ç ÷è ø
å
å
ö÷löö
) ç j=100ç jç
jçç j
ççç (II.15)
La variance du bruit étant inconnue a priori, la décision basée seulement sur le pourcentage
de la variance expliquée est un peu arbitraire. Sa capacité à fournir le nombre correct de
composantes principales dépendra fortement du rapport signal sur bruit.
Ä Moyenne des valeurs propres
Des règles empiriques peuvent également guider l’utilisateur. Une de ces règles consiste à
ne prendre en considération que les composantes pour lesquelles la valeur propre est supérieure à
la moyenne arithmétique de toutes les valeurs propres. En particulier, si on travaille sur les
données centrées réduites, cela revient à négliger les composantes dont la variance est inférieure
Chapitre II Analyse en Composantes Principales
25
à l’unité1
1( trace( ) )m
S = . Dans le cas du modèle ACP calculé à partir de la matrice de
covariance , la moyenne arithmétique des valeurs propres est donnée par 1
( trace( ))m
S .
II.3.2.2 Critère de validation croisé
L'objectif de l'analyse en composant principal est de construire un modèle qui doit être
employée pour le diagnostic d’un système, le critère suggéré pour identifier le nombre approprié
de composantes est la validation croisée. La validation croisée est une technique très populaire et
simple mais comportant de nombreux calculs. La base de cette méthode est d’estimer les
mesures d’un ensemble de données de validation à partir d’un modèle qui a été calculé à partir
d’un ensemble de données d’identification et de comparer ces estimations avec les valeurs
mesurées.
La minimisation d’une quantité PRESS qui représente la somme des carrés des erreurs
entre les données observées et celle estimées par le modèle obtenu à partir d’un jeu
d’identification différent.
( ) ( ) ( ) ( )2
1 1
1 N m
iik i
ˆPRESS x k x kNm = =
æ ö= -ç ÷è ø
åå ) ( )k x) ( )) ( )k x) ( )kk) ( )k x( )) 1 N m
k i
) 1
Nmå (II.16)
Ø Algorithme de la validation croisée
1. diviser les données en un jeu d’identification et un jeu de validation,
2. réaliser une ACP avec composantes ( = 1,…., m) sur le jeu d’identification et calculer
les critères correspondant sur le jeu de validation PRESS(1),…, PRESS(m),
3. la ème composante pour laquelle le minimum de PRESS apparaît sera la dernière
composante à retenir et sera le nombre de composantes principales retenu.
II.4 Les exemples de simulation
II.4.1 Exemple (II.1)
Pour illustrer ce qui a été dit jusqu’à présent sur l’ACPL, nous présentons ici un exemple
simple de simulation. On considère un système linéaire représenté par deux variables qui sont
décrites par les équations suivantes :
1 1
2 2
4x u
x u
m
m
= +
= +
Chapitre II Analyse en Composantes Principales
26
Où μi est un bruis aléatoire distribue dans l’intervalle [-0.1 0.1], u [-1 1] représente une
variable aléatoire uniforme.
La matrice de variance-covariance des variables est donnée par :
0.4994 0.4968
0.4968 0.4994
æ öS = ç ÷
è ø
La décomposition en valeurs singulières de la matrice de corrélation donne :
· La matrice diagonale des valeurs propres dans l’ordre descendant:
0.9962 0
0 0.0026D
æ ö= ç ÷è ø
· La matrice des vecteurs propres associés à chaque une des valeurs propres dans son
ordre descendant :
0.7071 0.7071
0.7071 0.7071P
æ ö= ç ÷è
-
- ø-
Les composantes principales sont données par :
1 1 2
2 1 2
0.7071 0.7071
0.7071 0.7071
t x x
t x x
= - +
= - -
Le tableau suivant contient les valeurs propres et leur variance ainsi leur PCV :
CPs VPrp V% PCV%
1 0.9962 99.7431 99.8017
2 0.0026 0.2569 100
(La figure II.1) représente la distribution d’informations (données) d’entrée. La droite en
noire représente l’estimation des données originelles par le modèle ACP caractérisé par la
première composante principale (correspondante au premier vecteur propre associé à la plus
grande valeur propre, (La figure II.2 (a)) de la matrice de variance-covariance), c’est-`a-dire, on
ne doit conserver que la première composante principale pour l’estimation des variables
originelles, parce qu’elle porte l’information significative permettant d’expliquer les différentes
variables (99.8% de variance expliquée par cette composante (La figure II.2 (b)).
Chapitre II Analyse en Composantes Principales
27
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
x1
x2
données originales
1 ère CL
1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 20
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1(a)
valeur propres
moyenne
1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 299.7
99.75
99.8
99.85
99.9
99.95
100
composantes principales
pourc
enta
ge d
e la v
ariance t
ota
le
(b)
Fig II.1 : Estimation de données par la première CP.
Fig II.2 : Sélection du nombre de CPs à retenir.
II.4.2 Exemple (II.2)
Nous disposons de 8 variables représentant un système statique et qui sont décrites par les
équations suivantes :
1 1 1
2 1 2
3 1 3
4 2 4
5 2 5
6 2 6
7 1 2 7
8 1 2 8
3 2
x u
x u
x u
x u
x u
x u
x u u
x u u
+
+
= + e
= + e
= + e
= + e
= + e
= + e
= + e
= + e
(II.17)
Où les bruits de mesure i sont des bruits aléatoires uniformément réparties entre -0,05 et +0,05,
u1 et u2 sont des signaux en forme de sinusoïdale dont les amplitudes et les durées changent de
manière aléatoire.
Les mesures simulées des variables x1, x5 et x7 sont données, à titre indicatif, sur (La figure II.3).
Chapitre II Analyse en Composantes Principales
28
0 50 100 150 200 250 300 350 400 450 500-4
-2
0
2
4
# échantillons
x1
Evolution des variables
0 50 100 150 200 250 300 350 400 450 500-2
-1
0
1
2
# échantillons
x5
0 50 100 150 200 250 300 350 400 450 500-4
-2
0
2
4
# échantillons
x7
Fig.II.3 : Evolution des variables x1, x5 et x7.
La matrice de corrélation des variables est donnée par :
0.4944 0.4391 0.4455 -0.0080 -0.0207 -0.0241 0.3210 -0.0241
0.4391 0.4911 0.4426 -0.0002 -0.0100 -0.0156 0.3243 -0.0156
0.4455 0.4426 0.5019 -0.0154 -0.0
S =
301 -0.0303 0.3157 -0.0303
-0.0080 -0.0002 -0.0154 0.5083 0.4759 0.4688 0.3403 0.4688
-0.0207 -0.0100 -0.0301 0.4759 0.4938 0.4649 0.3264 0.4649
-0.0241 -0.0156 -0.0303 0.4688 0.4649 0.4961 0.3225 0.4961
0.3210 0.3243 0.3157 0.3403 0.3264 0.3225 0.4835 0.3225
-0.0241 -0.0156 -0.0303 0.4688 0.4649 0.4961 0.3225 0.4961
æ öç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷è ø
Les matrices des valeurs et vecteurs propres ‘D’ et ‘P’ respectivement sont données par :
0.0000 0 0 0 0 0 0 0
0 0.0127 0 0 0 0 0 0
0 0 0.0245 0 0
D =
0 0 0
0 0 0 0.0501 0 0 0 0
0 0 0 0 0.0533 0 0 0
0 0 0 0 0 0.0551 0 0
0 0 0 0 0 0 1.5672 0
0 0 0 0 0 0 0 2.2025
æ öç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷è ø
Chapitre II Analyse en Composantes Principales
29
0 50 100 150 200 250 300 350 400 450 500-5
0
5
10x 10
-15
# échantillons
t 1
0 50 100 150 200 250 300 350 400 450 500-1
-0.5
0
0.5
# échantillons
t 2
0 50 100 150 200 250 300 350 400 450 500-1
0
1
# échantillons
t 3
0 50 100 150 200 250 300 350 400 450 500-1
0
1
# échantillons
t 4
0 50 100 150 200 250 300 350 400 450 500-1
0
1
2
# échantillons
t 5
0 50 100 150 200 250 300 350 400 450 500-1
0
1
# échantillons
t 6
0 50 100 150 200 250 300 350 400 450 500-5
0
5
# échantillons
t 7
0 50 100 150 200 250 300 350 400 450 500-5
0
5
# échantillons
t 8
-0.0000 -0.2383 0.0098 -0.2994 0.7516 0.0338 -0.5231 0.1173
-0.0000 -0.2026 -0.0623 -0.2494 -0.5162 -0.5856 -0.5176 0.1249
-0.0000 -0.1884 0.0671 0.4578 -
P =
0.2912 0.6110 -0.5291 0.1108
0.0000 -0.2419 -0.6540 0.4614 0.1606 -0.2225 0.1512 0.4502
0.0000 -0.2208 0.7484 0.2990 0.0965 -0.2664 0.1639 0.4411
0.7071 -0.0789 -0.0424 -0.4051 -0.1491 0.2798 0.1707 0.4452
0.0000 0.8643 0.0032 0.0903 0.0652 -0.0740 -0.2656 0.4057
-0.7071 -0.0789 -0.0424 -0.4051 -0.1491 0.2798 0.1707 0.4452
æ öç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷ç ÷è ø
Les composantes principales sont données par :
1 1 2 3 4 5 6 7 8
2 1 2 3 4 5 6 7 8
3 1 2 3 4 5
0 0000 0 0000 0 0000 0 0000 0 0000 0 7071 0 0000 0 7071
0 2383 0 2026 0 1884 0 2419 0 2208 0 0789 0 8643 0 0789
0 0098 0 0623 0 0671 0 6540 0 7484 0
t . x . x . x . x . x . x . x . x
t . x . x . x . x . x . x . x . x
t . x . x . x . x . x .
= - - - + + + + -
= - - - - - - + -
= - + - + - 6 7 8
4 1 2 3 4 5 6 7 8
5 1 2 3 4 5 6 7 8
6 1 2
0424 0 0032 0 0424
0 2994 0 2494 0 4578 0 4614 0 2990 0 4051 0 0903 0 4051
0 7516 0 5162 0 2912 0 1606 0 0965 0 1491 0 0652 0 1491
0 0338 0 5856 0 6110
x . x . x
t . x . x . x . x . x . x . x . x
t . x . x . x . x . x . x . x . x
t . x . x .
+ -
= - - + + + - + -
= - - + + - + -
= - + 3 4 5 6 7 8
7 1 2 3 4 5 6 7 8
8 1 2 3 4 5 6 7 8
0 2225 0 2664 0 2798 0 0740 0 2798
0 5231 0 5176 0 5291 0 1512 0 1639 0 1707 0 2656 0 1707
0 1173 0 1249 0 1108 0 4502 0 4411 0 4452 0 4057 0 4452
x . x . x . x . x . x
t . x . x . x . x . x . x . x . x
t . x . x . x . x . x . x . x . x
- - + - +
= - - - + + + - +
= + + + + + + +
Ainsi, on peut tracer l’évolution des composantes principales 1 8t , ,t1 8t1 81 8 de cet exemple.
A partir de (La figure II.4), on remarque que les composantes 1 6t , ,t1 6t1 61 6 ne représentent que
du bruit alors que les deux derniers composants sont porteurs d’information et sont corrélées
avec les variables originelles. Nous allons par la suite montrer par différent critère que le nombre
de composante principale est égal à ℓ=2.
Fig II.4: Evolution des composantes principales.
Chapitre II Analyse en Composantes Principales
30
1 2 3 4 5 6 7 855
60
65
70
75
80
85
90
95
100
composantes principales
pour
cent
age
de la
var
ianc
e to
tale
1 2 3 4 5 6 7 80
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
composantes principales
erre
ur d
e va
lidat
ion
1 2 3 4 5 6 7 80
0.5
1
1.5
2
2.5
valeur propres
moyenne
II.4.2.1 Détermination de la structure du modèle
Ä Pourcentage cumulé de la variance totale(PCV) :
Ici on choisit les composantes dont pourcentage cumulé soit supérieure ou égale 95% dans
notre cas en prend deux composantes.
Fig II.5: Pourcentage de la variance totale.
Ä Critère de validation croisé
Ici on a divisé le jeu de donnée en deux parties une pour la construction du modèle et
l’autre pour la validation, le nombre de composantes a retenu correspond à celui qui donne une
erreur PRESS ≤ 0.05 dans notre cas =2.
Fig II.6: Erreur de validation.
Ä Moyenne des valeurs propres
Ce critère consiste à ne prendre en compte que les composantes pour lesquelles la valeur
propre est supérieure à la moyenne arithmétique de toutes les valeurs propres. Ce qui signifie ℓ=2.
Fig II.7: La moyenne des valeurs propres.
Chapitre II Analyse en Composantes Principales
31
0 50 100 150 200 250 300 350 400 450 500-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
# échantillons
variable x1
variable x1est
0 50 100 150 200 250 300 350 400 450 500-5
0
5
# échantillons
x1 &
x1est
0 50 100 150 200 250 300 350 400 450 500-5
0
5
# échantillons
x2 &
x2est
0 50 100 150 200 250 300 350 400 450 500-4
-2
0
2
# échantillons
x3 &
x3est
0 50 100 150 200 250 300 350 400 450 500-2
0
2
# échantillons
x4 &
x4est
0 50 100 150 200 250 300 350 400 450 500-4
-2
0
2
# échantillons
x5 &
x5est
0 50 100 150 200 250 300 350 400 450 500-2
0
2
# échantillons
x6 &
x6est
0 50 100 150 200 250 300 350 400 450 500-4
-2
0
2
# échantillons
x7 &
x7est
0 50 100 150 200 250 300 350 400 450 500-2
0
2
# échantillonsx
8 &
x8est
II.4.2.2 Validation du modèle
Fig II.8 : validation du modèle de huit variables.
Fig II.9 : validation du modèle «la variable x1».
II.5 Conclusion
Dans ce chapitre nous avons présenté le principe de l’analyse en composantes principales
linéaires. L’idée de base de l’ACP est de réduire la dimension de la matrice des données, en
retenant le plus possible les variations présentes dans le jeu de données de départ. Cette
réduction ne sera possible que si les variables initiales ne sont pas indépendantes et ont des
coefficients de corrélation entre elles non nuls. Ces variables initiales sont transformées en de
nouvelles variables, appelées composantes principales. Elles sont obtenues par combinaisons
linéaires des précédentes et sont ordonnées et non corrélées entre elles.
Chapitre III Analyse en Composantes Principales non Linéaires
33
1x
2x2x
1x
nT ´Î Â
Modèle de compression
Projection (Extraction)Modèle de décompression
Projection inverse (Génération)
ℓm ℓ m
ˆ n mX ´ÎÂn mX ´ÎÂ
Sommaire
III.1 Introduction ................................................................................................................................... 33
III.2 Modélisation par ACPNL ............................................................................................................. 34
III.3 Approche neuronale de l’ACPNL ................................................................................................ 35
III.4 Exemple de simulation .................................................................................................................. 37
III.5 Conclusion ...................................................................................................................................... 39
III.1 Introduction
Dans l’industrie, la plupart des systèmes physiques ont des comportements non linéaires et
alors la propriété de linéarité de l’ACP linéaire, (La figure III.1), pose toujours le problème de
l’inaptitude de cette méthode à représenter les données non linéaires, puisqu’il s’agit d’une
projection linéaire et seules les dépendances linéaires entre les variables peuvent être révélées.
Fig III.1 : Transformation linéaire. Fig III.2 : Transformation non linéaire.
L’ACP non linéaire (ACPNL) est une extension dont l’objectif est d’extraire à la fois les
relations linéaires et non linéaires. Cette généralisation est effectuée par une projection des
données sur des courbes au lieu des droites, (La figure III.2). (La figure III.3) montre le principe
du modèle ACP général, que ce soit linéaire ou non linéaire. Dans le cas non linéaire :
n mX ´ÎÂ la matrice de données nT ´ÎÂ matrice de composantes principales avec ( )T X= F
et représente une fonction non linéaire équivalente à la matrice de vecteurs propres « P » de
l’ACP linéaire.
Fig III.3 : Principe du modèle ACP.
Chapitre III Analyse en Composantes Principales non Linéaires
34
ˆ n mX ´ÎÂ la génération de la matrice de données avec ( )X T= Y représente la fonction
non linéaire de reconstruction ou de génération. Et alors la matrice de données X peut être
représentée par l’estimation X plus l’erreur d’estimation (matrice résiduelle) XX :
( )ˆX X X T E= + = Y +( )( )Y( )X T( ) (III.1)
III.2 Modélisation par ACPNL
Les méthodes de modélisation par l’analyse en composantes principales non linéaire
peuvent être scindées en trois catégories :
III.2.1 Modèle ACPNL basé sur la transformation non linéaire
Réalise la transformation des données par une fonction de projection non linéaire proposée.
Ä ACP généralisée
Proposé par Gnanadesikan [16] est l’une des premières extensions non linéaire de l’ACP
linéaire, où comme on a déjà vu dans le deuxième chapitre, la transformation de l’ensemble de
données originelles est donnée par :
1
k
j j ij jj
T P x p x=
= = å (III.2)
L’ACP généralisée est basée sur le remplacement de xj par ( )j xY dans cette équation, on
obtient alors :
( )1
k
j ij jj
T p x=
= Yå (III.3)
Où k est la dimension de ( )xY pas forcément égale à la dimension de x.
Alors, l’ACP généralisé réalise une projection non linéaire de x où est la fonction de
projection non linéaire [17].
III.2.2 Approximation linéaire définie par morceaux
Un modèle d’approximation linéaire définie par morceaux, réalise une ACP linéaire dans
des domaines locaux de l’espace original de données, et totalement réalise une ACPNL dans
l’espace de données.
Ü Courbes principales
Proposée par Hastie [18] ; cette approche résume la distribution de données dans l’espace
de représentation multidimensionnel autour d’une courbe polygonal monodimensionnel dite
Chapitre III Analyse en Composantes Principales non Linéaires
35
courbe principale en minimisant la distance entre les point de données et leurs projections sur
cette courbe, il faut noter qu’il est difficile de construire plus de deux composantes principales
par l’utilisation de cette méthode[17].
Ü ACP locale
Proposée par Kambhalta & al [19], le principe de ce modèle non linéaire est de diviser
l’espace original en plusieurs sous-domaines autrement dit, cette approche appréhende le
comportement non linéaire d’un système par un ensemble de modèles locaux (ACP linéaires)
caractérisant le fonctionnement du système dans différentes zones de fonctionnement.
Dans le cas de ce modèle, en plus de l’identification des modèles locaux, il faut déterminer
le nombre de ces modèles ainsi que le nombre de composantes principales à retenir dans chaque
modèle, L’inconvénient majeur de cette approche est qu’il n’y a pas de méthode systématique
permettant de choisir les ACP locales.
III.2.3 Modèle ACPNL basé sur les réseaux de neurones artificiels
Dans la section suivante, seront exposés l’algorithme d’ACPNL à base de réseaux de
neurones à cinq couches (MLPs). Il faut noter aussi qu’il y a d’autres approches (modèles)
neuronales de l’analyse en composantes principales non linéaire tel que ACPNL par optimisation
des entrées du réseau (Input Training network), les réseaux à trois couches et courbes principales
et les réseaux de fonctions `a base radiale (RBF) et chaque un de ces modèles a ses propriétés et
ses inconvénients, dans ce travail on ne s’intéresse qu’au ACPNL basé sur MLP à cinq couches.
III.3 Approche neuronale de l’ACPNL
L’approche non linéaire basée sur les réseaux de neurones artificiels « RNAs » utilise un
perceptron multicouche « MLP » avec une topologie auto-associative constitué de cinq couches
avec une couche d’étranglement (bottleneck layer) [20]:
Le MLP est un modèle d’une plus grande capacité de calcul. Sa structure est composée
d’une couche d’entrée, une couche de sortie, et d’une ou plusieurs couches intermédiaires dites
couchent cachées.
Un neurone d’une couche inférieure ne peut être relié qu’à des neurones des couches
suivantes. Il faut noter que ce modèle utilise une règle d’apprentissage par rétro propagation.
En général, les neurones du Perceptron multicouche sont animés par une fonction
d’activation non linéaire (au moins dans une des couches). Le choix classique pour cette fonction
est la fonction sigmoïde que ce soit log-sigmoïdale :
( ) 1
1 xx
ej
-=
+ (III.4)
Chapitre III Analyse en Composantes Principales non Linéaires
36
x( )xh
u
( )uhx
Ou tangente-sigmoïdale : ( )2
2 2
2 11
1 1
x
x x
ex
e ej
-
- --
= - =+ +
(III.5)
Fig III.4 : Réseau à cinq couches pour l’extraction d’une seule composante principale non
linéaire
Pour effectuer l’ACPNL, et pour une seule composante principale non linéaire (La figure
III.4), une fonction de transfert G1 réalise une projection du vecteur x d’entrée de dimension m,
vers la première couche cachée (couche de réduction), cette projection est représentée par la
formule suivante :
( )( ) ( ) ( )( ) ( )1 1(1 )
1
mx x xx x
iij jj ri
h G V x b G v x b==
æ ö= + = +ç ÷ç ÷
è øå1 1)j r(1 )(1 ) G1 1(1 )(1 )(1 G1 1 (III.6)
ü ( ) r mV x ´ÎÂ est la matrice des poids.
ü b(x)
est le vecteur contenant les r paramètres de biais.
ü r est le nombre de neurones dans la première couche cachée.
Une deuxième fonction de transfert G2 réalise la projection de données de la première
couche cachée, vers la couche cachée d’étranglement contenant un seul neurone qui représente la
composante principale t :
( ) ( ) ( )( ) ( ) ( ) ( )2
1
rx xx x x x
j jj
t G w h b w h b=
= + = +å (III.7)
Ensuite, la fonction non linéaire G3 projette les données à partir de t vers la dernière
couche cachée h(t)
(couche de reconstruction), et cette projection est représentée par :
( ) ( )( ) ( ) ( )( ) ( )3 3(1 )
t t tt tj jj r
jh G W t b G w t b=
æ ö= + = +ç ÷
è ø3 3)j r(1 )(1 ) G3 3(1 )(1 ) GG3 3 (III.8)
La dernière fonction de transfert G4 projette les données à partir de h(t)
vers le vecteur de
sortie x de dimension m :
( ) ( ) ( ) ( )( ) ( ) ( )4
1
ˆr
t t tt t ti ij j i
i j
x G V h b v h b=
æ ö= + = +ç ÷è ø
å (III.9)
Chapitre III Analyse en Composantes Principales non Linéaires
37
La fonction coût2
ˆE x x= - doit être minimisée pour trouver les valeurs optimales de :
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), , , , , , , .x x x x t t t tV b w b w b V b
Une fois la structure générale définie, il reste à déterminer la structure précise du modèle
neuronale (architecture du réseau). Pour cela, il faut déterminer le nombre de couche caché
nécessaire et le nombre de neurones dans chaque couche cachée. Pour la détermination du
nombre de couches cachées , Funahashi et Cybenko [21,22] ont montré que toute fonction
continue peut être approximé par un réseau de neurones à trois couches utilisant une fonction
d’activation sigmoïdale pour les neurones de la couche cachée et une fonction d’activation
linéaire pour les neurones de la couche de sortie.
Le nombre de neurones dans la couche cachée est généralement déterminé en effectuant
une validation croisé sur un jeu de validation. Il existe des algorithmes permette de construire
itérativement la couche cachée, le contrôle de la croissance du réseau est effectué par une
validation croisé. La procédure d’apprentissage est détaillée dans l’annexe A.
III.4 Exemple de simulation
III.4.1 Exemple (III.1)
Pour illustrer ce qui a été dit jusqu’à présent sur l’ACPNL, nous présentons ici un
deuxième exemple simple de simulation. Si on applique l’ACP linéaire sur un jeu de données
non linéaire représenté par trois variables qui sont décrites par les équations suivantes:
( )( )
1 1
2 2
3 3
sin
cos
x u
x u
x u
p m
p m
m
= +
= +
= +
Où im est un bruis aléatoire distribue dans l’intervalle [-0.1 0.1] et u [-1 1] représente une
variable uniforme.
La matrice de variance-covariance des variables est donnée par :
0.4994 0.0007 0.3821
0.0007 0.4994 0.0018
0.3821 0.0018 0.4994
æ öç ÷S = ç ÷ç ÷è ø
-
-
La décomposition en valeurs singulières de la matrice de corrélation donne :
· La matrice diagonale des valeurs propres dans l’ordre descendant:
Chapitre III Analyse en Composantes Principales non Linéaires
38
-1.5-1
-0.50
0.51
1.5
-1.5-1
-0.50
0.51
1.5-1.5
-1
-0.5
0
0.5
1
1.5
x1x2
x3
données originales
1 ère CNL
1 ère CL
0.8814 0 0
0 0.4994 0
0 0 0.1173
D
æ öç ÷= ç ÷ç ÷è ø
· La matrice des vecteurs propres associés à chaque une des valeurs propres dans
son ordre descendant :
0.7071 0.0047 0.7071
0.0021 1 .0000 0.0046
0.7071 0.0017 0.7071
P
æ öç
-÷= ç
çè ø-
÷÷
Les composantes principales sont données par :
1 1 2 3
2 1 2 3
2 1 2 3
0.7071 0.0047 0.7071
0.0021 1.0000 0.0046
0.7071 0.8950 0.7071
t x x x
t x x x
t x x x
= - +
= + +
= + -
Le tableau suivant contient les valeurs propres et leur variance ainsi leur PCV :
On trouve les résultats représenté sur (la figure III.5), la droite en vert dans représente
l’estimation des données originelles par le modèle ACP linéaire, on remarque que cette
composante n’explique que 44,4% d’informations ce qui conduit au plus de 50% perte
d’informations, et ça montre bien l’inefficacité de l’ACP linéaire sur les données non linéaire.
Par contre dans le cas où on applique un modèle ACPNL pour faire l’estimation des
données, ce qui est représenté par la courbe en noire dans la même figure.
Fig III.5 : Estimation linéaire et non linéaire par la première CP.
CPs VPrp V% PCV%
1 0.8814 58.9607 58.9607
2 0.4994 33.3331 92.2938
3 0.1173 7.7062 100
Chapitre III Analyse en Composantes Principales non Linéaires
39
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 355
60
65
70
75
80
85
90
95
100
composantes principales
pourc
enta
ge d
e la v
ariance t
ota
le
Fig III.6: Pourcentage de la variance totale.
On remarque que la première composante principale non linéaire est suffisante pour
expliquer la plupart d’informations (98,2% de variance).
III.5 Conclusion
L’analyse en composantes principales non linéaire a été développée pour traiter les
données des comportements non linéaires, où l’ACP linéaire ne peut pas représenter les données
non linéaires.
Les approches neuronales semblent plus intéressantes pour la modélisation des systèmes
non linéaires. Le réseau le plus utilisé pour le calcul de l’ACPNL est un réseau à cinq couches,
couche d’entrée, couche de sortie et trois couches cachées où la deuxième représente la couche
d’étranglement qui permet de donner les CPs non linéaire à extraire, et malgré la base théorique
solide de ces approches neuronales, le choix du réseau appartient souvent à l’utilisateur car il
n’existe pas de guide approprié et reconnu.
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
41
Sommaire
IV.1 Introduction ...................................................................................................................................... 41
IV.2 Détection de défauts par ACP ......................................................................................................... 41
IV.3 Les exemples de simulation ............................................................................................................. 43
IV.4 Localisation de défauts par ACP .................................................................................................... 45
IV.5 Conclusion ........................................................................................................................................ 46
IV.1 Introduction
Les méthodes de détection et de localisation de défauts reposant sur l’analyse en
composantes principales linéaires (ACP) ont reçu une attention particulière et ont été largement
utilisées pour la surveillance des processus industriels [23]. Le principe de cette approche est
d’utiliser l’analyse en composantes principales pour modéliser le comportement du processus en
fonctionnement normal et les défauts sont alors détectés en comparant le comportement observé
et celui donné par le modèle ACP. La plupart des méthodes récentes utilisent l’erreur
quadratique de prédiction SPE et la statistique de Hotteling T2 pour la détection de défauts sur les
mesures.
Pour la détection des défauts sur les mesures, un indice sera utilisé dans cette section, le
SPE (Squared Prediction Error). La statistique SPE dépend de toutes les variables à surveiller.
IV.2 Détection de défauts par ACP
Généralement, la phase de détection de défaut dans le cas du diagnostic à base de modèle
analytique est liée à l’étape de génération de résidus qui a pour but de générer, à partir d’un
modèle de bon fonctionnement du processus et des mesures disponibles, des signaux révélateurs
de la présence de défauts, appelés résidus. A partir de l’analyse de ces résidus, l’étape de prise de
décision doit alors indiquer si un défaut est présent ou non.
IV.2.1 Génération de résidus par estimation d’état
Dans le cas de l’analyse en composantes principales on retrouve le même principe.
Concernant l’approche par estimation d’état, les résidus sont obtenus par un test de cohérence
entre l’estimation et les mesures.
La présence d’un défaut affectant l’une des variables provoque un changement dans les
corrélations entre les variables indiquant une situation inhabituelle car les relations entre les
variables ne sont plus vérifiées. Dans ce cas, la projection du vecteur de mesures dans le sous-
espace des résidus va croître par rapport à sa valeur dans les conditions normales. Pour détecter
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
42
un tel changement dans les corrélations entre les variables, l’ACP utilise généralement, la
statistique SPE [24] et la statistique.
Dans cette section, nous allons présenter les différents indices de détection utilisés avec
l’ACP ainsi que les limitations de ces derniers et la solution que nous proposons pour résoudre le
problème de détection en utilisant l’analyse en composantes principales.
1 1
ˆ
= == =å åå åT T
i i i ii i
X T p Xp p (IV.1)
IV.2.1.1 Statistique SPE
Une statistique typique pour détecter ces conditions anormales est la statistique SPE,
appelée aussi Q (Squared Prediction Error) qui est donnée par l’équation :
( ) ( ) ( )TQ k e k e k= (IV.2)
où ( )e k est l'erreur d'estimation. Généralement sous les conditions normales de fonctionnement,
la mesure est dans son espace statistique, et lorsque une erreur se produit sur cette mesure, elle
n’est plus dans cet espace ce qui cause une augmentation considérable dans le SPE (statistique
Q dans un certain seuil de confiance dépassant la « limite supérieure de contrôle »
(UCL: Upper Control Limit) 2
ad .
Ä Le processus est considéré en fonctionnement normal (absence de défaut) à l’instant k si:
2( )SPE t ad£
Ä Le processus est considéré dans un état défaillant (présence d'un défaut) à l’instant k si :
2( )SPE t ad>
Le seuil de contrôle 2
ad est déterminé par apprentissage, ou la distribution de la statistique
Q peut être approximée par [25]:
2
hQ ga c (IV.3)
Soit 1
mi
i jj
q l= +
= å1
i j1= +
i ji j pour i= 1, 2, 3 et λj est la jeme
valeur propre de la matrice Σ.
Le seuil est approximé par [25] :
0
1
22 2 0 2 0 0
12
1 1
2 ( 1)1
hc h h haa
q qd qq q
é ù-ê ú= + +ê úë û
Où
2
1
( 1)1
21
2
1
1 30 2 2
2 2
21 et
3 2
hoh ho oe
o
h c
h
q
qa
q q
q q
-- -
é ùæ öê úç ÷ê úè øë û= - = (IV.4)
ca est la limite au seuil de confiance (1-α) dans le cas d’une distribution normale. Il faut noter
que ce résultat est donné sous les conditions suivantes :
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
43
Ä le vecteur des échantillons x suit une distribution normale multi variable,
Ä une approximation est effectuée pour calculer le seuil ad2 du SPE.
Box [26] a antérieurement montré que :
2
1
gqq
= , 21
2
hqq
= (IV.5)
Alors : 2 2
,hgXa ad = (IV.6)
Plus récemment, Nomikos et MacGregor [25] ont démontré que les deux approximations
données par les équations (IV.4) et (IV.5) sont équivalentes où le poids g et le degré de liberté h
peuvent être estimés aussi par les moments : moyenne m et variance v correspondantes du SPE
[27] :
2
vg
m= ,
22mh
v= (IV.7)
Par conséquence, la limite supérieure de contrôle peut être calculée comme suit :
22 2
1
2( )
2
v m
m va ad c -= (IV.8)
IV.2.1.2 Filtrage EWMA pour la détection
Pour améliorer la qualité de la détection et réduire le taux de fausses alarmes, le filtre
EWMA (Exponentially Weighted Moving Average) peut être appliqué aux résidus. L’expression
générale de ce filtre appliqué aux résidus est donnée par :
( ) ( ) ( 1) ( )b b= - - +e k I e k e k (IV.9)
où β est une matrice diagonale dont les éléments sont les facteurs d’oubli pour les résidus, I est
une matrice identité et (0) 0=e , est un facteur d’oubli 0 < < 1.
b g= I (IV.10)
On obtient ainsi le SPE filtrés :
( ) ( ) ( )TSPE k e k e k= (IV.11)
Le SPE permet de réduire les fausses alarmes mais il introduit un certain retard à la détection.
IV.3 Les exemples de simulation
IV.3.1 Exemple (IV.1)
On prendre l’exemple (II.2), où nous avons construit le modèle ACP linéaire avec deux
composantes, et dans le cas de l’ACPNL l’architecture du réseau choisit est [8-2-1-2-8] avec des
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
44
0 100 200 300 400 5000
0.5
1
1.5
2
2.5
# Echantillons
(ACPNL)
SPE
da2
0 100 200 300 400 5000
0.5
1
1.5
2
2.5
# Echantillons
(ACPNL)
SPEf iltré
da2
0 100 200 300 400 5000
0.5
1
1.5
2
2.5
3
# échantillons
(ACP)
SPE
da2
0 100 200 300 400 5000
0.2
0.4
0.6
0.8
1
1.2
1.4
# échantillons
(ACP)
SPEf iltré
da2
fonctions non-linéaires log-sigmoïdale dans les couches cachées , une partie des données est
utilisée pour l’apprentissage du réseau et l’autre pour la validation c.à.d. le diagnostic.
Ici nous allons introduire un défaut sur la variable x4 entre les instant 100 et 200 (La figure
IV.1) représente le SPE par le cas de l’ACP et l’ACPNL respectivement.
Fig IV.1 : Evolution de l’erreur quadratique de prédiction ACP et ACPNL.
On remarque qu’on a un dépassement du seuil à des instant ou les défauts n’est pas encore
présent sur tout pour le cas de l’ACP et pour ACPNL il y a quelque fausse alarme. Pour éliminer
ce problème on présente le concept de SPE filtré.
IV.3.2 Exemple (IV.2)
Soit à reprendre l’exemple précèdent ou nous allons évaluer le SPE filtré
Fig IV.2 : Evolution ACP et ACPNL de l’SPE filtré avec simulation de défaut à partir de 100.
Ici nous illustrons la détection avec SPE filtré (La figure IV.2) pour les cas de l’ACP et
l’ACPNL où l’instant de détection est presque à l’instant d’apparition du défaut.
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
45
1 2 3 4 5 6 7 80
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
variables
Contr
ibution a
u S
PE
(ACPNL)
1 2 3 4 5 6 7 80
0.05
0.1
0.15
0.2
0.25
0.3
0.35
variables
(ACP)
IV.4 Localisation de défauts par ACP
Lorsqu’un défaut est détecté, il est nécessaire d’identifier la ou les variables qui sont en
cause: C’est la localisation de défauts. Pour réaliser cette tâche, plusieurs méthodes ont été
développées dans la littérature. Concernant la localisation de défauts par l’analyse en
composantes principales, on retrouve trois approches :
ü L’approche par calcule des contributions.
ü L’approche par structuration des résidus [28]. Cette approche s’inspire des méthodes de
diagnostic utilisant la redondance analytique.
ü approche utilisant le principe de reconstruction [29]. Dans cette approche chaque capteur
est supposé en défaut et reconstruit en utilisant le modèle ACP déjà calculé et les mesures des
autres capteurs.
IV.4.1 Localisation par calcul des contributions
Une approche largement utilisée consiste à calculer les contributions des variables à
l’indice de détection, et la variable ayant la plus forte contribution à l’instant de détection est la
variable affectée.
Ü La contribution au critère SPE [30]:
( ) ( ) ( )2 2ˆ( ) ( ) ( )SPE
i i i icont k e k x k x k= = - (IV.12)
xi (k) est le ieme
élément du vecteur de mesures x à l’instant k donnée.
IV.4.2 Exemple (IV.3)
Nous allons évaluer les contributions des différents variables à l’instant de détection pour
l’exemple précedent :
Fig IV.3: Localisation par la méthode de contribution ACP et ACPNL.
Chapitre IV Détection et localisation de défauts par Analyse en Composantes Principales
46
La figure IV.3 illustre le tracé des contributions des différents variables à l’indice SPE
pour les deux cas ACP et ACPNL. On remarque que la variable x4 est celle qui contribue plus
dans l’indice SPE donc c’est la variable défaillante.
IV.5 Conclusion
Ce chapitre a été consacré à la présentation des techniques de détection et de localisation
de défaut dans le cadre d’une procédure de diagnostic utilisant l’analyse en composantes dans
ces deux versions linéaire et non linéaire.
Les indices de détection le utilisé dans le cadre de l’ACP est dans notre travail la
statistiques SPE l’erreur quadratique d’estimation, et le critère de localisation des défauts, est
celui par calcul de contribution. Un filtre EWMA est utilisé pour éliminer les fausses alarmes et
alors pour améliorer la détection et l’identification des défauts de capteurs.
Chapitre V Application pour diagnostic avec ACP
48
Coagulation
Coagulation
-Floculation Décantation Filtration
Désinfection
Finale
Eau traitée
Réservoire
Désinfection
Preliminaire
· Turbidité
· PH
· Conductivité
· Temperature
· Oxygen dissoue
Paramètres
de l’Eau
Brute
Eau
Pompée
V. Introduction
Une eau propre est nécessaire à la vie. L’eau douce ne représente que 3 % de l’eau de notre
planète et environ 10 % seulement de cette réserve peuvent être exploités de façon rentable.
Actuellement, d’après une estimation internationale, plus d’un milliard de personnes dans le
monde vivent sans avoir accès à une eau potable propre. Ce n’est pas sans raison que l’eau est
considérée comme la matière première la plus importante, sans elle, la vie comme nous le savon
cesserait d'exister.
Dans un procédé typique de traitement de l'eau potable, l'eau brute provenant de diverses
sources est acheminée par des pipelines où il est traité chimiquement, filtrée et désinfectée [31].
Le traitement de l'eau potable fournit de multiples barrières pour protéger la santé publique
en éliminant les micro-organismes et les produits chimiques qui peuvent causer des maladies aux
consommateurs. L'élimination de la turbidité et la couleur pour produire de l'eau qui est
esthétiquement acceptable pour les consommateurs est un élément très important du traitement
de l'eau [32]. Une grande partie de la difficulté dans la modélisation des procédés de traitement
de l'eau peut être liée aux interactions complexes entre de nombreux facteurs de qualité de l'eau
qui influent, et de nombreuses réactions chimiques et physiques ainsi, dans la modélisation du
procédés de traitement de l'eau , le défi majeur est d'établir les relations non linéaires entre les
entrées et les sorties de chaque procédés [33] [34].
Le procédé traditionnel de traitement de l'eau potable qui a l'eau de surface comprend
généralement quatre processus importants: floculation, décantation, filtration, désinfection et qui
est principalement utilisé pour éliminer la turbidité et à stériliser.
L’unité de traitement de l'eau étudiée dans notre cas est celle Oued el Othmania qui se
trouve dans l'est de l'Algérie, son schéma synoptique simplifié est représenté sur la figure V.1.
Fig V.1 : Processus traditionnel de traitement de l'eau potable
Chapitre V Application pour diagnostic avec ACP
49
Cette unité fonctionne avec une capacité de production de 260.000 m3 d'eau par jour et
est responsable de l'approvisionnement en d’eau potable de haute qualité à de nombreux citoyens
à et autour de Constantine ville. Ce type de processus étudié est connu pour avoir de nombreux
paramètres de qualité à prendre en considération tels que la Turbidité (NTU), PH, Conductivité
(µs / cm), Température (C0) et O2 de l'oxygène dissous (mg / l).
L'eau brute contient des particules en suspension qui doivent être éliminés pour produire
de l'eau propre à des fins de consommation, en particulier les particules colloïdales qui ne
peuvent pas être éliminés par une simple filtration ou clarification, pour cette raison un
traitement chimique est nécessaire en ajoutant des produits chimiques spéciaux appelés
coagulants.
Les paramètres de l'eau à l'entrée sont mesurés et essais de floculation sont réalisés assez
fréquemment (Jar test), ce qui conduit à estimer le taux de dosage optimal à partir des données
brutes de la qualité de l'eau qui a été démontré expérimentalement pour être non linéairement
corrélées.
Lorsque les données de qualité et de dosage sont recueillies et intégrées, en plus de la
commande de dosage automatique en ligne pour le système de prédiction et d'ajustement, il est
alors essentiel à réagir à temps avec le dosage du coagulant le plus optimal, surtout lors de la
forte turbidité de l'eau brute [35], et de comprendre la différence entre le moment où les variables
de processus sont en contrôle statistique et quand ils sont hors contrôle.
Le travail que nous allons présenter consiste à appliquer les techniques de diagnostic
présentées avant. Pour réduire la probabilité d’erreur opérationnelle et réduire le cout des additifs
chimiques.
Les données utilisées dans la présente section contient: paramètres de l'eau brute:
Turbidité (NTU), PH, Conductivité (µs / cm), Température (C0) et O2 de l'Oxygène dissous
(mg / l), donc au total nous avons cinq mesures de capteurs à utiliser. Les mesures sont
échantillonnées par une unité de supervision et d'acquisition de données SCADA (Supervisory
Control And Data Acquisition). Les données sur l'eau brute couvrent une période de 816 jours
représentant des périodes différentes, de sorte que le jeu de données complet a été utilisé pour
construire et développer les modèles. La figure V.2 illustre l'évolution des variables dans l’état
normal. Les données dans l'intervalle [451-750] ont été utilisés pour créer un défaut à
l'échantillon 150.
Chapitre V Application pour diagnostic avec ACP
50
1 1.5 2 2.5 3 3.5 4 4.5 550
60
70
80
90
100
110
composantes principales
pourc
enta
ge d
e la v
ariance t
ota
le
1 1.5 2 2.5 3 3.5 4 4.5 50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
composantes principales
err
eur
de v
alidation
0 200 400 600 800 10000
20
40
# échantillons
turb
idité(N
TU
)
0 200 400 600 800 10006
8
10
# échantillons
PH
0 200 400 600 800 10000
1000
2000
# échantillons
conductivité(µ
s/c
m)
0 200 400 600 800 10000
20
40
# échantillons
tem
pera
ture
(°C
)
0 200 400 600 800 10000
5
10
# échantillons
Oxygen d
issoue (
mg/l)
Fig V.2 : Evolution des variables eau brute.
V.1 Application
Maintenant nous allons appliquer un modèle ACP sur les données, nous avons utilisé
deux critères pourcentage de la variance totale et erreur de validation où le nombre de
composantes retenu =2. Dans le cas de l’ACPNL l’architecture du réseau choisit est [5-4-2-4-5]
avec des fonctions non-linéaires tangente-sigmoïdale dans les couches cachées. Pour les limites
d’avertissement et d’action, le seuil prédéfini de signification est choisi : 0.05a = .
Fig V.3 : Pourcentage de la variance totale. Fig V.4 : Erreur de validation.
Chapitre V Application pour diagnostic avec ACP
51
1 2 3 4 50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
variables
Contr
ibution a
u S
PE
: in
sta
nt
de d
éte
ction
0 50 100 150 200 250 3000
0.5
1
1.5
2
2.5
3
3.5
4
4.5
# Echantillons
(ACPNL)
SPE
da2
0 50 100 150 200 250 3000
0.5
1
1.5
2
2.5
3
3.5
4
4.5
# Echantillons
SPEf iltré
da2
0 50 100 150 200 250 3000
0.5
1
1.5
2
2.5
3
3.5
4
# échantillons
SPE
da2
0 50 100 150 200 250 3000
0.5
1
1.5
2
2.5
3
3.5
4
# échantillons
SPEf iltré
da2
Fig V.5 : La statistique SPE et SPE filtré de l’ACP linéaire.
Les figures V.5 montrent le SPE et le SPE filtré ou nous remarquons un problème dans
l’instant de détection. La figure suivante illustre les contributions des différents variables à
l’instant 150.
Fig V.6 : Contribution des variables ACP.
La figure V.7 montre le SPE et le SPE filtré et la figure V.8 montre le tracé des
contributions dans le cas de l’ACPNL.
Fig V.7 : La statistique SPE et SPE filtré de l’ACP non linéaire avec un défaut à partir de
l’échantillon 150.
Chapitre V Application pour diagnostic avec ACP
52
1 2 3 4 50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
variables
Contr
ibution a
u S
PE
Fig V.8 : Contribution des variables ACPNL.
On peut remarquer que dans le cas de l’ACP linéaire, on ne peut pas détecter le défaut
dans le cas du SPE et dans le cas du SPE filtré (La figure V.5) on a un problème dans l’instant de
détection et qui mène à une localisation erronée (La figure V.6) ce qui n’est pas le cas dans
l’ACPNL ou la détection est bonne sauf pour le SPE ou nous avons une fausse alarme mais
celle-ci est éliminer avec le SPE filtré (La figure V.7). Le tracé des contributions (La figure V.8)
indique que le deuxième capteur (capteur du PH de l’eau brute) est en défaillance.
Conclusion générale
54
Conclusion générale
Dans ce mémoire, on a essayé de passer en revue les techniques de diagnostic les plus
importantes parmi plusieurs et déférentes classifications proposées par les chercheurs dans ce
domaine. Nous avons vu dans le premier chapitre, que le diagnostic dépend d’une représentation
du système, et cette représentation peut être physique, à base de règles relationnelles, ou à base
de données (mesures) disponibles sur le système.
L’ACP est l’une des méthodes de diagnostic à base de données, et comme on peut le
remarquer, elle est une technique de statistique descriptive dont le principe est simple mais qui
met en œuvre des calculs numériques importants, pour cette raison elle n’a pu se développer
qu’avec l’apparition des ordinateurs.
Dans notre travail, on a utilisé l’ACP pour détecter et localiser les défauts de capteur.
Généralement le principe de cette technique est la réduction de la dimensionnalité d’une base de
données avec la perte du moins d’information possible, pour faciliter l’analyse, cette méthode
permet d’identifier les relations entre les variables du système afin de trouver un modèle prévu
de bon fonctionnement aide par la suite à détecter et localiser les défauts de capteurs par
génération des indicateurs de défauts (résidu), en comparant le comportement donné par les
variables mesurées et le comportement donnée par le modèle ACP prévu. Un indicateur des
anomalies, la statique de l’erreur quadratique SPE, est décrit pour la d´détection.
Concernant la localisation où l’isolation des capteurs défaillants, nous avons présenté la
méthode de localisation par calcul de contribution à l’indice de détection .
L’approche standard présentée de l’ACP traite seulement des données linéaires, et alors
on ne peut pas obtenir une représentation compacte des données réelles non-linéaires par
l’utilisation de cette version. Dans notre troisième chapitre, on a expliqué le principe de ACPNL,
qui est une extension non linéaire de l’ACP dont l’objectif est d’extraire à la fois les relations
linéaires et non linéaires entre les variables du système, ainsi nous avons parlé brièvement et
généralement sur les méthodes de modélisation en ACPNL et particulièrement sur le modèle
neuronal le plus utilisé dans le domaine de diagnostic, le réseau à cinq couches. Et en fin, et pour
bien comprendre le principe de méthodes présentées, on a proposé des exemples simples de
simulation et une application basée sur des données réelles.
Les résultats et la discussion de l’application de l’analyse en composantes principales sur
un procédé de traitement d’eau potable afin de détecter et localiser les défauts de capteurs, ont
fait l’objet du dernier chapitre de cette étude, ou nous avons démontré l’efficacité des techniques
étudiées. Comme travail futur, on envisage d’introduire d’autre approches de détection et
localisation de défaut spécialement la statistique de Hotteling T² et la structuration des résidus,
aussi introduire le concept de reconstruction de mesure pour la correction des défauts.
Annexe
A.1 Apprentissage du réseau
L’apprentissage est une phase du développement d’un réseau de neurones durant laquelle
le comportement du réseau est modifié jusqu’`a l’obtention du comportement désiré.
Pour les « MLPs », l’algorithme de rétro-propagation peut traiter le problème de
comment modifier le poids pour les connexions qui ne sont pas en relation avec un neurone de
sortie, cet algorithme et comme tous les algorithmes d’apprentissage des réseaux de neurones
repose sur la minimisation de l’écart entre les réponses réelles du réseau et ses réponses désirées
où les poids sont initialisés aléatoirement avant l’apprentissage puis modifiés itérativement
jusqu’`a l’obtention d’un compromis satisfaisant entre la précision de l’approximation sur
l’ensemble d’apprentissage et la précision de l’approximation sur l’ensemble de validation.
L’erreur totale pour tous les neurones du réseau est donnée par :
1
1( )
N
k
E E kN =
= å (A.1)
Pour minimiser cette erreur, on calcule son gradient par rapport à chaque poids puis on modifie
les poids selon une stratégie de descente en gradient :
Ew w
wh+ -
-¶
= -¶
(A.2)
Où η est le pas d’apprentissage 0.1 1h< < .
( ) ( )2
1
1ˆ( ) ( )
2
m
i ii
E k x k x k=
= -å (A.3)
La minimisation de l’erreur quadratique E(k) par rapport aux poids
( )tjiv
est donnée par :
( ) ( )( )
( )( ) ( )
ˆ
ˆ
it t
iij ji
E k E k x k
x kv v
¶ ¶ ¶=
¶¶ ¶ (A. 4)
Et la modification des poids
( )tjiv
est donnée par :
( )( )
( )
tji t
ji
E kv
vh
¶D = -
¶ (A. 5)
La même chose pour les couches intermédiaires :
( ) ( )( )
( ) ( )
( ) ( ) ( )
ˆ
ˆ
tji
t t tij j j
hE k E k x k
x kw h w
¶¶ ¶ ¶=
¶¶ ¶ ¶ (A. 6)
Et la modification des poids
( )tjw
est donnée par :
Annexe
( )( )
( )
tj t
j
E kw
wh
¶D = -
¶ (A. 7)
( ) ( )( ) ( )x xj j
E k E k t
tw w
¶ ¶ ¶=
¶¶ ¶ (A. 8)
( )( )
( )
xj x
j
E kw
wh
¶D = -
¶ (A. 9)
Finalement, le gradient de E(k) par rapport aux poids
( )xijv
est donné par :
( ) ( ) ( )
( ) ( ) ( )
xj
x x xij j ij
hE k E k t
tv h v
¶¶ ¶ ¶=
¶¶ ¶ ¶ (A.10)
( )( )
( )
tij x
ij
E kv
vh
¶D = -
¶ (A.11)
Il est important de souligner que le problème de la sélection de l’ordre des composantes
principales à retenir peut être résolu en adoptant une stratégie d’apprentissage séquentiel. Dans
une première étape, en ayant qu’un seul neurone (CP) dans la couche d’étranglement, et après
l’évaluation de l’erreur de reconstruction E on peut procéder à l’extraction d’une 2eme
composante non linéaire. Cette opération peut être répéter jusqu’`a l’obtention d’une erreur
d’estimation inférieure un certain seuil choisi a priori.
Annexe
x( )xh
u
( )uhx
x(x )h
1u
1(u )
h
x
e( e )h
2u
2(u )
h
e
x x
-
+
e
B.1 Algorithme séquentiel (Fig B.1)
1. Projeter les données X dans un espace de dimension des composantes principales en
utilisant une structure de réseau à cinq couches.
2. Apprendre le réseau et estimer X par projection inverse.
3. Calculer l’erreur d’estimation ˆE X X= - . Répéter les étapes 1 et 2 en prenant la matrice E
à la place de X jusqu’à ce qu’un pourcentage de la variance de X soit capturé.
Fig B.1 : Extraction séquentielle des composantes principales non linéaires.
B.2 Algorithme parallèle (Fig B.2)
1. Projeter les données X dans un espace de dimension des composantes principales en
utilisant une structure de réseau à cinq couches.
2. Apprendre le réseau et estimer X par projection inverse.
Les deux algorithmes ont leurs avantage et inconvénients. L’avantage principal de l’algorithme
parallèlement est qu’il est plus rapide à apprendre en le comparant à l’algorithme séquence : pour
composantes, un seuil réseau de neurones est nécessaire dans le cas parallèle, alors qu’il faut
réseaux dans le cas séquentiel. L’inconvénient de l’algorithme parallèle réside dans la première
étape. Cette étape suppose que le nombre des CPs doit être connu a priori.
Fig B.2 : Extraction simultanée des composantes principales non linéaires.
Annexe
C.1 Indice de validité des capteurs (SVI) :
Après la détection de la présence d’un défaut, on effectue la reconstruction de toutes les
variables à partir de l’instant de détection, et on calcule l’indice de détection. Par exemple si on
détecte un défaut à l’instant de temps k, SPEj(k) représente l’indice de détection de la jeme
variable reconstruite.
La localisation est effectuée par la comparaison de l’indice de détection avant et après la
reconstruction. Cette comparaison est appelée indice de validité ηj(k) où :
( )( )
( )
jj
SPE kk
SPE kh = (C.1)
Cet indice est toujours inférieur ou égale à 1 [ ]( )0 1h Î parce que l’indice de détection
SPE(k) est toujours supérieur ou égale à SPEj(k). Si le jeme
capteur est défaillant, l’indice de
validité de ce capteur doit être descendant vers le zéro.
Notons que l’équivalence filtrées de ce critère donné par :
2 ( )( ) 1
( )
jj
SPE kk
SPE kh = < (C.2)
Bibliographie
[1] Thèse Doctorat, Gaouaui Mohammed, Diagnostic par reconnaissance des formes :
application à la machine asynchrone, Université Mouloud Mammeri de Tizi-ouzou,
2012.
[2] Thèse Doctorat, Zahi Sabeh, Diagnostic à base de modèle : application à un moteur
diesel suralimenté à injection directe, 2006.
[3] Thèse Doctorat, Nati Slimani Boukhalfa, Synthése d’observateur non linéaires :
application au daignostic de défauts, Université Mouloud Mammeri de Tizi-ouzou.
[4] Brunet M., Jaume D., Labarrere M., Rault A., Verge M., « Détection et diagnostic de
pannes-Approche par modélisation», Traité des nouvelles technologies, série
Diagnostic et Maintenance, Hermèse, Paris 1990.
[5] Maintenance prédictive d’un entraînement électrique par identification paramétrique.
Diagnostic et sûreté de fonctionnement, Vol. 3, N° 1, p 69-95, 1993.
[6] A. PHILIPPOT, «contribution au diagnostic décentralisé des systèmes a événements
discrets: appli- cation aux systèmes manufacturiers». Thèse Présentée pour obtenir le
grade de Docteur de l’Université de Reims Champagne Ardenne. Soutenue
publiquement le 18 juillet 2006.
[7] P.M. FRANK, «Enhancement of robustness in observer based fault detection»,
Int.J.of Cont., 59, 1994, p. 955-981.
[8] R. J. PATTON et J. CHEN, «Observer-based fault detection and isolation:
Robustness and applied», Control Engineering Practice, Vol. 5 (5), pp. 671-682,1997.
[9] M.COMBACAU, P.BERRUET, F.CHARBONNAUD, A.KHATAB, «Réflexions sur
la terminologie: Surveillance – Supervision», Groupement pour la Recherche en
Productique, Systèmes de Production Sûrs de Fonctionnent,
http:/www.laas.fr/~combacau/SPSF/ sursup.html, 03 mars 2000.
[10] G.ZWINGELSTEIN, «Diagnostic des défaillances», Traité des Nouvelles
Technologies, er-i.e. Diagnostic et Maintenance, Hermès, 1995.
[11] Abdelkader AKHENAK, «Conception d’observateurs non linéaires par approche
multimodale: application au diagnostic ; Thèse présentée et soutenue publiquement le
16 décembre 2004 pour l’obtention du Doctorat de l’Institut National Polytechnique
de Lorraine.
[12] B.DARKHOVSKI, M.STAROSWIECKI, «Theoretic Approach to Decision in FDI»,
IEEE Transactions on automatic control, Vol. 48, N°5, 2003.
Bibliographie
[13] Diamantaras K. I., Kung S. Y. (1996). Principal component neural networks. Theory
and applications. John Wiley & Sons.
[14] Valle S., Weihua L., and Qin S. J. (1999). Selection of the number of principal
components: The variance of the reconstruction error criterion with a comparison to
other methods. Industrial & Engineering Chemistry Research, vol. 38, pp. 4389-4401.
[15] Qin S. J. and Dunia R. (1998). Determining the number of principal components for
best reconstruction. Proc. of the 5-th IFAC Symposium on Dynamics and Control of
process Systems, pp. 359-364, Corfu, Greece.
[16] Z. Shijian and X.Yongmao : Multivariate statistical process monitoring usin robust
NLPCA,Tsinghai science and technology ISSN, Vol 10,N 5, PP 582-586, China
2005.
[17] R.Saegusa and S. Hashimoto: Pattern recognition using a nonlinear PCA, GVIP 05
conferance , Egypt 2005.
[18] T. Hastie and W.Stuetzle : Principal curves, Journal of the Americal Statistical
Association, Vol.84, 1989.
[19] N. Kambhalta: Dimension reduction by local principal component analysis, Neural
Computation, Vol.9, pp.1493-1516, 1997.
[20] M. Kramer : Nonlinear principal component using autoassosiative neural network,
AIChE journal, vol.37, N.2, 1991.
[21] Funahashi K. (1989). On the approximate realization of continuous mappings by
neural networks. Neural Networks, vol. 2, pp. 183-192.
[22] Cybenko G. (1989). Approximation by superposition od sigmoidal function.
Mathematics of Control Signal and Systems, vol. 2, pp.303-314.
[23] Tong H. and Bluck D. (1998). An inndustrial application of principal component test
to fault detection and identification. 3rd IFACWorkshop on On-line Fault Detection
and Supervision in the Chemical Process Industries, Lyon, France.
[24] Jackson J. E., Mudholkar G. S.(1979). Control procedures for residuals associated
with principal component analysis. Technometrics, vol. 21, N±3.
[25] Nomikos P. and MacGregor J. (1995). Multivariate SPC Charts for Monitoring Batch
Processes. Technometrics, vol. 37, N± 1, pp. 41-59.
[26] Box G. E. P. (1954). Some theorems on quadratique forms applied in the study of
analysis of variance problems: Effect of inequality of variance in one-way
classification. The Annals of Mathematical Statistics, vol. 25, pp. 290-302.
Bibliographie
[27] Tibshirani R. (1992). Principal curves revisited. Statistics and computation, vol. 2, pp.
183-190.
[28] Harkat M.F., Mourot G., Ragot J. (2000). Sensor failure detection of air quality
monitoring network. IFAC Symposium on Fault Detection, Supervision and Safety
for Technical Processes, SAFEPROCESS’2000, Budapest, Hungary, June 14-16.
[29] Qin, S. J. andWeihua L. (1999). Detection, identification and reconstruction of faulty
sensors with maximized sensitivity. AIChE Journal, vol. 45, N± 9, pp. 1963-1976.
[30] Thèse, Harkat Mohamed-Faouzi, Détection et Localisation de Défauts par Analyse en
Composantes Principales, Centre de Recherche en Automatique de Nancy, 2003.
[31] J.-J. Qin, M. H. Oo, K. A. Kekre, F. Knops, and P. Miller, “Impact of coagulation ph
on enhanced removal of natural organic matter in treatment of reservoir water,”
Separation and Purification Technology, vol. 49, no. 3, pp. 295–298, 2006.
[32] H. R. Maier, N. Morgan, and C. W. Chow, “Use of artificial neural networks for
predicting optimal alum doses and treated water quality parameters,” Environmental
Modelling & Software, vol. 19, no. 5, pp. 485–494, 2004.
[33] G.-D. Wu and S.-L. Lo, “Predicting real-time coagulant dosage in water treatment by
artificial neural networks and adaptive network- based fuzzy inference system,”
Engineering Applications of Artificial Intelligence, vol. 21, no. 8, pp. 1189–1195,
2008.
[34] N. Valentin, T. Denoeux, and F. Fotoohi, “A hybrid neural network based system for
optimization of coagulant dosing in water treatment plant,” in Proceeding of
international joint conference on neural networks (IJCNN’99), Washington, 1999.
[35] C.-L. Chen and P.-L. Hou, “Fuzzy model identification and control system design for
coagulation chemical dosing of potable water,” Water Science & Technology: Water
Supply, vol. 6 no 3, pp. 97–104, 2006.
Résumé
Dans ce travail, nous avons étudié le diagnostic des systèmes à base de
l’Analyse en Composantes Principales qui est une technique de control statistique
multi-varié.
Nous avons introduit en premier les différentes notions et définitions liées
aux diagnostics des systèmes, puis la présentation de l’ACP dans ces deux
versions linéaires et Non linéaires (ACPNL) à base d’un réseau de neurones auto
associatif à étranglement (Bottleneck) pour la détection et la localisation des
défauts. Des exemples de simulations sont présentés, et pour vérifier l’efficacité
des techniques étudiées, une base de données réelle d’une station de traitement
d’eau potable est prise comme exemple.
Mots clés : Diagnostic, Control Statistique Multi-varié, ACP, ACPNL, Détection
et Localisation des Défauts