Projet de Fin d’Études Application des réseaux de …mmsa/pages/documents/... · MÉMOIRE présenté en vue d’obtenir LE DIPLÔME D’INGÉNIEUR EN INFORMATIQUE. Projet de Fin

MÉMOIRE

présenté en vue d’obtenir

LE DIPLÔME D’INGÉNIEUR EN INFORMATIQUE.

Projet de Fin d’Études

Application des réseaux de neurones entélédétection satellitaire :

Typologie des aérosols atmosphériques parCartes de Kohonen Probabilistes

Réalisé par :BOUSSARSAR Mohamed Amine

Directeurs du stage :Mme Sylvie THIRIA, Professeur à l’Université de Versailles Saint-Quentin

M. Fouad BADRAN, Professeur du CNAM

Laboratoire d’Océanographie Dynamique et de Climatologie

Encadré par :Mme Awa NIANG, Professeur à l’École Supérieure Polytechnique de Dakar

Mme Rahma BEN AYED, Professeur à l’École Nationale d’Ingénieurs de Tunis

Soutenu le 24 juin 2003

2

Remerciements

Je tiens à remercier toutes les personnes travaillant au Laboratoire d’Océa-nographie Dynamique et de Climatologie (à l’Université Paris 6).

Plus particulièrement, je souhaiterais remercier mon maître de stage Syl-vie Thiria, professeur à l’Université de Versailles Saint-Quentin, pour m’avoiraccueilli au Laboratoire d’Océanographie Dynamique et de Climatologie,pour avoir suivi et encadré mes travaux avec un grand intérêt et pour avoirlu et corrigé ce mémoire.

Je remercie également mon maître de stage Fouad Badran, professeur duConservatoire National des Arts et Métiers, pour ses précises et précieusesexplications concernant les méthodologies des réseaux de neurones et pouravoir suivi mes travaux durant mon stage.

Un grand merci à Awa Niang, professeur à l’Ecole Polytechnique de Dakar.Sa rigueur, ses compétences et surtout son aimable caractère ont rendu cestage à la fois formateur et agréable. Je lui suis également reconnaissantd’avoir lu attentivement ce rapport et de m’avoir soumis des suggestionspertinentes sur le fond et la forme.

Je remercie aussi vivement Carlos Mejia, Meziane Yacoub, Cyril Moulin,Michel Crépon, Cédric Jamet pour leur disponibilité et leurs précieux conseilstout au long de ce projet.

Enfin, je tiens à remercier Rahma Ben Ayed, professeur à l’Ecole Natio-nale d’Ingénieurs de Tunis, qui, malgré la distance, a réussi de m’assuer unencadrement de qualité.

1

3

Résumé

Dans le présent rapport, nous proposons une méthode neuronale pour laclassification de réflectances mesurées par le radiomètre couleur de l’océanSea-viewing Wide Field-of-View Sensor (SeaWiFS).

L’objectif du travail consiste à déterminer les types et les épaisseurs op-tiques des aérosols atmosphériques contenus dans les images satellitaires dela couleur de l’océan, opération indispensable pour retrouver les paramètresmarins.

Les données à classifier sont des vecteurs de dimension 8, appelés spectres,correspondants aux 8 longueurs d’ondes de mesure du capteur SeaWiFS.Nous utiliserons le modèle PRobabilistic Self Organizing Map (PRSOM) quireprésente une extention du modèle des cartes auto-organisatrices de Ko-honen (SOM). La méthode se compose de trois phases. La première phaseconsiste en une classification (par PRSOM) d’un ensemble de spectres construità partir des images SeaWiFS de la Méditerrané pour l’année 1999. A l’issuede cette étape, les spectres d’observations sont répartis en groupements ho-mogènes. Chaque groupement est caractérisé par son vecteur moyen et savariance. La seconde phase consiste à labelliser les groupements formés enutilisant une base experte, appelée Look Up Table(LUT), et renfermant tousles spectres théoriques ainsi que leurs caractéristiques (type d’aérosol, épais-seur optique à 865 nm,etc.) Enfin, la dernière étape permet de traiter desimages SeaWiFS, c’est à dire, attribuer à chaque pixel de l’image un typed’aérosol et une épaisseur optique en utilisant le modèle construit lors desdeux premières phases.

Nous concluons ce travail par une validation des résultats obtenus enutilisant tout d’abord des informations météorologiques pour expliquer larépartition des aérosols désertiques pour la semaine d’août 1999 ensuite eneffectuant une comparaison qualitative et quantitative avec un alogorithme

2

de typologie d’aérosols élaboré au sein du Laboratoire des Sciences du Climatet de l’Environnement(LSCE).

3

Table des matières

Remerciements 1

Résumé 2

Environnement de travail 6

Introduction 8

1 Le problème physique : Couleur de l’océan 101.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2 Télédétection de la couleur de l’océan . . . . . . . . . . . . . 12

1.2.1 L’instrument SeaWifs . . . . . . . . . . . . . . . . . . . 121.2.2 Les mesures radiométriques . . . . . . . . . . . . . . . 13

1.3 Look Up Table . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Classification Automatique & Cartes de Kohonen 162.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Cartes auto-organisatrices de Kohonen . . . . . . . . . . . . . 17

2.2.1 Les réseaux de neurones artificiels . . . . . . . . . . . . 182.2.2 Architecture des cartes de Kohonen . . . . . . . . . . . 182.2.3 Apprentissage . . . . . . . . . . . . . . . . . . . . . . . 20

2.3 Cartes auto-organisatrices probabilistes . . . . . . . . . . . . . 212.4 Classification ascendante hiérarchique . . . . . . . . . . . . . . 24

2.4.1 Qualité d’une typologie . . . . . . . . . . . . . . . . . . 242.4.2 Le critère de Ward . . . . . . . . . . . . . . . . . . . . 242.4.3 Algorithme CAH . . . . . . . . . . . . . . . . . . . . . 25

2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4

3 Détection des aérosols : Méthodologie 273.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.2 Classification des spectres . . . . . . . . . . . . . . . . . . . . 283.3 Labellisation des neurones . . . . . . . . . . . . . . . . . . . . 29

3.3.1 Classification des géométries . . . . . . . . . . . . . . . 303.3.2 Introduction d’expertise . . . . . . . . . . . . . . . . . 303.3.3 Étiquetage des neurones . . . . . . . . . . . . . . . . . 323.3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.4 Traitement d’une image SeaWiFS . . . . . . . . . . . . . . . . 343.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Analyse des résultats & Validation 364.1 Construction du modèle . . . . . . . . . . . . . . . . . . . . . 36

4.1.1 Carte topologique des spectres . . . . . . . . . . . . . . 364.1.2 Introduction d’expertise . . . . . . . . . . . . . . . . . 38

4.2 Visualisation d’images SeaWiFS . . . . . . . . . . . . . . . . . 43

5 Conclusion générale 57

Liste des tableaux 59

Liste des figures 62

Bibliographie 63

A Script de construction de la carte experte 64

B Script de traitement d’une image SeaWiFS 67

C Fonction de Visualisation d’une image SeaWiFS 70

5

Environnement de travail

J’ai effectué mon stage de fin d’études au sein de l’équipe de recherchedu Laboratoire d’Océanographie Dynamique et de Climatologie (LODYC).

Le LODYC, créé en 1986, est une Unité Mixte de Recherche dépendant– du CNRS,– de l’IRD (ex-ORSTOM) (Département Milieux et Environnement),– de l’Université Pierre et Marie Curie à Paris 6.

Il fait partie de l’Institut Pierre-Simon Laplace, fédération d’unités de la-boratoires, et accueille du personnel de l’Université Versailles Saint-Quentin,de l’Université Denis Diderot (Paris VII), de Météo France, ainsi que duConservatoire National des Arts et Métiers.

Les objectifs scientifiques du LODYC se situent en amont de trois préoc-cupations majeures que sont :

– la variabilité du système climatique et la prévision saisonnière à inter-annuelle du temps,

– l’évolution naturelle et forcée du système climatique de la Terre et sesdiverses conséquences aux échelles globale et régionales,

– l’évolution de l’environnement océanique et de ses ressources biolo-giques.

le long de mon stage, j’ai été intégré dans l’équipe de statistiques et mo-délisation qui se consacre esentiellement aux activités suivantes :

– La modélisation théorique, conceptuelle et statistique avancée liée àl’interprétation des données (observations spatiales et in situ, réana-lyses, sorties de modèles, . . .)

– La modélisation numérique "réaliste" et assimilation des données.

6

Les recherches théoriques récentes portent sur la restitution des para-mètres physiques à partir des observations effectuées, l’utilisation des mé-thodes adjointes neuronales pour affiner les inversions directes et l’assimila-tion des données.

7

Introduction

Depuis une quinzaine d’années, les satellites fournissent aux thématiciensde la télédetection des données de plus en plus nombreuses et de plus en plusriches. Ces données servent essentiellement à la compréhension de divers phé-nomènes, entre autre les phénomènes physiques, à condition de les exploiterde la façon la plus efficace et la plus optimale possible.

Pour l’étude de l’océan, divers capteurs ont été lancés (POLDER, Sea-WiFS, MODIS) offrant des données multidimensionnelles et ayant pour ob-jectif la détermination de paramètres marins. Mais, le signal fourni par cesoutils de télédétection est fortement perturbé par son passage par l’atmo-sphère. Pour remédier à ce problème, des corrections atmosphériques sontmises au point pour extraire le signal provenant de l’océan seul.

Le présent travail s’inscrit dans la cadre du projet européen NAOC (Neu-ronal Algotithms for Ocean Color) et a pour objectif la construction d’unmodèle permettant la typologie des aérosols contenus dans des images satel-litaires SeaWiFS. Il représente donc la première étape des corrections atmo-sphériques du signal mesurant la couleur de l’océan fourni par le radiomètreSeaWiFS.

Disposant donc de données multidimensionnelles (dans notre cas, de di-mension 8), il s’agit de les classifier en groupements homogènes et de trouverpar la suite un moyen de les labelliser. Pour se faire, nous utiliserons un mo-dèle neuronal non supervisé à savoir le modèle PRobabilistic Self OrganizingMap (PRSOM) qui constitue un moyen de visualisation et d’abstraction dedonnées ayant généralement une grande dimension. Cependant, nous verronsqu’il peut être aussi un outil de classification automatique et ce en disposant

8

d’une certaine expertise sur les données à traiter, ou en le combinant à desméthodes statistiques classiques telle que la classification hiérarchique ascen-dante.

Dans le premier chapitre, nous introduisons le problème physique de lacouleur de l’océan. Le chapitre 2 constitue une brève présentation des mo-dèles neuronaux en particulier les cartes topologiques de Kohonen SOM etleurs extention probabiliste PRSOM. Le chapitre 3 présente la méthodolo-gie de la détection des aérosols à savoir la construction du modèle neuronalet l’algorithme de traitement d’images SeaWiFS. Enfin, dans le chapitre 4,nous présenterons les résultats obtenus et leur interprétation. Une conclusiongénérale et des perspectives seront l’objet du chapitre 5.

9

Chapitre 1

Le problème physique : Couleur

de l’océan

1.1 Introduction

La productivité biologique de l’océan joue un rôle important dans l’éco-nomie naturelle de la planète. En effet, elle influe d’une manière active sur lecycle du carbonne et possède un impact considérable sur les ressources ha-lieutiques1. C’est pourquoi physiciens et océanographes s’intéressent de prèsà l’étude de l’océan et plus précisement à la détermination de la concentra-tion en chlorophylle dans les eaux de surface de l’océan et à la quantificationde l’abondance du phytoplancton2. Pour ce faire, des données géophysiquesdécrivant le contenu de l’océan doivent être fournies d’une manière continueet régulière. Or, l’observation du contenu de l’océan sur une échelle spatio-temporelle globale est hors de portée des méthodes traditionnelles d’extrac-tion in-situ (les mesures sont trop coûteuses et par conséquent le nombre dedonnées disponibles est toujours très faible). Plusieurs capteurs mesurant "lacouleur de l’océan" ont été, alors, lancés (MOS, POLDER-1, OCST, Sea-WiFS, MODIS, MERIS) ou vont être lancés (POLDER-2, GLI), à bord dedivers satellites. Ces divers capteurs permettent d’avoir un ensemble gigan-tesque de données qui représentent les observations satellitaires de l’éclaire-ment au dessus de la mer. Tout le travail consiste donc à retrouver, à partirde ces informations, les constituants de l’océan : on parle du "Problème

1relatifs à la pêche2phytoplancton : algues microscopiques se trouvant dans la mer

10

d’inversion". Bien que les outils de télédétection représentent une solutionsatisfaisante pour l’étude de la couleur de l’océan, ils introduisent, en contrepartie, de nouvelles contraintes dont il faut tenir compte ; en effet, l’informa-tion acquise à partir d’un capteur est une intéraction du rayonnement solairenon seulement avec les composants de l’océan mais aussi les composants del’atmosphère, comme le montre bien la figure 1.1.

OCEAN

SPACE

ATMOSPHERE

SCATTERING

Top−Of−Atmosphere

RADIANCE

MOLECULAR

AEROSOLS/

ABSORPTION

MOLECULARAEROSOLS/

ABSORPTION

REFLECTIONOCEAN

SCATTERING

SOLARRADIANCE

PHYTOPLANKTON

PHYTOPLANKTON

Fig. 1.1 – Physique du signal : trajet du signal lumineux

On s’aperçoit que les données satellitaires représentent le couplage océan-atmosphère, et non l’océan seul. De plus, l’étude de ces données montre quele signal atmosphèrique représente 90% de l’information totale reçue par lesatellite. Il convient donc, afin d’étudier convenablement les propriétes del’océan, d’identifier la part du signal mesuré due aux aérosols3 de l’atmo-sphère. Corriger le signal atmosphérique pour pouvoir retrouver avec préci-sion les composants océaniques constitue le travail de la "Correction Atmo-sphèrique" [1]. Le présent travail s’inscrit dans le cadre de ce problème

3aérosol :mélange entre des phases condensées (solides ou liquides) et un gaz. On dé-signe, abusivement, les aérosols atmosphériques uniquement comme les particules solidesou liquides qui sont suspendues dans une masse d’air

11

1.2 Télédétection de la couleur de l’océan

La télédétection (détection à distance) consiste en l’enregistrement d’unrayonnement électromagnétique, qu’il soit naturel, c’est à dire émis par le so-leil, la terre ou tout autre corps céleste, ou qu’il soit généré par un instrument,tel un radar. La télédétection couleur de l’océan correspond au premier cas.Il s’agit de télédétection passive puisque l’on mesure un rayonnement sansémettre (ici le rayonnement solaire réfléchi par le système océan-atmosphère).On peut lui opposer la télédétection active, qui repose sur l’envoi d’un signalet l’analyse de la vitesse et l’intensité à laquelle il est renvoyé. La télédétec-tion couleur de l’océan se situe dans le domaine du visible (400 nm - 700 nm)et du proche infrarouge (700 nm - 1 µm). Deux bandes de longueur d’ondesituées dans le proche infrarouge servent à caractériser l’atmosphère pour per-mettre la correction des bandes visibles du signal atmosphérique. Les autreslongueur d’onde, dans le domaine visible, contiennent l’information sur lecontenu des eaux de mer en particules, en particulier en phytoplancton. Lesparamètres étudiés dans la correction du signal atmosphérique sont le typede l’aérosol et son épaisseur optique4.[2]

1.2.1 L’instrument SeaWifs

L’instrument SeaWiFS (Sea-viewing Wide Field-of-View Sensor) a étélancé sur le satellite Seastar par Orbital Sciences Corporation (OSC) en août1997, et observe maintenant la Terre depuis une orbite héliosynchrone, à unealtitude de 705 km, et avec une résolution spatiale de 1 km. L’instrumentcomporte six canaux dans le visible (412, 443, 490, 510, 555, 670 nm) et deuxdans le proche infra-rouge (765, 865 nm).

SeaWiFS est le successeur du capteur Coastal Zone Color Scanner(CZCS).Le succès du capteur expérimental CZCS, qui a fonctionné de 1978 à 1986, alargement contribué à faire connaître les applications potentielles de la cou-leur de l’océan dans l’étude de la biosphère marine et de l’atmosphère, descouplages entre processus physiques et biologiques, dans la compréhension durôle de l’océan dans le cycle global du carbone etc... Les données acquises parles capteurs POLDER, et OCTS de novembre 1996 à juin 1997 sur la plate-forme ADEOS ont confirmé ce potentiel. Par rapport à CZCS, l’instrumentSeaWiFS (comme la plupart des nouveaux capteurs de couleur de l’océan)

4épaisseur optique :paramètre physique mesurant la concentration en aérosols.

12

Bande k Longueur d’ondes (nm)1 4122 4433 4904 5105 5556 6707 7658 865

Tab. 1.1 – Bandes spectrales de SeaWiFS.

bénéficie de nombreuses améliorations : précision radiométrique bien supé-rieure, suivie de la calibration, acquisition de données en continu... De plus,la disponibilité de nouveaux canaux dans le visible et l’infra-rouge a suscitéde nombreuses études afin d’exploiter au mieux l’information apportée parces nouveaux canaux.[3]

1.2.2 Les mesures radiométriques

Les radiomètres, capteurs passifs embarqués sur les satellites, servent à lamesure de l’énergie lumineuse et permettent une surveillance de très grandeéchelle ; les informations fournies peuvent être utilisées dans la modélisationde nombreux processus océaniques. Un radiomètre couleur de l’océan mesuredonc l’énergie lumineuse émise par le soleil et "perturbée" par l’atmosphèreet l’océan. La grandeur mesurée est une luminance L, correspondant au fluxd’énergie lumineuse reçu par un élément de surface dans un angle solideélémentaire dΩ autour d’une direction (θv, φv)

5 (caractérisant la position dusatellite)(figure1.2).A partir de ces mesures, nous avons accès à de nouveaux paramètres, sansdimensions, plus faciles à interpréter : les réflectances, exprimées par :

ρ(θv, φv, λ) =πL(θv, φv, λ)

Ed(λ)(1.1)

où Ed(λ) est l’éclairement incident diffus. Mais les satellites utilisés dansl’étude de la couleur de l’océan gravitent à environ 800 km de la surface

5respectivement angle zénithal de visée et différence azimuthal

13

n

θ θ

φ

s

v

v

Fig. 1.2 – Géométrie de θv, φv et θs

terrestre ; nous pouvons donc faire l’hypothèse que le rayonnement incidentest unidirectionnel. En effet, à une telle altitude, bien au-dessus de l’atmo-sphère, le rayonnement provient uniquement du Soleil. Nous pouvons doncconsidérer un (unique) angle de position du rayonnement incident, noté θs

6.Dans ces conditions, l’équation 1.1 devient :

ρ(θv, φv, λ) =πL(θv, φv, λ)

E0(λ)cos(θs)(1.2)

où E0 est la valeur de l’éclairement solaire pour une surface perpendicu-laire aux rayons. L’information collectée correspond ainsi à une longueurd’onde et à une position particulières.[4] Le signal enregistré dépend donc decette géométrie de visée (θs, θv, φv) et interviendra donc dans la méthode descorrections atmosphériques puisque on va être amené à traiter les donnéescorrespondantes à chaque géometrie d’une façon indépendante.

6Angle zénithal solaire

14

1.3 Look Up Table

Pour corriger le signal marin, il faudrait déterminer la composition del’atmosphère en aérosols. Les informations relatives aux différents types d’aé-rosols ont été calculées à partir de modèles physiques (équations de transfertradiatif)[5] et sont donc disponibles dans une table experte appelée LookUp Table(LUT).

C’est donc une base de données contenant les paramètres que peut prendreun type donné à savoir différentes valeurs de reflectances pour chaque lon-gueur d’onde du radiomètre utilisé7, une épaisseur optique des aérosols à 865nm, les trois angles de visée définis dans la partie précédente8,etc..

Pour notre travail, nous ne retiendrons que cinq familles d’aérosols àsavoir :Costal, Maritime, Troposphérique, Océanique et Désertique.[6]

7Pour notre cas, nous disposons de 8 valeurs correspondantes aux 8 longueurs d’ondede SeaWiFS

8La LUT contient aussi d’autres paramètres. Nous n’avons cité que ceux que nous uti-liserons pour notre travail.

15

Chapitre 2

Classification Automatique &

Cartes de Kohonen

2.1 Introduction

Après le recueil de données, vient la démarche statistique qui consiste àtraiter et interpréter les informations disponibles ; c’est à dire, dans notrecas, retrouver les paramètres permettant d’effectuer les corrections atmo-sphériques. La statistique exploratoire représente un aspect fondamental decette démarche et consiste essentiellement à synthétiser, résumer, structurerl’information contenue dans les donneés. Connue sous le nom de statistiquedescriptive, cette phase s’est enrichie ces dernières années de nombreusestechniques de visualisation de données multidimensionnelles ; c’est l’analysedes données qui est une des branches les plus vivantes de la discipline sta-tistique. Le rôle de la statistique exploratoire est de mettre en évidence despropriétés de l’échantillon et de suggérer des hypothèses. Les principaux mo-dèles de l’analyse des données se séparent en deux groupes :- Les méthodes de classification visant à réduire la taille de l’ensemble desindividus en formant des groupes homogènes.- Les méthodes factorielles qui cherchent à réduire le nombre de variables enles résumant par un petit nombre de composants synthétiques.[7]

Dans ce qui suit, nous nous intéresserons à certaines méthodes de classi-fication automatique à savoir les cartes auto-organisatrices de Kohonen, sonextention probabiliste PRSOM et la classification hiérarchique ascendante

16

Fig. 2.1 – Des neurones voisins sur la carte représentent des observationsassez "proches" dans l’espace des données

(CAH) . Ce mode de classification vise à arranger, systématiquement un en-semble de données en groupes, catégories suivant un critère donné. La clas-sification automatique, ou encore "l’analyse des groupes" (Cluster Analysis)permet donc de traiter rapidement des ensembles d’effectif assez elevé.

2.2 Cartes auto-organisatrices de Kohonen

Les cartes auto-organisatrices ont été introduites par T.Kohonen en 1981en s’inspirant du fonctionnement des systèmes neuronaux en biologie plusprécisement du fait que les zones du cerveau qui gèrent le fonctionnement ducorps humain respectent la topologie du système physique. Le principe dumodèle des cartes auto-organisatrices (Self Organizing Map) consiste à proje-ter un ensemble D de données de dimension m dans un espace de dimensionréduite (2 ou 3) en faisant appraître les corrélations qui existent au sein de D[8]. L’espace ainsi déterminé peut servir à visionner les données, et proposeune topologie permettant d’apprécier les proximités existantes entre les don-nées.(figure 2.1). Mais avant d’aborder en détails le fonctionnement des cartesde Kohonen, nous allons rappeler quelques principes de bases des réseaux deneurones artificiels et qui s’avèrent indispensables pour la compréhension dece qui suit.

17

2.2.1 Les réseaux de neurones artificiels

Dans sa forme générale, un réseau de neurones est une machine destinéeà reproduire la manière dont le cerveau exécute une tâche. En statistique, ilest employé pour traiter des problèmes difficilement abordables par des mé-thodes linéaires ou par des équations algébriques. Un réseau de neurones estconstitué d’un ensemble de processeurs élémentaires, les neurones, qui sontconnectés les uns aux autres et qui sont capables d’échanger des informationsau moyen des connexions qui les relient. Les connexions sont directionnelleset à chacune d’elles est associé un nombre réel appelé poids de la connexion,ou poids synaptique, qui représente une mesure du lien. Pour déterminer cespoids, on a recours à des méthodes dites d’apprentissage. On se sert doncd’un ensemble de N données statistiquement représentatif du problème pourspécialiser le réseau, c’est l’ensemble d’apprentissage. Lorsqu’on cherche à ap-prendre à un réseau de neurones le lien fonctionnel qui existe entre deux en-sembles de données, l’apprentissage est supervisé. En revanche, si on chercheà analyser les structures d’un seul ensemble de données cohérentes entre elles,l’apprentissage est non supervisé car on ne donne aucune indication a prioriau réseau de neurones. Les cartes auto-organisatrices est une technique à ap-prentissage non supervisé permettant de retrouver l’information "prégnante"dans un ensemble de données de haute dimensionnalité.[9]

2.2.2 Architecture des cartes de Kohonen

Une carte de Kohonen est un réseau de neurones constitué de deux couchestotalement connectées (figure 2.2). La couche d’entrée prend la valeur duvecteur z et sert uniquement à la présentation des observations à classer, laseconde est un treilli régulier à deux ou trois dimensions dont chacun desnoeuds est un neurone linéaire. Ce treilli représente un espace discret, defaible dimension d, muni d’une topologie engendrée par sa structure. Nousdéfinissons une distance discrète δ : pour toute paire de neurones (c,r) de la"carte" C, δ(c, r) représente la longueur du plus court chemin entre r et c.Pour chaque neurone, cette discrète permet de définir la notion de voisinaged’ordre d de c : Vc(d) = r ∈ C, δ(c, r) ≤ d. La géométrie du treilli (figure2.3) définit le type de voisinage de chaque neurone.

18

c

Carte topologique en dimension 2 munie d’un maillage carre

Voisinage de la cellule c

Vecteur d’entre z=(z1,...,zn)

Wij

Fig. 2.2 – Architecture de la Carte de Kohonen

Fig. 2.3 – Différentes formes de cartes : (a) rectangulaire(la plus utilisée),(b) cylindrique et (c) toroïdale

19

2.2.3 Apprentissage

Après avoir choisi l’architecture de la carte, vient donc l’étape d’apprentis-sage ou encore l’estimation des paramètres du modèle : les poids synaptiquesappelés vecteurs référents. Cette phase se fait d’une manière itérative. En ef-fet, après une initialisation aléatoire des poids des neurones, chaque itérationse compose de deux étapes : une étape de compétition entre les neurones quidetermine la région du treillis que l’on va ajuster, et une étape d’adaptationdes poids de la zone sélectionnée à l’observation projetée.

Etape de compétition : A l’itération t, les neurones du treillis calculentleur état en parallèle à partir d’une observation sélectionnée aléatoirement,x(t), présentée en entrée. Seule la région la plus "active" de la carte verrases poids s’ajuster. Cette région est définie par le voisinage du neurone quis’approche le mieux, au sens de la distance euclidienne, de l’observation x(t).Ce neurone dit "neurone gagnant" et souvent noté bmu(Best Matching Unit),est obtenu par :

bmu(t) = arg(minr||x(t) − wr||) (2.1)

où r désigne tour à tour chaque neurone du treillis et wr son vecteur référent.

Etape d’adaptation : Au cours de l’apprentissage, la taille du voisinagedu bmu, qui détermine la zone active, décroit avec le temps. Pour modélisercette décroissance, on utilise une famille de fonctions noyaux positives etsymétriques KT , d’intégrale égale à 1, paramétrée par une fonction positive etdécroissante T(t) appelée Température. Cette famille de fonctions s’exprimepar :

KT (δ(c, bmu)) =1

T (t)K(

δ(c, bmu)

T (t)) (2.2)

où δ(c, bmu) est la distance discrète sur la carte, séparant le bmu duneurone c.

t désigne le temps.

La modification appliquée dans le voisinage choisi revient à rapprocherles vecteurs poids sélectionnés de l’exemple présenté. Cette modification, ouadaptation des poids de la région active de la carte, se fait suivant l’équation :

wt+1

c = wtc + α(t)KT (δ(c, bmu(t)))(x(t) −wt

c) (2.3)

20

où α est un paramètre de l’apprentissage, appelé pas d’apprentissage, quidécroit en fonction de t, et est inférieur à 1.

La figure 2.4 schématise cette phase d’adaptation.

Fig. 2.4 – Adaptation du BMU et de son voisinage lors de l’introductiond’une nouvelle observation x.

Algorithme de Kohonen :

1. présenter x(t) = (x1(t), x2(t), .., xn(t))

2. déterminer le neurone gagnant à l’itération t,bmu(t) Eq. 2.1

3. déterminer la température T (t) et le pas d’ap-prentissage α(t)

4. adapter les poids Eq .2.3

5. faire t=t+1 jusqu’à la convergence de l’algo-rithme

2.3 Cartes auto-organisatrices probabilistes

Une version probabiliste des cartes topologiques, que nous appelleronsPRobabilistic SOM (PRSOM), a été développée au LODYC. Ce modèlePRSOM associe à chaque neurone de la carte une fonction de densité nor-male, la notion de voisinage permettant d’introduire un ensemble de mélangesde gaussiennes. Chaque fonction densité est complètement définie par son

21

vecteur moyen (vecteur référent wc), ainsi que par sa matrice de variance-covariance. Dans le cadre du modèle PRSOM, on se limite à la famille desmatrices diagonales, définies par Σ = σ2I où I est la matrice unité et σ2 lavariance. Ainsi, dans le modèle PRSOM, on attribue à chaque neurone c de lacarte un vecteur moyen wc et un nombre positif σc (écart type), caractérisantla dispersion autour de ce référent.

Fig. 2.5 – Architecture du modèle PRSOM en trois couches.

Comme il est montré sur la figure 2.5, le réseau correspondant au modèlePRSOM possède une architecture à trois couches :

– la couche d’entrée sert à la présentation des observations à classer.– la carte est dupliquée et donne naissance à deux cartes C1 et C2 qui ont

la même topologie que celle des cartes de Kohonen presentée précédem-ment. Au niveau de la carte C1, chaque neurone c est modélisé par unegaussienne de vecteur moyen wc et de matrice de variance-covarianceσcI. Les fonctions de densité des neurones de la couche supérieure C2

correspondent, par l’intermédiaire des structures de voisinage, à desmélanges locaux de gaussiennes. C’est par ce moyen que ce modèle

22

arrive à approximer la fonction densité de probabilité de l’espace dedonnées, comme étant un mélange de mélanges de gaussiennes.

Une propagation d’information probabiliste se produit dans les deux sens,à travers les trois couches du réseau. Dans le sens qui va de la carte vers l’es-pace des données, cette propagation est décrite par les probabilités : p(c1|c2)et p(z|c1, c2). Si on suppose, de plus, que la propriété dite de Markov est vé-rifiée, à savoir : p(z|c1, c2) = p(z|c1), alors la fonction densité de probabilitéspeut s’écrire :

p(z) =∑

C2

p(c2)pc2(z) (2.4)

avecpc2(z) =

∑

C1

p(c1|c2)p(z|c1) (2.5)

p(c1|c2) peut s’exprimer en utilisant les relations de voisinages sur la cartecomme suit :

p(c1|c2) = [1/TC2]KT (δ(c1, c2)) (2.6)

avecTC2

=∑

r

KT (δ(c2, r)) (2.7)

KT : la fonction de voisinageδ(c1, c2) : la distance sur la carte entre le neurone c1 et le neurone c2

Les probabilités conditionnelles des observations p(z|c1) s’expriment en fonc-tion des distributions gaussiennes précédemment mentionnées. Ainsi, on peutécrire :

p(z|c1) =1

(2π)n

2 σnc1

exp(−||z − wc1||

2

2σ2c1

) (2.8)

où n est la dimension des observations.De même, en combinant les équations précédentes, et si on suppose de plusque les neurones c2 de la carte C2 ont des probabilités a priori égales, onobtient :

p(z) =1

p

∑

C2

∑

C1

KT (δ(c1, c2))∑r KT (δ(c2, r))

1

(2π)n

2 σnc1

exp(−||z − wc1||

2

2σ2c1

) (2.9)

23

où p est le nombre des neurones de la carte.[10]

Ainsi, en plus de sa capacité de visualisation et de classification, le modèleprobabiliste des cartes auto-organisatrices PRSOM sert d’approximateur defonction de densité.

2.4 Classification ascendante hiérarchique

La méthode de classification hiérarchique ascendante (CAH) a pour butla construction d’une typologie ou encore partition des individus en classestelles que les individus appartenant à une même classe sont proches, alorsque les individus appartenant à des classes différentes sont éloigné.

2.4.1 Qualité d’une typologie

Considérons une typologie de notre ensemble d’individus en k classesd’effectifs respectifs n1, ..., nk. Notons G1, ...Gk la typologie correspondantedu nuage de points associé N = x1,...,xn, et g1,...,gk les centres de gravitéde ces classes.

L’inertie totale du nuage N se décompose de la manière suivante :

I(N, g) =

k∑

i=1

(ni

n)d2(gi, g) +

k∑

i=1

(ni

n)I(Gi, gi) (2.10)

Le premier terme de droite s’appelle l’inertie inter-classes et mesure lamanière dont les classes s’éloignent les unes des autres. Ce terme est notéI(G1,...,Gk) et représente l’inertie expliquée par la typologie. Le deuxièmeterme de droite s’appelle l’inertie intra-classes et mesure l’homogénéité desclasses.

On mesure la qualité de la typologie à l’aide du rapport inertie inter-classes sur inertie totale.

2.4.2 Le critère de Ward

Lorsque dans la typologie G1,...,Gk on remplace deux classes Gi et Gj

par leur réunion Gi ∪ Gj, il y a diminution de l’inertie inter-classes. Cettediminution :

24

D(Gi, Gj) = I(G1, ..., Gi, ..., Gj, ...Gk) − I(G1, ...Gi ∪ Gj , ..., Gk) (2.11)

peut se calculer et vaut :

D(Gi, Gj) =ninj

n(ni + nj)d2(gi, gj)

Ce critère est utilisé pour mesurer la distance entre les deux classes Gi etGj et s’applle le critère d’agrégation de Ward.

2.4.3 Algorithme CAH

L’algorithme de classification ascendante hiérarchique est itératif. À l’étapecourante, on part d’une partition de l’ensemble des individus en k classesG1, ...Gk et on groupe les deux classes Gi, Gj minimisant le critère de WardD(Gi,Gj). À l’étape initiale, chaque individu forme une classe et l’inertietotale est alors égale à l’inertie inter-classe. À l’étape finale, il n’y a plusqu’une seule classe et l’inertie inter-classes est donc nulle. La somme despertes d’inertie inter-classes des différentes étapes est donc égale à l’iner-tie totale. À chaque étape, on calcule un indice obtenu en divisant la perted’inertie inter-classes par l’inertie totale.

On choisit la typologie obtenue à l’étape correspondant à une augmenta-tion brutale de l’indice.[11]

2.5 Conclusion

Les cartes auto-organisatrices convertissent des relations statistiques com-plexes, existant au sein d’une grande quantité de données, en de simplesrelations géométriques établies sur une structure de faible dimension. Ellesconstituent, ainsi, un outil efficace de visualisation de données ayant, gé-néralement, une grande dimension. Aussi, en compressant les données dedépart, tout en préservant leur topologie d’origine, elles offrent un grandmoyen d’abstraction.

Ces deux aspects, visualisation et abstraction, permettent aux cartesauto-organisatrices, comme on le verra dans la suite de ce travail, de se trans-former en un outil de classification automatique, en disposant d’une certaine

25

"expertise" sur les données, ou en les combinant à des méthodes statistiquesclassiques telle que la classification hiérarchique ascendante.

Finalement, en modélisant les neurones par des fonctions gaussiennes,l’outil PRSOM possède l’avantage d’apporter une information supplémen-taire de nature probabiliste concernant la partition produite.

26

Chapitre 3

Détection des aérosols :

Méthodologie

3.1 Introduction

L’objectif principal de notre méthode "Détection des Aérosols" est l’éla-boration d’un modèle informatique capable de détecter automatiquement lestypes d’aérosols contenus dans une image SeaWiFS.

Le problème revient donc à classifier les spectres d’ondes reçus pour uneimage en groupements similaires selon un critère bien déterminé afin de pou-voir identifier les aérosols.

Pour ce faire, une modélisation neuronale non supervisée a été adaptéevu les grandes performances de ce modèle à aborder les problèmes de lastatistique multidimensionnelle. La méthode non supervisée est justifiée parle peu d’expertise disponible concernant les observations.

On utilisera donc la quantification par PRSOM, présentée au chapitre2, afin de résumer un ensemble de spectres observables, qui constitue notreensemble d’apprentissage. Par la suite, une introduction d’expertise à partirde la Look Up Table (définie au chapitre 1) sera effectuée afin d’étiqueterles neurones. Une analyse des résultats permettra de définir des neuronessûrs pour lesquels un type sera définitivement fixé. Pour les neurones res-tants, nous exposerons une méthode permettant de représenter l’expertiseintroduite. Une fois le modèle construit, une image SeaWiFS est traitée enattribuant à chaque pixel un type d’aérosol et une épaisseur optique.

27

3.2 Classification des spectres

La première phase de la méthode de typologie des aérosols consiste àconstruire une carte topologique à partir d’un ensemble de spectres obser-vables. Cet ensemble représente l’ensemble d’apprentissage du modèle PR-SOM.

Les données sont de dimension 8 (correspondant aux 8 longueurs d’ondesfournis par le capteur SeaWiFS). On se propose donc de les ramener d’unespace ℜ8 à un espace plus restreint de ℜ2.

Notons que la quantification PRSOM fournira des répartitions homogènesde spectres en se basant essentiellement sur leurs formes.

Nous commençons par construire une base d’apprentissage représentativedes données que nous présentons, par la suite, au modèle PRSOM. Rappelonsque les paramètres de l’apprentissage sont :

– La taille de la carte.– La température maximale et minimale.– Le pas d’apprentissage.– Le nombre de cycles.

Il n’y a pas une méthode déterministe pour fixer des paramètres opti-maux ; en effet, c’est en analysant dans un premier temps les données à trai-ter et en visualisant en fin d’apprentissage les résultats que l’on peut fixerles paramètres du PRSOM.

A la sortie du modèle, les fichiers suivants sont générés :

– Fichier des poids des neurones après apprentissage– Fichier de variances des neurones– Fichier de cardinalité des neurones (nombre d’observations captés par

chaque neurone)– Fichier des "neurones gagnants" (BMUs) pour chaque observation– Fichier des états d’activation des neurones pour chaque observation, qui

permettent de calculer les probabilités a posteriori p(c|z), pour qu’uneobservation tirée au hasard, z, soit captée par le neurone c.

La carte ainsi formée est constituée de N neurones (le nombre de neuronesdépend de la taille de la carte) et où chaque neurone est caractérisé par

28

son référent (moyenne des spectres gagnés) et une variance décrivant lesincertitudes introduites par les données. La figure 3.1 montre un exemple deneurone à la sortie de l’apprentissage.

1 2 3 4 5 6 7 8

0.05

0.06

0.07

Canal

Reflectance NEURONE APRES APPRENTISSAGE

Fig. 3.1 – A la sortie de l’apprentissage, chaque neurone est représenté parson référent représenté en bleu et une variance. Les spectres en rouge repré-sentent les valeurs maximales et minimales w ± σ.

A ce stade, nous avons, uniquement, réparti des spectres d’apprentis-sage observables sur les neurones d’une carte topologique. Mais, ces neuronesainsi définis ne disposent pas d’informations expertes capables de caractériserchaque classe. Il est indispensable donc de passer par une étape de labellisa-tion en introduisant toute l’expertise disponible.

3.3 Labellisation des neurones

L’objectif de la phase de labellisation est de donner, si c’est possible,une étiquette à chaque neurone. Rappelons que l’on dispose de cinq typespossibles : Costal, Maritime, Océanique, Troposphérique et Désertique.

Les informations relatives aux types des aérosols sont contenues dansune table appelée Look Up Table, renfermant tous les spectres théoriquespossibles calculés en se basant essentiellement sur des modèles physiques.

Le problème revient donc à introduire cette expertise dans le modèlePRSOM.

Mais, comme nous l’avons évoqué lors de la définition de la table experte(Chapitre 1), chaque type est défini, en plus de son spectre, par sa géométrie

29

de visée ce qui fait que deux spectres de la LUT ayant la même forme (c’està dire le même spectre) peuvent très bien représenter deux types distinctss’ils sont vus sous des angles différents.

Ainsi, nous sommes amenés à répartir les spectres théoriques en groupesde géométries avant de les utiliser. Comme, les physiciens ne disposent pasde partitions d’angles prédéfinis, nous avons choisi d’utiliser une méthodestatistique pour déterminer une répartition des géométries en classes.

3.3.1 Classification des géométries

Rappelons qu’une géométrie est définie par trois angles de visée : θs, θv

et φv (voir chapitre 1). Les océanographes font intervenir un autre anglerésultant de la combinaison des trois angles : l’angle de diffusion γ, défini parla formule suivante[4] :

γ = arccos(− cos(θv) ∗ cos(θs) + sin(θv) ∗ sin(θs) ∗ cos(φv)) (3.1)

Pour la classification des angles, nous ne retiendrons que l’angle de diffu-sion et l’angle zénithal solaire θs et ce après discussion avec les experts.

Les données à classifier sont donc de dimension 2, on se propose de trou-ver des groupements homogènes caractérisant les géométries à partir d’un en-semble d’apprentissage statistiquement représentatif des données. Pour cela,nous utiliserons le modèle PRSOM suivi d’une CAH selon le critère de Ward.

En résultat, nous obtenons m classes d’angles caractérisant nos différentesgéométries de visée.

3.3.2 Introduction d’expertise

Pour introduire l’expertise disponible dans la table experte LUT, noussuivons les étapes suivantes :

Pré-traitement de la LUT

Comme nous l’avons indiqué précédemment, la Look Up Table est unetable contenant tous les spectres théoriques possibles. Pour cette raison, il afallu, tout d’abord, éliminer les données qui ne sont pas appropriées à notreproblème plus précisément les données ayant des géométries hors notre régiond’étude(Méditerranée).

30

Répartition des LUTs en géométries

Pour introduire de l’expertise à la carte topologique des spectres, l’idéeest de projeter les spectres théoriques sur la carte d’observations. Or, chaquespectre de la LUT est défini selon une géométrie de visée donnée1. Il faudraitdonc répartir les spectres théoriques de notre table experte en fonction deleurs géométries avant de les utiliser.

Cette opération consiste à :

– Extraire l’angle de diffusion et l’angle zénithal solaire correspondant àchaque spectre de la LUT. Nous obtenons une table de dimension 2 etde même taille que la LUT.

– Projeter les données de la nouvelle table sur la carte des géométries.Cette opération constitue un Test PRSOM où chaque vecteur d’anglesva être capté par un neurone gagnant selon le critère d’affetation dePRSOM

– Déterminer la classe de chaque vecteur de données. En effet, cette classen’est autre que la classe du neurone gagnant(BMU).

– Attribuer à chaque spectre de LUT (table experte complète) sa classede géométrie correspondante.

Projection des LUTs

A ce stade, nous disposons d’une carte de spectres observables constituéede N neurones et de m tables expertes (LUT) réparties selon les différentesgéométries de visée.

L’introduction d’expertise se compose de deux principales étapes à savoir :– Dupliquer la carte d’observations en m cartes identiques. Chaque carte

représentera une géométrie de visée donnée.– Effectuer un Test PRSOM en projetant les données de chaque LUT sur

la carte de spectres correspondante.

En sortie, nous disposons de m cartes topologiques constituées de Nneurones et où chaque neurone est défini par son référent, sa variance et unnombre de spectres experts captés et correspondants à une géométrie donnée.

1Voir chapitre 1

31

Filtrage des LUTs

La dernière étape d’introduction d’expertise consiste à réduire le nombrede LUTs captés par chaque neurone des m cartes topologiques et ce en uti-lisant sa variance(fournie par le modèle PRSOM).

D’un point de vue physique, seuls les 3 longueurs d’ondes 670, 765 et865 nm interviennent dans la détermination du type d’un aérosol. Partant dece fait, le filtrage des LUTs consistera à sélectionner les spectres théoriquescompris entre l’écart type minimum et l’écart type maximum pour les 3derniers canaux indiqués auparavant.

La figure 3.2 illustre bien l’opération de filtrage des LUTs pour un neuronedonné.

1 2 3 4 5 6 7 80.04

0.045

0.05

0.055

0.06

0.065

0.07Filtrage des spectres LUT

Canal

Ref

lect

ance

OK

Fig. 3.2 – Opération de filtrage tenant compte des 3 dreniers canaux. Lespectre en bleu représente le poids d’un neurone. Seul le spectre en bleu clairsera retenu car il est compris entre l’écart type maximum et minimum (enrouge) pour les 3 derniers canaux.

3.3.3 Étiquetage des neurones

Nous disposons maintenant de m cartes topologiques représentant cha-cune une géométrie donnée. Les LUTs captés (spectres théoriques des typesd’aérosols) par un neurone vont nous permettre de donner un label (typed’aérosol) à ce neurone. Si un neurone a gagné en grande majorité un seul

32

type d’aérosols, nous attribuons à ce neurone le type majoritaire et cela d’unefaçon définitive. Ce neurone est ainsi appelé "Neurone Sûr" et son typesera inchangé pour l’analyse de n’importe quelle image SeaWiFS.

Dans la cas contraire, c’est à dire, pour un neurone ayant gagné diffé-rents types d’une manière assez homogène, il est impossible de lui attribuerune étiquette d’une façon définitive. Par contre, nous essayerons de garderl’information apportée par les spectres théoriques et ce en sauvegardant lamoyenne des LUTs pour chaque type gagné.

En résultat, un neurone non sûr sera représenté par son référent et unnombre de moyennes correspondant au nombre de types possibles.

La figure 3.3 illustre le contenu d’un neurone non sûr.Le type du neurone sera alors choisi selon l’image à traiter. Nous détaille-

rons cette phase dans la section suivante.

Enfin, notons que ce choix du type en fonction de l’image représente unpoint fort de la méthode de typologie d’aérosols qui est ainsi une méthodeadaptative offrant la possibilité de définir le traitement adéquat aux donnéesà classifier.

1 2 3 4 5 6 7 80.05

0.052

0.054

0.056

0.058

0.06

0.062

0.064

0.066

CANAL

REF

LEC

TAN

CE

NEURONE 66 APRES INTRODUCTION D’EXPERTISE

Spectre moyenCoastMaritimeDust

Fig. 3.3 – Visualisation d’un neurone non sûr. Pour la géométrie 4, le neurone66 a pu capté trois types possibles Coast, Maritime et Dust. Il est représentédonc, en plus de son référent en bleu, par trois spectres qui représentent lesmoyennes des LUTs captés relatives à chaque type.

33

3.3.4 Conclusion

En résumé, nous avons pu construire un système de reconnaissance detypologie d’aérosols qui est représenté donc par m cartes topologiques forméechacune par N neurones et où chaque neurone est défini par un vecteur poidset une indication experte qui est soit un type pour les neurones sûrs soit unnombre de spectres représentant des moyennes de types possibles.

3.4 Traitement d’une image SeaWiFS

Le traitement d’une image consiste essentiellement à attribuer pour chaquepixel un type d’aérosols et une épaisseur optique (Voir Chapitre 1).

En fait, cette phase se divise en deux étapes. La première étape vise, toutd’abord, à labéliser les neurones non sûrs. La deuxième attribue un type pourchaque pixel.

Nous présentons, dans ce qui suit, l’algorithme de traitement d’une imageSeaWiFS.

Notons que l’on attribue à chaque neurone non sûr un compteur de tailleégale au nombre de types possibles. Ce compteur va être utilisé pour effectuerun vote majoritaire en fin d’analyse et ainsi étiqueter le neurone en question.

34

Algorithme Traitement d’une image SeaWiFS :

1. Récupérer les données pour les pixels validesa de l’image à traiter.

2. Pour chaque pixel valide de l’image

(a) Projeter les deux angles de géométrie du pixel sur la carte desgéométries

(b) Récupérer la classe de géométrie k du pixel

(c) Projeter le spectre du pixel sur la carte de spectres d’indice k.

(d) Si bmu(pixel) est un neurone sûrAlors Retour à l’étape 2

Sinon

i. Déterminer la moyenne de type T la plus proche du spectre dupixel au sens de la distance euclidienne.

ii. Incrémenter de 1 le type T du compteur relatif au neuronegagnant.

iii. Retour à l’étape 2.

3. Attribuer pour chaque neurone non sûr son type majoritaire. Ce typecorrespondent à l’indice du compteur ayant la valeur maximale.

4. Chaque pixel de l’image prend le type de son neurone gagnant ainsi queson épaisseur optique moyenneb.

apixels correspondants aux aérosols de l’atmosphère après avoir masqué les pixels nuageset terre.

bPour chaque neurone , nous calculons la moyenne des épaisseurs optiques τ desspectres LUTs captés

3.5 Conclusion

Tout au long de ce chapitre, nous avons présenté toutes les étapes dela méthode de détection d’aérosols qui consistait à construire un systèmeneuronale possédant une certaine expertise et capable de trouver les typesd’aérosols intervenant dans une image SeaWiFS donnée.

Mais pour juger des performances de la méthode, une phase d’analyse etde validation des résultats s’avère indispensable. Ceci sera donc l’objet duchapitre suivant.

35

Chapitre 4

Analyse des résultats &

Validation

Après avoir présenté la méthodologie de la méthode de typologie des aéro-sols, nous exposerons dans ce chapitre les résultats obtenus à savoir les cartesfinales de classification de spectres et la visualisation d’exemples d’imagesSeaWiFS.

4.1 Construction du modèle

La classification des spectres se compose d’une phase de quantificationvectorielle des spectres observés et d’une phase de labellisation qui vise àintroduire l’expertise contenue dans la Look Up Table.

4.1.1 Carte topologique des spectres

La construction de la base d’apprentissage des spectres a été faite à partirdes images de la Méditerrané de l’année 1999 fournies chaque jour par lecapteur SeaWiFS. Nous avons échantillonné les images en prenant 1 ligne depixels sur 10 pour tous les jours de l’année. Nous formons, ainsi, un ensemblede spectres représentatif des données à traiter.

Cette base a été, par la suite, présentée au modèle PRSOM pour unequantification vectorielle des données.

Les paramètres de l’apprentissage ont été choisi après une série d’expé-riences. Nous avons enfin retenu le meilleur apprentissage. La carte PRSOM

36

optimale a été obtenu ainsi :

– Taille de la carte : 20 x 20 soit 400 Neurones.– Température ǫ [3 ; 0,01]– Pas d’apprentissage ǫ [ 0,01 ; 0,037]– Nbre de cycles 1000

En sortie de l’apprentissage, nous disposons d’une carte constituée de400 neurones. Chaque neurone est caractérisé par son référent (moyenne desspectres gagnés) et une variance décrivant la dispersion des données.

La figure 4.1 présente un exemple de neurone après apprentissage.

400 450 500 550 600 650 700 750 800 850 9000

0.05

0.1

0.15

0.2

0.25Spectres gagnes et poids : Neurone 201

Fig. 4.1 – Visualisation des spectres captés par le neurone 201 après appren-tissage.

En analysant les neurones de la carte topologique obtenue, nous remar-quons que certains ont capté une certaine forme "inhabituelle" de spectres.La figure 4.2 illustre un exemple de ce type de neurones. En fait, ceci estdû essentiellement à des erreurs de codage des données après détection. Pournotre exemple, c’est le canal 2 qui n’a pas fonctionné pour tous les spectrescaptés.

Ce phénomène permet d’affirmer tout l’intérêt du modèle des cartes to-pologiques qui, pour notre cas, a réussi à détecter les observations erronéeset les regrouper dans des neurones spécifiques.

37

400 450 500 550 600 650 700 750 800 850 9000

0.05

0.1

0.15

0.2

0.25Spectres gagnes et poids : Neurone 10

Fig. 4.2 – Le neurone 10 a capté les spectres contenant une erreur lors de ladétection : le 2ème canal génère des valeurs très faibles.

4.1.2 Introduction d’expertise

Carte topologique des géométries

En analysant les angles de visée, θs et γ, nous avons remarqué que cesdeux paramètres ne présentent pas des changements brutaux pour des joursconsécutifs. Ainsi, pour construire la base d’apprentissage des angles, nousavons sélectionné 25 jours de l’année 1999 (2 jours en moyenne par mois),pour lesquels nous avons extrait l’angle de diffusion et l’angle zénithal solairecorrespondants à chaque pixel de l’image. Nous construisons ainsi une basede 1809743 vecteurs, chacun composé de deux variables à savoir γ et θs.

Angle de diffusion γ Angle solaire θs

Min 113,67 7,5Max 180 74

Tab. 4.1 – Données de la base d’angles exprimées en degré C.

Avant de présenter les données de la base d’apprentissage construite pré-cédemment, il a fallu s’assurer que les deux variables composants un vecteurde données ont la même échelle de grandeur.

Dans notre cas, on remarque bien que les deux angles varient dans desintervalles différents (voir tableau 4.1) ce qui risque de donner une influence

38

à une variable au dépend d’une autre lors du calcul des poids. Pour évitercette contrainte, nous sommes passés par une phase de codage des donnéesavant de pouvoir les utiliser : on parle de phase de normalisation.

Cette opération consiste à ramener toutes les données dans l’intervalle[-1,1].

La normalisation est effectuée en appliquant la formule suivante pourchaque couple d’angles :

xnorm = 2 ∗x − min(xi)

max(xi) − min(xi)− 1 (4.1)

Où xnorm est la donnée normalisée, x donnée non normalisée, min(xi) estla valeur minimale de l’ensemble des données et max(xi) sa valeur maximale.

Nous passons maintenant à la phase d’apprentissage où nous utiliseronsle modèle PRSOM. Pour cela, il a fallu tout d’abord fixer les paramètresd’apprentissage. Une série d’expériences a été effectuée en changeant à chaquefois un paramètre et en fixant les autres.

L’apprentissage optimal a été obtenu avec les paramètres suivants :

– Taille de la carte = 10 x 10.– Température ǫ [5 ; 0,1]– Pas d’apprentissage ǫ [0,03 ; 0,01]– Nbre de cycles = 1000

La figure 4.3 montre les neurones de la carte après apprentissage et leurscardinalités.

L’étape suivante consiste à une classification hiérarchique des référentsdes neurones après apprentissage.

Pour ce faire, nous avons utilisé le logiciel statistique SPAD version4. C’estun logiciel qui offre différentes méthodes statistiques pour analyser plusieurstypes de données. SPAD offre la possibilité de définir les caractéristiques de laclassification voulue (Classification mixte ou hiérarchique, longueur de l’his-togramme des indices, propriétés de la coupure de l’arbre, etc).

Pour la classification des géométries, nous avons choisi une classificationhiérarchique avec une recherche automatique des coupures optimales.

39

Fig. 4.3 – Visualisation de la carte des géométries après apprentissage :Les rectangles représentent les neurones, le chiffre au dessus représente lacardinalité du neurone soit le nombre d’observations captées.

En résultat, SPAD fournit une coupure optimale en 10 classes. Nous adop-terons cette classification pour répartir les géométries de visée.

La figure 4.4 montre la carte topologique des géométries après classifica-tion. Les 10 classes sont représentées par des couleurs différentes et le numérode la classe de chaque neurone est indiqué à droite.

Dans ce qui suit, nous visualiserons les résultats de classification sur desimages SeaWiFS. En effet, nous projetons les angles de diffusion et l’anglesolaire de chaque pixel de l’image sur la carte des angles. Chaque couple dedonnées va être gagné par un neurone au sens du PRSOM. Il appartient doncà une classe qui n’est autre que la classe du neurone gagnant. La figure 4.5montre les classes d’angles pour l’image du 8 Août 1999.

Nous avons aussi visualisé les moyennes pour chaque angle de classe pourl’image 8 Août 1999 afin de vérifier la continuité de chaque angle pour unemême image donnée. Les figures 4.6 et 4.7 illustrent ces résultats.

Nous adopterons la classification trouvée pour la génération des cartesfinales.

40

Fig. 4.4 – Visualisation de la carte après classification en 10 classes. Lenuméro de la classe est indiqué à droite de chaque neurone.

0.5

1

1.5

2

2.5

3

3.5

4

Visualisation Classes d’angles : 8 Aout

200 400 600 800 1000

100

200

300

400

500

Fig. 4.5 – Visualisation des classes d’angles pour l’image du 8 Août 1999.

41

0

5

10

15

20

25

30

Moyennes des classes : Angle Solaire : 8 Aout

200 400 600 800 1000

100

200

300

400

500

Fig. 4.6 – Visualisation des moyennes des classes : angle Solaire pour l’imagedu 8 Août 1999.

0

20

40

60

80

100

120

140

160

Moyennes des classes : Angle Diffusion : 8 Aout

200 400 600 800 1000

100

200

300

400

500

Fig. 4.7 – Visualisation des moyennes des classes : angle de diffusion pourl’image du 8 Août 1999.

42

Labellisation des neurones

Comme nous l’avons définit dans le chapitre méthodologie, cette étapecommence par la projection des LUTs sur la carte des spectres. Ensuite nousfiltrons en premier temps les spectres théoriques pour ensuite les répartir en10 géométries.

Nous disposons enfin de dix cartes de spectres correspondants aux diffé-rentes géométries de visée. Chaque neurone d’une carte est caractérisé parson référent et l’ensemble de spectres théoriques captés.

Un analyse des neurones permet de déterminer les neurones sûrs, c’est àdire les neurones qui auront un type fixé d’une façon définitive. Notons quepour qu’un neurone soit considéré comme "sûr", nous avons imposé que lenombre de spectres captés du type attribué doit dépasser les 95 % du nombretotal de LUTs gagnés.

L’étude des cartes topologiques nous montre que les neurones sûrs re-présentent, en moyenne, le quart du nombre total des neurones de chaquecarte. Pour les autres neurones, nous représentons l’expertise comme cela aété définit dans le chapitre précédent.

4.2 Visualisation d’images SeaWiFS

Dans cette partie, nous exposerons les résultats de quelques images Sea-WiFS présentées au modèle de détection d’aérosols. Les périodes étudiéessont la semaine du 6 au 11 août 1999 et la semaine du 10 au 13 avril 1999.

Rappelons que chaque image est traitée selon l’algoritme présenté au cha-pitre 3 (§4) et qui se compose de deux phases : la première phase vise à label-liser les neurones non sûrs obtenus après apprentissage. La seconde consisteà attribuer à chaque pixel un type d’aérosol et une épaisseur optique.

Semaine d’août

Nous avons étudié les images fournies par le radiomètre SeaWiFS concer-nant l’observation de la Méditerranée pour une semaine d’août 1999 (le6,7,8,9,10 et 11 août). La figure 4.8 illustrent les résultats de la typologiefournie par notre modèle neuronal.

43

6 Aout 7 Aout

8 Aout 9 Aout

10 Aout 11 Aout

coast

marit

dust

ocean

tropo

ocean

ocean ocean

ocean ocean

tropo

tropo tropo

tropo tropo

dust

dust

dust

dust

dust

marit

marit

marit

marit

marit

coast coast

coast coast

coast

Fig. 4.8 – Visualisation du résultat de classification pour les images d’unesemaine (6-11) Août 1999.

44

D’un point de vue physique, nous savons que les types d’aérosols déser-tiques correspondent à des épaisseurs optiques fortes, contrairement au typeMaritime, qui présente des épaisseurs optiques assez faible. Ceci représenteun premier moyen pour verifier la cohérence de nos résultats.

En analysant les résultats de l’épaisseur optique, présentés dans la figure4.9,nous vérifions bien que les zones correspondant au type Dust (aérosols déser-tiques) dans la classification (figure 4.8) présentent des épaisseurs optiquesfortes (comprises entre 0.4 et 0.8) tandis que les Maritimes présentent desépaisseurs optiques faibles (inférieures ou égales à 0.1). Les mêmes observa-tions ont donné de pareils résultas sur d’autres images testées de l’année 1999.

Une seconde information experte indique que cette période d’août corres-pond au passage d’un panache de poussières désertiques sur la zone d’étude.La carte de météo, pŕesentée dans la figure 4.10, nous montre que le sens duvent est Ouest vers Est1. Nous attendons donc que les images fournies parnotre modèle de classification de la semaine d’août révèlent bien le passagede ces poussières dans le même sens que le sens du vent.

En analysant les images, nous constatons effectivement l’élargissement etle déplacement du panache d’aérosols, d’ouest en est, de la côte tunisiennevers le large.

1D’après le modèle de Coriolis, le vent se dirige à droite de la ligne allant des hautespressions vers les basses pressions.

45

0.2

0.4

0.6

0.8 Tau 6 Aout

0.2

0.4

0.6

0.8 Tau 7 Aout

0.2

0.4

0.6

0.8 Tau 8 Aout

0.2

0.4

0.6

0.8 Tau 9 Aout

0.2

0.4

0.6

0.8 Tau 10 Aout

0.2

0.4

0.6

0.8 Tau 11 Aout

Fig. 4.9 – Visualisation du résultat de l’épaisseur optique pour les imagesd’une semaine (6-11) Août 1999.

46

Fig. 4.10 – Carte de vent pour le 8 août 1999 fournie par Meteo France. Levent se dirige à droite de la ligne allant des hautes pressions vers les bassespressions. Il suit donc les lignes d’égale pression.

47

Semaine d’avril

Dans cette partie, nous proposons une étude comparative entre les ré-sultats des épaisseurs optiques fournis par notre méthode et une autre ap-proche utilisée par le Laboratoire des Sciences du Climat et de l’Environne-ment(LSCE)2 basée sur une méthode différente de typologie d’ aérosols etutilisant la même table experte que celle utilisée par notre modèle.

Les jours étudiés sont le 10, 11, 12 et 13 Avril 1999. Nous présentonspour chaque cas, le résultat donné par notre modèle, le résultat de l’algo-rithme LSCE, une image visualisant l’erreur en valeur absolue entre les deuxméthodologies et un tableau exprimant les pourcentages de similitudes pourdifférents seuils d’erreurs.

Une synthèse des résultats montre qu’en moyennant sur les images d’avrilétudiées, le nombre de pixels ayant exactement la même épaisseur optiquepour les deux méthodologies représente 15% du nombre total des pixels va-lides3. Si nous considérons maintenant une marge d’erreur 6.25%, nos résul-tats coincident pour 80.27% des pixels. De la même manière, nous retrouvons92.37% de pixels si l’on considère une marge d’erreur de 12.5% et 96.2 % pourune marge d’erreur de 25%.

Partant de cette analyse, nous pouvons estimer que les résultats de notreméthode de détection d’aérosols atmosphériques sont cohérents. Notre mo-dèle neuronal constitue ainsi une approche satisfaisante de typologie des aé-rosols atmosphériques ayant l’avantage de traiter directement des donnéesmultidimensionnelles.

Notons enfin que les différences constatées par rapport au modèle duLSCE ne sont pas obligatoirement considérées comme des erreurs. Une mei-leure validation consisterait à comparer les résultats obtenus avec des mesuresréelles. Limités par la courte durée du stage, nous n’avons pas pu effectuercette validation.

2méthode élaborée par Cyril Moulin, expert physicien3pixels pour lesquels nous avons attribué un type donné

48

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Optical Thickness 10/ 4

200 400 600 800 1000

100

200

300

400

500

Fig. 4.11 – Visualisation du résultat de Tau par la méthode neuronale pourl’image du 10 avril 1999.

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Optical Thickness 10 Avril 1999 : Cyril Moulin

200 400 600 800 1000

100

200

300

400

500

Fig. 4.12 – Visualisation du résultat de Tau par l’algorithme LSCE pourl’image du 10 avril 1999.

49

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Erreur en valeur absolue : PRSOM & Algorithme LSCE : Tau 10 4

100 200 300 400 500 600 700 800 900 1000

100

200

300

400

500

Fig. 4.13 – Visualisation de l’erreur de Tau en valeur absolue entre les deuxméthodes pour l’image du 10 avril 1999.

δτ Nbre de pixels Pourcentage %δτ = 0 11508 19.51

δτ < 0.05 44209 74.96δτ < 0.1 50526 85.68δτ < 0.2 54778 93.02

Tab. 4.2 – Table d’erreur pour l’image du 10 avril 1999.

50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


51

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


100 200 300 400 500 600 700 800 900 1000

100

200

300

400

500



δτ < 0.05 50663 84.88δτ < 0.1 56602 94.84δτ < 0.2 58039 97.24


52

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


53

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


100 200 300 400 500 600 700 800 900 1000

100

200

300

400

500



δτ < 0.05 41916 76.59δτ < 0.1 50557 92.39δτ < 0.2 52872 96.62


54

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


200 400 600 800 1000

100

200

300

400

500


55

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


100 200 300 400 500 600 700 800 900 1000

100

200

300

400

500



δτ < 0.05 54947 84.65δτ < 0.1 62706 96.60δτ < 0.2 63560 97.92


56

Chapitre 5

Conclusion générale

Dans ce mémoire, nous avons présenté une méthode neuronale non super-visée pour la détermination des types d’aérosols contenus dans des imagessatellitaires SeaWiFS.

Nous avons commencé par construire une carte topologique à l’aide dumodèle PRSOM. La base d’apprentissage utilisée a été construite à par-tir d’images SeaWiFS de l’année 1999 échantillonées en prenant 1 ligne depixels sur 10. Nous avons ensuite utilisé une table experte, contenant lesparamètres théoriques des cinq types d’aérosols à déterminer, pour une in-troduction d’expertise. La contrainte de géométrie des spectres théoriquesnous a amenée à générer, à partir de la carte initiale, dix cartes selon lesangles de visée. Le nombre de partitions des géométries a été déterminé eneffectuant un apprentissage PRSOM d’une base d’angles suivi d’une classifi-cation hiérarchique ascendante en utilisant le logiciel de statistiques SPAD.

Enfin, nous avons visualisé les résultats du modèle pour deux périodescorrespondantes à deux saisons diffŕentes à savoir la semaine du 6 au 11 aoûtet la semaine du 10 au 13 avril 1999.

Pour la première période, nous avons utilisé des informations météorolo-giques plus précisement les données du vent pour valider la répartition desaérosols désertiques. Pour les images d’avril, nous avons présenté une étudecomparative avec une méthode de typologie d’aérosols élaborée au sein duLaboratoire des Sciences du Climat et de l’Environnement(LSCE).

Les résultats obtenus sont satisfaisants. Cependant, certains aspects res-tent à améliorer :

– L’attribution du type majoritaire pour les neurones non sûrs présente

57

certains inconvénients. En effet, en analysant les résultats après traite-ment d’une image, nous pouvons avoir le cas où le compteur maximalne représente pas une nette majorité. Dans notre méthode, nous netenons pas compte de ce détail puisque nous attribuons automatique-ment le type majoritaire au neurone en question. Nous proposons doncde tenir compte du voisinage lors de l’étiquetage du neurone non sûret ce en calculant des probabilités d’attribution de types.

– La prise en compte des trois angles de visée (θs, θv, φv) pour la déter-mination des géométries peut éventuellement constituer un deuxièmepoint d’amélioration.

58

Liste des tableaux

1.1 Bandes spectrales de SeaWiFS. . . . . . . . . . . . . . . . . . 13

4.1 Données de la base d’angles exprimées en degré C. . . . . . . . 384.2 Table d’erreur pour l’image du 10 avril 1999. . . . . . . . . . . 504.3 Table d’erreur pour l’image du 11 avril 1999. . . . . . . . . . . 524.4 Table d’erreur pour l’image du 12 avril 1999. . . . . . . . . . . 544.5 Table d’erreur pour l’image du 13 avril 1999. . . . . . . . . . . 56

59

Liste des figures

1.1 Physique du signal : trajet du signal lumineux . . . . . . . . . 111.2 Géométrie de θv, φv et θs . . . . . . . . . . . . . . . . . . . . . 14

2.1 Des neurones voisins sur la carte représentent des observationsassez "proches" dans l’espace des données . . . . . . . . . . . 17

2.2 Architecture de la Carte de Kohonen . . . . . . . . . . . . . . 192.3 Différentes formes de cartes : (a) rectangulaire(la plus utilisée),

(b) cylindrique et (c) toroïdale . . . . . . . . . . . . . . . . . 192.4 Adaptation du BMU et de son voisinage lors de l’introduction

d’une nouvelle observation x. . . . . . . . . . . . . . . . . . . 212.5 Architecture du modèle PRSOM en trois couches. . . . . . . . 22

3.1 A la sortie de l’apprentissage, chaque neurone est représentépar son référent représenté en bleu et une variance. Les spectresen rouge représentent les valeurs maximales et minimales w±σ. 29

3.2 Opération de filtrage tenant compte des 3 dreniers canaux.Le spectre en bleu représente le poids d’un neurone. Seul lespectre en bleu clair sera retenu car il est compris entre l’écarttype maximum et minimum (en rouge) pour les 3 dernierscanaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.3 Visualisation d’un neurone non sûr. Pour la géométrie 4, leneurone 66 a pu capté trois types possibles Coast, Maritime etDust. Il est représenté donc, en plus de son référent en bleu, partrois spectres qui représentent les moyennes des LUTs captésrelatives à chaque type. . . . . . . . . . . . . . . . . . . . . . 33

4.1 Visualisation des spectres captés par le neurone 201 après ap-prentissage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

60

4.2 Le neurone 10 a capté les spectres contenant une erreur lorsde la détection : le 2ème canal génère des valeurs très faibles. . 38

4.3 Visualisation de la carte des géométries après apprentissage :Les rectangles représentent les neurones, le chiffre au dessusreprésente la cardinalité du neurone soit le nombre d’observa-tions captées. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.4 Visualisation de la carte après classification en 10 classes. Lenuméro de la classe est indiqué à droite de chaque neurone. . 41

4.5 Visualisation des classes d’angles pour l’image du 8 Août 1999. 414.6 Visualisation des moyennes des classes : angle Solaire pour

l’image du 8 Août 1999. . . . . . . . . . . . . . . . . . . . . . 424.7 Visualisation des moyennes des classes : angle de diffusion pour

l’image du 8 Août 1999. . . . . . . . . . . . . . . . . . . . . . 424.8 Visualisation du résultat de classification pour les images d’une

semaine (6-11) Août 1999. . . . . . . . . . . . . . . . . . . . . 444.9 Visualisation du résultat de l’épaisseur optique pour les images

d’une semaine (6-11) Août 1999. . . . . . . . . . . . . . . . . . 464.10 Carte de vent pour le 8 août 1999 fournie par Meteo France.

Le vent se dirige à droite de la ligne allant des hautes pressionsvers les basses pressions. Il suit donc les lignes d’égale pression. 47

4.11 Visualisation du résultat de Tau par la méthode neuronalepour l’image du 10 avril 1999. . . . . . . . . . . . . . . . . . . 49

4.12 Visualisation du résultat de Tau par l’algorithme LSCE pourl’image du 10 avril 1999. . . . . . . . . . . . . . . . . . . . . . 49

4.13 Visualisation de l’erreur de Tau en valeur absolue entre lesdeux méthodes pour l’image du 10 avril 1999. . . . . . . . . . 50







61




62

Bibliographie

[1] R.M. Chomko and H.R Gordon,1998 Atmospheric correction ofocean color imagery.Applied Optics.

[2] Gordon et Wang, 1994 Influence of oceanic whitecaps on atmos-pheric correction of SeaWiFS.

[3] http ://seawifs.gsfc.nasa.gov/SEAWIFS.html.

[4] Galois B. Correction des images de la couleur de l’océan à l’aidede réseaux de neurones Mémoire d’ingenieur. CNAM, 2002.

[5] Nobileau D. Etude de la distribution des aérosols d’origine sa-harienne au-dessus de la Méditerranée à partir de l’imageriesatellite couleur de l’océan Rapport de DEA, Méthodes Physiques enTélédétection, Paris VII.

[6] Bergametti G. Les aérosols atmosphériques. Technical report, Labora-toire Interuniversitaire des Systèmes Atmosphériques, CNRS, ParisVII,2000.

[7] Tenenhaus M., 1996 Méthodes statistiques en gestion. Dunod.

[8] Kohonen T., 1984 self organizing and associative memory Springer-Verlag, Berlin.

[9] Richaume P 1996. Neuronal computation and self organizing mapsAddison Wesley.

[10] Dreyfus .J, Martinez M., Samuelides M., Gorgon M.B, Badran F., thi-ria S. et Hérault L, 2002. Réseaux de neurones, méthodologies etapplications. Eyrolles.

[11] Saporta., 1990 Probabilités, Analyse des données et Statistiques.Editions Technip

63

Annexe A

Script de construction de la carte

experte

Ce script permet de construire la carte topologique experte en sauvegar-dant pour chaque neurone le spectre moyen, les spectres LUTs captés, lesparamètres des LUTs, et enfin le spectre moyen et le au moyen pour chaquetype gagné.

%%%%%%%%%%%%%%%%% Construction de Carte Experte %%%%%%%%%%%%%%%%%

% N_std écarts types utilisés pour le filtrage des LUT

%N_std = 1;

N_std = 2;

% Nombres de géométries de visée. Déterminées par la methode de

% classification des angles

nbre_geometries=10;

% Nombre de types d’aérosols donnés par l’expertise (LUT)

nbre_types=5;

% fichier card du test des fichiers LUT amine dans APP_1_AWA

f=fopen(’spec_lut_amine_sans_ur_TPSOM_Card.res’);

fscanf(f,’%s’,6);

card=fscanf(f,’%f’);

fclose(f) ;

n_neur=length(card);

nonvide=find(card~=0); % neurone ayant capté des LUT

% fichier poids des neurones

f=fopen(’spec_lut_amine_sans_ur_TPSOM_WeiCard.map’);


W=fscanf(f,’%f’,[9 inf]);

W=W’;

64

fclose(f);

Wei=W(:,1:8);

N = size(Wei,1);

f=fopen(’../ecart_type_des_neurones’); % fichier ecart type des neur


ecart_type=fscanf(f,’%f’,[8 inf]);

fclose(f);

ecart_type=ecart_type’;

val_sup = Wei + N_std .* ecart_type; % poids + N_std ecart type

val_inf = Wei - N_std .* ecart_type; % poids - N_std ecart type

for iGeo=1:nbre_geometries

eval([’load /usr/temp/mablod/SANS_URBAN/geo’ num2str(iGeo)])

% geo* contient WFEP_geo, base_geo, param_geo

eval([’type_neurones_geo’ num2str(iGeo) ’=zeros(400,1);’])

for i=1:length(nonvide)

neur=nonvide(i);

eval([’i_spect_neur=find(WFEP_geo’ num2str(iGeo) ’==neur-1);’])

eval([’spect_neur=base_geo’ num2str(iGeo) ’(i_spect_neur,:)’’;’])

eval([’param_neur=param_geo’ num2str(iGeo) ’(i_spect_neur,:);’])

nbre_gagnes = length(i_spect_neur);

ValSup = repmat(val_sup(neur,:),nbre_gagnes,1)’;

ValInf = repmat(val_inf(neur,:),nbre_gagnes,1)’;

%iOk représente les LUT conservées a +/- 1 std par

%rapport aux 3 longueurs d’ondes. On sauve tous les param des LUT gardées

% /géométrie.

iOk = find(prod(spect_neur([5 6 8],:) <= ValSup([5 6 8],:) & ...

spect_neur([5 6 8],:) >= ValInf([5 6 8],:)));

if ~isempty(iOk)

eval([’spect_neur_2std_geo’ num2str(iGeo) ’=spect_neur(:,iOk)’’;’])

eval([’param_neur_2std_geo’ num2str(iGeo) ’=param_neur(iOk,:);’])

disp([’--> geometrie ’ num2str(iGeo) [’ --> neurone non vide’ ...

’ dans cette geometrie : ’ num2str(neur)]);

mean_types_tau_neur_version1_aw

eval([’save(’’Geo’ num2str(iGeo) ’_2Std_Neurone_’ num2str(neur) ’’’,’ ...

’’’spect_neur_2std_geo’ num2str(iGeo) ’’’,’ ...

’’’param_neur_2std_geo’ num2str(iGeo) ’’’,’ ...

’’’meantauneur’ num2str(neur) ’_2std_geo’ num2str(iGeo) ’_type1’’,’





’’’mean_neur’ num2str(neur) ’_2std_geo’ num2str(iGeo) ’_type1’’,’




’’’mean_neur’ num2str(neur) ’_2std_geo’ num2str(iGeo) ’_type5’’)’])

65

end

end

disp([’-----------> terminer avec la geometrie : ’ num2str(iGeo)]);

save([’type_neurones_geo’ num2str(iGeo)], [’type_neurones_geo’ num2str(iGeo)])

end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% FIN %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Notons que ce script fait appel à un script qui génère le spectre moyen etla moyenne de Tau pour chaque type gagné.

66

Annexe B

Script de traitement d’une image

SeaWiFS

En sortie de ce script, nous diposons de deux matrices NbrePixels x 10.La première attribue un type d’aérosol à chaque pixel par géométrie. Ladeuxième contient le tau de chaque pixel par géométrie. Notons que Nbre-Pixels représente le nombre du pixels de l’image à traiter après masque deterre et de nuages.

% Chaque pixel d’une image choisit son type parmi tous les types de

% son neurone gagnant: cad le type le plus proche par rapport a la

% distance sur les 3 longueurs d’ondes de filtrage.

clear all

date_en_cours =’10_Avril’

disp([’============= TRAITEMENT DU : ’ num2str(date_en_cours) ’ =============’]);

nbre_geometries=10; nombre_neurones=400; nombre_types=5;

f=fopen(’/usr/home/awa/data/NAOC_02/Seawifs_Base/convergence_TPSOM_Card.res’);


card=fscanf(f,’%f’);

fclose(f);

nonvide=find(card~=0);

f=fopen([ ’Test_’ date_en_cours ’/test_geometrie/ClassForEachPattern_geo’]);


CFEP_geo=fscanf(f,’%f’);

fclose(f);

% Repartition des pixels de l’image par geometries

for i=1:nbre_geometries

eval([’pixels_geo’ num2str(i) ’=find(CFEP_geo==’ num2str(i) ’);’]);

end

67

%Extraction de la base de spectes et de la base d’angles f=fopen([

’Test_’ date_en_cours ’/test_prsom/base_angles.dat’]);

fscanf(f,’%s’,4); base_angle=fscanf(f,’%f’,[9 inf]);

base_angle=base_angle’; base=base_angle(:,2:9); fclose(f); % Lecture

du Neurone gagnant pour chaque pixel f=fopen([ ’Test_’ date_en_cours

’/test_prsom/convergence_TPSOM_WFEP.res’]); fscanf(f,’%s’,6);

WFEP=fscanf(f,’%f’); fclose(f);

%------------------------------------------------

% tableaux pour contenir le type et le tau d’un neurone selon la geometrie

tau_neurones_par_geo=zeros(nombre_neurones,nbre_geometries);

type_neurones_par_geo=zeros(nombre_neurones,nbre_geometries);

for num_geo=1:nbre_geometries

if ~isempty(eval([’pixels_geo’ num2str(num_geo)]))

disp([’---> traitement de la geometrie : ’ num2str(num_geo)]);

%les spectres de la geometrie de la region testee

load([’type_neurones_geo’ num2str(num_geo) ])

eval([’wfep_geo’ num2str(num_geo) ’=WFEP(pixels_geo’ num2str(num_geo) ’);’])

eval([’base_geo’ num2str(num_geo) ’=base(pixels_geo’ num2str(num_geo) ’,:);’]);

eval([’wfep_type_geo’ num2str(num_geo) ’=type_neurones_geo’ ...

num2str(num_geo) ’(wfep_geo’ num2str(num_geo) ’+1);’])

% leur nombre

compt_neurones_types=zeros(nombre_neurones,nombre_types);

%%%%%%%%%%%%%%%%%%% traitement des pixels dont les neurones %%%%%%%%%%%%%

%%%%%%%%%%%%%%%%%%% gagnants ont un type sur dans la geo : dans %%%%%%%%%

%%%%%%%%%%%%%%%%%%% type_neurones_geo %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

eval([’type_non_nul=find(wfep_type_geo’ num2str(num_geo) ’~=0 & wfep_type_geo’ num2str(num_geo) ’~=0);’])

for i=1:length(type_non_nul)

donnee=type_non_nul(i);

eval([’gagnant=wfep_geo’ num2str(num_geo) ’(donnee)+1;’])

eval([’type=wfep_type_geo’ num2str(num_geo) ’(donnee);’])

load([’Carte_neur_par_Geo_2std_version1/Geo’ num2str(num_geo) ’_2Std_Neurone_’ num2str(gagnant)])

compt_neurones_types(gagnant,type)=compt_neurones_types(gagnant,type)+1;

end

%%%%%%%%%%%%%%%%%%% traitement des pixels dont les neurones %%%%%%%%%%%%%

%%%%%%%% gagnants n’ont pas de type dans la geo type_neurones_geo%%%%%%

eval([’type_nul=find(wfep_type_geo’ num2str(num_geo) ’==0);’])

for i=1:length(type_nul)

donnee=type_nul(i);

eval([’spectre_actuel=base_geo’ num2str(num_geo) ’(donnee,:);’])

eval([’gagnant=wfep_geo’ num2str(num_geo) ’(donnee)+1;’])

if eval([’~isempty(dir(’’Carte_neur_par_Geo_2std_version1/Geo’ num2str(num_geo) ’_2Std_Neurone_’ num2str(gagnant) ’.mat’’))’])

load([’Carte_neur_par_Geo_2std_version1/Geo’ num2str(num_geo) ’_2Std_Neurone_’ num2str(gagnant)])

min_dist=ones(6,1)*99;

%coast

if eval([’~isnan(mean_neur’ num2str(gagnant) ’_2std_geo’ num2str(num_geo) ’_type1(1))’])

eval([’min_dist(1)=dist(spectre_actuel([5 6 8]),mean_neur’ num2str(gagnant) ’_2std_geo’ num2str(num_geo) ’_type1([5

end

68

%marit



end

%dust



end

%tropo



end

%ocean



end

type=find(min_dist==min(min_dist));

compt_neurones_types(gagnant,type)=compt_neurones_types(gagnant,type)+1;

end

end

for i=1:length(nonvide)

k=nonvide(i);

type=find(compt_neurones_types(k,:)==max(compt_neurones_types(k,:)));

if length(type)==1

type_neurones_par_geo(k,num_geo)=type;

eval([ ’tau_neurones_par_geo(k,num_geo) = meantauneur’ ...

num2str(k) ’_2std_geo’ num2str(num_geo) ...

’_type’ num2str(type) ’;’ ]);

end

end

end

disp([’-----------> terminer avec la geometrie : ’ num2str(num_geo)]);

end

Type_of_EachPattern=WFEP*0;

Tau_of_EachPattern=WFEP*0;

for i=1:nbre_geometries

if ~isempty(eval([’pixels_geo’ num2str(i)]))

eval([’Type_of_EachPattern(pixels_geo’ num2str(i) ’)=type_neurones_par_geo(wfep_geo’ num2str(i) ’+1,i);’]);

eval([’Tau_of_EachPattern(pixels_geo’ num2str(i) ’)= tau_neurones_par_geo(wfep_geo’ num2str(i) ’+1,i);’]);

end

end

save([ ’Result_’ date_en_cours ],’Type_of_EachPattern’,’Tau_of_EachPattern’);

69

Annexe C

Fonction de Visualisation d’une

image SeaWiFS

Cette fonction permet, à partir des variables contenus dans le fichier du’Result.mat’, de visualiser le type le tau de chaque pixel d’une image traitée.La fonction prend en entrée le jour et le mois (entier) de la date à visualiser.

Nous utilisons une fonction d’extraction de données élaborée par CarlosMejia (LODYC) récupérant les différentes valeurs des pixels correspondantesà chaque longueur d’onde ainsi que ceux correpondantes aux nuages et à laterre dans une structure R.

function Visualisation_res_jour_amine(jour, mois)

% Cette fonction permet la visualisation du tau et la

% classification pour une date donnee.

% Entrees : jour (int) mois (int).

% Sorties : Figure 1 : Tau de la region testee.

% Figure 2 : Classification de la region testee.

if nargin ~= 2;

error(’nombre d’’arguments incorrect’);

end;

Rep_region = ’NAOC_CyrilMoulin/DAILY_DSP_MED_1999/’;

La_region = ’’;

chemin_region = [Rep_region La_region];

% Attention : Formule vraie que pour les mois > Fev

if eval([’mod(’ num2str(mois) ’,2)==0’]);

Case = (floor(str2num(mois)/2)*31+(((floor((str2num(mois))/2)-2))

*30)+28+str2num(jour));

else

Case = (floor(str2num(mois)/2)*31+(((floor((str2num(mois))/2)-2)+1)

*30)+28+str2num(jour));

70

end

path(path,’/usr/temp/mablod/Le_17_12_02/EXTRACTION’);

R=charge_don(Case);

[nbre_lignes_region nbre_colonnes_region]=size(R.rho412);

nbre_pixels_region=nbre_lignes_region*nbre_colonnes_region;

% Chargement des Flags

MasqueTerreNuages_Tested_day = zeros(size(R.rho412));

MasqueTerreNuages_Tested_day(R.i_nuages)= 1;

MasqueTerreNuages_Tested_day(R.i_terre) = 1;

% Valid_Pixels : pixels qui sont ni NaN ni terre

Valid_Pixels = find(isnan(R.rho412)==0 & isnan(R.rho443)==0 & ...

isnan(R.rho490)==0 & isnan(R.rho510)==0 & ...



MasqueTerreNuages_Tested_day==0);

% resultats de types_pixels_region_version2.m

load ([’./Result_’ num2str(jour) ’_’ num2str(mois) ’.mat’]);

% visualisation des resultats

figure

image_tau=zeros(nbre_pixels_region,1);

image_tau(Valid_Pixels)=Tau_of_EachPattern;

image_tau=reshape(image_tau,nbre_lignes_region,nbre_colonnes_region);

imagesc(image_tau)

axis image

localcolor1=jet(256);

LocalColorMap1=[1 1 1; localcolor1];

colormap(LocalColorMap1)

set(gca,’FontSize’,18)

titre =[’ Optical Thickness ’ num2str(jour) ’/ ’ num2str(mois)]

h = title (num2str(titre))

set(h,’interpreter’,’none’)

colorbar

figure

%

image1=zeros(nbre_pixels_region,1);

image1(Valid_Pixels)=Type_of_EachPattern;

%-------------------------

image1=reshape(image1,nbre_lignes_region,nbre_colonnes_region);

nbclasses=5;

imagesc(image1,[0 nbclasses]);

axis image

nbcolors = max(256,2*nbclasses);

localcolor=jet(nbcolors);

s0color = floor((nbcolors / nbclasses) / 2);

s1color = floor(nbcolors / nbclasses);

tbcolor = localcolor(s0color:s1color:nbcolors,:);

LocalColorMap=[1 1 1; tbcolor];

colormap(LocalColorMap)

set(gca,’CLim’,[-0.5, (nbclasses + 0.5)])

set(gca,’FontSize’,18)

71

titre = [’Classification ’ num2str(jour) ’/’ num2str(mois)]

h = title (num2str(titre))

set(h,’interpreter’,’none’)

local_non_valid=[1.0000 1.0000 1.0000];

local_dust=[0.9063 0 0];

%local_urban=[1.0000 0.5625 0];

local_coast=[0.7969 1.0000 0.2188];

local_tropo=[0.1406 1.0000 0.8750];

local_marit=[0 0.4844 1.0000];

local_ocean=[0 0 0.8281];

local_map=[local_non_valid;local_ocean;local_marit;local_dust;

local_tropo;local_coast]

colormap(local_map)

xxx=colorbar

set(xxx,’YTickLabel’,’coast’, ’marit’, ’dust’, ’tropo’,’ocean’)

72

Documents

Projet de Fin d’Études Application des réseaux de …mmsa/pages/documents/... · MÉMOIRE présenté en vue d’obtenir LE DIPLÔME D’INGÉNIEUR EN INFORMATIQUE. Projet de Fin