Identification du nombre de composants dun mélange gaussien Sous la direction de Bernard Garel par...

Identification du nombre de composantsd’un mélange gaussien

Sous la direction de Bernard Garel

par chaînes de Markov à sauts réversibles dans le cas multivarié

par maximum de vraisemblance dans le cas univarié

Les mélanges gaussiens par l’exemple

Etudes cliniques :Dosage de globules blancs dans le sang des patients

Pour des individus sains, la distribution est gaussiennede moyenne 0 connue

Pour certaines maladies, le nombre de globules blancs augmente

La variance des observations est commune et connue

Deux hypothèses :

Les individus analysés sont sains Certains individus sont malades

Le nombre de globule blancsuit une loi normale

Le nombre de globules blancssuit une loi de mélange

Problématique

Ayant observé un échantillon

Comment faire un choix entre les deux hypothèses ?Quelle confiance dans le résultat ?

Comment repérer les individus malades ?

Théorie des tests statistiques

Approche classificatrice

Pour d’autres maladies, le taux de globules diminuePeut on caractériser les maladies ?Les repérer, les compter ?

Détection du nombre de composants

Et en multivarié ?

Images d’étoile double prises au pic du midiQuelle est la probabilité d’avoir observé une étoile double ?

On souhaite analyser des données supposées Indépendantes, provenant d’un mélange gaussien à k composants de

densité :

Nombre de composants

Estimation des paramètresObjectifs de l’inférence :

Première utilisation d’un modèle de mélange : Karl Pearson (1894)

Utilisation de plus en plus large : 50% des publications postérieures à 1995

Très nombreuses applications pratiques, en univarié comme en multivarié

Thème général : Les mélanges gaussiens5/42

Notion d’identifiabilité

Le mélange est invariant sous les k! permutations des paramètres

La vraisemblance possède donc k! modes

Solution classique :

imposer une condition d’ordre comme

Conditions non utilisées dans cette thèse

PARTIE 1 : Test d’homogéneité contre mélange simple dans le cas général

PARTIE 2 : Méthodes de Monte Carlo par chaînes de Markov

• Test du rapport des maximums de vraisemblance• Log-vraisemblance modifiée• Application aux mélanges sur les variances• Tabulations

• Méthodes de Monte Carlo par chaînes de Markov• Illustrations• Le problème du « label switching »

• Modélisation bayésienne des modèles à dimension variable• Choix des lois a priori• La méthode MCMC à sauts réversibles• L’algorithme• Le mouvement de séparation• Simulations

PARTIE 3 : RJMCMC appliqué au mélanges gaussiens multivariés

PARTIE 1

Test d’homogéneité contre mélange simpledans le cas général

Ce type de problème a été étudié par de nombreux auteurs :

Approche adoptée :Résoudre ce problème dans le cas général de manière simpleen recherchant des hypothèses minimales sur la densité g

Chen & Chen (2001) Garel (2001) Lemdani & Pons (1999) Dacunha- Castelle & Gassiat (1997)

Retour à l’exemple introductif

Homogéneité : Mélange simple :

La statistique de test est :

Avec :

Test du rapport des maximums de vraisemblance

on peut écrire la Log-vraisemblance de la façon suivante

Avec : et

On utilise une Log vraisemblance modifiée

Le sup de :

est atteint pour

c’est-à-dire sur des ensemblesde la forme :

: Zone où la vraisemblance est maximale

Retour à la Log-vraisemblance originale

Selon Redner(1981), la vraisemblance atteint son maximum sur un voisinage de l’hypothèse nulle, c’est-à-dire :

On se ramène à des ensembles de la forme

sur lesquels on montre que :

On peut donc utiliser le maximum de la vraisemblance modifiée

qui s’écrit :

En faisant certaines hypothèses simples sur la loi g (régularité, intégrabilité)on obtient le résultat suivant :

Application aux mélanges gaussiens sur les variances

Le théorème précédents’applique avec :

Poursuite d’un travail initié par Goussanou (2001)On montre que les hypothèses nécessaires sont vérifiées

converge vers De plus,

où est un processus gaussien centré de variance 1 et de même fonctiond’autocovariance que

On est donc en mesure d’effectuer les tabulations de ce testdans ce cas particulier

Davies (1977) :

Tabulations

Connaissant , on souhaite calculer u tel que :

On ne dispose que de

avecoù est la fonction d’autocovariancedu processus.

Delmas (2001) :

Les valeurs critiques pour un niveau fixé seront solutions de

Le terme est très complexe (Delmas (2001))et conduit à de nombreuses instabilités numériques

PARTIE 2

Méthodes de Monte Carlo par Chaînes de Markovet « label switching »

De plus, les méthodes classiques de maximisation ne réussissent

généralement pas à trouver le maximum global de la vraisemblance à cause de la multimodalité (identifiabilité).

Même des modèles simples peuvent mener à des calculs très complexes

La vraisemblance d’un mélange gaussien à k composants

possède kn termes, ce qui rend son calcul prohibitifpour de grands échantillons

Permettent de résoudre des problèmes d’optimisation (liés à la vraisemblance)comme des problèmes d’intégration (fréquents en statistique bayesienne)

Méthodes de Monte Carlo par chaînes de Markov

Méthodes de Monte Carlo par Chaînes de Markov

Objectif de l’intégration par MCMC :générer un échantillon distribué selon , la loi de Y

et approximer

par : On a

Un exemple, l’algorithme de Metropolis Hastings

MCMC et méthodes bayesiennes

Dans un cadre bayésien, l’information apportée par les données y1,…,yn

réalisations d’une v.a. , combinée avec une informationa priori sur le paramètre (donnée par la densité )est résumée par la loi a posteriori

Les méthodes MCMC sont ici utilisées pour simuler des lois a posteriori

Le problème du « label switching »

Un exemple

On génère un échantillon de densité :

4000 itérations de l’algorithme de Gibbs nous donnent le résultat suivant :

Des solutions existentStephens (2000) : Un algorithme de type k-means avec k! classescorrespondant aux k! façons d’ordonner les composants du mélange

Celeux (1998) : Comparable à une version séquentielle de l’algorithme des k-means dont les centres sont déterminés par les m premières itérations.

PARTIE 3

Méthode de Monte Carlo par chaînes de Markovà sauts réversibles

appliquée aux mélanges gaussiens multivariés

Généralisation multidimensionnelle de Richardson & Green (1997)

Choix de modèles

Le nombre de composants k représente la dimension du modèle

associés

La densité d’un mélange gaussien multivarié s’écrit

avec :

choisir parmi

Objectif :

Modélisation bayésiennedes modèles à dimension variable

On s’intéresse à la loi a posteriori de

« One of the things we do not know is the number of things we do not know »Peter Green

Loi a priori sur

Vraisemblance

Second problème :K! modes dans la vraisemblanceET DONC dans

Phénomène de « label switching » dans les simulations

Premier problème : ne peut être obtenue analytiquement

Utilisation de méthodes de type MCMC

Modèle hiérarchique

On introduit le modèle à données manquantes

Chaque donnée yi provient d’un des composants du mélange

yi est associée à une variable indicatrice telle que

Choix des lois a priori

Inspirés par Richardson & Green (1997) et Stephens (2000)

A priori sur le nombre de composants :

A priori sur les moyennes et les variances :

Attention ! Les lois a priori impropres sont prohibées

Risque de composants vides Loi a posteriori impropre

indépendants et faiblement informatifs{

loi de Poisson tronquée à

Richardson & Green (1997) Stephens (2000)

R = amplitude de variation des données

Graphe acyclique ordonné

La méthode MCMC à sauts réversibles

Soit la variable aléatoire de réalisation

Sauts réversibles entre espaces différents

On génère une chaîne de Markov sur

se déplaçant de vers

Si : mouvement de Gibbs classique

Si : changement de dimension !

On définit un difféomorphisme avec (réversibilité)

Transition de vers Transition de vers

Pour se déplacer de vers , nous devons compléter ces espacespour se ramener à une dimension commune

nnnn kkkkkk '''

Applications permettant de changer de dimension

est généré selon la densité est généré selon la densité

R 'kn k R k' n k

R ' n k

Le nouvel état proposé est

Il est alors accepté avec la probabilité :

c’est-à-dire

: la probabilité de tenter un déplacement de vers

Rapport des lois a prioridu nombre de composants

Rapport des lois a priorisur les paramètres

Rapportdes vraisemblances

: jacobien de la transformation

L’algorithme

2. Mise à jour de

3. Mise à jour des

4. Mise à jour des allocations

5. Mise à jour de l’hyperparamètre

Avec probabilité ½ essayer de séparer un composantAvec probabilité ½ essayer de combiner deux composants

Avec probabilité ½ essayer de faire naître un composantAvec probabilité ½ essayer de tuer un composant

Le mouvement de Séparation

Proposer un nouveau jeu de paramètres aussi bien supporté par les donnéesque le précédent

Garantir la définie positivité des nouvelles matrices de variance

Conserver les moments jusqu’à l’ordre 2

Utiliser la décomposition de Cholesky

Le changement de variable proposé est le suivant :

de jacobien : J =

Pour r = 1

J =à comparer avec celui

de Richardson & Green (1997)

Simulations

Nous avons généré l’échantillon bivarié suivant :

Estimation à noyau de la densité

Données générées

Evolution du nombre de composants au cours des itérations

Loi a posteriori associée

Nombre de composants a posteriori

Paramètre a priori pour le nombre de composants :

Evolution du nombre de composants au cours des itérations

Loi a posteriori associée

Nombre de composants a posterioripour les données réelles « geyser »

Conclusion

Algorithme complexe Nécessitant un très grand nombre d’itérations Estimation du nombre de composants prometteuse

Nécessité d’une étude plus approfondie (convergence, « label switching » …)

Programmer avec un langage compilé et effectuer un très grand nombre d’itérations

Envisager d’autres solutions au « label switching » (fonctions de coûts « label free »)

Envisager d’autres types de mouvements (condition sur les moments non nécessaire)

Utiliser une paramétrisation des matrices de variance

Identification du nombre de composants dun mélange gaussien Sous la direction de Bernard Garel par...

Documents

Utilisation du métamodèle processus gaussien pour l'analyse de

QUENTIN GAREL “GUEULE DE BOIS” : MAY 2 – JUNE 1, 2013

CENTRE D’ART CONTEMPORAIN - Matmut...8 Depuis l’ouverture du Centre d’Art Contemporain de la Matmut Philippe Garel, Multiprise, 2 décembre 2011 – 25 mars 2012 Jean-Pierre

Estelle DUBREUIL 18 janvier 2007 Distorsion de pulse gaussien femtosecondes à travers une lentille IFIPS Département Optronique Cycle ingénieur 2 ème année

Travailler en équipe projet 15 octobre 2007 Gilles Garel PCC / Département HSS Projet Scientifique Collectif

11 | RESPECT | QUENTIN GAREL | VANNI CUOGHI | GABRIELE BURATTI | MASSIMO CACCIA | ALICE ZANIN

CALIBRAGE D UN MODELE DE TAUX GAUSSIEN A 2 FACTEURS · Le modèle que nous avons retenu est un modèle gaussien à 2 facteurs, appelé modèle G2++, c’est un cas particulier du

Langage C pour le TSIdonias.vvv.enseirb-matmeca.fr/c_tsi/c_tsi_work.pdf · passe-bas 2D de type gaussien : double * gaussian2d_create ... d’entrée image de sortie Calcul ... Une

GAROUSTE 18 FIGARO.FR - Galerie Templon - Current … Jean Cortot, Vladimir Velickovic Philippe Garel, Jean-Marc Bustamante et Gérard Garouste. L'une des cinq Académies composant

Cnam garel corsiv1.1

Portrait 360o sur les aspirations de la main-d'oeuvre ... · Portrait 360o sur les aspirations de la main-d’œuvre | 4 Février 2020 – Le Portrait 360° offre un regard multivarié

Fetales MRT in der Kinderradiologie München Nymphenburg · 50 kind & radiologie toriell erst um die Geburt herum einsetzt. Biometrische Daten (Garel 2004) geben uns Hinweise auf

Anne Drost Sunny Handa Natalie Bussière Michael …lemondejuridique.com/wp-content/uploads/2016/12/LMJ_vol23-4.pdf · Bouvette, Alexandre Buswell, Rick Coburn, Marie Garel, Manon

TEST SEQUENTIEL Probabilité de confiance après acceptation - Ludovic dEstampes (destampe@len7.enseeiht.fr) - Bernard Garel (garel@len7.enseeiht.fr) - Guillaume

Partie 0: Rappel de communications numériques · 2.Quelques modèles de canaux 2.1Canal gaussien (AWGN) 2.2Canal sélectif en fréquence 3.Description de modulateurs simples (linéaires)

Caractérisation des dimensions et de la forme des ... · 2.3.2.4 Théorème de convolution et Transformée de Fourier Rapide.....20 2.3.2.5 Le filtre gaussien ... Fourragère New

Générateurs de scénarios économiques (GSE) en … · d’une prise en compte du caractère non gaussien des rendements de l'actif. 1.1. Risque action Modèles classiques 1. Risques

Modèle de régression linéaire multivarié · 2017-01-15 · Exemple: Consommation mondiale du pétrole U. Paris Ouest L. Ferrara, 2016-17 Forecast 0 20 40 60 80 100 120 140 80

Le modèle de régression linéaire - Master1 SESfermin.perso.math.cnrs.fr/Files/Slides_Regression_M1.pdf · Modèle gaussien de la régression linéaire simple OnveutexpliquerY (ozone)àpartirdeX

JUNTA DE GOBIERNO - ddd.uab.cat... · gundanave de 1G5'50 metros cuadradosydesaho¬ garel escenario, delque se hanpodido sacarenor¬ mes bastidores yotrasmuchas piezas que jamás