Upload
hahuong
View
218
Download
0
Embed Size (px)
Citation preview
Chaînes de Markov : une initiation
INFO1 - Semaine 22
Guillaume CONNAN
IUT de Nantes - Dpt d'informatique
Dernière mise à jour : 30 mai 2012
(IUT de Nantes - Dpt d'informatique ) 1 / 35
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 2 / 35
Àíäðåé Àíäðååâè÷ ÌÀÐÊÎÂ (1856 - 1922)
(IUT de Nantes - Dpt d'informatique ) 3 / 35
Vision dynamique des probabilités - Automates
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 4 / 35
Vision dynamique des probabilités - Automates Découverte
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 5 / 35
Vision dynamique des probabilités - Automates Découverte
Les boules dans l'urne, deux tirages successifs sans remise...
(IUT de Nantes - Dpt d'informatique ) 6 / 35
Vision dynamique des probabilités - Automates Découverte
i jpij
Le présent contient toutes les données du passé...
(IUT de Nantes - Dpt d'informatique ) 7 / 35
Vision dynamique des probabilités - Automates Découverte
i jpij
Le présent contient toutes les données du passé...
(IUT de Nantes - Dpt d'informatique ) 7 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 8 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
(IUT de Nantes - Dpt d'informatique ) 9 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
(IUT de Nantes - Dpt d'informatique ) 10 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
(IUT de Nantes - Dpt d'informatique ) 11 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
état absorbant
bord
états intérieurs
chaîne absorbante
parcours (promenade) aléatoire
longueur d'un parcours
(IUT de Nantes - Dpt d'informatique ) 12 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Les règles
1 la probabilité de réaliser un parcours donné à partir d'un point donnéest égale au produit de toutes les probabilités de transition le long dece parcours ;
2 La probabilité d'atteindre un sous-ensemble du bord à partir d'un étatdonné est égale à la somme des probabilités de tous les parcours allantde cet élément aux éléments du sous-ensemble ;
3 la durée moyenne des parcours allant d'un état au bord (le temps
moyen d'absorption) est la moyenne des longueurs des parcours de cesommet au bord pondérée par les probabilités de chaque transition. Sion introduit une variable aléatoire égale au temps de parcours, il s'agitdonc de l'espérance de cette v.a.r.
(IUT de Nantes - Dpt d'informatique ) 13 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Les règles
1 la probabilité de réaliser un parcours donné à partir d'un point donnéest égale au produit de toutes les probabilités de transition le long dece parcours ;
2 La probabilité d'atteindre un sous-ensemble du bord à partir d'un étatdonné est égale à la somme des probabilités de tous les parcours allantde cet élément aux éléments du sous-ensemble ;
3 la durée moyenne des parcours allant d'un état au bord (le temps
moyen d'absorption) est la moyenne des longueurs des parcours de cesommet au bord pondérée par les probabilités de chaque transition. Sion introduit une variable aléatoire égale au temps de parcours, il s'agitdonc de l'espérance de cette v.a.r.
(IUT de Nantes - Dpt d'informatique ) 13 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Les règles
1 la probabilité de réaliser un parcours donné à partir d'un point donnéest égale au produit de toutes les probabilités de transition le long dece parcours ;
2 La probabilité d'atteindre un sous-ensemble du bord à partir d'un étatdonné est égale à la somme des probabilités de tous les parcours allantde cet élément aux éléments du sous-ensemble ;
3 la durée moyenne des parcours allant d'un état au bord (le temps
moyen d'absorption) est la moyenne des longueurs des parcours de cesommet au bord pondérée par les probabilités de chaque transition. Sion introduit une variable aléatoire égale au temps de parcours, il s'agitdonc de l'espérance de cette v.a.r.
(IUT de Nantes - Dpt d'informatique ) 13 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
1
0
2
3
4
51/2
1/2
1/2
1/2
1/2
1/2
1/2
1/2
p1 =(1
23+ 1
24
)︸ ︷︷ ︸0 boucle
+(
1
23+4+ 1
24+4
)︸ ︷︷ ︸
1 boucle
+(
1
23+2×4+ 1
24+2×4
)︸ ︷︷ ︸
2 boucles
+(
1
23+3×4+ 1
24+3×4
)︸ ︷︷ ︸
3 boucles
+·· ·
(IUT de Nantes - Dpt d'informatique ) 14 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
1
0
2
3
4
51/2
1/2
1/2
1/2
1/2
1/2
1/2
1/2
p1 =(1
23+ 1
24
)︸ ︷︷ ︸0 boucle
+(
1
23+4+ 1
24+4
)︸ ︷︷ ︸
1 boucle
+(
1
23+2×4+ 1
24+2×4
)︸ ︷︷ ︸
2 boucles
+(
1
23+3×4+ 1
24+3×4
)︸ ︷︷ ︸
3 boucles
+·· ·
(IUT de Nantes - Dpt d'informatique ) 14 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
1
0
2
3
4
51/2
1/2
1/2
1/2
1/2
1/2
1/2
1/2
Faites un calcul similaire pour déterminer la probabilité de perdre : vousconnaissez déjà le résultat donc vous pourrez contrôler vos calculs...
(IUT de Nantes - Dpt d'informatique ) 15 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Temps de parcours
1 1→ 0 précédé de k cycles : X = 4k +1,
P([X = 4k +1])=(124
)k × 12 = 1
24k+1 ;
2 1→ 2→ 0 précédé de k cycles : X = 4k +2,
P([X = 4k +2])=(124
)k × (12
)2 = 124k+2 ;
3 1→ 2→ 4→ 5 précédé de k cycles : X = 4k +3,
P([X = 4k +3])=(124
)k × (12
)3 = 124k+3 ;
4 1→ 2→ 4→ 3→ 5 précédé de k cycles : X = 4k +4,
P([X = 4k +4])=(124
)k × (12
)4 = 124k+4 .
(IUT de Nantes - Dpt d'informatique ) 16 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Temps de parcours
1 1→ 0 précédé de k cycles : X = 4k +1,
P([X = 4k +1])=(124
)k × 12 = 1
24k+1 ;
2 1→ 2→ 0 précédé de k cycles : X = 4k +2,
P([X = 4k +2])=(124
)k × (12
)2 = 124k+2 ;
3 1→ 2→ 4→ 5 précédé de k cycles : X = 4k +3,
P([X = 4k +3])=(124
)k × (12
)3 = 124k+3 ;
4 1→ 2→ 4→ 3→ 5 précédé de k cycles : X = 4k +4,
P([X = 4k +4])=(124
)k × (12
)4 = 124k+4 .
(IUT de Nantes - Dpt d'informatique ) 16 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Temps de parcours
1 1→ 0 précédé de k cycles : X = 4k +1,
P([X = 4k +1])=(124
)k × 12 = 1
24k+1 ;
2 1→ 2→ 0 précédé de k cycles : X = 4k +2,
P([X = 4k +2])=(124
)k × (12
)2 = 124k+2 ;
3 1→ 2→ 4→ 5 précédé de k cycles : X = 4k +3,
P([X = 4k +3])=(124
)k × (12
)3 = 124k+3 ;
4 1→ 2→ 4→ 3→ 5 précédé de k cycles : X = 4k +4,
P([X = 4k +4])=(124
)k × (12
)4 = 124k+4 .
(IUT de Nantes - Dpt d'informatique ) 16 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Temps de parcours
1 1→ 0 précédé de k cycles : X = 4k +1,
P([X = 4k +1])=(124
)k × 12 = 1
24k+1 ;
2 1→ 2→ 0 précédé de k cycles : X = 4k +2,
P([X = 4k +2])=(124
)k × (12
)2 = 124k+2 ;
3 1→ 2→ 4→ 5 précédé de k cycles : X = 4k +3,
P([X = 4k +3])=(124
)k × (12
)3 = 124k+3 ;
4 1→ 2→ 4→ 3→ 5 précédé de k cycles : X = 4k +4,
P([X = 4k +4])=(124
)k × (12
)4 = 124k+4 .
(IUT de Nantes - Dpt d'informatique ) 16 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Rappel
Nous avons prouvé au module précédent que :
∀q ∈R, |q| < 1=⇒ S = ∑nÊ0
qn = 1
1−q
Pour |q| < 1, notons T = ∑nÊ1
nqn−1 en supposant que cette écriture a un
sens.Calculer (1−q)T en fonction de S
(IUT de Nantes - Dpt d'informatique ) 17 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Rappel
Nous avons prouvé au module précédent que :
∀q ∈R, |q| < 1=⇒ S = ∑nÊ0
qn = 1
1−q
Pour |q| < 1, notons T = ∑nÊ1
nqn−1 en supposant que cette écriture a un
sens.Calculer (1−q)T en fonction de S
(IUT de Nantes - Dpt d'informatique ) 17 / 35
Vision dynamique des probabilités - Automates Premier exemple - Règles de parcours
Rappel
Nous avons prouvé au module précédent que :
∀q ∈R, |q| < 1=⇒ S = ∑nÊ0
qn = 1
1−q
Pour |q| < 1, notons T = ∑nÊ1
nqn−1 en supposant que cette écriture a un
sens.Calculer (1−q)T en fonction de S
(IUT de Nantes - Dpt d'informatique ) 17 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 18 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
(IUT de Nantes - Dpt d'informatique ) 19 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Départ
P PP PPP PPPP
F FF FFP FFPP
(IUT de Nantes - Dpt d'informatique ) 20 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
probabilité pi pour un état i d'être � absorbé � dans un sous-ensembleSB du bord ;
pi = 1 ;
pi = 0
pi =∑k∈S
pikpk
pi =∑k∈Ei
pikpk
(IUT de Nantes - Dpt d'informatique ) 21 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
probabilité pi pour un état i d'être � absorbé � dans un sous-ensembleSB du bord ;
pi = 1 ;
pi = 0
pi =∑k∈S
pikpk
pi =∑k∈Ei
pikpk
(IUT de Nantes - Dpt d'informatique ) 21 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
probabilité pi pour un état i d'être � absorbé � dans un sous-ensembleSB du bord ;
pi = 1 ;
pi = 0
pi =∑k∈S
pikpk
pi =∑k∈Ei
pikpk
(IUT de Nantes - Dpt d'informatique ) 21 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
probabilité pi pour un état i d'être � absorbé � dans un sous-ensembleSB du bord ;
pi = 1 ;
pi = 0
pi =∑k∈S
pikpk
pi =∑k∈Ei
pikpk
(IUT de Nantes - Dpt d'informatique ) 21 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
probabilité pi pour un état i d'être � absorbé � dans un sous-ensembleSB du bord ;
pi = 1 ;
pi = 0
pi =∑k∈S
pikpk
pi =∑k∈Ei
pikpk
(IUT de Nantes - Dpt d'informatique ) 21 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
x
0
y 1
(IUT de Nantes - Dpt d'informatique ) 22 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
x
y2 0
y 1+y2 1
(IUT de Nantes - Dpt d'informatique ) 23 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
x
3y4
y2 0
y 1+y2
1+y2 1
(IUT de Nantes - Dpt d'informatique ) 24 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
x
7y8
3y4
y2 0
y 1+y2
1+y2 1
(IUT de Nantes - Dpt d'informatique ) 25 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
34
710
35
25 0
45
910
910 1
(IUT de Nantes - Dpt d'informatique ) 26 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Durée moyenne
La valeur du délai d'absorption est égal à 1 augmenté de la moyennepondérée des délais d'absorption en les états voisins.
mi = 1+ ∑kÊ1
pikmk
(IUT de Nantes - Dpt d'informatique ) 27 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Durée moyenne
La valeur du délai d'absorption est égal à 1 augmenté de la moyennepondérée des délais d'absorption en les états voisins.
mi = 1+ ∑kÊ1
pikmk
(IUT de Nantes - Dpt d'informatique ) 27 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Xi =∑kÊ1
1ik(1+Yk)
(IUT de Nantes - Dpt d'informatique ) 28 / 35
Vision dynamique des probabilités - Automates Deuxième exemple - Valeur moyenne
Départ
P PP PPP PPPP
F FF FFP FFPP
(IUT de Nantes - Dpt d'informatique ) 29 / 35
Comportement asymptotique des chaînes de Markov
Sommaire
1 Vision dynamique des probabilités -
Automates
Découverte
Premier exemple - Règles de parcours
Deuxième exemple - Valeur moyenne
2 Comportement asymptotique des chaînes de
Markov
(IUT de Nantes - Dpt d'informatique ) 30 / 35
Comportement asymptotique des chaînes de Markov
(IUT de Nantes - Dpt d'informatique ) 31 / 35
Comportement asymptotique des chaînes de Markov
(IUT de Nantes - Dpt d'informatique ) 32 / 35
Comportement asymptotique des chaînes de Markov
V1
V3V2
0,2
0,1
0,8
0,3
0,1
0,2
0,6
0,5
0,2
(IUT de Nantes - Dpt d'informatique ) 33 / 35
Comportement asymptotique des chaînes de Markov
matrice de transition
(IUT de Nantes - Dpt d'informatique ) 34 / 35
Comportement asymptotique des chaînes de Markov
On notera x(k)i
la proportion de tra�quants qui se trouvent au matin dujour k dans la ville Vi .
Dé�nition 1 (Vecteur d'état)
On appelle vecteur d'état tout élément (x1, ...,xn) de Rn tel quex1+·· ·+xn = 1.
Ainsi, x (k) =(x(k)1 ,x
(k)2 ,x
(k)3
)est un vecteur d'état (pourquoi ?).
Démontrez que :∀k ∈ �1,n�, x (k) = x (k−1) ·P
puis que :
∀k ∈ �1,n�, x (k) = x (0) ·Pk
(IUT de Nantes - Dpt d'informatique ) 35 / 35
Comportement asymptotique des chaînes de Markov
On notera x(k)i
la proportion de tra�quants qui se trouvent au matin dujour k dans la ville Vi .
Dé�nition 1 (Vecteur d'état)
On appelle vecteur d'état tout élément (x1, ...,xn) de Rn tel quex1+·· ·+xn = 1.
Ainsi, x (k) =(x(k)1 ,x
(k)2 ,x
(k)3
)est un vecteur d'état (pourquoi ?).
Démontrez que :∀k ∈ �1,n�, x (k) = x (k−1) ·P
puis que :
∀k ∈ �1,n�, x (k) = x (0) ·Pk
(IUT de Nantes - Dpt d'informatique ) 35 / 35
Comportement asymptotique des chaînes de Markov
On notera x(k)i
la proportion de tra�quants qui se trouvent au matin dujour k dans la ville Vi .
Dé�nition 1 (Vecteur d'état)
On appelle vecteur d'état tout élément (x1, ...,xn) de Rn tel quex1+·· ·+xn = 1.
Ainsi, x (k) =(x(k)1 ,x
(k)2 ,x
(k)3
)est un vecteur d'état (pourquoi ?).
Démontrez que :∀k ∈ �1,n�, x (k) = x (k−1) ·P
puis que :
∀k ∈ �1,n�, x (k) = x (0) ·Pk
(IUT de Nantes - Dpt d'informatique ) 35 / 35
Comportement asymptotique des chaînes de Markov
Supposons que le chef de la ma�a locale dispose de 1000 tra�quants quipartent tous le matin du jour 0 de la ville de Zlot. Quelle sera la proportionde tra�quants dans chacune des villes au bout d'une semaine ? d'un an ?Il s'agit donc de calculer des puissances successives de P.On obtient les proportions au bout d'une semaine en calculant x (0) ·p7 avecx (0) = (1000,0,0).Nous allons utiliser SCILAB pour les longs calculs.
(IUT de Nantes - Dpt d'informatique ) 36 / 35
Comportement asymptotique des chaînes de Markov
Supposons que le chef de la ma�a locale dispose de 1000 tra�quants quipartent tous le matin du jour 0 de la ville de Zlot. Quelle sera la proportionde tra�quants dans chacune des villes au bout d'une semaine ? d'un an ?Il s'agit donc de calculer des puissances successives de P.On obtient les proportions au bout d'une semaine en calculant x (0) ·p7 avecx (0) = (1000,0,0).Nous allons utiliser SCILAB pour les longs calculs.
(IUT de Nantes - Dpt d'informatique ) 36 / 35
Comportement asymptotique des chaînes de Markov
Dé�nition 2 (Matrice de transition régulière)
Une matrice de transition A est dite régulière si, et seulement si, il existe unentier naturel r tel que Ar a ses coe�cients tous strictement positifs.
(IUT de Nantes - Dpt d'informatique ) 37 / 35
Comportement asymptotique des chaînes de Markov
Théorème 3 (Théorème des chaînes de Markov régulières)
Soit A une matrice régulière. Il existe une matrice stochastique :
A∞ =
a1 a2 · · · an
a1 a2 · · · an...
......
...
a1 a2 · · · an
telles que lim
n→+∞An =A∞.
De plus, v = (a1,a2, · · · ,an) est l'unique vecteur d'état stationnaire (tel que
v ·A= v).
(IUT de Nantes - Dpt d'informatique ) 38 / 35