Page 1

Chaînes de Markov Arthur Charpentier École Nationale de la Statistique et d’Analyse de l’Information - notes de cours à usage exclusif des étudiants de l’ENSAI - ne pas diffuser, ne pas citer -

1

Quelques motivations

1.1

La sentinelle de la tour carrée

Lors d’une ronde, une méthode simple pour “tromper l’ennemi” est d’avancer ou reculer de manière aléatoire, en tirant à pile ou face. Comme précédement, si Xn désigne la position du garde à l’instant n, l’évolution peut se modéliser à l’aide d’une matrice de transition, /N/ /E/ /S/ /O/ 0 1/2 0 1/2 N  P = E  1/2 0 1/2 0   S  0 1/2 0 1/2  1/2 0 1/2 0 O

1.2

Le système bonus-malus en assurance auto

A Hong Kong, il existe 6 classes de tarification, de 1 (fort bonus) à 6 fort malus • si un assuré n’a pas eu de sinistre, il passe de i à max{1, i − 1}, • si l’assuré a eu au moins un sinistre, il passe de i à 6. Si p est la probabilité de ne pas avoir  p 0  p 0   0 p P =  0 0   0 0 0 0

de sinistre, 0 0 0 p 0 0

0 0 0 0 p 0

1−p 1−p 1−p 1−p 1−p 1−p

       

0.2

0.2 0.0

0.4

0.6

0.8

1.0

Proportion par classe en fonction de n, p=80%

0.0

0.4

0.6

0.8

1.0

Proportion par classe en fonction de n, p=90%

0 0 0 0 0 p


• si un assuré n’a pas eu de sinistre, il passe de i à max{1, i − 1}, • si l’assuré a eu k sinistres, il passe de i à min{6, i + k}. Si le nombre de sinistres suit une pk = p0 + ... + pk ,  p0  p0   0 P =  0   0 0

loi de Poisson pk = P(N = k) = e−λ λk /k!, k ∈ N, et p1 p2 0 p1 p0 0 0 p0 0 0 0 0

p3 p2 p1 0 p0 0

1.3

1 − p4 1 − p3 1 − p2 1 − p1 1 − p0 1 − p0

       

0.2

0.4

0.6

0.8

1.0

Proportion par classe en fonction de n, 35%

0.0

0.0

0.2

0.4

0.6

0.8

1.0

Proportion par classe en fonction de n, 10%

p4 p3 p2 p1 0 p0

La ruine d’un joueur

Deux joueurs jouent à pile ou face, chaque fois que X gagne, il touche 1 de Y , et réciproquement. Ils partent respectivement d’un capital X0 et Y0 , et le jeu s’arrête lorsqu’un joueur n’a plus d’argent pour payer. La fortune d’un joueur prend les valeurs {0, 1, 2, ...., X0 + Y0 }. Si le joueur X possède une fortune Xn = k à la date n, à la date n + 1 • sa fortune devient k − 1 avec probabilité p etk + 1 avec probabilité 1 − p si 0 < k < X0 + Y 0 , • sa fortune reste en 0 avec probabilité 1 si k = 0, • sa fortune reste en X0 + Y0 avec probabilité 1 si k = X0 + Y0 .

1.4

Le modèle stepping stone

On considère un tableau n × n, où chaque cellule a une couleur choisie parmi k. A chaque date, on choisit une cellule au hasard, qui prend la couleur d’un de ses voisins immédiat, au hasard. Les figures suivantes montrent l’évolution de ce système pour k = 2 couleurs, et n = 40, puis k = 8 couleurs, et n = 80. On peut montrer qu’il s’agit d’une chaîne de Markov absorbante au sens où des régions absorbantes vont se former, Ce type de modèle apparaît naturellement en génétique1 . 1

Une animation de cet algorithme est téléchargeable sur http://www.crest.fr/pageperso/charpent/MC-ST-0001.avi


0

10

20

30

40

Le moldèle Stepping stone, Etape 0

0

10

20

30

40

Figure 1: Le modèle stepping stone, k = 2 et n = 40.

0

10

20

30

40

Le moldèle Stepping stone, Etape 10 000

0

10

20

30

40

Figure 2: Le modèle stepping stone, k = 2 et n = 40.

0

10

20

30

40

Le moldèle Stepping stone, Etape 1 000 000

0

10

20

30

40

Figure 3: Le modèle stepping stone, k = 2 et n = 40.


0

20

40

60

80

Le moldèle Stepping stone, Etape 0

0

20

40

60

80

Figure 4: Le modèle stepping stone, k = 8 et n = 80.

0

20

40

60

80

Le moldèle Stepping stone, Etape 1 000 000

0

20

40

60

80

Figure 5: Le modèle stepping stone, k = 8 et n = 80.


1.5

Une application économique

La plupart des entreprises qui émettent des obligations sont notées par des agences de notations (Moody’s ou Standard & Poors). Les notes sont de la forme AAA, AA, A, BBB, BB, B, CCC, du plus sûr au plus risqué. De matrice de transition sur un an existent: AAA AA A BBB BB B CCC défaut AAA 90, 81% 8, 33% 0, 68% 0, 06% 0, 12% 0, 00% 0, 00% 0, 00% AA 0, 70% 90, 65% 7, 79% 0, 64% 0, 06% 0, 14% 0, 02% 0, 00% A 0, 09% 2, 27% 91, 05% 5, 52% 0, 74% 0, 26% 0, 01% 0, 06% BBB 0, 02% 0, 33% 5, 95% 86, 93% 5, 30% 1, 17% 0, 12% 0, 18% BB 0, 02% 0, 14% 0, 67% 7, 73% 80, 53% 8, 84% 1, 00% 1, 06% B 0, 00% 0, 11% 0, 24% 0, 43% 6, 48% 83, 46% 4, 08% 5, 20% CCC 0, 22% 0, 00% 0, 22% 1, 30% 2, 38% 5, 00% 64, 85% 19, 79% défaut 0, 00% 0, 00% 0, 00% 0, 00% 0, 00% 0, 00% 0, 00% 100%

1.6

Applications lexicographiques

Cette application a été proposée dans la modélisation initiale d’Andrei Andreevich Markov, en 1913. On considère une suite de 20 000 caractères pris dans Eugène Onegin d’Alexandre Pouchkine, et on distingue entre les voyelles, et les consonnes.

Heedless of the proud world’s enjoyment, I prize the attention of my friends, and only wish that my employment could have been turned to worthier ends ... En russe, il avait obtenue la matrice de transition suivante, ' ( 12, 8% 87, 2% P = , 66, 3% 33, 7%

i.e. la probabilité qu’une voyelle soit suivie d’une consonne est de 87, 2%. La loi limite associé cette matrice est π = (43, 2% 56, 8%), ce qui correspond aux fréquences des voyelles et des consonnes respectivement. Notons qu’en français les fréquences sont π = (45, 6% 54, 4%), pour l’italien π = (47, 4% 52, 6%), et pour l’allemand π = (38, 5% 61, 5%).

1.7

Diffusion d’un gaz et urne

Les chaînes de Markov avaient été introduites avant les travaux de Markov: En 1889, Galton a introduit des chaînes de Markov pour étudier le problème de la disparition de noms de famille. En 1907, Ehrenfest a introduit des chaînes de Markov pour étudier la diffusion d’un gaz.

1.8

Chaînes de Markov et jeux de cartes

En 1912, Poincarré a introduit des chaînes de Markov pour étudier le problème du battage de cartes. Ce problème a été étudié par la suite par Borel & Cheron (1940), Doob (1954) ou Thorpe (1972). Le nombre de méthodes pour battre les cartes est presque infini, 1 On coupe en deux, et on intervertit les deux tas (figure 1.8), 2 On prend une carte au hasard, on la met au dessus du tas, et on recommence (figure ??). Toutes ces méthodes conduisent plus ou moins vite (parfois jamais) à une répartition uniformément aléatoire des cartes.


Urne d’Ehrenfest, étape 0

Urne d’Ehrenfest, étape 1

Urne d’Ehrenfest, étape 2

Urne d’Ehrenfest, étape 10 000

Figure 6: L’urne d’Ehrenfest.

Urne d’Ehrenfest, étape 0

Urne d’Ehrenfest, étape 1

Urne d’Ehrenfest, étape 2

Urne d’Ehrenfest, étape 10 000

Figure 7: L’urne d’Ehrenfest.

1 2 3 4 5 6 7 8 9 VDR 9 VDR 1 2 3 4 5 6 7 8 R 1 2 3 4 5 6 7 8 9 VD VDR 1 2 3 4 5 6 7 8 9

Figure 8: Le battage de cartes.


1 2 3 4 5 6 7 8 9 VDR

4 9 3 5 1 2 6 7 8 VDR

5 1 2 3 4 6 7 8 9 VDR

9 4 3 5 1 2 6 7 8 VDR

3 5 1 2 4 6 7 8 9 VDR

2 9 4 3 5 1 6 7 8 VDR

9 3 5 1 2 4 6 7 8 VDR

4 2 9 3 5 1 6 7 8 VDR

Figure 9: Le battage de cartes.

1.9

Chaînes de Markov et ADN

L’ADN est une succession de nucléotique, l’adémine, la cytosine, la guanine et la thymine. Par exemple gactgaactctgag... Rappelons qu’il y a en réalité deux brins complémentaires, le a s’associant toujours au t, et le c avec le g. On note cg le dinucléotide c suivi de g. Ces dinucléotide ont naturellement tendance à disparaître (par méthylation c mute facitement en t). Les séquences cg est alors plus rare que ce que l’on pourrait espérer. Dans certaines régions toutefois, appelée ilôts, on trouve beaucoup de cg. Soit X1 le premier nucléotide d’une séquence d’ADN, de loi de probabilité λ = (λa , λc , λg , λt ), où λa = P(X1 = a), λc = P(X1 = c), λg = P(X1 = g) et λt = P(X1 = t), avec λa + λc + λg + λt = 1 et λa , λc , λg , λt ≥ 0. Il peut paraître légitime de penser que la suite des nucléotides (Xn )n∈N n’est pas indépendante. Un modèle Markovien devrait pouvoir faire l’affaire. Dans la région d’ilôts cg, la matrice de transition (observée empiriquement)     a 18, 0% 27, 4% 42, 6% 12, 0%  c   17, 1% 36, 8% 27, 4% 18, 8%     pour le vecteur X =   g  est P =  16, 1% 33, 9% 37, 5% 12, 5%  t 7, 9% 35, 5% 38, 4% 18, 6%

et dans la region où région l’on n’est pas  30, 0%  32, 2% P =  24, 8% 17, 7%

1.10

en présence d’ilôts cg,

 20, 5% 28, 5% 21, 0% 29, 8% 7, 8% 30, 2%   24, 6% 29, 8% 20, 8%  23, 9% 29, 2% 29, 2%

Application au jeu de Monopoly

Le jeu de Monopoly peut être vu comme une marche aléatoire sur 40 cases, avec pour chaque case, des répercussions sur le déplacement (aller en prison) et/ou la fortune (payer car un adversaire a construit un hotel, ou recevoir 20 000 francs). La position d’un joueur est une chaîne de Markov à 40 états (dont un de probabilité nulle “allez en prison”). Il est ainsi possible de montrer que l’avenue Henri Martin est la plus fréquentée (3,2%) alors que la rue Lecourbe et l’avenue des Champs Elysées sont les moins fréquentée (2,1%), et que la zone orange l’emporte sur la zone rouge.


0.8 0.6 0.4 0.2 0.0

Probabilité de gagner un jeu

1.0

Probabilité de gagner un jeu au tennis

0.0

0.2

0.4

0.6

0.8

1.0

Probabilité de gagner une balle

Figure 10: Probabilité de gagner un jeu au tennis.

1.11

Modélisation d’une partie de tennis

Le jeu de tennis. Considérons l’évolution du score au cours d’un jeu de tennis. Un joueur gagne le jeu s’il atteint 50.

1.12

(0,50)

(15,50)

(30,50)

(0,40)

(15,40)

(30,40)

(0,30)

(15,30)

(30,30)

(40,30)

(50,30)

(0,15)

(15,15)

(30,15)

(40,15)

(50,15)

(0,0)

(15,0)

(30,0)

(40,0)

(50,0)

Les processus de file d’attente

On considère une file d’attente. A chaque date n arrive un nouveau client avec probabilité p et pas de client avec probabilité 1 − p. Un client dans la file qui se fait servir quitte la file avec probabilité q, ou attend encore avec probabilité 1 − q. On note Xn le nombre de clients présents dans la file à la date n. (Xn )n∈N est une chaîne de Markov. A l’aide de cette modélisation (et en généralisant), on peut regarder s’il est optimal - lorsqu’il y a plusieurs guichets - de créer une file unique, ou que les clients choisissent leur file en arrivant (en choisissant a priori la file la moins longue).

1.13

Considération plus générales, introduction aux processus

Un processus (Xt )t∈T est une collection de variables aléatoires à valeurs dans X . Pour tout ω ∈ Ω, la suite (Xt (ω)) sera appelée une trajectoire. Parmi les processus usuels, on distinguera • le cas où T est discret (N ou Z), et X est dénombrable: chaîne de Markov, • le cas où T est discret (N ou Z), et X = R: séries temporelles, • le cas où T est continu (R ou R+ ), et le cas où X est dénombrable: processus de Poisson,


Modèle de file d’attente p>q

25 20 15

0

5

10

Nombre d’usagers dans la file

8 6 4 2

Nombre d’uagers dans la queue

30

10

File d’attente p>q

0

5

10

15

20

0

20

40

Date

60

80

100

Dates

Figure 11: Evolution de la file d’attente, p > q.

Modèle de file d’attente p>q 16 14 12 10 8 2

0

4

6

Nombre d’usagers dans la file

8 6 4 2

Nombre d’uagers dans la queue

10

File d’attente p>q

0

5

10

15

20

0

20

40

Date

60

80

100

Dates

Figure 12: Evolution de la file d’attente, p > q.

Modèle de file d’attente p=q 4 3 2 0

1

Nombre d’usagers dans la file

8 6 4 2 0

Nombre d’uagers dans la queue

10

File d’attente p=q

0

5

10 Date

15

20

0

20

40

60 Dates

Figure 13: Evolution de la file d’attente, p = q.

80

100


Modèle de file d’attente p<q

2.5 2.0 1.5 1.0

Nombre d’usagers dans la file

0.0

0.5

8 6 4 2 0

Nombre d’uagers dans la queue

10

3.0

File d’attente p<q

0

5

10

15

20

0

20

40

Date

60

80

Dates

Figure 14: Evolution de la file d’attente, p < q. • le cas où T est continu et X = R : processus stochastiques. Trajectoire d’une chaîne de Markov

Trajectoire d’une chaîne de Markov

Trajectoire d’une chaîne de Markov

Trajectoire d’une chaîne de Markov

100


2 0 !2 !4

!4

!2

0

2

4

Trajectoire d’une série temporelle

4

Trajectoire d’une série temporelle

2

4

6

8

10

2

8

10

8 6 0

2

4

6 4 2 0

0

2

4

6

8

10

0

2

4

6

8

10

2 0 !2 !4

!4

!2

0

2

4

Trajectoire d’un processus stochastique

4

Trajectoire d’un processus stochastique

0

2

6

Trajectoire d’un processus de comptage

8

Trajectoire d’un processus de comptage

4

2

4

6

8

10

0

2

4

6

8

10

Quelques petits rappels de probabilité

L’étude des chaînes de Markov va reposer sur l’étude de la loi de Xn+1 sachant Xn = xn .

2.1

La loi conditionnelle

P(A ∩ B) . P(B) P(Xn = xn , Xn+1 = xn+1 ) . Aussi, P(Xn+1 = xn+1 |Xn = xn ) = P(Xn = xn ) La formule des probabilités totales : si (Bk )k∈K forme une partition de E, alors ) ) P(A ∩ Bk ) = P(A|Bk ) × P(Bk ). P(A) =

Rappelons la formule de Bayes : P(A|B) =


Aussi, P(Xn+1 = xn+1 ) ==

)

xn ∈E

2.2

P(Xn+1 = xn+1 |Xn = xn ) × P(Xn = xn ).

Un tout petit mot sur l’indépendance

Xn et Xn+1 sont indépendantes si et seulement si P(Xn+1 = xn+1 |Xn = xn ) ne dépend pas de xn . Dans ce cas {X0 , X1 , ..., Xn , Xn+1 } est un échantillon indépendant. Si les Xi sont de même loi, et si les variables sont de variance finie, rappelons que l’on a une loi (faible) des grands nombres (théorème de Khintchine), qui garantie que * ( '* * * X1 + ... + Xn * * lim P * − E(X)* > ε = 0, n→∞ n

X1 + ... + Xn P → E(X). n La loi (forte) des grands nombres garantie une convergence presque sûr dès lors que les variables sont d’espérance finie, ( ' X1 + ... + Xn (ω) = E(X) = 1. P lim n→∞ n qui se montre à l’aide de l’inégalité de Tchebychev, et donc

3

Quelques définitions

Soit E un espace dénombrable, appelé espace d’états. Les i ∈ E sont appelés états. E sera isomorphe à {1, . . . , k}, ou à N. Exemple 1. Dans le cas de la sentinelle sur la tour carrée, {N, S, E, O} sera isomorphe à {1, 2, 3, 4}. Une mesure sur E est un vecteur λ = (λi , i ∈ E) tel que 0 ≤ λi < ∞. On parlera de distribution de probabilité si λ% 1 = 1. On se donne un espace de probabilité (Ω, F, P). Une variable aléatoire X à valeurs dans E est une fonction X : Ω → E. On pose alors λi = P(X = i) = P({ω|X(ω) = i}), et λ = (λi )i∈E . Définition 2. On considère une suite de variables aléatoires à valeurs dans E, (Xn )n∈N . Cette suite est une chaîne de Markov si pour tout n ≥ 1, et pour tout i0 , i1 , . . . , in−1 , in , in+1 telle que P(X0 = i0 , . . . , Xn = in ) > 0, on ait P(Xn+1 = in+1 |Xn = in , Xn−1 = in−1 , . . . , X0 = i0 ) = P(Xn+1 = in+1 |Xn = in ).

(1)

On parlera d’absence de mémoire. Remarque 3. On parlera aussi de processus Markovien à l’ordre 1. Plus généralement, on peut définir un processus Markovien à l’ordre k si P(Xn+1 = in+1 |Xn = in , Xn−1 = in−1 , . . . , X0 = i0 )

= P(Xn+1 = in+1 |Xn = in , . . . , Xn−k+1 = in−k+1 ).

(2) (3)

En posant X n = (Xn , . . . , Xn−k+1 ), à valeurs dans E k , notons que l’équation précédante s’écrit P(X n+1 = in+1 |X n = in , X n−1 = in−1 , . . . , X k−1 = ik−1 ) = P(X n+1 = in+1 |X n = in ). On retrouve un processus Markovien à l’ordre 1, sur X n = (Xn , . . . , Xn−k+1 ). Définition 4. Une chaîne de Markov (Xn )n∈N est dite homogène (dans le temps) si P(Xn+1 = in+1 |Xn = in ) ne dépend pas de n.


La dynamique du processus est alors entièrement caractérisée par les pi,j = P(Xn+1 = j|Xn = i), appelées probabilité de transition de l’état i à l’état j si la chaîne est homogène, ou plus (n) généralement pi,j = P(Xn+1 = j|Xn = i). Définition 5. Une matrice P = (pi,j , i, j ∈ I) est une matrice stochastique, ou matrice de transition, si chaque ligne pi = (pi,j , j ∈ I) est une distribution de probabilité. Pour tout i, j ∈ E pi,j peut alors s’interpréter comme la probabilité d’aller à l’état j sachant qu’on se trouve à l’état i à l’instant d’avant. Remarque 6. A toute matrice de transition, on peut associer un graphe orienté. Les sommets sont les états de la chaîne, et l’orientation est donnée par la probabilité pi,j > 0. ' ( 1−α α Exemple 7. La matrice P = est une matrice stochastique. β 1−β 1-β

1-α 1

α

2 β Les chaînes de Markov peuvent être interprétées comme des marches aléatoires (à probabilité non uniformes) sur un graphe.   1/2 1/2 0 Exemple 8. La matrice P =  2/3 0 1/3  est une matrice stochastique. 0 2/3 1/3 1/2 1 1/3

2/3 1/2 1/3 2

3 2/3   1/2 1/2 0 Exemple 9. La matrice P =  2/3 0 1/3  est une matrice stochastique. 0 0 1 1/2 1 1

2/3 1/2 2 

1/3

3

 1/5 1/5 3/5 Exemple 10. La matrice P =  0 1/2 1/2  est une matrice stochastique. 1 0 0


1

1/5

1 3/5 3

1/2

2

1/2

Définition 11. Une suite de variable aléatoire (Xn )n∈N est une chaîne de Markov de distribution initiale λ et de matrice de transition P = [pi,j ] si • X0 a pour distribution initiale λ, i.e. P(X0 = i) = λi , • le probabilité que Xn+1 = j sachant que Xn = i est pi,j , i.e. P(Xn+1 = j|Xn = i) = pi,j . Théorème 12. (Propriété de Markov) Si (Xn )n∈N est une chaîne de Markov de distribution initiale λ et de matrice de transition P , alors conditionnellement à Xn0 = i, (Xn0 +n )n∈N est une chaîne de Markov, de distribution initiale δi et de matrice de transition P , indépendante des variables aléatoires {X0 , ..., Xn0 }. Proposition ) 13. si P est une matrice stochastique et λ une distribution de probabilité, λi pi,j est une mesure de probabilité. (λP )j = i

Proposition 14. Une suite récurrente aléatoire Xn+1 = f (Xn , Un+1 ) avec (Un ) suite de v.a. i.i.d. à valeurs dans F et indépendantes de X0 , f : E × F → E mesurable est une chaîne de Markov homogène à valeurs dans E. En effet

P(Xn+1 = xn+1 |X0 = x0 , . . . , Xn = xn ) = P(f (xn , U1 ) = xn+1 ).

Proposition 15. Réciproquement, si (Xn ) est une chaîne de Markov homogène à valeurs dans E, de matrice de transition P , alors il existe une suite de variables aléatoires i.i.d. (Un ) à valeurs dans F et indépendantes de X0 telle que Xn+1 = f (Xn , Un+1 ) où. Il suffit de prendre f (x, y) = inf{u : P(x, ] − ∞, u]) > y}. + x + u si u = 1 Exemple 16. E = N, F = {0, 1} et f (x, u) = . 0 si u = 0 (n)

On notera P (n) = (pi,j ) la matrice de probabilité, en partant de l’état i en l’instant 0, d’arriver à l’état j à l’instant n, (n)

pi,j = P(Xn = j|X0 = i), pour tout i, j ∈ E. Proposition 17. (Propriété de Markov) Si (Xn )n∈N est une chaîne de Markov de distribution initiale λ et de matrice de transition P , pour tout n, k ∈ N, • P(Xn = i) = (λP (n) )i (k)

• P(Xn+k = j|Xn = i) = pi,j

Théorème 18. (Equation de Chapman-Kolmogorov (1)) Pour tout n ∈ N, P (n) = P n . Théorème 19. (Equation de Chapman-Kolmogorov (2)) Si (Xn )n∈N est une chaîne de Markov de distribution initiale λ et de matrice de transition P , pour tout n, k ∈ N, pour tout h = 1, ..., k − 1, ) P(Xn+k = j|Xn+h = u) × P(Xn+h = u|Xn = i), P(Xn+k = j|Xn = i) = u∈E


En effet, P k = P h × P k−h pour tout h = 1, ..., k − 1. (k)

Corollaire 20. (Equation de Chapman-Kolmogorov (3)) Si pi,j = P(Xn+k = j|Xn = i), alors ) (h) (k) (k−n) pi,u × pu,j . pi,j = u∈E

Equation de Chapman!Kolmogorov

Equation de Chapman!Kolmogorov

Exemple 21. Revenons à l’exemple où P = P = 2

'

'

(

1−α α β 1−β

. Alors

1 − [(1 − α)2 + αβ] (1 − α)2 + αβ 1 − [(1 − β)2 + αβ] (1 − β)2 + αβ

(

Plus générallement, notons que de P n+1 = P n × P , on en déduit que (n)

(n+1)

pn+1 (11) = (1 − α)p11 + βp12

(n)

(n+1)

= (1 − α)p11 + β[1 − p11

(n)

] = (1 − α − β)p11 + β.

(0)

Cette suite définie par récurence, avec comme valeur initiale p11 = 1 admet pour unique solution (n)

p11 =

β β + [1 − α − β]n , α+β α+β

dès lors que α + β > 0. Aussi, entre les dates t et t + 1, les probabilités de transitions sont 1-β 1-α 1

α

2

β entre les dates t et t + 2, les probabilités de transitions sont (1 − α)2 + αβ (1 − β)2 + αβ 1 − [(1 − α)2 + αβ]

1

1 − [(1 − β)2 + αβ] (2)

(2)

Les probabilités de transition p1,1 et p1,2 s’interprètent ainsi

2


1-α

1-α α

1

2

α

1

2

α

β (2) (2) et les probabilités de transition p2,1 et p2,2

1-β 1-β

1-α α

1

4

1-β

2

α

α

1

2

β

Classification des états

L’irréductibilité va nous assurer que tout point de l’espace E peut être atteint par la chaîne de Markov, mais aucune information n’est apportée quant au nombre de passage par cet état. On introduira la notion de récurrence afin de formaliser cette idée. Définition 22. Étant donnée une chaîne de Markov (Xn )n∈N de distribution initiale λ et de matrice de transition P , on dira que j est atteignable depuis j si P(Xn+k = j|Xn = i) > 0 pour un k ∈ N On notera i → j . On dira que les états i et j communiquent , noté i ↔ j si i → j et j → i. (n)

Proposition 23. i → j si et seulement si il existe n ∈ N tel que pi,j > 0. Proposition 24. Si i → j et i → k, alors i → k. Proposition 25. La relation ↔ est une classe d’équivalence. À partir de cette propriété on peut partitionner E en ensembles de valeurs qui communiquent. Définition 26. Une classe C est dite fermée si i ∈ C et i → j implique j ∈ C. Définition 27. Si la chaîne de Markov ne possède qu’une unique classe, c’est à dire que tous ses éléments communiquent, la chaîne sera dite irréductible. On ne peut pas sortir d’une classe fermée. Définition 28. Un état i est dite absorbant si {i} est une classe fermée. Exemple 29. Considérons la chaîne de Markov suivante 1/2

1/4 1/2

1

1/2

2/3 1/4

2

1/3

3 (n)

Cette chaîne est irréductible car tous les états communiquent. Bien que p1,3 = 0, p1,3 > 0 pour n ≥ 2.

4.1

Pour résumer...

• Il existe trois type d’état: transients (on n’y revient pas toujours), récurrents nuls (on y revient toujours, au bout d’un temps moyen infini), ou récurents positifs (on y revient une infinité de fois, à intervalle de temps finis, en moyenne),


5

Temps d’atteinte d’une classe

Définition 30. Étant donnée une chaîne de Markov (Xn )n∈N de distribution initiale λ et de matrice de transition P , si A est un sous-ensemble de I, la variable aléatoire τA définie par τA (ω) = inf{n ≥ 0, Xn (ω) ∈ A} est appelée temps d’atteinte de A. Notons que la probabilité d’atteindre un état A dépuis i est pA|i = P(τA < ∞|X0 = i). Définition 31. Si A est une classe fermée de E, pA|i est appelée probabilité d’absorption. Dans ce cas, notons que le temps moyen d’atteinte de la classe A, à partir de i est ) nP(τA = n)+∞P(τA = ∞). eA|i = E(τA |X0 = i) = n<∞

On écrira ainsi pA|i = P(atteindre A|X0 = i) et eA|i = E(temps d’atteinte de A|X0 = i). Exemple 32. On considère la chaîne suivante 1/2 1

1

1/2

1/2 2

3

1

4

1/2 On part de X0 = 2, et on cherche à calculer la probabilité d’atteindre l’état 4 ? On note p4|i la probabilité d’atteindre 4 depuis l’état i. Notons que p4|1 = 0 et p4|4 = 1. 1 1 1 1 De plus p4|2 = p4|3 + p4|1 et p4|3 = p4|2 + p4|4 . Aussi, 2 2 2 2 ' ( 1 1 1 1 p + . p4|2 = p4|3 = 2 2 2 4|2 2 Aussi à partir de X0 = 2, la probabilité d’atteindre 4 est 1/3. Toujours à partir de X0 = 2, et on cherche à calculer le temps moyen pour atteindre un état absorbant ? On note e{1,4}|i le temps moyen d’atteindre 1 ou 4 depuis l’état i. Notons que e{1,4}|1 = e{1,4}|4 = 0. 1 1 1 1 De plus e{1,4}|2 = 1 + e{1,4}|1 + e{1,4}|3 et e{1,4}|3 = 1 + e{1,4}|2 + e{1,4}|4 . Aussi, 2 2 2 2 ' ( 1 1 1 1 + e{1,4}|2 . e{1,4}|2 = 1 + e{1,4}|3 = 1 + 2 2 2 Aussi à partir de X0 = 2, le temps moyen pour atteindre un état absorbant est 2. Notons que pour le vecteur de probabilité d’atteindre {4}, on a le système suivant  p4|1 = 0,    p4|2 = [p4|1 + p4|3 ]/2, , = [p4|2 + p4|4 ]/2, p    4|3 p4|4 = 1. et pour le vecteur de temps moyen d’atteinte des états absorbants  e{1,4}|1 = 0,    e{1,4}|2 = 1 + [e{1,4}|1 + p{1,4}|3 ]/2, , e  {1,4}|3 = 1 + [p{1,4}|2 + p{1,4}|4 ]/2,   e{1,4}|4 = 0.


De manière plus générale, on a le résultat suivant Proposition 33. Le vecteur des probabilités pA = (pA|i )i∈I est la solution minimale positive du système 0 si i ∈ A pA|i = 1 1 pA|i = j∈I pi,j × pA|j si i ∈ /A Proposition 34. Le vecteur des temps moyen d’atteinte de la classe A eA = (eA|i )i∈I est la solution minimale positive du système 0 si i ∈ A eA|i = 0 1 eA|i = 1 + j ∈A p × e si i∈ /A i,j A|j / Définition 35. Une variable aléatoire T à valeurs dans {0, 1, 2, ...} ∪ {∞} est un temps d’arrêt pour une chaîne de Markov (Xn )n∈N si l’évènement {T = n} depend seulement de X0 , X1 , X2 , .... Exemple 36. Le temps d’atteinte d’une classe A est un temps d’arrêt, avec {T = n} = {X0 ∈ / A, X1 ∈ / A, X2 ∈ / A, ..., Xn−1 ∈ / A, Xn ∈ A}. Exemple 37. Le dernier temps de sortie d’une classe A, τ = sup{n ≥ 0, Xn ∈ A} n’est pas un temps d’arrêt. Théorème 38. (Propriété de Markov forte) Si (Xn )n∈N est une chaîne de Markov de distribution initiale λ et de matrice de transition P , et T un temps d’arrêt pour (Xn )n∈N , alors conditionnellement à {T < ∞} et XT = i, (XT +n )n∈N est une chaîne de Markov de distribution initiale δi et de matrice de transition P . De plus, cette chaîne est indépendante de X0 , X1 , ..., XT .

6

Récurrence et transcience

Soit (Xn )n∈N une chaîne de Markov sur un ensemble dénombrable E de matrice de transition P . On note (Xnx )n∈N la chaîne partant de X0 = x. Pour x ∈ E, on introduit Txn la suite des instants sucessifs de retour en x définie par récurrence pour n ≥ 1 Tx1 = Tx = inf{k > 0 : Xkx = x} Txn+1 = inf{k > Txn : Xkx = x}. Avec la convention inf{∅} = ∞. Définition 39. Soit Xnx une chaîne de Markov partant de x ∈ E. L’état x est dit 1. transient pour P si P(Tx < ∞) < 1, 2. récurrent pour P si P(Tx < ∞) = 1. Les états récurrents peuvent être de deux types : - les états récurrents nuls si E(Tx ) = ∞, - les états récurrents positifs si E(Tx ) < ∞. Une autre caractérisation de ces notions est la suivante, Proposition 40. Soit Xnx une chaîne de Markov partant de x ∈ E. L’état x est dit 1. transient pour P si P(Xn = x pour une infinité de valeurs de n|X0 = x) = 1, 2. récurrent pour P si P(Xn = x pour une infinité de valeurs de n|X0 = x) = 0.


Exemple 41. Considérons la chaîne de Markov suivante 1/2 1

1/4

1/2 1/2 2

1/4

3

1/4

4

1

1/2 1/4  1/2 1/2 0 0  1/2 1/2 0 0   de matrice de transition P =   1/4 1/4 1/4 1/4  0 0 0 1 Cette chaîne comporte 3 classes {1, 2}, {3} et {4}. L’état {4} est absorbant, les classes {1, 2} et {4} sont récurrentes et la classe {3} est transiente. 

Proposition 42. Si E est un espace d’état fini, toute chaîne irréductible est récurrente. Les temps 1 de passage sont reliés au nombre de visites Nx de la chaîne dans un état par la x formule1Nx = ∞ Nx ≥ p + 1 ⇔ Txp < ∞, k=0 1(Xk = x) nombre de passage en x de la chaiîne, n Nxn = k=0 1(Xkx = x) nombre de passage en x avant l’instant n, Nxn ≥ p + 1 ⇔ Txp ≤ n.

Proposition 43. Soit x ∈ E, alors si Txn < ∞, les variables Tx , Tx2 − Tx1 , . . . , Txn+1 − Txn sont indépendantes et identiquement distribuées. Proposition 44. Si x est récurrent, la suite (Xnx ) revient presque surement une infinité de fois à son état initial, i.e. P(Nx = ∞) = 1. Proposition 45. Si x est transient, presque surement la suite (Xnx ) visite x un nombre fini de fois. Le nombre de visite suit la loi géométrique P(Nx = k) = (1 − π)π k−1 , k ≥ 1

avec π = P(Tx < ∞).

Si C est une classe de E dont tous les éléments communiquent, alors tous les états sont soit transients, soit récurrents. Proposition 46. Supposons P irréductible. Alors • tous les états sont de même nature (récurrents positifs, ou récurrents nuls, ou transients). • dans le cas récurrent, tous les points de E sont visités infiniment souvent : pour x, y ∈ E P(Xnx = y pour un infinité de n) = 1, • dans le cas transient, les sous-ensembles finis de E ne sont visités (qu’au plus) un nombre fini de fois : pour A ⊂ E de cardinal fini P(Xn ∈ A pour une infinité de n) = 0.


7

Premier temps d’atteinte d’un état , récurrence et transience

Définition 47. Étant donnée une chaîne de Markov (Xn )n∈N de distribution initiale λ et de matrice de transition P , on considère la probabilité d’atteindre un état pour la première fois un (n) (n) état j, partant de i, en n étapes, notée fi,j , i.e. fi,j = P(T{j} = n|X0 = i). (0)

On pose, par convention, fi,j = 0. n )

(n)

Proposition 48. Pour n ≥ 0,pi,j =

k=0

(k)

(n−k)

fi,j · pi,j

.

Si le processus passe de i ) j en n étapes, on s’intéresse à l’instant k où le processus à atteint j pour la première fois. (n) Cette dernière écriutre permet en particulier de calculer de manière récursive les fi,j , en (1)

(1)

notant que fi,j = pi,j , et que (n)

(n)

fi,j = pi,j −

n−1 ) k=1

(k)

(n−k)

fi,j · pi,j

, pour n ≥ 2.

On peut alors montrer le criètre de récurrence et de transience suivant Proposition 49. Si

∞ )

n=0

)

n≥0

(k)

pj,j = ∞ l’état j est récurent, et si

∞ )

n=0

(k)

pj,j < ∞ l’état j est transient.

Une démonstration peut se faire à l’aide des fonction génératrice, en posant Pi,j (z) = ) (n) (n) pi,j z n et Fi,j (z) = fi,j z n , en notant que Pi,j (z) = δi,j + Fi,j (z) · Pj,j (z) et du Lemme

d’Abel,

n≥0

Lemme 50. Si une série de terme général un converge, et u = Réciproquement, si un ≥ 0, et si lim

z→1

)

n≥0

1

n≥0 un , alors lim

un z = u(≤ ∞) alors u = z

z→1

1

n≥0 un .

)

un z z = u.

n≥0

Ce résultat permet de montrer que la récurrence est une propriété de classe, Proposition 51. Si i ↔ j, et si i est récurrent, alors j sera également récurrent. Proposition 52. Si une chaîne de Markov a un nombre d’état fini, il existe au moins un état récurrent.

8

Marche aléatoire et ruine du joueur

Considérons dans un premier temps la marche aléatoire2 dans Z. 2

Une animation de cet algorithme est téléchargeable sur http://www.crest.fr/pageperso/charpent/MA-0001.avi


Principe de réflexion de la marche aléatoire

A B T’

A’

Figure 15: Principe de réflexion.

8.1

Approche fréquentiste

On considère ici la marche aléatoire, Xn = Xn−1 + εn pour n ≥ 1, où εn est une suite i.i.d. de variables valant +1 avec probabilité p et −1 avec probabilité 1 − p. xn est la richesse d’un joueur jouant à pile ou face, gagnant 1 euro dès que pile sort (probabilité p), et perdant 1 dès que face sort, au bout de n tirages. Plaçons nous dans le cas p = 1/2. Pour déterminer les probabilités de transition, on peut compter les trajectoires. Soit A l’origine (A = (0, 0)), et un B un point atteignable en n tirages, B = (n, xn ). Notons que −n ≤ xn ≤ +n. Notons de plus que xn est forcément de la même parité que n (si n est impair, xn est forcément ' (impair, et réciproquement). Le nombre de trajectoires passant de A à B est alors Nn,xn =

n+xn 2

. Comme le nombre total de trajectoires de longueur n est 2n , la probabilité n d’atteindre le point B est alors ' ( n 1 n+x 2 . pn,xn = n 2 n

Le retour à l’origine correspond à la position xn = 0, qui est nécessairement possible seulement pour n pair, i.e. n = 2k. Aussi, ' ( 1 k p2k,0 = 2k . 2 2k √ On peut monter que pour n grand, à l’aide de la formule de Stirling, p2k,0 ∼ 1/ πn. Avant d’attaquer le problème du premier retour à l’origine, rappelons le principe de réflexion. Considérons désormais deux points quelconques A = (a, xa ) et B = (b, xb ), dont les ordonnées sont supposées strictement positives. Le nombre de trajectoires allant de A = (a, xa ) à B = (b, xb ) est égal au nombre de trajectoires allant de A% = (a, −xa ) à B = (b, xb ). C’est ce qui s’appelle principe de réflexion. Ce résultat se montre simplement par un principe de bijection, en considérant toutes les trajectoires possibles, et en introduisant le point T correspondant au premier retour en 0 (cf Figure ??) On peut alors utiliser ce résultat pour calculer la probabilité de ne jamais revenir en 0, entre la date 0 et la date n. Pour cela calculons le nombre de trajectoires qui sont toujours au dessus de la l’axe horizontal + . Le nombre total de trajectoire est N entre A = (1, 1) et B = (n, xn ), noté Nn,x n−1,xn −1 n (compte tenu du fait que l’on part de (1, 1) et non pas de (0, 0)). On peut alors écrire que + − − + Nn,x où Nn,x est le nombre de trajectoires allant de A à B qui touche Nn−1,xn −1 = Nn,x n n n − correspond au nombre l’axe horizontal. En utilisant le principe de réflexion, notons que Nn,x n % de trajectoires allant de A = (1, −1) à B, soit (par un changement d’origine), entre (0, 0) et


− (n − 1, xn + 1) Nn,x = Nn−1,xn +1 . Aussi, n + Nn,x n

= Nn−1,xn −1 − Nn−1,xn +1 =

( ' n+xn ( −1 xn 2 − = Nn,xn × , n−1 n−1 n

' n+xn 2

Pour détermininer le nombre Nn+ de trajectoires qui sont toujours au dessus de la l’axe horizontal à partir de A = (1, 1), i.e. {X1 > 0, ...., Xn > 0}, notons que, pour n pair, 'n ( ' n ( −1 + + 2 2 − Nn = 4Nn−2 − n−2 n−2 ' ( 1 n2 + . (par récurence, et en comptant les chemins). Aussi, Nn = 2 n La probabilité pour qu’on n’ait aucun retour à l’origine entre 0 et la date n = 2k est alors π2k = P(X0 = 0, X1 0= 0, X2 0= 0, ..., X2k−1 0= 0, X2k = 0). Pour ce calcul, montrons ' quelques résultats intermédiaires. Rappelons déjà que p2k,0 = P(X2k = ( 1 k . Montrons que p2k,0 = P(X1 0= 0, X2 0= 0, ..., X2k−1 0= 0, X2k 0= 0|X0 = 0) = p2k,0 = 2k 2 2k 0). Si la trajectoire ne coupe jamais l’axe horizontal, ce que soit on est toujours positif, soit toujours négatif, i.e. P(X1 0= 0, X2 0= 0, ..., X2k−1 0= 0, X2k 0= 0) = 2P(X1 > 0, X2 > 0, ..., X2k−1 > 0, X2k > 0). Or d’après la question précédante, P(X1 > 0, X2 > 0, ..., X2k−1 > 0, X2k

' ( 1 + 1 k > 0) = 2k N2k = 2k = p2k,0, 2 2 2k

aussi P(X2k = 0|X0 = 0) = p2k,0

' ( 1 k = 2k 2 2k

0 0, ..., X2k−1 0= 0, X2k 0= 0). =P(X1 0= 0, X2 = Soit enfin τ la variable aléatoire du premier retour en 0.

P(τ = 2k) = P(X1 0= 0, X2 0= 0, ..., X2k−1 0= 0, X2k = 0), qui peut s’écrire P(τ = 2k) = P(X1 0= 0, X2 0= 0, ..., X2k−1 0= 0) − P(X1 0= 0, X2 0= 0, ..., X2k−1 0= 0, X2k 0= 0), c’est à dire, en utilisant les questions précédantes, P(τ = 2k) = p2k−2,0 − p2k,0

' ( p2k,0 1 1 k = = . 2k 2k − 1 2k − 1 2 2k

Il est possible de montrer que cette fonction est effectivement une loi de probabilité (sur N∗ ), dont la loi et la fonction de répartition sont représentées sur le graphique ?? Parmi les autres résultats classiques sur la marche aléatoire, il y a la loi de l’arcsinus, liée à l’étude du dernier passage en 0 (puisque nous avons vu que la marche aléatoire avait tendance à toujours revenir en 0, on peut légitimement se poser la question). Si π2k,2n désigne la probabilité que jusqu’à l’instant 2n - inclus - le dernier passage ait eu lieu à la date 2k (≤ 2n), alors π2k,2n = p2k,0 × p2n−2k,0, pour k = 0, 1, ..., n. Ce résultat s’obtient en motant que π2k,2n = P({·, X2k=0 } ∩ {X2k+1 0= 0, ..., X2n 0= 0}),


Loi du premier temps de retour en 0

0.0

0.8 0.7 0.5

0.1

0.6

0.2

0.3

Probabilités cumulées

0.4

0.9

0.5

Loi du premier temps de retour en 0

0

100

200

300

400

500

Temps

Figure 16: Loi du temps avant le premier retour en 0.

0.10 0.05 0.00

0.00

0.05

0.10

0.15

Loi de l’arcsinus, n=20

0.15

Loi de l’arcsinus, n=20

0

5

10

15

20

0

10

20

30

Figure 17: Loi de l’arc sinus, n = 20 et n = 50.

40

50


où ces deux évènements sont indépendants. Les probabilités associées ont été calculées auparavant. Cette loi π2·,2n est appelée loi discrète de l’arcsinus, donnée par ' (' ( 1 1 k n−k 1 ∼ 2 lorsque n → ∞. π2k,2n = 2n 2 π k(n − k) 2k 2n − 2k 2 Cette loi 1/π t(1 − t) est la densité de la loi continue de l’arc sinus. On parle de loi de l’arcsinus car la fonction de répartition associée est de la forme √ √ (2/ π) arcsin( ·). L’interprétation est que pour un jeu de pile ou face durant depuis n périodes, la probabilité 2 pour que le dernier retour en 0 ait eu lieu dans le premier quart du jeu est √ (2/ π) arcsin( 1/4) soit 1/3. La probabilité 2 pour que le dernier retour en 0 ait eu lieu dans la √ première moitié du jeu est (2/ π) arcsin( 1/2) soit 1/2.

8.2

Approche par les chaînes de Markov

On considère la chaîne de Markov suivante

p k−2

1−p

k−1

p

p

p

k+1

+k+ 1−p

1−p

k+2 1−p

avec comme état initial X0 . On note Xn la fortune du joueur à la date n. Les probabilités de transition sont ici • p0,0 = 1: l’état de ruine (0) est aborbant, • pi, i − 1 = 1 − p: on perd 1 si face sort (probabilité 1 − p), • pi,i+1 = p: on gagne 1 si pile sort (probabilité p). On note hi la probabilité d’atteindre 0 sachant qu’on est à l’état i, hi = P(atteindre 0|Xn = i), alors hi est solution de 0 h0 = 1, hi = phi+1 + (1 − p)hi pour i ≥ 1. Aussi, pour p 0= 1/2, la forme générale de la solution est hi = A + B

'

1−p p

(i

.

= 0 et donc hi = 1 pour tout i: la ruine est certaine. Comme hi ∈ [0, 1], si p < 1 − p, alors B 3 ' (i ' (i 4 1−p 1−p +A 1− Si p > 1 − p, alors hi = . Comme hi ∈ [0, 1], on en déduit p p ' ( 1−p i . que A = 0 et donc hi = p Enfin, si p = 1/2, hi = A + Bi, et donc hi = 1, comme hi ∈ [0, 1]. Notons Nj la variable aléatoire Nj = inf{n ≥ 0, Xn = j}, correspond au premier temps d’atteinte de la fortune j ∈ N. Pour la marche aléatoire dans Z, commençant en X0 = 0. ' ( 2n n (2n) p (1 − p)n , p0,0 = P(X2n = 0X0 = 0) = n √ Rappelons que d’après la formule de Stirling, n! ∼ 2πn(n/e)n lorsque n → ∞. On peut alors montrer que (2n)

p0,0 =

2n [4p(1 − p)]n (n!)2 [p(1 − p)]n ∼ 2 lorsque n → ∞. !


Marche aléatoire (+1,!1) en dimension 2, n=25000

150 100

Position en Y

!50

0

50

150 100 0

50

Position en Y

200

250

200

Marche aléatoire (+1,!1) en dimension 2, n=25000

!2000

!1500

!1000

!500

0

!400

Position en X, probabilités 0.45!0.55

!300

!200

!100

0

Position en X, probabilités 0.49!0.51

Figure 18: Marche aléatoire non uniforme dans Z2 . 1 (2n) Dans le cas symmétrique où p = 1 − p = 1/2, il existe n0 tel que pour n > n0 , p0,0 ≥ √ . 2 πn Aussi ∞ ∞ ) 1 ) 1 (2n) √ = ∞, p0,0 ≥ √ 2 π n=n n n=n 0

0

on en déduit que la marche aléatoire est récurrente, si p = 1/2. Dans le cas asymmétrique où p 0= 1 − p, 4p(1 − p) < 1, on peut montrer que ∞ )

n=n0

∞ 1 ) (2n) p0,0 ≤ √ [4p(1 − p)]n < ∞, 2 π n=n 0

on en déduit que la marche aléatoire est transient, si p 0= 1/2. Pour la marche aléatoire3 dans Z2 , commençant en X0 = (0, 0), où p = 1/4, (2n) p(0,0),(0,0)

= P(X2n = (0, 0)X0 = (0, 0)) =

3'

2n n

( ' (2n 42 1 2 ∼ lorsque n → ∞, 2 πn

d’après la formule de Stirling. Aussi ∞ )

n=n0

(2n) p(0,0),(0,0)

∞ 1 ) 1 ≥ = ∞, 2π n=n n 0

on en déduit que la marche aléatoire est récurrente, si p = 1/4. La Figure ?? présente des simulations de trajectoires dans le cas où p 0= 1/4 (selon l’axe verticale, les probabilités sont toujours 50% − 50%, mais elles passent à 49% − 51% puis 45% − 55% selon l’axe horizontal, i.e. dans ce dernier cas, les probabilités des 4 états sont (25%, 25%, 22.5%, 27.5%). Pour la marche aléatoire dans Z3 , commençant en X0 = (0, 0, 0), où p = 1/6, (2n)

p(0,0,0),(0,0,0) = P(X2n = (0, 0, 0)X0 = (0, 0, 0)) =

)

i,j,k≥0,i+j+k=n 3

(2n)! (i!j!k!)2

Une animation de cet algorithme est téléchargeable sur http://www.crest.fr/pageperso/charpent/MA-d2-0001.avi

' (2n 1 6


En utilisant la formule de Stirling, on peut montrer que (2n) p(0,0,0),(0,0,0)

'

2n n

( ' (2n ' (n 1 (2n)! 1 , 3 2 ((n/3)!) 3

pour tout i, j, k, aussi (2n) p(0,0,0),(0,0,0)

1 ≤ 2(π)3/2

' (3/2 6 , lorsque n → ∞, n

on en déduit que la marche aléatoire est transiante, si p = 1/6.

9 9.1

Distributions limites ou distributions invariantes Les distributions invariantes (ou stationnaires)

Définition 53. Une mesure λ est dite invariante pour P si λP = λ. On parlera aussi de loi stationnaire. Il n’existe pas forcément de loi stationnaire pour une chaîne de Markov de matrice de transition P (par exemple la chaîne qui fait passer de i à i + 1 avec probabilité 1). De même il peut exister une infinité de lois stationnaires. Dans le cas de la ruine du joueur, i.e. la marche aléatoire bornée inférieurement par 0, et supérieurement par s, la fortune totale des deux joueurs, E = {0, 1, ..., s}, alors toute loi π = (p, 0, ..., 0, 1 − p) est une loi stationnaire, pour tout p ∈]0, 1[. Théorème 54. Soit (Xn )n∈N une chaîne de Markov de matrice de transition P et de mesure initiale λ invariante pour P , alors (Xh+n )n∈N une chaîne de Markov de matrice de transition P et de mesure initiale λ. Proof. Ceci se montre triviallement en invoquant la propriété de Markov, et en notant que, pour tout i ∈ E, P(Xh = i) = (λP h )i = ([λP ]P h−1 )i = ([λ]P h−1 )i = ... = λ)i .

9.1.1

Cas où E est fini

Plusieurs résultats peuvent être obtenus dans le cas fini. En effet, dans ce cas, on peut utiliser le résultat suivant Proposition 55. Si E est un espace d’état fini, alors elle admet au moins un état récurrent. ) (n) pi,j = k pour tout n ∈ N, aussi, Proof. Si E = {1, ...., k}, alors

  3 4 ) ) (n) ) ) (n)  p = p = ∞. i,j

n

i,j

i,j

i,j

i,j

S’il n’existait pas d’état récurrent, tous seraient

n

transients. Or pour un état transient j, et pour tout état i,

)

(n)

pi,j est finie. Ce qui est

n≥0

impossible: au moins un des état est récurrent.

Il est possible d’avoir tous les états transients dans le cas d’une chaîne sur E dénombrable, mais non fini. n

1) h P = Π, où Π est une matrice n→∞ n

Proposition 56. Si E est un espace d’état fini, alors lim stochastique vérifiant ΠP = P Π = Π, et Π2 = Π.

h=1


Proof. On admettra qu’une telle limite existe (algèbre linéaire sur les matrices à coefficients positifs: théorie de Perron-Frobenius, exposée pages 105-109 dans Foata & Fuchs (2004)). Notons que pour tout i ∈ E, ) j

car

)

πi,j =

) j

(1)

(n)

n ) pi,j + ... + pi,j 1 ) (h) = lim 1 = 1, lim pi,j = lim n→∞ n n→∞ n→∞ n j

h=1

(h)

pi,j = 1 pour tout i. Aussi les lignes de Π sont de somme égale à 1, Π est donc une matrice

j

stochastique. Les dernières propriétés sont obtenues en notant que P n+1 = P P n = P n P . (n)

Théorème 57. Si l’espace d’état E est fini, et s’il existe i tel que pi,j → πj pour tout j, alors π = (πj ) est une distribution invariante. Proof. Il suffit de noter que ) j

πj =

) j

lim pni,j = lim

n→∞

n→∞

)

pni,j = 1,

j

où l’interversion de la limite et de la somme est valide puisque E est supposé fini, donc π est une mesure de probabilité. De plus ) ) pni,j pi,j = πk pk,j , πj = lim pni,j = lim pn+1 i,j = lim n→∞

n→∞

n→∞

k

k

c’est à dire que π = (πj ) est une distribution invariante. Rappelons que si j ∈ E est un état transient, alors pour tout i, limn→∞pni,j =0 (le terme général d’une série convergent tend vers 0). Proposition 58. Si la chaîne est irréductible, et possède un nombre fini d’états, alors πj = 1/E(Tj |X0 = j), correspondant à l’inverse du temps de retour moyen de j à j. Théorème 59. Si E est un espace d’état fini, alors • existence: il existe au moins une mesure stationnaire, • unicité: la loi stationnaire est unique si et seulement si la chaîne admet une seule classe récurrente. De plus, si C désigne cette classe, πj > 0 si et seulement si j ∈ C, et πj = 0 si et seulement si j ∈ /C Proof. On admettra l’existence, qui repose sur des résultats d’algèbre linéaire sur les matrices à coefficients positifs (théorie de Perron-Frobenius, exposée pages 105-109 dans Foata & Fuchs (2004)). L’unicité s’obtient de la manière suivante. Montrons que si la chaîne admet une seule classe récurrente, alors il existe une loi stationnaire unique, vérifiant les propriétés mentionnées. On sépare alors E en son unique classe récurrente C, et T la réunion des classes transients. Soit (i, j) ∈ E. (n)

• si j ∈ T (et i quelconque, dans E) alors limn→∞ pi,j = 0. • si j ∈ C et i ∈ C alors la restriction du processus à la classe C est irréductible, et d’après ??, la limite est unique (correspondant à l’inverse d’un temps de retour), • si j ∈ C et i ∈ T , c’est un peu plus compliqué. L’idée est de passer par un état intermédiaire k, qui sera soit dans C soit dans T à une date intermidiaire avant n, ) (m) (h) ) (m) (h) (m+h) = pi,k pk,j + pi,k pk,j . pi,j k∈C

k∈T


Dans un second temps, on utilise le fait que si pni,j → πi,j , alors par le théorème de Cesarro, n 1 ) m+h lim pi,j = πi,j , et n→ n h=1

n

1 ) (m+h) ) (m) pi,j = pi,k n h=1

k∈C

3

n

1 ) (h) pk,j n h=1

4

+

)

k∈T

(m)

pi,k

3

n

1 ) (h) pk,j n h=1

4

.

En utilisant le théorème de Cesarro sur les trois sommes, 5 5 6 6 ) (m) ) (m) pi,k πj + pi,k πk,j . πi,j = k∈C

k∈T

(m)

Si m → ∞, pi,k → 0 pour tout k ∈ T , et

) k∈C

(m)

pi,k → 1, et donc πi,j = πj > 0. Pour

montrer la réciproque, raisonnons par l’absurde. Supposons qu’il existe (au moins) deux classes récurrentes C1 et C2 . La matrice de transition P a alors la forme suivante   ) 0 0 P = 0 ) 0  ) ) )

et pour tout n ∈ N, P n aura la même forme. Il est alors impossible d’avoir limn→∞ πi1 ,j = limn→∞ πi2 ,j pour i1 ∈ C1 et i2 ∈ C2 Exemple 60. Considérons la chaîne de Markov de matrice de transition   0 1/2 1/2 0   0 1 0 , P =  0 0 0 1  0 0 1 0

alors {2} et {3, 4} sont deux classes récurrentes: on n’a plus unicité de la distribution stationnaire. En effet, π = (0, 1 − 2p, p, p) pour tout p ∈ [0, 1/2].   1/5 1/5 3/5 Exemple 61. Considérons la chaîne de l’exemple ??, P =  0 1/2 1/2  1 0 0 1/5 1

1/5

1 3/5 3

1/2

1/2 2

Les distributions invariantes sont données par la résolution du système x = x/5 + z y = x/5 + y/2 z = 3x/5 + z/2 Toute solution est proportionelle au vecteur (5, 2, 4). Le vecteur de probabilité associé est ' ( 5 2 4 , , ∼ (45.4%, 18.2%, 36.4%). π= 11 11 11


6

8

10

0 0

2

Valeurs de départ (i)

4

6

8

10

Valeurs de départ (i)

0.4 0.3 0.2

8 6

0.1

0.1

Probabilités de transition

0.2

10 8 6 4

Valeurs d’arrivée (j)

0.3

0.4

0.5

Probabilités de la matrice de transition, k=10

0.5

Probabilités de la matrice de transition, k=5

Probabilités de transition

Valeurs d’arrivée (j)

4

Valeurs d’arrivée (j)

0.4 0.3 0.2

2

0.0

0.0

2

10

4

2 0 0

10 8 6

0.1

Probabilités de transition

4

Valeurs d’arrivée (j)

0.4 0.3 0.2

10 8 6

0.1

Probabilités de transition

0.5

Probabilités de la matrice de transition, k=2

0.5

Probabilités de la matrice de transition

4

0 0

2

4

6

8

10

2

0.0

0.0

2 0 0

2

Valeurs de départ (i)

4

6

8

10

Valeurs de départ (i)

Figure 19: Calcul des puissances d’une matrice de transition.

En guise d’exemple, considérons le code suivant, qui permet de générer des matrices stochastiques aléatoires, P=matrix(0,n,n) for(i in 1:n){ s=c(0,sort(runif(n-1)),1) p=s[2:(n+1)]-s[1:(n)] P[i,]=p} En eefet, la ligne de code s=c(0,sort(runif(n-1)),1); p=s[2:(n+1)]-s[1:(n)] permet de tirer au hasard un point du simplexe en dimension n, c’est à dire une mesure de probabilité sur {1, 2, ..., n}. Les figures4 ?? suivantes montrent les probabilités des matrices P, P 2 , P 5 et P 1 0.

9.1.2

Cas où E est infini

Dans le cas où E est dénombrable, mais non-fini, une condition suffisante n’est plus l’irréductibilité et la récurrence d’états, mais il faut ajouter la propriété de récurence positive. En particulier, la proposition ?? doit être affaiblie, n

1) h P = Π, où Π est une matrice n→∞ n h=1 sous-stochastique (la somme des éléments par ligne est inférieure ou égale à 1) vérifiant ΠP = P Π = Π. Proposition 62. Si E est un espace d’état infini, alors lim

Il est aussi possible que Π = 0, par exemple si tous les états sont transients. En revanche Proposition 63. Si E est un espace d’état infini (dénombrable), et s’il existe au moins un état récurrent positif alors il existe au moins une mesure stationnaire. Si l’on suppose la chaîne irréductible et réucurrent positive, alors la probabilité stationnaire est unique.

9.2 9.2.1

La période Périodicité d’un état j ∈ E

Définition 64. Soit jE on appelera d période de l’état j le plus grand commun diviseur de tous (n) les entiers n pour lesquels pj,j > 0. Si d = 1 on dira que j est apériodique. 4

Des animations de cet algorithme sont téléchargeable sur

http://www.crest.fr/pageperso/charpent/P-trans-1.avi, /P-trans-2.avi, /P-trans-3.avi


(n)

Un état i est apériodique si pi,i > 0 pour tout n suffisement grand, c’est à dire que d = 1. Exemple 65. Considérons la chaîne suivante

1

1 1/2

1

2 1/2 1 4

3

Tous les états communiquent: il y a une seule classe récurrente. Les lacets issus de 1 sont 1 → 3 → 2 → 1 ou 1 → 4 → 2 → 1, de longueur 3, donc d(1) = 3. Les lacets issus de 2 sont 2 → 1 → 3 → 2 ou 2 → 1 → 4 → 2, de longueur 3, donc d(2) = 3. Les lacets issus de 3 sont 3 → 2 → 1 → 3 ou 3 → 2 → 1 → 4 → 2 → 1 → 3, etc, de longueur 3, 6, etc, donc d(3) = 3. Les lacets issus de 4 sont 4 → 2 → 1 → 3 ou 4 → 2 → 1 → 3 → 2 → 1 → 4, etc, de longueur 3, 6, etc, donc d(4) = 3. On peut alors diviser la classe en sous-classes cycliques, {1}, {2} et {3, 4}. La matrice de transition peut alors s’écrire par blocs pour E = {2, 1, 3, 4},   0 1 0 0  0 0 1/2 1/2   P =  1 0 0 0  1 0

0

0

Exemple 66. Pour la marche aléatoire dans Z, tous les états sont périodiques de période 2.

9.2.2

Périodicité de classe

Théorème 67. Si un état j est périodique de période d et que j ↔ i, alors i sera également périodique de période d. Cette propriété de périodicité étant une propriété de classe, on pourra parler de chaîne de markov de période d pour si P est irréductible. Théorème 68. Pour une chaîne irréductible, tous les états ont la même période.

9.3

Convergence vers la loi limite

Lemme 69. Si P est une matrice irréductible et possède un état apériodique i, alors pour tout (n) j, k ∈ E, il existe n0 tel que pj,k > 0 pour tout n ≥ n0 . Aussi, tous les états sont apériodiques. (r)

(s)

Proof. Il existe r, s tels que pj,i > 0 et pi,k > 0 et donc (r+n+s)

pj,k

(r)

(s)

≥ pj,i · pni,i · pi,k > 0.

Théorème 70. Soit P une matrice irréductible et apériodique, possédant une distribution invariante π. Étant donnée une distribution initiale λ, et (Xn )n∈N une chaîne de Markov (λ, P ), alors P(Xn = j) = πj lorsque n → ∞ pour tout j ∈ E, (n)

et en particulier pi,j → πj lorsque n → ∞, pour tout i, j ∈ E. Pour démontrer ce résultat, on va utiliser un argument de couplage.


Proof. Soit (Yn )n∈N une chaîne de Markov (π, P ), et pour b ∈ E on pose Tb = inf{n ≥ 1 : Xn = Yn = b}. • on commence par montrer que P(T < ∞) = 1, 0 Xn si n ≤ T • on pose Zn = Yn si n ≥ T ,

9.4

Interprétation de l’invariance

Exemple 71. Sur l’exemple précédant, supposons suivantes sont alors ( 100.0% 00.0% ( 20.0% 20.0% ( 64.0% 14.0% ( 34.8% 19.8% ( 52.4% 16.9% ( 41.2% 18.9% ( 48.1% 17.7% .. .. . . (

45.4%

λ = (1, 0, 0). Les distributions aux dates 00.0% 60.0% 22.0% 45.4% 30.8% 39.9% 34.2% .. .

) ) ) ) ) ) )

18.2% 36.4% )

0.0

0.2

0.4

0.6

0.8

1.0

Evolution des proportions en fonction de n

0.2

0.4

0.6

0.8

1.0

Evolution des proportions en fonction de n

0.0

0.0

0.2

0.4

0.6

0.8

1.0

Evolution des proportions en fonction de n

0.2

0.2 0.0

0.4

0.6

0.8

1.0

Evolution des proportions en fonction de n

0.0

0.4

0.6

0.8

1.0

Evolution des proportions en fonction de n

Exemple 72. Si E est infini il n’existe pas forcément de loi stationnaire.


0

1 1/3

2/3 1 2 1/9 1/27 1/81

80/81

26/27

8/9 3

4

5

Si la chaîne est périodique il n’existe pas forcément de loi stationnaire. 1/2 1

2 1/2 1/2 1/2 1/2 1/2 1/2 4 3 1/2 0 P(X2n+1 = u|X0 = u) = 0 Pour des raisons de parité, lim n→∞ P(X2n = u|X0 = u) > 0

9.5

Pour résumer...

• Les lois stationnaires ne chargent que les évènements récurrents (positifs si E est seulement dénombrable), • La loi stationnaire est unique si et seulement il n’existe qu’une classe réccurrente (positive si E est seulement dénombrable), • Quand il y a une loi stationnaire, les probabilités de la chaîne convergent vers la loi stationnaire au sens de Cesarro. Il y a convergence simple si toutes les composantes récurrentes sont de période 1 (chaîne apériodique).

10

Résultats d’algèbre linéaire pour les chaînes de Markov

Lemme 73. 1 est forcément valeur propre d’une matrice stochatique. Proposition 74. Soit P une matrice carrée stochastique, • Si 1 est valeur propre simple de P , et si toutes les valeurs propres de P autres que 1 sont de module strictement inférieur à 1, alors la suite de matrice (P n )n∈N converge vers une matrice stochastique. De plus, toutes les lignes de la matrice sont identiques. • Si 1 est valeur propre multiple de P , et que toutes les autres valeurs propres sont de module strictement inférieur à 1, la suite (P n )n∈N converge vers une matrice stochastique. • Si P a au moins une valeur propre autre que 1 dont le module est égal à 1, alors la suite (P n )n∈N ne converge pas. Toutefois, la suite (Qn )n∈N , définie par Qn =

I + P + . . . + P n−1 n

converge vers une matrice stochastique (ou, dit autrement, la suite (P n )n∈N converge au sens de Cesaro vers une matrice stochastique).


Rappelons que si M est une matrice carrée d’ordre r, elle admet r valeurs propres. Soit s le nombre de valeurs propres distinctes, λ1 , . . . , λs , et notons α1 , . . . , αs leur multiplicité. Il existe P telle que   Dλ1 0 ... 0  0 Dλ . . . 0  2   A = P DP −1 où P =  . .. ..  , .  . . .  0

0

. . . Dλs

où les matrices Dλi sont triangulaires supérieures, αi × αi , avec λi sur la diagonale. s ) On peut écrire D = (λi Ji + ui ), où Ji et ui sont de la forme i=1

         

0 0 ... 0 ... 0 0 ... 0 ... .. .. .. . . . 0 0 ... # ... .. .. .. . . . 0 0 ... 0 ...

0 0 .. .

0 .. .

0

       , où ) =       

λi 0 . . . 0 0 λi . . . 0 .. .. .. . . . 0 0 . . . λi

    ou    

0 0 .. .

∗ 0 .. .

00 . . .

 ... ∗ ... ∗   ..  .  0

Les matrices ui et Ji vérifient des propriétés d’orthogonalité, Ji Jj = Ji uj = ui Jj = ui uj = 0 pour i 0= j, avec

Ji2

= Ji , Ji ui = ui Ji = ui , et

Alors

s )

Ji = I.

i=1

3 s 4n s ) ) (λi Ji + ui ) = (λi Ji + ui )n . D = n

i=1

Si λi 0= 0, on pose Qi (n) = On a alors

'

ui Ji + λi

(n

i=1

=

n ' ) i=0

Mn =

s )

n k

('

ui λi

(k

.

(λi )n P Qi (n)P −1 .

i=1

Si de plus on suppose que 2λ2 = 1, alors Qi (n) = Qi . Soit Π la matrice Q1 associée à la valeur propre 1, Proposition 75. Soit P une matrice stochastique d’ordre r, alors pour tout n ≥ r, ) ) (λj )n Qj + (λk )n Qk (n), Pn = Π + j

k

où la première somme se fait sur les valeurs propres 2λi 2 = 1 et la seconde 2λi 2 < 1. Notons que Π2 = Π et Q2j = Qj (ce sont des projecteurs).   1/5 1/5 3/5 Exemple 76. Considérons la matrice de transition P =  0 1/2 1/2 , 1 0 0 1/5 1

1/5

1 3/5 1/2

1/2


alors P = T DT −1 , où 1/5 0 1

1/5 1/2 0

3/5 1/2 0

−0.577 −0.577 −0.577

=

0.494 0.354 −0.794

0.107 −0.936 0.334

1.00 0 0

0 −0.622 0

−0.577 −0.577 −0.577

0 0 0.322

0.494 0.354 −0.794

0.107 −0.936 0.334

−1

La matrice étant diagonale, la puissance nième se calcul aisément 1/5 0 1

1/5 1/2 0

3/5 1/2 0

n

−0.577 −0.577 −0.577

=

0.494 0.354 −0.794

0.107 −0.936 0.334

1.00 0 0

0 −0.622 0

0 0 0.322

n

−0.577 −0.577 −0.577

0.494 0.354 −0.794

0.107 −0.936 0.334

−1

En particulier P

5

=

0.413 0.421 0.524

0.189 0.190 0.168

0.398 0.388 0.308

et P

10

=

0.458 0.457 0.448

0.181 0.181 0.183

0.360 0.361 0.369

Proposition 77. Si la matrice de transition P est telle qu’il existe k tel que P k n’admet que des termes stricements positifs, alors Pn → P = [π].   3/4 1/4 0 Exemple 78. Soit P =  1/2 0 1/2 , alors 0 1 0 7 11/16 3/16 1/8 8 7 39/64 19/64 3/32 8 7 155/256 63/256 38/256 8 3/8 5/8 0 , P 3 = 19/32 3/32 5/16 et P 4 = 63/128 59/128 3/64 P2 = 1/2

0

1/2

3/8

5/8

0

19/32

3/32

5/16

Aussi la chaîne de Markov est convergente. Or l’équation charactéristique de P est   3/4 − z 1/4 0 detP =  1/2 −z 1/2  = 0 0 1 −z

soit z 3 − 3/4z 2 − 5/8z + 3/8 = 0. Comme 1 est racine, cette équation se ramène à (z − 1)(z 2 + 1/4z − 3/8) = 0

dont les racines sont 1/2 et −3/4 (de module strictemnt inférieur à 1). La chaîne de Markov est effectivement convergente. Formellement rappelons qu’il suffisait de résoudre π(P − I) = 0.

Proposition 79. Une chaîne de Markov de matrice de transition P est ergodique si et seulement si la valeur propre 1 est valeur propre simple, et est l’unique valeur propre de module 1. La loi limite de la chaîne est alors donnée par l’unique vecteur propre à gauche (ligne) de la matrice P (c’est-à-dire, les probabilités limites sont les coefficients de l’unique tel vecteur propre dont la somme des coefficients soit 1).

11 11.1

Exemples de chaînes de Markov Modèle de Bernoulli-Laplace

On considère 2 urnes, A et B, et on suppose que deux types de boules (rouges et vertes) sont introduites, en nombre k. On note X0 le nombre de boules rouges dans la première urne. À chaque date, on procède à un échange deux boules prises dans chacune des urnes, et on note Xn le nombre de boules rouges dans la première urne après n échanges. La matrice de transition est donnée par ' (2 ' ( i(k − i) i k−i 2 , pi,i−1 = et pi,i+1 = , pi,i = 2 k2 k k pour 0 < i, j < k, et p0,1 = 0 = pk,k−1 = 1. Cette chaîne (finie) est effectivement irréductible, puisqu’il est possible de joindre les états i et j en |i − j| étapes, avec une probabilité non nulle, max{i,j}−1 '

9

k−i k

(2

.


Cette chaîne est apériodique car Pi,i > 0 pour tout i. Compte tenu de la forme quasi-diagonale de la matrice de transition, on peut déterminer la loi invariante π, solution de P % π = π, ce qui revient à résoudre  π0 = p0,0 π0 + p1,0 π1      π1 = p0,1 π0 + p1,1 π1 + p2,1 π2 ...   π = pi−1,i πi−1 + pi,i πi + pi+1,i πi+1    i ...πk = pk−1,k πk−1 + pk,k πk ce qui se résoud de manière récursive, 1

=

p0,1 p1,2 p0,1 pi−1,i p0,1 π0 ,2 = π0 , ..., πi = ... π0 , p1,0 p2,1 p1,0 pi,i−1 p1,0

'' ((2 i soit, au final, πi = π0 , soit, par normalisation k πi =

7: ;82 i k

:i; , 2k

aussi, la loi hypergéométrique H(2k, k, 1/2) est la loi invariante.

11.2

Urne de Ehrenfest

On considère deux urnes A et B contenant au total m boules. On tire une boule dans une des urnes choisie au hasard et on la replace dans l’autre. On cherche à décrire Xn = nombre de boule dans l’urne A après n tirages. (Xn ) est une chaîne de Markov, avec pour probabilités de transition P(Xn+1 = k − 1|Xn = k) =

k pour k = 1, ..., m − 1, m, m

m−k pour k = 0, 1, ..., m − 1, m = j|Xn = i) = 0 sinon .

P(Xn+1 = k + 1|Xn = k) = P(Xn+1

La matrice de transition associée est  0 1 0 0  1/m 0 (m − 1)/m 0   0 2/m 0 (m − 2)/m   .. . . . .. .. .. P = .   0 0 0 0   0 0 0 0 0 0 0 0

··· ··· ··· ··· ··· ···

Dans le cas où n = 4, la chaîne est alors 0

1

2

0 0 0 .. .

0 0 0 .. .

       0 2/m 0   (m − 1)/m 0 1/m  0 1 0

1/2

3/4 1

0 0 0 .. .

1/4 3 

1

4

1/2 3/4 0 1 0 0 0  1/4 0 3/4 0 0     de matrice de transition P =   0 1/2 0 1/2 0   0 0 3/4 0 1/4  0 0 0 1 0 La chaîne est irréductible (donc récurente positive) et admet une probabilité invariante.  1/4


Notons que pour i = 1, ..., m − 1, πi = πi−1 ×

m−i−1 i+1 + πi+1 × , m m

avec des conditions de bords de la forme π0 = π1 /m. Par récurence, πi = π0 m )

π = 1 alors π0

i=0

aussi, πi =

11.3

:i;

1 2m m

m ' ( ) i i=0

m

= 2m π0 = 1,

:i; m . Comme

pour i = 0, ..., m. La loi stationnaire est la loi binomiale B(m, 1/2).

Urne de Pólya

On considère une urne5 avec v + r boules, de deux couleurs V et R. Lorsqu’on tire une boule, on la remet dans l’urne, et on rajoute une boule de la même couleur. Il s’agit d’un modle(simple)decontagion. Soient Vn et Rn le nombre de boules après n tirages. X n = (Vn , Rn ) est une chaîne de Markov dans N × N, d’état initial (1, 1), et de matrice de transition P((i + 1, j)|(i, j) =

j i et P((i, j + 1)|(i, j) = . (i + j (i + j

Notons Zn = Rn /[Vn + Rn ] la proportion de boules rouge. Par récurence, on peut monter aisément que ( ' k 1 = pour k = r, r + 1, r + 2, ..., r + n. P Zn = n+2 n+1 Soient Vn% et Rn% le nombre de boules sorties après n tirages, i.e. Vn% = Vn − v et Rn% = Rn − v. Alors P(Vn% = i, Rn% = n − i) =

n! r(r + 1)...(r + i − 1)v(v + 1)...(v + n − i − 1) i!(n − i)! (r + v)(r + v + 1)...(r + v + n − 1)

Notons Zn% = Rn% /[Vn% + Rn% ] = Rn% /n la proportion de boules rouge sorties. ... Alors (r + nz − 1)! (v + n(1 − z) − 1)! (r + v − 1)!n! P(Zn% = z) = (r − 1)!(nz)! (v − 1)!(n(1 − z)! (r + v + n − 1)! En utilisant la formule de Stirling, on peut montrer que P(Zn% = z) ∼

11.4

(r + v − 1)! r−1 z (1 − z)v−1 , pour x ∈ [0, 1]. (r − 1)!(v − 1)!

Processus de branchement et taille de population

On considère une population dont les individus se reproduisent, à chaque génération, de manière indépendante, et tels que le nombre de descendants X admet une loi de fonction génératrice g, g(t) = E(tX ). On note Sn le nombre d’individus à la nième génération. Notons que L

Sn = X1 + .... + XSn−1 , où les Xi sont i.i.d. En partant d’un seul individu, on obtient que la fonction génératrice gn de Sn est gn (t) = gn (t) où gk = g ◦ gk−1 . 5

Une animation de cet algorithme est téléchargeable sur http://www.crest.fr/pageperso/charpent/MC-UP-0001.avi


Si P(X = 0) = 0, la chaîne est croissante, et donc la chaîne (Sn ) est transiente. Si P(X = 0) 0= 0, il est possible que la population disparaisse, et la probabilité de premier retour à 0 est ρn = P(Sn = 0) = gn (1). Notons que (ρn ) vérifie alors une relation de récurrence ρn = g(ρn−1 ). ρn → 1 ∈ [0, 1[ si et seulement si g% (1) > 1, c’est à dire E(X) > 1: la transience de la chaîne est associée au nombre moyen de descendant par individu. Si g% (1) > 1, la chaîne est transiente, et si g% (1) ≤ 1, la chaîne est récurente. Supposons que g% (1) ≤ 1. Si (Sn ) admet une loi invariante, de fonction caractéristique ψ, alors ψ doit vérifier ψ(t) = g(t)ψ(0) + ψ(g(t)) − ψ(0).

Exemple 80. Si X suit une loi de Bernoulli, B(p), g(t) = (1 − p) + pt, et ψ est alors solution de ψ(t) = g(t)ψ(0) + ψ(g(t)) − ψ(0) = ψ((1 − p) + pt) + p(t − 1)ψ(0),

ce qui donne, de manière itérative

ψ(t) = ψ((1 − p) + p(1 − p) + ... + pk−1 (1 − p) + pk t) + (p + p2 + ... + pk )(t − 1)ψ(0), pour tout k ∈ N. Par passage à la limite, k → ∞, ' ( ' ( 1−p p p ψ(t) = ψ +ψ (t − 1)ψ(0) = 1 + (t − 1)ψ(0), 1−p 1−p 1−p i.e. ψ(0) = 1 − p et ψ(t) = 1 + p(t − 1) = (1 − p) + pt: la loi de Bernoulli est invariante.

12

Théorème(s) ergodique(s)

Le premier théorème ergodique est une forme de loi de grand nombre pour des suites de variables aléatoires non indépendantes (mais markoviennes). Rappelons que de manière classique, si les Xi sont de même loi, et si les variables sont de variance finie, la loi (faible) des grands nombres (théorème de Khintchine) garantie que * '* ( * X1 + ... + Xn * lim P ** − E(X)** > ε = 0, n→∞ n

qui se montre à l’aide de l’inégalité de Tchebychev, et donc résultat peut s’écrire, pour toute fonction f intégrable, n

1) P f (Xi ) → E(f (X)) = n i=1

<

X1 + ... + Xn P → E(X). Aussi, ce n

f (x)dπ(x),

E

où π désigne la loi des Xi . La loi (forte) des grands nombres garantie une convergence presque sûr dès lors que les variables sont d’espérance finie, ( ' X1 + ... + Xn (ω) = E(X) = 1. P lim n→∞ n Théorème 81. Soit (Xn )n∈N une chaîne de Markov irréductible récurrente positive, et π son unique mesure invariante. Pour toute fonction f bornée sur E, n−1

1) P f (Xk ) → n k=0

<

E

f (x)dπ(x) =

) x∈E

π(x)f (x).


Proof. Pour tout état x ∈ E, on note Nx (n) le nombre de retour à l’état x avant l’instant n, n ) 1(Xk = x). On s’intéresse alors à toutes les excursions, entre chaque retour à l’état Nx (n) = k=0

x, notées E0 , E1 , ..., ENx (n) , chacune de longueur Lx (k). Notons que Lx (0) + ... + Lx (Nx (n) − 1) ≤ n ≤ Lx (0) + ... + Lx (Nx (n)), de telle sorte que Lx (0) + ... + Lx (Nx (n) − 1) n Lx (0) + ... + Lx (Nx (n)) ≤ ≤ . Nx (n) Nx (n) Nx (n)

Les excursions étant indépendantes (propriété de Markov), on peut utiliser la loi des grands nombres, et Lx (0) + ... + Lx (Nx (n)) p.s. → E(Tx ), Nx (n) où Tx est le temps du premier retour à l’état x, Tx = inf{n ≥ 1, Xn = x}. Aussi, n/Nx (n) tend Nx (n) p.s. 1 (le presque sûr étant par rapport à presque sûrement vers E(Tx ), ou encore → x E(Tx ) Px (·) = P(·|X0 = x), mais on peut montrer que la convergence a lieu quelle que soit la mesure initiale λ, puisque les limites sont identiques). Pour montrer maintenant la convergence, notons que * * * * ( * *) ' N (n) * * 1 n−1 ) * * * * ) x f (Xk ) − π(x)f (x)* = * − π(x) f (x)* . * * * * *n n x∈E

k=0

x∈E

On utilise le fait que f est bornée, i.e. |f (·)| ≤ M . Soit F ∈ E, alors * * * * n−1 ( * *) ' N (n) * *1 ) ) * * * * x f (Xk ) − π(x)f (x)* = * − π(x) f (x)* * * * * *n n k=0 x∈E x∈E * * ( ) ' Nx (n) ) * Nx (n) * *+M * − π(x) +π(x) ≤ M * * n n x∈F x∈F / * * ) ) * Nx (n) * * * pi(x). ≤ 2M * n − π(x)* + 2M x∈F

x∈F /

La )difficulté est que E peut être de cardinal infini, on choisit alors F de cardinal fini, tel que pi(x) soit aussi petit que possible (inférieure à ε). On utilise alors la convergence étable x∈F / * * ) * Nx (n) * * ≤ ε, ce qui garantira * − pi(x) précédement, et donc, il existe N tel que pour n ≥ N , * * n x∈F la convergence. Le second théorème ergodique est une forme de théorème centrale limite pour des suites de variables aléatoires non indépendantes (mais markoviennes). Rappelons que de manière classique, si les variables Xi sont indépendantes, de même loi (et centrées, pour simplifier l’écriture) n−1

où σ 2 = Var(X) = E(X) =

<

1 ) L √ Xk → N (0, σ 2 ), n i=0

x2 dπ(x).

On supposera (dans la démonstration, mais le théorème reste généralement vrai) que E est fini. On se placera également dans le cas centré, là aussi pour simplifier. et π son unique mesure invariThéorème 82. Soit (Xn )n∈N une chaîne de Markov irréductible, < ) f (x)dπ(x) = π(x)f (x) = 0, alors il ante sur E fini. Pour toute fonction f sur E telle que E

existe σ (dépendant de f ) telle que

n−1

1 ) L √ f (Xk ) → N (0, σ 2 ). n i=0

x∈E


Proof. L’idée est d’écrire 32 4 = n−1 ) Nx (n) Nx (n) 1 ) n √ f (Xk ) = π(x)f (x) −2 , n n π( x) N (n) x i=0 x∈E

qui va se comportement de la même manière que = ) Nx (n) Lx (0) + ... + Lx (Nx (n)) 2 π(x)f (x) , n Nx (n) x∈E

où Lx (k) = Lx (k)−1/π(x). Par indépendance sur chaque excursion, on peut invoquer le théorème centrale limite qui assure que Lx (0) + ... + Lx (Nx (n)) L 2 → N (0, 1). Nx (n) Notons que le calcul de la variance n’est pas forcément simple à obtenir (en pratique). Elle vaut ∞ ) ) ) π(x)µ(x)f (x) − π(x)f (x)2 , où µ(x) = E(f (Xn )|X0 = x), σ2 = 2 x∈E

n=0

x∈E

pour tout x ∈ E.

13

Inversion du temps

Si (Xn )n0 est une chaîne de Markov de matrice de transition P , conditionnellement à la valeur présente, le passé et le futur sont indépendant. Théorème 83. Soit (Xn )0nN une chaîne de Markov de matrice de transition P irréductible, de distribution invariante π, et de mesure initiale λ = π, et poson Yn = XN −n . Alors (Yn )0nN est une chaîne de Markov de matrice de transition P˜ et de mesure initiale π où πj p˜j,i = πi pi,j pour tout i, j, et P˜ est irréductible, de distribution invariante π.

14 14.1

Passage au temps continu Approche infinitésimale

Etant donnée une matrice Q , la série

) Qk k≥0

k!

converge, et sera notée exp(Q).

Théorème 84. Soit Q une matrice définie sur l’espace d’état I. Notons P (t) = exp(tQ), alors la fonction P (·) vérifie • P (s + t) = P (s) + P (t), • P est l’unique solution de l’équation différencielle forward

d P (t) = P (t)Q, dt

• P est l’unique solution de l’équation différencielle backward • pour tout k ≥ 0,

'

d dt

(k

* * * P (t)* t = 0 = Qk . *

Définition 85. Une matrice M est une Q-matrice sur I si

d P (t) = QP (t)., dt


• qi,i ∈ (−∞, 0], • qi,j pour tout j 0= i, ) qi,j = 0. • j∈I

-2  -1 Exemple 86. La matrice 2

1 1 1

 1 0  est une Q-matrice. -3

Théorème 87. Une matrice Q est une Q-matrice si et seulement si P (t) = exp(tQ) est une matrice stochastique pour tout t ≥ 0. Les composantes de l’équation différentielle forward P % (t) = P (t)Q sont p%i,i (t) = −λpi,i (t) p%i,j (t) = −λpi,j (t) + λpi,j−1 (t) p%i,N (t) = λpi,N −1(t)

pi,i (0) = 1 pi,j (0) = 0 pi,N (0) = 0

pour i < N pour i<j < N pour i < N

La première équation admet pour solution pi,i (t) = exp(−λt) for i < N , et pour i < j < N , (λt)j−i . Si i = 0, on obtient les probabilités (e−λt pi,j (t))% = eλt pi,j−1 (t), et par induction, e−λt (j − i)! d’une loi de Poisson de paramètre λt. à continuer

14.2

Processus de Poisson

Pour rappel, une variable aléatoire positive T suit une loi exponentielle de paramètre λ ≥ 0 si P(T > t) = exp(−λt), pour tout t ≥ 0. La moyenne de T est alors E(T ) = 1/λ. Théorème 88. T suit une loi exponentielle si et seulement si elle vérifie la propriété d’absence de mémoire, P(T > s = t|T > s) = P(T > t) pour tout s, t ≥ 0. [à compléter]

15 15.1

Statistique pour les chaînes de Markov Un petit exemple

Considérons un processus de branchement de type Galton-Watson. On part de X0 = 1, et on suppose que la loi de reproduction est une loi binomiale B(N, p, où p est inconnu. On suppose les reproductions sont indépendantes On note Xn le nombre de descendant en n générations.


Processus de Galton!Watson

Notons que Xn+1 sachant Xn = i est la somme de i binomiales indépendantes B(N, p, donc Xn+1 |Xn = i simB(N i, p) donc P(Xn+1 = j|Xn = i) =

'

( Ni j p (1 − p)N i−j , = pi,j , pour j = 0, 1, ..., N i. j

Supposons que l’on ait observé à chaque date x0 = 1, x1 , ..., xn . La vraisemblance de cet échantillon est n−1 n−1 9 9 ' N xi ( pxi ,xi+1 = pxi+1 (1 − p)N xi −xi+1 L(x0 , ..., xn , p) = xi+1 i=0

aussi L(x0 , ..., xn , p)

3n−1 ' 4 9 N xi ( i=0

xi+1

i=0

n−1 i=0

p

xi+1

(1 − p)N

n−1 i=0

xi −xi+1

. On cherche alors

p> ∈ p ∈ (0, 1) log L(x0 , ..., xn , p). argmax

La log-vraisemblance s’écrit

'

p log L(x0 , ..., xn , p) = constante + log 1−p Aussi,

15.2

( n−1 ) i=0

xi+1 + N (log(1 − p))

∂ log L(x0 , ..., xn , p) = 0 si et seulement si ∂ p> 31 4 n−1 x 1 i+1 i=0 p> = . 1 n−1 N i=0 xi

n−1 )

xi .

i=0

Généralisation

On suppose que E est un espace d’état fini. On cherche à estimer P = [pi,j ], la matrice de transition. On note Nni,j le nombre de transition de i vers j observées entre les dates 0 et n, Nni,j =

n−1 )

1(Xk = i, Xk+1 = j).

k=0

Soit Nni,· le nombre de passage en i, Nni,· =

n−1 )

1(Xk = i) =

)

Nni,j .


Supposons que l’on ait observé à chaque date x0 = 1, x1 , ..., xn . La vraisemblance de cet échantillon est n−1 9 L (x0 , ..., xn , P = [pi,j ]) = λ(x0 ) × pxk ,xk+1 . k=0

On cherche alors

P> = [> pi,j ] ∈ pi,j ∈ (0, 1) argmax

n−1 )

log pxk ,xk+1 =

)

log pi,j Nni,j ,

i,j∈E

k=0

avec la constrainte d’avoir une matrice stochastique, i.e.

)

pi,j = 1 pour tout i.

j∈E

En posant λi le multiplicateur de Lagrange associé,   ) )  = 0. log L − λi  j∈Epi,j −1

i∈E

Pour tout iE, on obtient que λi = Nni,· , et donc p>i,j =

Nni,j Nni,·

= estimateur empirique.

D’après le théorème ergodique,

n−1

1) 1 i,· P−as Nn = 1(Xk = i) → π(i), n n k=0

où λ est la mesure stationnaire associée à la chaîne P , et n−1

1) 1 i,j P−as Nn = 1(Xk = i, Xk+1 = j) → π(i)pi,j , n n k=0

aussi, pour tout i, j ∈ E,

P−as

p>i,j → pi,j .

On peut en fait montrer que cet estimateur est normalement convergent, ' ( √ pi,j (1 − pi,j ) L n (> pi,j − pi,j ) → N 0, . π(i)


References [1] Benaïm, M. & El Karoui, N. Promenade Aléatoire, Ed. Ecole Polytechnique. [2] Cottrell, M., Genon-Catalot, V., Duhamel, C. & Meyren T. Exercices de probabilits, Ed. Cassini. [3] Foata, D. & Fuchs, A. Processus Stochastiques, Ed. Dunod. [4] Norris, J.R. Markov Chains, Ed. Cambridge University Press. [5] Robert, C. Méthodes de Monte Carlo par chaîne de Markov, Ed. Economica. [6] Ycart, B. Premiers pas en statistique, Ed. Springer.

processus markovien  

processus markovien