# TP Chaînes de Markov

## 1- Génération d'une variable aléatoire discrète

### Exemple : 
On se place sur un espace fini
$$
E= \{ Rouge, Bleu, Vert\}
$$

On souhaite simuler une variable aléatoire de loi :
$$
\begin{array}{c|ccc}
X & Rouge & Bleu & Vert \\
\hline
\mathbb{P}(X=k) & \frac{1}{2} & \frac{1}{3} & \frac{1}{6}
\end{array}
$$

Pour cela, on se sert de la fonction Python
$$ np.random.uniform(0,1) $$
qui simule une loi uniforme sur [0,1]

In [1]:
import numpy as np
import matplotlib.pyplot as plt

In [9]:
#Simulation d'une réalisation de la variable aléatoire X 
x=np.random.uniform(0,1)
if x <= 1/2 :
    print("Rouge");
elif x<= 5/6 :
    print("Bleu");
else: print("Vert");
    


Vert


Expliquer pourquoi l'exemple précédent fonctionne.

### Exercice 1
Soit $m\in\mathbb{N}$. On se place sur l'ensemble 
$$
E_m= \{0, 1, ..., m\}
$$
1. Écrire une fonction "Simu" qui prend en entrée un vecteur de probabilité $$\mu=(p_0~~\ldots ~~ p_m)$$ et qui simule une observation d'une variable aléatoire $X$ telle que $\mathbb{P}(X=k)=p_k$ pour tout $k\in E_m$.

2. Vérifier son bon fonctionnement pour le vecteur $$\mu=(1/4,1/3,1/12,1/6,1/6).$$

In [10]:
# Définition de la fonction Simu
def Simu(mu):
    u = np.random.uniform(0,1)
    c = np.cumsum(mu)
    c = np.insert(c,0,0, axis=0)
    for i in range(len(mu)):
        if u > c[i] and u <= c[i+1]:
            return i


In [16]:
# Test de la fonction Simu
mu=(1/4,1/3,1/12,1/6,1/6)
for i in range(10):
    print(Simu(mu))

1
4
0
0
1
1
4
0
1
1


## 2- Application à la simulation d'une chaîne de Markov

### Exemple :

On considère la chaîne de Markov sur $E_2=\{0,1,2\}$ de matrice de transition
$$P= \begin{pmatrix} 0 & 0.1 & 0.9 \\ 0.1 & 0 & 0.9 \\ 0.5 & 0.5 & 0 \end{pmatrix}$$

On rappelle que si $\mu_n$ désigne la loi de $X_n$, c'est à dire:
$$
\mu_n= 
\begin{pmatrix}\mathbb{P}(X_n=0)& \mathbb{P}(X_n=1)& \mathbb{P}(X_n=2)
\end{pmatrix}
$$


Alors, on a la relation:
$$
\mu_{n+1} = \mu_{n}P
$$

Prenons $X_0$ de loi 
$$
\mu_0 = \begin{pmatrix}
\frac{1}{2}& \frac{1}{3}& \frac{1}{6}
\end{pmatrix}
$$

On donne le code suivant.

In [None]:
# Simulation de n pas dans la chaîne de Markov:
n=100
Mkv=[]

# Simulation de X_0:
mu_0=(1/2,1/3,1/6)
Mkv.append(Simu(mu_0))

# Matrice de transition:
P = np.array([[0, 0.1, 0.9],
              [0.1, 0, 0.9],
              [0.5, 0.5, 0.0]])
    

for i in range(n):
    State = Mkv[-1] # On sélectionne la ligne de P correspondant à l'état dans lequel est la chaîne
    mu_i= P[State] 
    Mkv.append(Simu(mu_i))# On simule une réalisation de loi la ligne correspondante.


print(Mkv)


S'approprier le code ci dessus. On pourra par exemple :
- faire varier le nombre de pas dans la chaîne de Markov ;
- changer la matrice de transition et/ou la probabilité initiale.

### Exercice 2 : 
On souhaite simuler une chaîne de Markov sur $E_m=\{0,\ldots,m\}$. 
Écrire une fonction "Markov" qui prend en paramètres :
- une loi initiale, 
- une matrice de transition,
- un nombre $n$ de pas à simuler 

et qui retourne un vecteur contenant les $n+1$  états parcourus par la chaîne de Markov.

Vérifier le bon fonctionnement du code à l'aide de l'exemple précédent.

### Représentation et visualisation

Revenons à notre exemple. On peut chercher à représenter la trajectoire en fonction du nombre de pas :

In [None]:
#Représentation de la chaîne de Markov donné en exemple :
Niter=range(n+1)
plt.plot(Niter,Mkv)

On voit qu'en temps long, ce genre de graphique n'est pas très utile. 
À la place, on dessine un histogramme :

In [None]:
plt.hist(Mkv, range = (-0.5, 2.5), density=False, bins = 3,edgecolor = 'red')

### Exercice 3 :

1. Se servir du code écrit à l'exercice 2 pour simuler $n$ pas d'une chaîne de Markov $(X_n)_{n \in \mathbb{N}}$ et représenter l'histogramme obtenu pour différentes valeurs de $n$. 
<br>
On prendra différentes matrices de transitions et lois initiales donnant :
- une chaîne irréductible, récurrente et apériodique,
- une chaîne avec plusieurs états transitoires et une seule classe récurrente,
- une chaîne avec plusieurs classes récurrentes.
<br>
<br>
Pour chaque exemple, illustrer en faisant plusieurs simulations avec différents choix de loi initiale, le comportement de la chaîne de Markov et commenter les résultats obtenus.

#### Une simulation de chaîne irréductible, récurrente et apériodique :

#### Commentaires :
<br>
<br>
<br>

#### Une simulation de chaîne comportant plusieurs états transitoires  et une seule classe récurrente :

#### Commentaires :
<br>
<br>
<br>

#### Une simulation de chaîne comportant plusieurs classes récurrentes :

#### Commentaires :
<br>
<br>
<br>

### 3- Loi de $X_n$

Ecrire une fonction puissanceM qui prend en arguments une matrice $M$ et un entier naturel $n$ et renvoie la puissance $n^{\textrm{ième}}$ de la matrice $M$.

On pourra utiliser la commande np.dot pour le produit matriciel.

La tester sur l'exemple ci-dessous.

In [None]:
# Exemple 
M = np.array([[0, 1, 2],
              [1, 1, 0],
              [0, -1, 1]])
# Calcul des puissances de P
puissanceM(M,14)

### Exercice 4 : 

1. Écrire un programme "LoiXn" qui prend en arguments : 
- une matrice de transition,
- un entier n,
- le vecteur qui représente la loi initiale,
<br>
et qui renvoie la loi de $X_n$ (sous forme d'un vecteur).

On considère à nouveau la chaîne de Markov $(X_k)_{k\in \mathbb{N}}$ sur $E_2$ de matrice de transition
$$P= \begin{pmatrix} 0 & 0.1 & 0.9 \\ 0.1 & 0 & 0.9 \\ 0.5 & 0.5 & 0 \end{pmatrix}.$$

2. Donner la loi $\mu_{n}$ de $X_n$ lorsque $\mathbb{P}(X_0=0)=1$ pour différentes valeurs de $n$.

In [None]:
P = np.array([[0, 0.1, 0.9],
              [0.1, 0, 0.9],
              [0.5, 0.5, 0.0]])


a. Que constate-t-on ? 
<br>
<br>
<br>
<br>
b. Illustrer graphiquement le résultat obtenu.

c. Faire de même avec différents choix de loi initiale. Que remarque-t-on ?


d. Considérons $\mu_{100}$. Calculer $\mu_{100}P$.

- Que constate-t-on ? 
<br>
<br>
- Quel résultat cela illustre-il ? 
<br>
<br>
<br>
<br>

3. On considère maintenant la chaîne $(Z_n)_{n\in \mathbb{N}} $ sur $\{0,1,2,3\}$ de matrice de transition :
    $$P_a= \begin{pmatrix} 0  & 0.4 & 0   & 0.6 \\ 
                        0.3 & 0   & 0.7 & 0   \\ 
                         0  & 0.6 & 0   & 0.4  \\
                        0.2 & 0   & 0.8 & 0     
\end{pmatrix}$$

In [None]:
Pa = np.array([[0, 0.4, 0,0.6],
              [0.3, 0, 0.7,0],
              [0, 0.6, 0.0,0.4],
              [0.2, 0,0.8,0]])

a. Calculer la loi de $Z_n$ pour $n$ grand et pair avec pour loi initiale 
$$\mu_0=(1~~0~~0~~0).$$

b. Faire de même avec $n$ grand et impair. 

c. Que constate-t-on ? À quoi cela est-il dû ?  

4. On considère maintenant le vecteur $$\mu=(0,1275~~0,2745~~0,3725~~0,2250)$$ et le produit $\mu P_a$ : 

In [None]:
mu=np.array([0.1275,0.2745,0.3725,0.2255])
print("mu=",mu)
muPa=np.dot(mu,Pa)
print("muPa=",muPa)

a. Que constate-t-on ?

b. Comparer le vecteur $\mu$ avec les distributions limites des sous-suites $(X_{2n})_{n\in\mathbb{N}}$ et $(X_{2n+1})_{n\in\mathbb{N}}$. Commenter.

5. Étudier la convergence en loi pour une chaîne qui comporte des états transitoires et une seule classe récurrente.

#### Remarque :
Pour éviter des calculs de puissance d'une grosse matrice, on pourrait laisser évoluer la chaîne de Markov pendant un certain temps et *compter* la proportion du temps passé dans chaque état.

## 4- Application

France TV a lancé fin 2020 sa plate-forme de streaming, "Salto".
Elle devait se faire une place entre Netflix et Disney+, les plus gros intervenants du secteur.

On suppose que la distribution des parts de marché est comme suit:

$$
\begin{array}{c|cccc}
Service & Netflix & Disney+ & Salto & SansAbonnement \\
\hline
Part \  de \  marché & .55 & .2 & .1 & .15
\end{array}
$$

Disney+ s'inquiète alors de l'évolution du marché si rien n'est fait et contacte une agence de publicité. L'agence leur indique qu'avec la campagne qu'elle leur propose, les abonnées des différentes plateforme passeront, chaque semaine, d'une plateforme à l'autre selon ce qu'indique la matrice suivante : 

$$
\begin{array}{c|cccc}
 & Netflix & Disney+ & Salto & SansAbonnement \\
 \hline 
Netflix& 0.9262 & 0.0385 & 0.01&  0.0253 \\
Disney+&0.01& 0.94& 0.01& 0.04\\
Salto&0.01& 0.03& 0.92& 0.04\\
SansAbonnement&0.035& 0.035& 0.035& 0.895              
\end{array}
$$
C'est à dire qu'un usager de Netflix a une probabilité 92.62 \% de rester sur Netflix pour la semaine, 3,85\% de de passer chez Disney+, 1\% de passer chez Salto, etc.


### Exercice 6 :

- Simuler le comportement de $N$ abonnées après trois semaines de campagne, puis après vint semaines.
- Calculer la loi de $X_n$ pour $n$ grand.
- Interpréter les résultats obtenus.

In [None]:
S = np.array([[0.9262, 0.0385, 0.01, 0.0253],
              [0.01, 0.94, 0.01, 0.04],
              [0.01, 0.03, 0.92, 0.04],
             [0.035, 0.035, 0.035, 0.895]])

mu_S=np.array([0.55, 0.2, 0.1, 0.15])

## 5- Cas d'une chaîne de Markov sur un espace infini

Dans cette dernère partie, on s'intéresse à une chaîne de Markov sur un espace d'états infini. 

### Exercice  7 : 
- Simuler la marche aléatoire (partant de 0) sur $\mathbb{N}$ à l'aide d'une suite de variables aléatoires de Rademacher:
$$
\mathbb{P}(X_n= 1)=p = 1-\mathbb{P}(X_n= -1).
$$

- Comparer les comportements de la chaîne pour $p<1/2$, pour  $p>1/2$ et pour $p=1/2$.
- Représenter graphiquement ces 3 cas.

### Modèle de Stock 

On considère l'exemple de l'exercice 5 de la feuille de TD 2. 
On pourra utiliser sans preuve les résultats de cet exercice.

On note $X_n$ l'état d'un stock de pièces détachées à l'instant $n$, $D_{n+1}$ la demande (aléatoire) formulée par des clients, et on suppose qu'une seule pièce détachée est fabriquée entre les instants $n$ et $n+1$.

L'état du stock à l'instant $n+1$ est alors
$$X_{n+1} = \max(X_n + 1 - D_{n+1},0).$$


On suppose que $X_0 = 0$ (le stock est initialement vide) et que $(D_n)_{n \geq 1}$ est une suite de v.a. indépendantes et de même loi que $D$, une v.a. à valeurs dans $\{0,1,2\}$:

$$
\begin{array}{c|ccc}
D & 0 & 1 & 2 \\
\hline
\mathbb{P}(D=k) & p_0 & p_1 & p_2
\end{array}
$$

On suppose que les trois probabilités $p_0,p_1,p_2$ sont strictement positives, et $p_2 \ge p_1$.


### Exercice 9 :

- Simuler cette chaine de Markov (partant de 0)  pour différentes valeurs de $p_0,p_1,p_2$.


- Étudier le cas $p_0=p_2$. 
- En question 5 de l'exercice 5, on montre que si $p_0 < p_2$,
$$
\mu(k) = \left(\frac{p_0}{p_2}\right)^k
$$
est une mesure invariante pour la chaine. 


- Comparer le vecteur des fréquences empiriques avec la probablité invariante.

On définit la variable aléatoire: 

$$
T= \inf\{n \geqslant 1 \vert X_n=0 \}.
$$

- Que représente $T$?

- Simuler une réalisation de T et afficher l'évolution de la chaîne au cours du temps.

- Calculer numériquement $\mathbb{E}[T]$ pour $p_0<p_2$ 
- Comparer avec la valeur théorique.