<center>
# Chaînes de Markov

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import numpy.random as rnd
%matplotlib inline

## Exercice 1 : Simulation d'une chaîne de Markov

Le langage Python dispose d'une fonction pour simuler suivant une loi discrète *rnd.choice*.
On dispose d'une matrice de transition $P$, par exemple celle modélisant le climat à Nantes et définie par :

$$P=
\begin{pmatrix}
  0.5& 0.5 \\ 0.1& 0.9
\end{pmatrix}.
$$

>**Question 1.** Simuler une valeur d'une chaîne de Markov de matrice de transition $P$ et issue de $2$.

In [8]:
pla = np.array([[.5, .5], [.1, .9]])
pla

array([[ 0.5,  0.5],
       [ 0.1,  0.9]])

>**Question 2.** Creer un vecteur $x$ qui contiendra les n premières valeurs simulées d'une chaîne de Markov issue de 2.

>**Question 3.** Ecrire une fonction $genmarkov(x,n,P)$ 
qui simule une chaîne de markov de matrice de transition p issue de $x$ et qui renvoie la valeur $X_{n-1}(\omega)$. On écrira également la fonction $vgenmarkov(x,n,P)$ qui elle renvoie le vecteur des valeurs $(X_0(\omega), ..., X_{n-1}(\omega))$.


In [6]:
def vgenmarkov(z, n, p):
    x = np.arange(n)
    x[0] = z
    dim = len(P[0])
    for i in np.arange(1, n):
        x[i] = np.random.choice(a=dim, p=p[x[i-1]])
    return(x)

In [7]:
def genmarkov(x, n ,p):
    dim = len(P[0])
    z = x
    for i in np.arange(1, n):
        y = np.random.choice(a=dim, p=p[z])
        z = y
    return z
    

>**Question 4.** Pour le climat à Nantes, vérifiez que  la proportion de temps
passé dans chaque état converge vers un nombre qui ne dépend que de
cet état et pas du point de départ. Représentez sur un même graphique le vecteur des moyennes des deux états. Tirer une conclusion de convergence. 

>**Question 5.**  Ce résultat est-il encore vrai pour les matrices $P_a$ et $P_b$ ci dessous ? Pouvez vous expliquer pourquoi ?
$$P_a=
\begin{pmatrix}
7/20&3/20&1/4&1/4\\
3/10&1/4&7/20&1/10\\
1/4&1/4&7/20&3/20\\
3/10&1/4&1/4&1/5
\end{pmatrix},\qquad 
P_b=
\begin{pmatrix}
1/2&0&0&0&1/2\\
0&1/2&0&1/2&0\\
0&0&1&0&0\\
0&1/4&1/4&1/4&1/4\\
1/2&0&0&0&1/2
\end{pmatrix}.
$$

## Exercice 2 : Calcul des probabilités de transition
On utilise également la  matrice de  transition $P$ suivante
$$P=
\begin{pmatrix}
  1/2&0&1/2&0\\
  0&1&0&0\\
  1/2&0&0&1/2\\
  0&1/2&0&1/2
\end{pmatrix}.
$$

>**Question 1.** Utiliser la loi forte des grands nombres pour calculer, pour les matrices $P_a,P_b$ des valeurs approchées de $p^{(n)}_{2,3}, p^{(n)}_{3,3}, p^{(n)}_{1,4}$ pour les valeurs de n suivantes $n=2,5,10, 20$. Par exemple, vous faites N=1000 (ou N=10000, ou N=50000) simulations de la chaîne de Markov issue de 2, puis vous comptez la proportion de fois où vous observez la valeur $3$

>**Question 2.** Vérifier vos simulations  en utilisant le calcul matriciel. Sous Python, le produit matriciel des matrices p et q s'écrit $np.dot(p,q)$ ce qui est très différent de $p*q$. Ecrivez une fonction $puis(p,n)$ qui renvoie la matrice $p^n$. (Vous pouvez utiliser un algorithme de calcul rapide de
puissance si vous savez le coder).

## Exercice 3 : Calcul de probabilités et de temps d'absorption
Premièrement, en utilisant la structure de classes, décrire les 3
comportements asymptotiques possibles pour la chaîne de Markov de
matrice de transition
$$P=
\begin{pmatrix}
 1&0&0&0&0\\
 0&1&0&0&0\\
 3/20&1/10&3/10&1/5&1/4\\
 1/5&3/20&3/20&7/20&3/20\\
 0&0&0&0&1
\end{pmatrix}.
$$

>**Question 1.** En utilisant la loi forte des grands nombres, calculer une valeur approchée de la probabilité que la chaîne de Markov, issue de 4, réussisse à atteindre l'état 2.

>**Question 2.** Essayons maintenant de répondre à la même question en utilisant le
calcul matriciel.  Ecrire la matrice de la chaîne absorbee $\tilde{P}$
sous la forme canonique 
$$\tilde{P}=
\begin{pmatrix}
  Q & R \\ 0 & I
\end{pmatrix}
$$
Puis utiliser la fonction  np.linalg.inv pour calculer
$N=(I-Q)^{-1}$ et enfin retrouver le calcul précédent de la
probabilité d'absorption en 2 lorsque l'on part de 4.

## Exercice 4 : Détermination de probabilités invariantes
On cosidère la matrice de transition $P$ définie par 
$$P=
\begin{pmatrix}
  0.5& 0.5 \\ 0.1& 0.9
\end{pmatrix}.
$$
On peut chercher les valeurs et vecteurs propres de la matrice $P$ en utilisant $np.linalg.eig(P)$. N'oublions pas que le vecteur $\mathbf{1}$  dont toutes les coordonnées sont des  $1$  est un vecteur propre avec la valeur propre 1. Ici nous cherchons une probabilité invariante, i.e. un vecteur propre à gauche. Il faut donc déterminer le spectre de la transposée.  Pour comparer des valeurs numériques $a$ et $b$, à la précision de la machine utilisée, on utilise la commande $np.isclose(a,b)$


> Ecrire une fonction $probinv(p)$
qui prenne en paramètre une matrice stochastique $p$ et qui retourne une probabilité invariante pour $p$. N'oubliez pas de normaliser le vecteur propre pour obtenir une probabilité.
Tester cette fonction avec $P$ et la matrices de transition $P$ de l'exercice $3$.

 ## Exercice 5 : Le théorème ergodique
Rappelez les conditions d'application de ce théorème. Indiquez pour chacun des exercices $4.7,4.12$ si vous avez le droit de l'appliquer et faites le, éventuellement, pour répondre aux  questions de ces exercices. 

> Vous devez déterminer la/les probabilités invariantes, la fonction $f$ dont vous prenez la moyenne temporelle (c'est un vecteur de la bonne dimension) et calculer la moyenne $<f,\pi>$.

 ## Exercice 5 : Le théorème de convergence vers l'équilibre

Relire attentivement l'énoncé de ce théorème. On cosidère la matrice de transition $P$ définie par 
$$P=
\begin{pmatrix}
  0.5& 0.5 \\ 0.1& 0.9
\end{pmatrix}.
$$

Indiquer, pour la matrice $P$ et celle de l'exercice 4.17, vers quelle matrice $P^\infty$  doit converger $P^n$ quand $n\to \infty$. \\

> Vérifier, dans ces deux cas,  que la décroissance d'une distance entre $P^n$ et $P^\infty$ est en $\rho^n$ avec $\rho \in ]0,1[$. Comparer la valeur de $\rho$ trouvée expérimentalement et la valeur théorique donnée par le théorème de Perron Frobenius.


> **Indication  ** Utiliser la fonction $distance(p,q)$ qui calcule la distance entre deux matrices.

In [3]:
def distance(p,q):
    r=(p-q)**2
    return(np.sqrt(r.sum()))