Une chaîne de Markov est un processus stochastique qui renseigne sur la probabilité d'observer une succession de $n$ événements. On considère ces événéments comme une séquence de $n$ variables aléatoires que l'on note $\boldsymbol{X} = (X_1, X_2, ..., X_n)$. Une chaîne de Markov peut être déterminée à partir de trois ensembles de paramètres :

- un ensemble de $p$ états $\mathcal{X} = \{s_1, s_2, s_3, ..., s_p\}$
- une matrice de transition $A$. Chaque élément $a_{ij}$ de A
représente la probabilité de transitionner de l'état i au temps t vers l'état j au temps t+1 :

$$
A = \begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1p}\\
a_{21} & a_{22} & \cdots & a_{2p}\\
\vdots & \vdots & \ddots & \vdots\\
a_{p1} & a_{p2} & \cdots & a_{pp}
\end{bmatrix}
$$

- un vecteur de distributions initiales pour chaque état $\Pi$:

$$
\Pi = \begin{bmatrix}
\pi_{1}\\
\pi_{2}\\
\vdots\\
\pi_{p}\\
\end{bmatrix}
$$

### Partie I - Compréhension du modèle

On se place désormais dans le cas d'application suivant. On souhaite développer un modèle de Markov de premier ordre capable de prédire la météo du prochain jour. Pour cela, on détermine trois états discrets : Nuageux, Pluvieux et Ensoleillé.

**Question 1** : Que devient l'ensemble des états $\mathcal{X}$ dans ce cas de figure ?

**Question 2** : Que devient la matrice de transition A dans ce cas de figure ? Pour compléter la matrice, on utilisera des variables avec une notation sous la forme $a_{s_{from},s_{to}}$.

**Question 3** : Que devient le vecteur de distributions initiales $\Pi$ dans ce cas de figure ? Pour compléter le vecteur, on utilisera des variables avec une notation sous la forme $\pi_{s_i}$.

Dans cette première partie, on considère que les paramètres du modèle sont donnés par des experts. On considère les éléments suivants :

- La probabilité de rester dans l'état Ensoleillé est de 0.5
- La probabilité de rester dans l'état Pluvieux est de 0.2
- La probabilité de rester dans l'état Nuageux est de 0.4

- La probabilité de transitionner de l'état Ensoleillé vers l'état Pluvieux est de 0.1
- La probabilité de transitionner de l'état Ensoleillé vers l'état Nuageux est de 0.4
- La probabilité de transitionner de l'état Pluvieux vers l'état Ensoleillé est de 0.2
- La probabilité de transitionner de l'état Pluvieux vers l'état Nuageux est de 0.6
- La probabilité de transitionner de l'état Nuageux vers l'état Ensoleillé est de 0.3
- La probabilité de transitionner de l'état Nuageux vers l'état Pluvieux est de 0.3

**Question 4** : Compléter le diagramme de la chaîne de Markov ci-dessous avec les valeurs numériques correspondantes :

In [None]:
from IPython.display import display, Image, HTML
html_code = '''
<div style="text-align: center;">
    <img src="MC_1.jpg" width="600">
</div>
'''
display(HTML(html_code))

**Question 5** : Remplacer les variables de la matrice de transition précédente par leur valeur numérique correspondante.

**Question 6** : Par construction, que vaut la somme des éléments de $\Pi$ ? Quelle contrainte similaire porte sur les éléments de la matrice A ? Vérifier que cette contrainte est satisfaite pour la matrice A.

**Question 7** : Compléter maintenant la matrice $\Pi$ à l'aide des informations complémentaires suivantes :
- la probabilité que le premier jour soit Ensoleillé est de 0.7
- la probabilité que le premier jour soit Nuageux est de 0.2

**Question 8** : Quelle est la propriété (ou hypothèse) de Markov dans le cadre de ce modèle d'ordre 1 ?

### Partie II - Implémentation

Nous allons maintenant coder la classe MC1, qui permet de définir un objet correspondant à une chaîne de Markov d'ordre 1. 

- Première version : basée sur une seule séquence d'états

In [None]:
import numpy as np
from collections import Counter

In [None]:
class MC1_single_inputs():
    """
    Single inputs implementation of a first order Markov Chain.
    This algorithm takes a sequence of states as input, and can be used to infer the likelihood of an input sequence
    or estimate the probability of a state taking place in the next timestep, given an input sequence.

    """

    def encode_states(self, sequence):
        """Encodes a list of strings to numerical categorical values.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.
        """
        # ...

    def compute_init_distribution_vector(self):
        """Computes the vector of initial distributions Pi.

        """
        self.init_dist = np.zeros(self.p)
        self.init_dist[self.states_encoding['sunny']] = # ...
        self.init_dist[self.states_encoding['cloudy']] = # ...
        self.init_dist[self.states_encoding['rainy']] = # ...

    def compute_transition_matrix(self, sequence):
        """Computes the transition matrix A.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.
        """
        # ...

    def normalize_transition_matrix(self):
        """Normalizes the previously computed transition matrix.

        """
        # ...
    
    def fit(self, sequence):
        """Estimates all the parameters of the first order Markov chain.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.
        """
        self.encode_states(sequence)
        self.compute_init_distribution_vector()
        self.compute_transition_matrix(sequence)
        self.normalize_transition_matrix()

    def predict_proba_next_state(self, sequence):
        """Predicts the probabilities of the next state occurring, given an input sequence of previous states.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.

		Returns
		-------
		options_dict : dict of structure {state:probability}.
		A dictionary reporting the probability of each state taking place in the next timestep.
        """
        # ...

    def compute_likelihood(self, sequence):
        """Computes the likelihood of an input sequence of states.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.

		Returns
		-------
		likelihood : float.
		The likelihood of the input sequence.
        """
        # ...

**Question 9** : On considère la séquence de 8 états suivante : $\boldsymbol{X} = [s_s, s_r, s_c, s_s, s_s, s_s, s_c, s_r]$. Quelle est la vraisemblance de cette succession d'états ?

In [None]:
sequence_test = ['sunny', 'rainy', 'cloudy', 'sunny', 'sunny', 'sunny', 'cloudy', 'rainy']
MC1_si_model = MC1_single_inputs()
MC1_si_model.fit(sequence_test) 

In [None]:
MC1_si_model.states_encoding # ne pas supprimer cette cellule pour faciliter la verification

In [None]:
MC1_si_model.normalized_transition_matrix # ne pas supprimer cette cellule pour faciliter la verification

In [None]:
MC1_si_model.compute_likelihood(sequence_test)

**Question 10** : On souhaite maintenant appliquer notre modèle à une tâche de prévision météo. Etant donné que l'on vient d'observer la séquence précédente, quelle est la probabilité que le prochain jour soit ensoleillé ? Nuageux ? Pluvieux ?

In [None]:
MC1_si_model.predict_proba_next_state(sequence_test)

**Question 11** : Même question, appliquée à la séquence suivante : $\boldsymbol{X_2} = [s_s, s_c, s_r]$. Que remarquez-vous ?

In [None]:
sequence_test_2 = ['sunny', 'cloudy', 'rainy']
MC1_si_model.predict_proba_next_state(sequence_test_2)

**Question 12** : Même question, appliquée à la séquence suivante : $\boldsymbol{X_3} = [s_c, s_r, s_s, s_c, s_r, s_c]$. 

In [None]:
sequence_test_3 = ['cloudy', 'rainy', 'sunny', 'cloudy', 'rainy', 'cloudy']
MC1_si_model.predict_proba_next_state(sequence_test_3)

- Deuxième version : basée sur une liste de séquence d'états (par exemple, une séquence correspond à l'évolution à New-York, une autre à Johannesburg, etc.)?

In [None]:
class MC1_multiple_inputs():
    """
    Multiple inputs implementation of a first order Markov Chain.
    This algorithm takes a sequence of states as input, and can be used to infer the likelihood of an input sequence
    or estimate the probability of a state taking place in the next timestep, given an input sequence.

    """
    
    def encode_states(self, sequences):
        """Encodes a list of strings to numerical categorical values.

        Parameters
        ----------
        sequences : list of list of strings, of length nb_sequences.
        A list of states.
        """
        # Modifications attendues par rapport à la précédente classe.

    def compute_init_distribution_vector(self):
        """Computes the vector of initial distributions Pi.

        """
        # Rien à modifier par rapport à la précédente classe.

    def compute_transition_matrix(self, sequences):
        """Computes the transition matrix A.

        Parameters
        ----------
        sequences : list of list of strings, of length nb_sequences.
        A list of states.
        """
        # Modifications attendues par rapport à la précédente classe.

    def normalize_transition_matrix(self):
        """Normalizes the previously computed transition matrix.

        """
        # Rien à modifier par rapport à la précédente classe.

    def fit(self, sequences):
        """Estimates all the parameter of the first order Markov chain.

        Parameters
        ----------
        sequences : list of list of strings, of length nb_sequences.
        A list of states.
        """
        self.encode_states(sequences)
        self.compute_init_distribution_vector()
        self.compute_transition_matrix(sequences)
        self.normalize_transition_matrix()

    def predict_proba_next_state(self, sequence):
        """Predicts the probabilities of the next state occurring, given an input sequence of previous states.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.

		Returns
		-------
		options_dict : dict of structure {state:probability}.
		A dictionary reporting the probability of each state taking place in the next timestep.
        """
        # Rien à modifier par rapport à la précédente classe.

    def compute_likelihood(self, sequence):
        """Predicts the probabilities of the next state occurring, given an input sequence of previous states.

        Parameters
        ----------
        sequence : list of strings, of length n_states.
        A list of states.

		Returns
		-------
		likelihood : float.
		The likelihood of the input sequence.
        """
        # Rien à modifier par rapport à la précédente classe.

In [None]:
sequences_test = [
                  ['sunny', 'cloudy', 'sunny', 'sunny', 'sunny', 'cloudy', 'cloudy', 'cloudy'],
                  ['rainy', 'rainy', 'cloudy', 'sunny', 'cloudy', 'rainy'],
                  ['sunny', 'sunny', 'cloudy', 'cloudy', 'rainy', 'cloudy', 'rainy', 'cloudy', 'sunny', 'rainy', 'cloudy', 'rainy', 'sunny'],
                  ['rainy', 'rainy', 'rainy', 'cloudy', 'rainy', 'cloudy', 'cloudy', 'cloudy', 'cloudy', 'rainy']
                 ]

MC1_mi_model = MC1_multiple_inputs()
MC1_mi_model.fit(sequences_test)

In [None]:
MC1_mi_model.states_encoding # ne pas supprimer cette cellule pour faciliter la verification

In [None]:
MC1_mi_model.normalized_transition_matrix # ne pas supprimer cette cellule pour faciliter la verification

**Question 13** : On considère à nouveau notre séquence de 8 états précédente : $\boldsymbol{X} = [s_s, s_r, s_c, s_s, s_s, s_s, s_c, s_r]$. Quelle est maintenant la probabilité d'observer cette succession d'états ?

In [None]:
MC1_mi_model.compute_likelihood(sequence_test)

**Question 14** Appliquer ce nouveau modèle aux séquences de test 1, 2 et 3 précédentes. Comment les probabilités d'observer chaque état ont-elles évolué ? 

In [None]:
MC1_mi_model.predict_proba_next_state(sequence_test)

In [None]:
MC1_mi_model.predict_proba_next_state(sequence_test_2)

In [None]:
MC1_mi_model.predict_proba_next_state(sequence_test_3)