# TP2 - MCMC

## Estimation avancée - G3 SDIA

Dans ce TP, on s'intéresse aux méthodes d'échantillonnage dites "MCMC" (Monte Carlo par Chaînes de Markov). Le premier exercice consiste à implémenter un Metropolis-Hastings et de regarder l'influence de quelques paramètres. Le deuxième exercice mettra en oeuvre une méthode de régression bayésienne linéaire (disponible dans un deuxième notebook).

### Instructions

1. Renommer votre notebook sous la forme `tp2a_Nom1_Nom2.ipynb`, et inclure le nom du binôme dans le notebook. 

2. Votre code, ainsi que toute sortie du code, doivent être commentés !

3. Déposer votre notebook sur Moodle dans la section prévue à cet effet avant la date limite : 10 Décembre 2023, 23h59.

In [None]:
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as ss

### Partie 1 - Metropolis-Hastings

Dans cet exercice, on cherche à générer des échantillons d'une loi appelée *skew-normal* (cf. [Wikipedia](https://en.wikipedia.org/wiki/Skew_normal_distribution)). C'est une loi à support sur $\mathbb{R}$ à trois paramètres : $\alpha \in \mathbb{R}$ (paramètre de skewness), $\xi \in \mathbb{R}$ (paramètre de position), et $\sigma > 0$ (paramètre d'échelle). Dans ce TP nous prendrons $\alpha = 4, \xi = 0, \sigma = 3$.

L'objectif est d'implémenter un algorithme Metropolis-Hastings (MH) avec une loi instrumentale Gaussienne $\mathcal{N}(x_n, \sigma_0^2)$ (i.e., centrée en l'état courant, de variance $\sigma_0^2$).

In [None]:
# pdf of the target distribution
a = 4
lc = 0
sc = 3
x = np.linspace(-4,12,500)
y = ss.skewnorm.pdf(x, a, loc=lc, scale=sc)
plt.plot(x,y)
plt.title('pdf de la loi cible')
plt.tight_layout()

**Q1.** Écrire une fonction qui implémente l'algorithme MH proposé, prenant comme arguments :
* La taille de la chaine N
* L'état initial $x_0$
* L'écart-type $\sigma_0$ de la *proposal* gaussienne
* Une graine aléatoire

Pensez à utiliser les fonctions implémentées dans `scipy.stats` pour les pdfs !

In [None]:
def metropolis_hastings(N, x0, s, seed):
    #######
    ## YOUR CODE HERE
    #######

**Q2**. Prendre $N = 1000, x_0 = 1$. Afficher les *traceplots* (échantillons en fonction de $n$) de la chaine pour des valeurs différentes de $\sigma$ : $0.1, 2, 40$.

Pour chacun des cas, comparer la pdf de la loi cible à une estimation par noyaux de la densité ou un histogramme. Commenter.

In [None]:
N = 1000
x0 = 1
s_tab = [0.1, 2, 40]
#######
## YOUR CODE HERE
#######

**Q3.** Prendre $N = 1000, s = 2$. Afficher les *traceplots* pour $x_0$ valant 0 et 50.

Pour chacun des cas, comparer la pdf de la loi cible à une estimation par noyaux de la densité ou un histogramme. Commenter.

In [None]:
N = 1000
s = 2
x0_tab = [0, 50]
#######
## YOUR CODE HERE
#######