# TP2 : MCMC (Partie 1)

## G3 SDI - Estimation Avancée

Dans ce TP, on s'intéresse aux méthodes d'échantillonnage dites "MCMC" (Monte Carlo par Chaînes de Markov). Le premier exercice consiste à implémenter un Metropolis-Hastings et de regarder l'influence de quelques paramètres. Dans un deuxième exercice, on cherchera à implémenter un échantillonneur de Gibbs dans un modèle de régression linéaire bayésienne (disponible dans un deuxième notebook).

### Instructions

1. Renommez votre notebook sous la forme `tp2a_Nom1_Nom2.ipynb`. 

2. Votre code, ainsi que toute sortie du code, doivent être commentés !

3. Déposez votre notebook sur Moodle dans la section prévue à cet effet avant la date limite.

<div style="background-color: rgba(255, 255, 0, 0.15); padding: 8px;">
Compte-rendu écrit par [nom1], [nom2], date.
</div>

In [8]:
# Usual libraries
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as ss

### Exercice - Régression logistique bayésienne

Soit le modèle de régression logistique 1D suivant :
\begin{align}
\beta & \sim \mathcal{N}(0,4) \\
y | x_i, \beta & \sim \text{Bernoulli} \left( \frac{1}{1+\exp(-\beta x)} \right)
\end{align}

(I.e., on suppose que l'intercept vaut 0 pour simplifier).

Le posterior $p(\beta|\mathcal{D})$ est intractable, on va donc chercher à en tirer des échantillons par un algorithme Metropolis-Hastings (MH). On prendra comme loi instrumentale une loi normale centrée en l'état courant et de variance $\sigma^2$.


In [9]:
# Generate fake data from the model

np.random.seed(2024)

b = -2.5
N = 50
x = np.random.randn(N)
p = 1/(1+np.exp(-b*x))
y = np.random.rand(N) < p

**Q1.** Écrire une fonction implémentant l'algorithme MH proposé pour tirer des échantillons de $p(\beta|\mathcal{D})$, qui prend comme arguments :
* La taille de la chaine N ;
* L'état initial de la chaîne $\beta^{(0)}$ ;
* L'écart-type $\sigma$ de la *proposal* gaussienne ;
* Une graine aléatoire.

On utilisera les fonctions implémentées dans `scipy.stats` pour les pdfs !

In [12]:
beta0=0

def likelihood(x,y,beta):
    conjointe=1
    for xi in x:
        conjointe*=ss.bernoulli.rvs(1/(1+np.exp(-beta*xi)))
    prior=ss.norm.rvs(0,4)
    likelihood=conjointe/prior
    return likelihood
    

def mh(N, beta0, sigma, seed):
    np.random.seed(seed) 
    beta_chain = np.zeros(N)
    beta_chain[0]=beta0
    for i in range(1, N):
        beta_old=beta_chain[i-1]
        beta_new=ss.norm.rvs(loc=beta_old, scale=sigma)
        prior1=ss.norm.rvs(0,4)
        prior2=ss.norm.rvs(0,4)
        likelihood1=likelihood(x,y,beta_new)
        likelihood2=likelihood(x,y,beta_old)
        qold=ss.norm.rvs(loc=beta_new, scale=sigma)
        qnow=ss.norm.rvs(loc=beta_old, scale=sigma)
        value=(prior1*likelihood1*qold)/(prior2*likelihood2*qnow)
        alpha=min(1,value)
        if alpha>1-alpha:
            beta_chain[i]=beta_new
        else:
            beta_chain[i]=beta_chain[i-1]
        return beta_chain

**Q2**. Prendre $N = 2000$ et $\beta^{(0)} = -1.5$. Afficher les *traceplots* (i.e. les échantillons en fonction de $n$) de la chaîne pour des valeurs différentes de $\sigma$ : $0.01, 0.5, 20$. Dans chaque cas, tracer un histogramme des échantillons obtenus. Commenter.

In [13]:
N= 2000
beta0=-1.5
beta_chain=mh(N, beta0, 0.01, 42)
print(beta_chain)

[-1.5        -1.49503286  0.         ...  0.          0.
  0.        ]


  value=(prior1*likelihood1*qold)/(prior2*likelihood2*qnow)


<div style="background-color: rgba(255, 255, 0, 0.15); padding: 8px;">
Votre réponse ici
</div>

**Q3.** Prendre $N = 2000$ et $\sigma = 0.5$. Afficher les *traceplots* pour $\beta^{(0)}$ valant $-2$ et $20$. Dans chaque cas, tracer un histogramme des échantillons obtenus. Commenter.

In [None]:
##########
##### YOUR CODE HERE
##########

<div style="background-color: rgba(255, 255, 0, 0.15); padding: 8px;">
Votre réponse ici
</div>

**Q4.** À partir d'échantillons d'une chaîne avec des valeurs de $\beta^{(0)}$ et $\sigma$ bien choisies, donner le MMSE de $\beta$ ainsi que son intervalle de crédibilité à $95\%$.

In [None]:
##########
##### YOUR CODE HERE
##########

<div style="background-color: rgba(255, 255, 0, 0.15); padding: 8px;">
Votre réponse ici
</div>