# Nested sampling
Nous avons vu en classe la procédure étape par étape du Nested sampling.
Le but de ce notebook est d'implémenter l'algorithme nous-même.
En pratique, pour le reste du cours, nous utiliserons dynesty.
On peut cependant acquérir une bonne intuition de comment le nested sampling fonction en codant une version simple.

L'algorithme est donné dans les diapos vues en classe et discuté en plus grand détail dans l'article de Skilling (2006) disponible sur StudiUM.

## Définition d'un modèle 1D simple

Pour commencer, nous allons tester notre implémentation sur une vraisemblance normale 1D avec une moyenne $\mu = 0$ et $\sigma = 1$, avec une distribution à priori entre -10 et 10.

### Transformation du prior

Pour implémenter le prior, il faut une "transformation du prior" (CDF inverse), comme nous avons vu en classe.
Cette fonction doit transformer des échantillons d'un intervalle unitaire vers la distribution souhaitée, soit $\mathcal{U}(-5, 5)$ dans ce cas-ci.

**Pour cette partie-ci, nous allons:**

- **Coder la transformation du prior dans la fonction `prior_transform()`.**
- **Tester notre transformation avec un échantillonnage aléatoire** (vérifiez que l'histogramme donne la distribution uniforme attendue entre -5 et 5.

In [None]:
from typing import Callable

import matplotlib.pyplot as plt
import numpy as np
import tqdm
from matplotlib import rcParams
from numpy.typing import NDArray

plt.style.use("tableau-colorblind10")

rcParams["font.size"] = 14



# TODO: prior transform et histogrammes

### Vraisemblance
Pour la vraisemblance, on utilise une distribution $p(D|\theta)$ gaussienne avec une seule mesure à $\theta_0 = 0$.
Implémentez le log de la vraisemblance.
Utilisez un écart type de $\sigma = 1$.

Comme la vraisemblance est facile à calculer. On peut d'abord l'afficher sur une grille.

In [None]:
# TODO: Log-likelihood et évaluation sur grille

## Algorithme Nested Sampling

On peut maintenant implémenter le nested sampling.
Voici quelques suggestions ci-dessous.

- Pour commencer, utilisez un nombre fixe d'itérations (`nsteps`) au lieu d'un critère de convergence.
- Définissez une fonction `nested_sampling()` avec la signature suggérée ci-dessous. Les arguments sont:
  - `loglike_fn`: fonction log-vraisemblance, qui prend un argument `p` (vecteur du paramètre theta avec un seul élément).
  - `pt_fn`: fonction de _prior transform_
  - `ndim`: nombre de dimension du vecteur de paramètre (1, dans ce premier exemple)
  - `nlive`: nombre de live points. Commencez par quelques centaines. 500 fonctionne bien.
  - `nsteps`: nombre d'itérations maximum.
  - N'hésitez pas à coder une première version de votre algorithme hors de la fonction, pour avoir accès facilement aux variable et "débugger".
- Pour la génération de nouveaux "live points", vous pouvez utiliser le _rejection sampling_: générer des points sur tout le prior et accepter le premier point qui satisfait $L(\theta)>L_{\text{min}}$.
  - Ce n'est pas une manière efficace de générer des points. Je vous invite à tester des alternatives (e.g. MCMC à partir d'un _live point_ tiré au hasard, échantillonnage uniforme dans un ellipsoide) si le temps vous le permet.

In [None]:
# TODO: Nested sampling

Vous pouvez maintenant afficher différentes quantités en fonction du volume du prior (ou de son logarithme):

- L'évidence
- La (log-)vraisemblance
- Le poid des échantillons
- Un histogramme pondéré de la distribution à posteriori

In [None]:
# TOOD: Graphiques

## Exercices bonus
Si vous voulez explorer ce code un peu plus, voici quelques options. Elles ne seront pas évaluées, ni utilisées dans les devoir, mais elles sont intéressantes pour approfondir votre compréhension:

- Implémentez un échantillonnage par marche aléatoire
- Testez un modèle à deux paramètre (régression linéaire) avec ce code, comparez avec dynesty.

### MCMC

Dans ce cas-ci, notre MCMC sert à explorer la distribution a priori, et non la distribution a posteriori.

- Il faut donc utiliser une fonction `log_prior` pour explorer l'espace-paramètre. Définissez d'abord cette fonction.
- Il faut aussi rejeter les échantillons avec L < Lmin, en plus de l'acceptance MCMC habituelle.
- Pour l'échelle du MCMC, vous pouvez utiliser une distribution de proposition avec la taille du MCMC.
- Itérez un certain nombre d'itération (ex.: 1000) avant de prposer de nouveaux échantillons.

In [None]:
# TODO: Définir une proposition MCMC et utiliser dans le nested sampling.

### Régression linéaire

On simule d'abord les données, on définit notre modèle probabiliste, et on lance ensuite le nested sampling.

In [None]:
m_true = -0.9594
b_true = 4.294

N = 50
x = np.sort(10 * np.random.rand(N))
yerr = 0.1 + 0.5 * np.random.rand(N)
y = m_true * x + b_true
y += yerr * np.random.randn(N)

plt.errorbar(x, y, yerr=yerr, fmt=".k", capsize=0)
x0 = np.linspace(0, 10, 500)
plt.plot(x0, m_true * x0 + b_true, "k", alpha=0.3, lw=3)
plt.xlim(0, 10)
plt.xlabel("x")
plt.ylabel("y")
plt.show()

In [None]:
# TODO: Prior, prior transform et likelihood.

In [None]:
# TODO: Nested sampling