## <font color=darkcyan>Modèles de mélange</font>

#### <font color=darkorange>Densité de mélange </font>

Considérons un mélange de $K$ lois gaussiennes dont la densité est donnée par
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{\mathcal N(\mu_k,\sigma^2_k)}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$, $\mu_k\in\mathbb R$ et $\sigma_k>0$, $k=1,\dots,K$. 


In [None]:
"""""""""""""""""
Required packages
"""""""""""""""""
import seaborn as sns
import math
import autograd.numpy as np
import pandas as pd
import scipy.stats as st
import matplotlib.pyplot as plt
# package which differentiates standard Python and Numpy code
from autograd import grad
# to get progress bars
from tqdm import tqdm

#### Question 1
Ecrire une fonction **multi_gauss** qui prend en argument une moyenne et une matrice de covariance et renvoie l'opposé de  la logdensité gaussienne associée à ces paramètres. On écrira une fonction pour une variable en dimension $d>1$.

In [None]:
def multi_gauss(mu, sigma):
    """
    Inputs
    ----------
    mu: mean of the Gaussian distribution
    sigma: covariance matrix of the Gaussian distribution
    
    Outputs
    -------
    logp: opposite of the loglikelihood
    """

    # A completer
    

#### Question 2
Ecrire une fonction **mixture** qui prend en argument différentes logdensités et un vecteur de poids et renvoie la logdensité du mélange associé.

In [None]:
def mixture(log_prob, weights):
    """
    Inputs
    ----------
    log_prob: opposite of the likelihood of each term
    weights: weights of the components of the mixture
    
    Outputs
    -------
    logp: opposite of the loglikelihood of the mixture
    """
    
    # A completer

#### Question 3
Utilisez la fonction précédente pour tracer la densité d'un mélange de trois gaussiennes en dimension 2.
Les mélanges de lois gaussiennes peuvent être implémentés directement en Python en utilisant le package `sklearn.mixture`, voir ici https://scikit-learn.org/stable/modules/mixture.html pour une aide détaillée (non nécessaire pour cette question).


In [None]:
mu1 = 2*np.ones(2)
cov1 = np.array([[1., 0.5],
                [0.5, 1.]])
mu2 = -mu1
cov2 = np.array([[1., -0.1],
                [-0.1, 1.]])

mu3 = np.array([-1.5, 2.2])
cov3 = 0.8 * np.eye(2)

logp  = mixture([multi_gauss(mu1, cov1), multi_gauss(mu2, cov2), multi_gauss(mu3, cov3)], [0.25, 0.35, 0.4])

plt.figure(figsize=(8, 8), dpi=80)

grid_lim = 6
# grid on which the target pdf is displayed
grid_plot = (-grid_lim, grid_lim, -grid_lim, grid_lim)
# coordinates chosen on this grid
nb_points = 100

xplot = np.linspace(-grid_lim, grid_lim, nb_points)
yplot = np.linspace(-grid_lim, grid_lim, nb_points)
Xplot, Yplot = np.meshgrid(xplot, yplot)

# A completer

#### Question 4
- Considérons les mélanges de loi uniforme $U[0,\lambda]$ dont la densité est donnée par 
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{U[0,\lambda_k]}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$ et $\lambda_k>0$, $k=1,\dots,K$. Ecrire une fonction **uniform_logpdf** pour évaluer la densité du mélange. Quelles formes de densité peut-on obtenir avec un mélange uniforme ?
- Mêmes questions pour les mélanges de loi Gamma $\Gamma(\alpha,\beta)$ dont la densité est donnée par 
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{\Gamma(\alpha_k,\beta_k)}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$ et $\alpha_k>0, \beta_k>0$ pour $k=1,\dots,K$.  Comparer aux formes des mélanges gaussiens.

In [None]:
def uniform_logpdf(lmbd):
    """
    Inputs
    ----------
    lmbd: upper bound of the support of the uniform distribution
    
    Outputs
    -------
    logp: opposite of the loglikelihood
    """

    # A completer

In [None]:
def gamma_logpdf(a,b):
    """
    Inputs
    ----------
    a, b: shapes and inverse scales of the gamma distribution
    
    Outputs
    -------
    logp: opposite of the loglikelihood
    """

    # A completer

In [None]:
# A completer

#### <font color=darkorange>Simulation de données</font>

#### Question 5
- Ecrire une fonction **rnormmix** pour générer des réalisations d'un mélange gaussien à $K$ composantes. Les arguments de la fonction sont la taille d'échantillon **n**, le moyennes, variances et poids des éléments du mélange.
- Tester votre fonction en générant un grand échantillon d'un mélange gaussien dont on compare l'histogramme à sa densité par un graphique.

In [None]:
def rnormmix(n, mu, sigma, weights):
    """
    Inputs
    ----------
    n: number of sample
    mu: mean of each component
    sigma: std of each component
    weights: weights of the mixture
    
    Outputs
    -------
    samples: samples from the mixture model
    """
    
    # A completer

In [None]:
# A completer

#### <font color=darkorange>Estimation du modèle</font>

#### Question 6
- Estimez les paramètres du modèle en utilisant les échantillons précédents et le package `mixture` de `sklearn`. On pourra utiliser la classe `GaussianMixture` et la méthode `fit`.
- Fournissez les paramètres estimés (à l'aide des attributs `means_`, `weights_`, etc.).

In [None]:
# A completer