In [None]:
"""""""""""""""""
Required packages
"""""""""""""""""
import math
import numpy as np
import pandas as pd
import scipy.stats as st
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme() 

# <font color=darkcyan>Modèles de mélange</font>

## <font color=darkorange>Densité de mélange </font>

Considérons un mélange de $K$ lois dont la densité est donnée par
$$f(x, \theta)=\sum_{k=1}^K\pi_kf(x, \theta_k),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$, $\theta = (\theta_1, \ldots, \theta_K)$. 

Dans l'optique du calcul de l'estimateur de maximum de vraisemblance, nous désirons calculer la logdensité du mélange, à partir des logdensités des composantes du mélange. 

#### Question 1
Ecrire une fonction `mixture_logpdf` qui prend en argument une liste de logdensités et une liste de poids et renvoie la logdensité du mélange associé.

### Mélange de gaussiennes multivariées

Considérons un mélange de $K$ lois gaussiennes multivariées dont la densité est donnée par
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{\mathcal N(\mu_k,\Sigma_k)}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$, $\mu_k\in\mathbb R^d$ et $\Sigma_k \in \mathcal{M}_d(\mathbb R)$ semi-definie positive, $k=1,\dots,K$. 

#### Question 2
Ecrire une fonction `multi_gauss_logpdf` qui prend en argument une moyenne et une matrice de covariance et renvoie la logdensité gaussienne associée à ces paramètres. On écrira une fonction pour une variable en dimension $d>1$. On rappelle que

$$f_{\mathcal N(\mu,\Sigma)}(x) = \frac {1}{(2\pi )^{d/2} \det(\Sigma )^{1/2}}\;\;e^{-{\frac {1}{2}}(x-\mu )^{\top }\Sigma ^{-1}(x-\mu )} \quad \forall x\in\mathbb R ^d$$

#### Question 3
Utilisez la fonction `mixture_logpdf` pour tracer la densité d'un mélange de trois gaussiennes en dimension 2, de paramètres
\begin{equation*}
\mu_1 = \binom 2  2, 
\Sigma_1 = 
\begin{pmatrix}
1. & 0.5 \\
0.5 & 1.
\end{pmatrix}, \quad
\mu_2 = -\mu_1, 
\Sigma_2 = 
\begin{pmatrix}
1. & -0.1 \\
-0.1 & 1.
\end{pmatrix}, \quad
\mu_3 = \binom{-1.5 }{ 2.2}, 
\Sigma_3 = 
\begin{pmatrix}
0.8 & 0 \\
0 & 0.8
\end{pmatrix}
\end{equation*}

Les mélanges de lois gaussiennes peuvent être implémentés directement en Python en utilisant le package `sklearn.mixture`, voir ici https://scikit-learn.org/stable/modules/mixture.html pour une aide détaillée (non nécessaire pour cette question).


## Mélange de lois uniformes
Considérons les mélanges de lois uniformes $U_k \sim \mathcal U([0,\lambda_k])$, $k=1,\ldots,K$, dont la densité est donnée par 
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{U_k}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$ et $\lambda_k>0$, $k=1,\dots,K$.

#### Question 4
- Écrire une fonction `uniform_logpdf` qui prend en argument un paramètre $\lambda$ et renvoie la logdensité de la loi uniforme $U\sim\mathcal U([0,\lambda])$. 

- Quelles formes de densité peut-on obtenir avec un mélange de lois uniformes ?

- Afficher dans un même graphe la densité du mélange uniforme de paramètres $(\lambda_1, \lambda_2, \lambda_3) = (2,7,15)$ et de poids $(w_1, w_2, w_3) = (0.15, 0.40,0.45)$, ainsi que les densités de chacune de ses composantes.


## Mélange de lois Gamma

Considérons les mélanges de loi Gamma $\Gamma(\alpha,\beta)$ dont la densité est donnée par 
$$f_\theta(x)=\sum_{k=1}^K\pi_kf_{\Gamma(\alpha_k,\beta_k)}(x),$$
où $0<\pi_k<1$, $\sum_{k=1}^K\pi_k=1$ et $\alpha_k>0, \beta_k>0$ pour $k=1,\dots,K$. 

#### Question 5
- Écrire une fonction `gamma_logpdf` qui prend en argument deux paramètres $a$ et $b$ et renvoie la logdensité de la loi $\Gamma(a,b)$. 

- Quelles formes de densité peut-on obtenir avec un mélange de lois Gamma ? 


- Afficher dans un même graphe la densité du mélange de lois Gamma de paramètres $a = (2.0,4.0,30.0)$ et $
b = (1.0,0.5,2.5)$ et de poids $(w_1, w_2, w_3) = (0.15, 0.40,0.45)$, ainsi que les densités de chacune de ses composantes.

- Comparer aux formes des mélanges gaussiens.

## <font color=darkorange>Simulation de données</font>

#### Question 5
- Ecrire une fonction `gaussian_mixture` pour générer des réalisations d'un mélange gaussien à $K$ composantes. Les arguments de la fonction sont la taille d'échantillon `n`, le moyennes `mu`, variances `sigma` et poids des éléments du mélange `weights`.
- Tester votre fonction en générant un grand échantillon d'un mélange gaussien de taille `n=5000` dont on compare l'histogramme à sa densité par un graphique.

## <font color=darkorange>Estimation du modèle</font>

#### Question 6
- Estimez les paramètres du modèle en utilisant les échantillons précédents et le package `mixture` de `sklearn`. On pourra utiliser la classe `GaussianMixture` et la méthode `fit`.
- Fournissez les paramètres estimés (à l'aide des attributs `means_`, `weights_`, etc.).