## **Principe Mathématique de l'Algorithme EM**

L'algorithme EM (Expectation-Maximization) est une méthode itérative pour estimer les paramètres $$\theta$$ d'un modèle probabiliste lorsque certaines variables sont latentes (non observées).  

### **Formalisation**
1. **Modèle de mélange** :  
   Les données $$X = \{x_1, ..., x_N\}$$ sont supposées générées par un mélange de $$K$$ distributions :  
   $$
   p(x|\theta) = \sum_{k=1}^K \pi_k \, p(x|\theta_k), \quad \text{avec } \sum_{k=1}^K \pi_k = 1.
   $$

2. **Variables latentes** :  
   On introduit $$Z = \{z_{nk}\}$$, où $$z_{nk} = 1$$ si $$x_n$$ provient de la composante $$k$$, sinon $$0$$.

3. **Étapes de l'EM** :  
   - **E-Step** : Calcul des responsabilités $$\gamma_{nk} = \mathbb{E}[z_{nk}|X, \theta^{(t)}]$$.  
     $$
     \gamma_{nk} = \frac{\pi_k \, p(x_n|\theta_k^{(t)})}{\sum_{j=1}^K \pi_j \, p(x_n|\theta_j^{(t)})}.
     $$
   - **M-Step** : Maximisation de l'espérance de la log-vraisemblance complète :  
     $$
     \theta^{(t+1)} = \arg\max_\theta \sum_{n=1}^N \sum_{k=1}^K \gamma_{nk} \ln \left( \pi_k \, p(x_n|\theta_k) \right).
     $$

### **Convergence**
L'algorithme garantit une amélioration monotone de la vraisemblance jusqu'à convergence vers un maximum local.

# Exemple Complet d'Application de l'Algorithme EM sur un Mélange de Gaussiennes (GMM)

## Énoncé du Problème

Supposons que nous avons 4 points de données unidimensionnels :

$$X = \{x_1 = 1, x_2 = 2, x_3 = 5, x_4 = 6\}$$

Nous voulons modéliser ces données comme un mélange de deux Gaussiennes ($$K=2$$) avec :

- **Moyennes initiales** : $$\mu_1=2, \mu_2=5$$
- **Variances initiales** : $$\sigma_1^2=1, \sigma_2^2=1$$
- **Proportions initiales** : $$\pi_1=0.5, \pi_2=0.5$$

**But** : Estimer les paramètres finaux ($$\mu_k, \sigma_k^2, \pi_k$$) en utilisant l'algorithme EM.

---

## Étape 1 : Initialisation

$$\theta^{(0)} = \{ \pi_1=0.5, \pi_2=0.5, \mu_1=2, \mu_2=5, \sigma_1^2=1, \sigma_2^2=1 \}$$

---

## Étape 2 : Itération 1 (E-Step → M-Step)

### E-Step : Calcul des Responsabilités ($$\gamma_{nk}$$)

Pour chaque point $$x_n$$, calculer :

$$\gamma_{nk} = \frac{\pi_k \cdot N(x_n | \mu_k, \sigma_k^2)}{\sum_{j=1}^{2} \pi_j \cdot N(x_n | \mu_j, \sigma_j^2)}$$

où $$N(x | \mu, \sigma^2)$$ est la densité Gaussienne.

**Calcul pour $$x_1 = 1$$** :

$$N(1 | \mu_1=2, \sigma_1^2=1) = \frac{1}{\sqrt{2\pi}} e^{-\frac{(1-2)^2}{2}} \approx 0.2419$$

$$N(1 | \mu_2=5, \sigma_2^2=1) = \frac{1}{\sqrt{2\pi}} e^{-\frac{(1-5)^2}{2}} \approx 0.0004$$

$$\gamma_{11} = \frac{0.5 \times 0.2419}{0.5 \times 0.2419 + 0.5 \times 0.0004} \approx 0.9983$$

$$\gamma_{12} = 1 - \gamma_{11} \approx 0.0017$$

De même pour les autres points :

| $$x_n$$ | $$\gamma_{n1}$$ | $$\gamma_{n2}$$ |
|------|--------------|--------------|
| 1    | 0.9983       | 0.0017       |
| 2    | 0.9538       | 0.0462       |
| 5    | 0.0462       | 0.9538       |
| 6    | 0.0017       | 0.9983       |

### M-Step : Mise à Jour des Paramètres

Nouvelles proportions ($$\pi_k$$) :

$$\pi_k^{new} = \frac{1}{N} \sum_{n=1}^{4} \gamma_{nk}$$

$$\pi_1^{new} = \frac{0.9983 + 0.9538 + 0.0462 + 0.0017}{4} \approx 0.5$$

$$\pi_2^{new} = 1 - \pi_1^{new} = 0.5$$

Nouvelles moyennes ($$\mu_k$$) :

$$\mu_k^{new} = \frac{\sum_{n=1}^{4} \gamma_{nk} x_n}{\sum_{n=1}^{4} \gamma_{nk}}$$

$$\mu_1^{new} = \frac{0.9983 \times 1 + 0.9538 \times 2 + 0.0462 \times 5 + 0.0017 \times 6}{2} \approx 1.51$$

$$\mu_2^{new} = \frac{0.0017 \times 1 + 0.0462 \times 2 + 0.9538 \times 5 + 0.9983 \times 6}{2} \approx 5.49$$

Nouvelles variances ($$\sigma_k^2$$) :

$$\sigma_k^2 = \frac{\sum_{n=1}^{4} \gamma_{nk} (x_n - \mu_k^{new})^2}{\sum_{n=1}^{4} \gamma_{nk}}$$

$$\sigma_1^2 \approx 0.25, \quad \sigma_2^2 \approx 0.25$$

Nouveaux paramètres après Itération 1 :

$$\theta^{(1)} = \{ \pi_1=0.5, \pi_2=0.5, \mu_1 \approx 1.51, \mu_2 \approx 5.49, \sigma_1^2 \approx 0.25, \sigma_2^2 \approx 0.25 \}$$

---

## Itération 2 (Convergence Rapide)

En répétant l'E-Step et M-Step, les paramètres convergent vers :

$$\theta^{final} = \{ \pi_1=0.5, \pi_2=0.5, \mu_1 \approx 1.5, \mu_2 \approx 5.5, \sigma_1^2 \approx 0.25, \sigma_2^2 \approx 0.25 \}$$

### Interprétation :

- **Cluster 1** : Points autour de $$1.5$$ ($$\{1,2\}$$).
- **Cluster 2** : Points autour de $$5.5$$ ($$\{5,6\}$$).

---

## Conclusion

L'algorithme EM a correctement identifié les deux sous-populations dans les données.

- **E-Step** : Calcule les probabilités d'appartenance.
- **M-Step** : Met à jour les paramètres pour maximiser la vraisemblance.

**Application Réelle** : Segmentation de clients, détection d'anomalies, etc.