
**Algoritmo de Expectation-Maximization (EM) para GMM**

El algoritmo de Expectation-Maximization (EM) nos permite encontrar un máximo de la verosimilitud de los datos $X$, con respecto a los parámetros $\theta = \{ \pi_j, \mu_j, \Sigma_j \}$ de un modelo de mezcla gaussiana (GMM).

**Paso E (Expectation step)**
En el paso E, calculamos la expectativa de la función de verosimilitud completa con respecto a la distribución posterior de la variable latente $Z$, dadas las observaciones actuales de los datos y los parámetros actuales $\theta^{(t)}$.

La función de verosimilitud completa es:

$ p(X, Z | \theta) = \prod_{i=1}^{N} \prod_{j=1}^{K} \left[ \pi_j \mathcal{N}(x_i | \mu_j, \Sigma_j) \right]^{z_{ij}} $

La expectativa a calcular es:

$ Q(\theta, \theta^{(t)}) = \mathbb{E}_{Z | X, \theta^{(t)}} \left[ \log p(X, Z | \theta) \right] $

Esto se traduce en:

$ Q(\theta, \theta^{(t)}) = \sum_{i=1}^{N} \sum_{j=1}^{K} \gamma_{ij}^{(t)} \left[ \log \pi_j + \log \mathcal{N}(x_i | \mu_j, \Sigma_j) \right] $

donde $\gamma_{ij}^{(t)}$ es la probabilidad a posteriori de que $x_i$ pertenezca a la $j$-ésima componente, calculada como:

$ \gamma_{ij}^{(t)} = \frac{\pi_j^{(t)} \mathcal{N}(x_i | \mu_j^{(t)}, \Sigma_j^{(t)})}{\sum_{l=1}^{K} \pi_l^{(t)} \mathcal{N}(x_i | \mu_l^{(t)}, \Sigma_l^{(t)})} $

**Paso M (Maximization step)**
En el paso M, maximizamos $Q(\theta, \theta^{(t)})$ con respecto a los parámetros $\theta$ para obtener los nuevos valores de los parámetros $\theta^{(t+1)}$.

Los nuevos parámetros se obtienen resolviendo las siguientes ecuaciones:

$ \pi_j^{(t+1)} = \frac{1}{N} \sum_{i=1}^{N} \gamma_{ij}^{(t)} $

$ \mu_j^{(t+1)} = \frac{\sum_{i=1}^{N} \gamma_{ij}^{(t)} x_i}{\sum_{i=1}^{N} \gamma_{ij}^{(t)}} $

$ \Sigma_j^{(t+1)} = \frac{\sum_{i=1}^{N} \gamma_{ij}^{(t)} (x_i - \mu_j^{(t+1)})(x_i - \mu_j^{(t+1)})^T}{\sum_{i=1}^{N} \gamma_{ij}^{(t)}} $

**Resumen del Algoritmo EM para GMM**

**Inicialización:** Elegir valores iniciales para los parámetros $\pi_j^{(0)}, \mu_j^{(0)}, \Sigma_j^{(0)}$.\\

**Paso E:** Calcular $\gamma_{ij}^{(t)}$ para cada $i$ y $j$.\\

**Paso M:** Actualizar los parámetros $\pi_j^{(t+1)}, \mu_j^{(t+1)}, \Sigma_j^{(t+1)}$.\\

**Convergencia:** Repetir los pasos E y M hasta la convergencia de los parámetros.\\
