## 📊 GMM (Gaussian Mixture Models)

🧠 **Gaussian Mixture Models (GMMs)** são modelos probabilísticos utilizados em problemas de **agrupamento (clusterização)** de dados, que assumem que os dados são gerados a partir de uma **mistura de várias distribuições gaussianas**.

🔹 Cada componente da mistura (**cluster**) é uma **distribuição normal (gaussiana)**,  
🔸 e a distribuição total é uma **combinação ponderada dessas distribuições**.

![image.png](attachment:image.png)

## 🤖 GMM (Gaussian Mixture Models) vs K-Means

🔄 GMM possui certa similaridade com o algoritmo **K-Means**, também usado para clusterização.  
📌 Porém, podemos dizer que o **GMM é uma versão probabilística do K-Means**.

⚠️ Comparado ao GMM, o K-Means possui algumas limitações como:

- 📏 **Assume que os clusters são esféricos** e de **tamanho similar**, o que nem sempre reflete a realidade.
- 🔒 É um método de **hard cluster**, ou seja, cada ponto de dado é designado para **apenas um cluster**.

![image-2.png](attachment:image-2.png)

## 🧰 Casos de Uso

### 📌 Agrupamento de Dados (Clustering)
GMMs são usados para **agrupar dados em subconjuntos homogêneos**, onde cada grupo é modelado por uma **distribuição gaussiana diferente**.

### 🔍 Modelagem de Distribuições Complexas
São utilizados para modelar **distribuições de dados multi-modais** ou com **formas complexas** que não podem ser bem representadas por uma única distribuição gaussiana.A

### 🖼️ Segmentação de Imagens  
Na análise de imagens, GMMs são aplicados para **segmentar uma imagem em diferentes regiões** com características semelhantes.

### 🗣️ Reconhecimento de Padrões e Fala  
GMMs são usados em **reconhecimento de fala** para modelar as características acústicas de diferentes fonemas.

### 🚨 Detecção de Anomalias  
Utilizados para **identificar comportamentos anômalos ou raros** em conjuntos de dados, comparando as observações com a **distribuição modelada**.

![image-3.png](attachment:image-3.png)

## ⚖️ Vantagens e Desvantagens

### ✅ Vantagens
- 🧩 Alta flexibilidade para **modelar dados complexos**.
- 🔄 Capacidade de **lidar com dados de diferentes formas e orientações**.
- 🌐 Aplicável em diversas áreas como **visão computacional**, **processamento de fala** e **detecção de anomalias**.

### ❌ Desvantagens
- 🎯 Pode **convergir para um ótimo local** dependendo da **inicialização dos parâmetros**.
- ⚠️ **Sensível à escolha do número de componentes** (K).
- 🖥️ **Computacionalmente intensivo** para grandes conjuntos de dados.

![image-4.png](attachment:image-4.png)

## ⚙️ Como funciona o algoritmo GMM?

### 🧮 Passo 1: Definir a quantidade de clusters

Para definir a quantidade de clusters, temos um desafio similar ao que ocorre no **K-Means**.  
Desta forma, podemos:

- 📚 Definir este parâmetro `k` com base no **conhecimento do domínio** do problema a ser modelado, ou  
- 🧪 Utilizar uma **métrica de validação** para avaliar o modelo.

📏 No caso dos GMMs, a métrica mais utilizada é chamada de **BIC (Bayesian Information Criterion)**.

### 🔢 Passo 2: Inicializa Média, Covariância e Pesos

- 📍 **Média**:  
  Representa o **centro de cada Gaussiana**.  
  Inicializa de forma **aleatória**.

- 🔄 **Covariância**:  
  Define a **forma e orientação** de cada Gaussiana.  
  Também é inicializada de forma **aleatória**.

- ⚖️ **Peso**:  
  É a **proporção** que cada componente gaussiano contribui para a mistura total.  
  Inicializa com base no parâmetro `k`.  
  👉 *Exemplo*: Se `k = 3`, cada componente é inicializado com `1/3`.

### 🔁 Passo 3: Usar o algoritmo EM (Expectation-Maximization)

O algoritmo **EM (Expectation-Maximization)** é uma técnica usada para encontrar parâmetros em modelos estatísticos, como os **Gaussian Mixture Models (GMMs)**.

🔧 Ele é utilizado para **ajustar os parâmetros das distribuições gaussianas** (médias, covariâncias e pesos), com o objetivo de **melhor modelar os dados observados**.

🔄 A cada iteração, o modelo se ajusta para **melhorar a representação dos dados**, resultando em uma **melhor compreensão da estrutura subjacente** dos dados.

#### 🧠 Passo 3a: Etapa Expectation (E)

O passo **E** do algoritmo EM calcula a **responsabilidade** de cada componente da mistura por cada ponto de dado,  
usando as **estimativas atuais dos parâmetros** (📍média, 🔄covariância e ⚖️peso).

📊 Essas responsabilidades indicam a **probabilidade de que cada ponto pertença a um componente**,  
e serão usadas na próxima etapa do algoritmo (**passo M**) para **atualizar os parâmetros do modelo**.

#### 📈 Passo 3b: Etapa Maximization (M)

O objetivo do passo **M** do algoritmo EM é **atualizar os parâmetros do modelo**  
(médias 📍, covariâncias 🔄 e pesos ⚖️ das distribuições),  
de forma a **maximizar a probabilidade dos dados observados**,  
com base nas **responsabilidades calculadas na Etapa de Expectation**.

### 🔄 Passo 4: Itere no algoritmo EM até convergir

🔁 Execute os passos **E** e **M** repetidamente até que ocorra a **convergência** do algoritmo,  
ou seja, até que os **parâmetros do modelo deixem de mudar significativamente** de uma iteração para outra.

![image.png](attachment:image.png)