## 🧪 1. Métricas para **Classificação**

- Vamos explorar **exemplos práticos do uso das métricas de avaliação** mais comuns em machine learning, organizadas por tipo de problema. 
- Será mostrado como utilizá-las no Python com a biblioteca `scikit-learn`, sempre associando cada métrica a uma técnica de validação.
- Vamos usar o dataset **Iris** e um modelo de classificação (`RandomForestClassifier`).

### ✅ Exemplo: Acurácia, F1 Score, Precision, Recall, ROC-AUC

| Métrica     | O que mede?                             | Ideal para...                          |
|-------------|------------------------------------------|----------------------------------------|
| Acurácia    | % de previsões corretas                  | Dados balanceados                      |
| Precision   | Acertos entre os que previu como positivo| Evitar falsos positivos                |
| Recall      | Acertos entre os que eram realmente positivo | Evitar falsos negativos              |
| F1 Score    | Equilíbrio entre precision e recall      | Dados desbalanceados                   |
| ROC-AUC     | Capacidade de separar classes            | Comparar modelos probabilísticos       |

In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score
import numpy as np

# Carregar dados
iris = load_iris()
X, y = iris.data, iris.target

# Binarizando para simplificar (apenas duas classes)
X = X[y != 2]
y = y[y != 2]

# Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Treinar modelo
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# Prever rótulos e probabilidades
y_pred = model.predict(X_test)
y_proba = model.predict_proba(X_test)[:, 1]  # Probabilidade da classe positiva

# Calcular métricas
print("Acurácia:", accuracy_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))
print("ROC AUC:", roc_auc_score(y_test, y_proba))

Acurácia: 1.0
Precision: 1.0
Recall: 1.0
F1 Score: 1.0
ROC AUC: 1.0


> 💡 **Observações:**
> - `roc_auc_score` requer **probabilidades**, não apenas previsões.
> - Use `predict_proba()` para isso.
> - As métricas podem ser ajustadas com o parâmetro `average` se for multi-classe.


## 📈 2. Métricas para **Regressão**

Vamos usar os dados simulados do seno e um modelo de regressão (`RandomForestRegressor`).

### ✅ Exemplo: MAE, MSE, RMSE, R²

| Métrica | O que mede?                          | Interpretação                        |
|--------|--------------------------------------|---------------------------------------|
| MAE    | Erro médio absoluto                  | Fácil de entender                    |
| MSE    | Erro médio quadrático                | Penaliza erros maiores               |
| RMSE   | Raiz do MSE                          | Mesma unidade do alvo                |
| R²     | Proporção da variância explicada     | Quanto mais próximo de 1, melhor     |

In [2]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

# Dados simulados
X = np.sort(np.random.rand(100, 1), axis=0)
y = np.sin(X).ravel() + np.random.normal(0, 0.1, 100)

# Divisão treino-teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Modelo de regressão
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Previsão
y_pred = model.predict(X_test)

# Avaliação
print("MAE:", mean_absolute_error(y_test, y_pred))
print("MSE:", mean_squared_error(y_test, y_pred))
print("RMSE:", np.sqrt(mean_squared_error(y_test, y_pred)))
print("R² Score:", r2_score(y_test, y_pred))

MAE: 0.08480777818911074
MSE: 0.012414474472505942
RMSE: 0.11142026060149897
R² Score: 0.7879978858876039


> 💡 **Dicas:**
> - O **MAE** é fácil de interpretar (erro médio absoluto).
> - O **RMSE** penaliza mais erros maiores.
> - O **R²** varia de 0 a 1, onde 1 significa perfeito ajuste.

## 🔍 3. Métricas para **Clusterização**

Vamos usar o dataset **make_blobs** e o algoritmo **KMeans**.

### ✅ Exemplo: Silhouette Score, Rand Index

#### 🎯 **Silhouette Score**

- **O que é?**  
  Uma métrica que mede **quão bem cada ponto está posicionado dentro do seu cluster**.

- **Faixa:**  
  Varia de **-1 a 1**:
  - **1**: O ponto está bem posicionado no seu cluster e longe dos outros.
  - **0**: O ponto está na fronteira entre dois clusters.
  - **-1**: O ponto pode estar no cluster errado.

- **Quando usar?**  
  Quando **não temos os rótulos reais** das classes e queremos avaliar a qualidade da clusterização.

#### 🎯 **Rand Index (Índice Rand)**

- **O que é?**  
  Mede a **similaridade entre dois agrupamentos** (por exemplo, os clusters encontrados e os rótulos verdadeiros).

- **Versão ajustada:**  
  Usa-se mais comummente o **Adjusted Rand Index (ARI)**, que corrige o valor esperado em caso de agrupamento aleatório.

- **Faixa:**  
  - **1**: Agrupamento perfeito (total concordância com os rótulos verdadeiros).
  - **0**: Equivalente a um agrupamento aleatório.
  - Pode ser negativo: pior que aleatório.

- **Quando usar?**  
  Quando **temos os rótulos verdadeiros** e queremos comparar com os clusters gerados.

In [3]:
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score, adjusted_rand_score

# Gerando dados sintéticos
X, y_true = make_blobs(n_samples=300, centers=4, random_state=42)

# Clusterização
kmeans = KMeans(n_clusters=4, random_state=42)
kmeans.fit(X)
y_pred = kmeans.labels_

# Avaliação
print("Silhouette Score:", silhouette_score(X, y_pred))  # Mede a qualidade dos clusters
print("Adjusted Rand Index:", adjusted_rand_score(y_true, y_pred))  # Compara com verdadeiros labels

Silhouette Score: 0.7915830011443039
Adjusted Rand Index: 0.9910811504997546


> 💡 **Explicando:**
> - **Silhouette Score**: mede quão bem cada ponto está dentro do seu cluster (de -1 a 1).
> - **Rand Index (ajustado)**: compara agrupamentos com os rótulos reais (se disponíveis).

## 📊 Resumo – Quando usar qual métrica?

| Tipo de Problema | Métrica             | Quando usar? |
|------------------|---------------------|--------------|
| Classificação    | Acurácia            | Casos gerais, dados balanceados |
|                  | F1 Score            | Dados desbalanceados |
|                  | ROC AUC             | Comparar modelos probabilísticos |
| Regressão        | MAE                 | Erro médio simples de entender |
|                  | RMSE                | Penaliza erros grandes |
|                  | R²                  | Explicação da variância |
| Clusterização    | Silhouette Score    | Sem rótulos verdadeiros |
|                  | Rand Index          | Com rótulos verdadeiros |