# Avaliação de Modelos de Classificação

Para avaliar o desempenho de um modelo de classificação, é fundamental utilizar diferentes métricas, pois cada uma oferece uma perspectiva distinta sobre como o modelo está se comportando. A seguir, detalho as principais métricas de avaliação:

## 1. Acurácia (Accuracy)

**Definição:** Proporção de predições corretas em relação ao total de predições realizadas.

**Fórmula:**

\[ \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} \]

- **Vantagem:** Fácil de interpretar.
- **Limitação:** Pode ser enganosa em datasets desbalanceados.

## 2. Matriz de Confusão

A matriz de confusão apresenta a distribuição de acertos e erros do modelo, dividindo as predições em:

- **Verdadeiros Positivos (TP):** Casos em que o modelo previu positivo e o rótulo real é positivo.
- **Verdadeiros Negativos (TN):** Casos em que o modelo previu negativo e o rótulo real é negativo.
- **Falsos Positivos (FP):** Casos em que o modelo previu positivo, mas o rótulo real é negativo.
- **Falsos Negativos (FN):** Casos em que o modelo previu negativo, mas o rótulo real é positivo.

## 3. Precisão (Precision) e Revocação (Recall)

**Precisão:**

- **Definição:** Proporção de predições positivas que são corretas.

  \[ \text{Precision} = \frac{TP}{TP + FP} \]

**Revocação (Recall) ou Sensibilidade:**

- **Definição:** Proporção de exemplos positivos corretamente identificados.

  \[ \text{Recall} = \frac{TP}{TP + FN} \]

## 4. F1-Score

**Definição:** Média harmônica entre precisão e revocação.

**Fórmula:**

  \[ F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \]

- **Interpretação:** Um F1-Score alto indica um bom equilíbrio entre precisão e revocação, sendo especialmente útil em cenários com classes desbalanceadas.

## 5. Curva ROC e AUC

**Curva ROC (Receiver Operating Characteristic):**

- **Definição:** Gráfico que relaciona a taxa de verdadeiros positivos (Recall) e a taxa de falsos positivos para diferentes limiares de classificação.

**AUC (Area Under the ROC Curve):**

- **Definição:** A área sob a curva ROC. Varia de 0 a 1, onde valores próximos a 1 indicam um excelente desempenho do modelo.

- **Utilidade:** Fornece uma medida agregada do desempenho do modelo em todos os possíveis limiares de decisão.

## 6. Exemplo Prático

A seguir, um exemplo prático utilizando dados fictícios para demonstrar o cálculo dessas métricas.

In [None]:
import numpy as np
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report, roc_curve, auc
import matplotlib.pyplot as plt

# Exemplo fictício de rótulos verdadeiros e predições
y_true = np.array([0, 1, 0, 1, 0, 1, 1, 0, 0, 1])
y_pred = np.array([0, 1, 0, 0, 0, 1, 1, 0, 1, 1])

# Cálculo de Acurácia
acc = accuracy_score(y_true, y_pred)
print("Acurácia:", acc)

# Matriz de Confusão
cm = confusion_matrix(y_true, y_pred)
print("Matriz de Confusão:\n", cm)

# Relatório de Classificação (incluindo precisão, recall e F1-score)
report = classification_report(y_true, y_pred)
print("Relatório de Classificação:\n", report)

# Exemplo de probabilidades preditas para a classe positiva
y_probs = np.array([0.1, 0.9, 0.2, 0.4, 0.3, 0.8, 0.7, 0.2, 0.6, 0.85])

# Cálculo da curva ROC
fpr, tpr, thresholds = roc_curve(y_true, y_probs)
roc_auc = auc(fpr, tpr)

plt.figure(figsize=(8,6))
plt.plot(fpr, tpr, label=f'Curva ROC (AUC = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], 'k--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Taxa de Falsos Positivos')
plt.ylabel('Taxa de Verdadeiros Positivos')
plt.title('Curva ROC')
plt.legend(loc='lower right')
plt.show()

## Conclusão

Cada métrica de avaliação oferece uma perspectiva diferente do desempenho do modelo:
- **Acurácia:** Útil quando as classes estão equilibradas.
- **Matriz de Confusão:** Permite identificar os tipos de erros (falsos positivos e falsos negativos).
- **Precisão e Recall:** Essenciais quando há custo diferente para os tipos de erro.
- **F1-Score:** Um bom indicador global em casos de classes desbalanceadas.
- **Curva ROC e AUC:** Avaliam o desempenho do modelo em diferentes limiares de decisão.

Compreender essas métricas é fundamental para interpretar corretamente os resultados e ajustar o modelo conforme as necessidades do problema.