# Comparação e Escolha do Modelo Final - Detecção de Fraudes em Cartões de Crédito

Este notebook tem como objetivo documentar a comparação dos modelos treinados (Random Forest e XGBoost), analisar suas métricas de desempenho e justificar a escolha do modelo final que será utilizado na aplicação.

## Modelos avaliados:

- **Random Forest Classifier**
- **XGBoost Classifier**

## Métricas analisadas:

- Matriz de confusão
- Precision
- Recall
- F1-Score
- AUC-ROC

O foco principal da análise está na performance sobre a **classe minoritária (fraude)**, priorizando métricas como **Recall** e **F1-Score** da classe `1`.

---


In [3]:
import pandas as pd

dados_comparacao = {
    'Modelo': ['Random Forest', 'XGBoost'],
    'Recall (Classe 1)': [0.71, 0.79],
    'Precision (Classe 1)': [0.97, 0.88],
    'F1-Score (Classe 1)': [0.82, 0.83],
    'AUC-ROC': [0.96, 0.9705]  # substitua 0.96 pelo real do RF se já tiver
}

comparacao_df = pd.DataFrame(dados_comparacao)
comparacao_df

Unnamed: 0,Modelo,Recall (Classe 1),Precision (Classe 1),F1-Score (Classe 1),AUC-ROC
0,Random Forest,0.71,0.97,0.82,0.96
1,XGBoost,0.79,0.88,0.83,0.9705


## Conclusão

Com base nas métricas obtidas, o modelo **XGBoost** apresentou melhor desempenho na detecção de fraudes (Classe 1), especialmente nos seguintes aspectos:

- **Maior Recall (0.79 vs 0.71)** → detecta mais fraudes
- **Maior F1-Score (0.83 vs 0.82)** → melhor equilíbrio entre precisão e sensibilidade
- **AUC-ROC mais alta (0.9705)** → maior capacidade de separar fraudes de não fraudes

Apesar do Random Forest ter um Precision ligeiramente superior, o modelo XGBoost foi escolhido para ser utilizado no deploy, considerando que o objetivo principal do projeto é **detectar o maior número possível de fraudes com qualidade aceitável**.
