# Fluzz — Détection de fraude bancaire  
**Partie 2 — Comparatif des modèles (Module 2)**

Ce notebook compare 3 algorithmes d'apprentissage automatique pour la détection de fraude bancaire :
- **Régression Logistique** : modèle linéaire simple et interprétable
- **Random Forest** : ensemble d'arbres de décision
- **MLP** (Multi-Layer Perceptron) : réseau de neurones

**Métriques d'évaluation** : F1-Score, Précision, Rappel (adaptées aux classes déséquilibrées)

## 1. Chargement des données et préparation

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, confusion_matrix, f1_score, precision_score, recall_score
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Chargement des données
df = pd.read_csv('../01_data/creditcard.csv')
print(f"Dataset chargé : {df.shape[0]} transactions, {df.shape[1]} features")
print(f"Taux de fraude : {df['Class'].mean()*100:.3f}%")

In [None]:
# Séparation des features et de la cible
X = df.drop('Class', axis=1)
y = df['Class']

# Division train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

print(f"Jeu d'entraînement : {X_train.shape[0]} échantillons")
print(f"Jeu de test : {X_test.shape[0]} échantillons")
print(f"Fraudes dans le test : {y_test.sum()} ({y_test.mean()*100:.3f}%)")

In [None]:
# Normalisation des données (nécessaire pour MLP et Régression Logistique)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print("Données normalisées avec succès")

## 2. Entraînement des modèles

In [None]:
# Configuration des modèles avec gestion du déséquilibre
models = {
    'Régression Logistique': LogisticRegression(
        class_weight='balanced',
        random_state=42,
        max_iter=1000
    ),
    'Random Forest': RandomForestClassifier(
        class_weight='balanced',
        random_state=42,
        n_estimators=100
    ),
    'MLP': MLPClassifier(
        hidden_layer_sizes=(100, 50),
        random_state=42,
        max_iter=500,
        early_stopping=True
    )
}

print("Modèles configurés")

In [None]:
# Entraînement des modèles
trained_models = {}

print("Début de l'entraînement...\n")

for name, model in models.items():
    print(f"Entraînement de {name}...")
    
    # Utiliser les données normalisées pour LR et MLP, originales pour RF
    if name in ['Régression Logistique', 'MLP']:
        model.fit(X_train_scaled, y_train)
    else:
        model.fit(X_train, y_train)
    
    trained_models[name] = model
    print(f"✓ {name} entraîné")

print("\nTous les modèles sont entraînés !")

## 3. Évaluation et comparaison

In [None]:
# Évaluation des modèles
results = []

for name, model in trained_models.items():
    # Prédictions
    if name in ['Régression Logistique', 'MLP']:
        y_pred = model.predict(X_test_scaled)
    else:
        y_pred = model.predict(X_test)
    
    # Calcul des métriques
    f1 = f1_score(y_test, y_pred)
    precision = precision_score(y_test, y_pred)
    recall = recall_score(y_test, y_pred)
    
    results.append({
        'Modèle': name,
        'F1-Score': f1,
        'Précision': precision,
        'Rappel': recall
    })
    
    print(f"\n=== {name} ===")
    print(f"F1-Score : {f1:.4f}")
    print(f"Précision : {precision:.4f}")
    print(f"Rappel : {recall:.4f}")

# Création du DataFrame des résultats
results_df = pd.DataFrame(results)
print("\n" + "="*50)
print("RÉSUMÉ DES PERFORMANCES")
print("="*50)
print(results_df.round(4))

In [None]:
# Visualisation des résultats
fig, axes = plt.subplots(1, 3, figsize=(15, 5))

metrics = ['F1-Score', 'Précision', 'Rappel']
colors = ['#2E8B57', '#4169E1', '#DC143C']

for i, metric in enumerate(metrics):
    bars = axes[i].bar(results_df['Modèle'], results_df[metric], 
                       color=colors[i], alpha=0.7)
    axes[i].set_title(f'{metric}', fontsize=14, fontweight='bold')
    axes[i].set_ylim(0, 1)
    axes[i].grid(axis='y', alpha=0.3)
    
    # Ajout des valeurs sur les barres
    for bar, value in zip(bars, results_df[metric]):
        height = bar.get_height()
        axes[i].text(bar.get_x() + bar.get_width()/2., height + 0.01,
                     f'{value:.3f}', ha='center', va='bottom', 
                     fontweight='bold')
    
    # Rotation des labels
    axes[i].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.suptitle('Comparaison des Modèles de Détection de Fraude', 
             fontsize=16, fontweight='bold', y=1.02)
plt.show()

## 4. Analyse détaillée du meilleur modèle

In [None]:
# Identification du meilleur modèle basé sur le F1-Score
best_model_name = results_df.loc[results_df['F1-Score'].idxmax(), 'Modèle']
best_model = trained_models[best_model_name]

print(f"Meilleur modèle : {best_model_name}")
print(f"F1-Score : {results_df.loc[results_df['F1-Score'].idxmax(), 'F1-Score']:.4f}")

# Prédictions du meilleur modèle
if best_model_name in ['Régression Logistique', 'MLP']:
    y_pred_best = best_model.predict(X_test_scaled)
else:
    y_pred_best = best_model.predict(X_test)

# Rapport de classification détaillé
print("\nRapport de classification détaillé :")
print(classification_report(y_test, y_pred_best, 
                          target_names=['Non Fraude', 'Fraude']))

In [None]:
# Matrice de confusion
cm = confusion_matrix(y_test, y_pred_best)

plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Non Fraude', 'Fraude'],
            yticklabels=['Non Fraude', 'Fraude'])
plt.title(f'Matrice de Confusion - {best_model_name}', 
          fontsize=14, fontweight='bold')
plt.xlabel('Prédictions', fontsize=12)
plt.ylabel('Vraies valeurs', fontsize=12)
plt.show()

# Calcul des taux d'erreur
tn, fp, fn, tp = cm.ravel()
print(f"\nAnalyse des erreurs :")
print(f"Vrais positifs (fraudes détectées) : {tp}")
print(f"Faux positifs (fausses alertes) : {fp}")
print(f"Faux négatifs (fraudes manquées) : {fn}")
print(f"Vrais négatifs (transactions légitimes) : {tn}")
print(f"\nTaux de fausses alertes : {fp/(fp+tn)*100:.2f}%")
print(f"Taux de fraudes manquées : {fn/(fn+tp)*100:.2f}%")

## 5. Conclusion

### Résumé des performances
Les résultats montrent les performances relatives de chaque algorithme sur notre dataset de fraude bancaire.

### Points clés à retenir :
- **F1-Score** : mesure équilibrée entre précision et rappel
- **Précision** : pourcentage de fraudes correctement identifiées parmi les alertes
- **Rappel** : pourcentage de fraudes détectées parmi toutes les fraudes réelles

### Recommandations :
- Pour minimiser les fausses alertes → privilégier la **précision**
- Pour ne manquer aucune fraude → privilégier le **rappel**
- Pour un équilibre optimal → privilégier le **F1-Score**