# Surveillance des dérives - Credit Scoring
    Ce notebook utilise Evidently AI pour détecter et visualiser les dérives de données et de modèles.
**Objectifs :**
- Détecter les changements dans la distribution des features
- Comparer les performances du modèle sur de nouvelles données
- Générer un dashboard HTML de suivi

## Import des bibliothèques

In [None]:
# Import des bibliothèques
import pandas as pd
from evidently.dashboard import Dashboard
from evidently.dashboard.tabs import DataDriftTab, ClassificationPerformanceTab
from evidently.model_profile import Profile
from evidently.model_profile.sections import DataDriftProfileSection, ClassificationPerformanceProfileSection
import matplotlib.pyplot as plt
import os

## Charger les données de référence et nouvelles données

In [None]:
# Charger les données de référence et nouvelles données
reference_data = pd.read_csv('../data/reference/reference_data.csv')
new_data = pd.read_csv('../data/new_data/new_data.csv')

# Assurez-vous que la colonne cible s'appelle 'target'
target_column = 'target'

# Séparer features et target
features = [col for col in reference_data.columns if col != target_column]

## 1️⃣ Dashboard de dérive

In [None]:
data_drift_dashboard = Dashboard(tabs=[DataDriftTab()])
data_drift_dashboard.calculate(reference_data, new_data)

# Export en HTML
os.makedirs('../dashboards', exist_ok=True)
data_drift_dashboard.save('../dashboards/data_drift_dashboard.html')
print('Dashboard de dérive généré dans dashboards/data_drift_dashboard.html')

## 2️⃣ Dashboard de performance classification

In [None]:
performance_dashboard = Dashboard(tabs=[ClassificationPerformanceTab()])
performance_dashboard.calculate(reference_data, new_data, target_column=target_column, prediction_column='prediction')  # remplacer 'prediction' par la colonne de prédiction
performance_dashboard.save('../dashboards/classification_performance_dashboard.html')
print('Dashboard de performance généré dans dashboards/classification_performance_dashboard.html')

## 3️⃣ Profil complet de dérive (optionnel)

In [None]:
profile = Profile(sections=[DataDriftProfileSection(), ClassificationPerformanceProfileSection()])
profile.calculate(reference_data, new_data, target_column=target_column, prediction_column='prediction')
profile.save('../dashboards/model_profile_report.json')
print('Profil complet sauvegardé dans dashboards/model_profile_report.json')

## ✅ Explications :

- `DataDriftTab` : visualise la dérive des features entre les données de référence et les nouvelles données.
- `ClassificationPerformanceTab` : compare les performances du modèle (AUC, F1, confusion matrix) sur les deux jeux de données.
- `Profile` : génère un rapport JSON complet pour intégration automatisée dans un pipeline de monitoring.
- Les dashboards HTML peuvent être intégrés dans un tableau de bord de supervision.