# üöÄ Google Colab Setup

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ogautier1980/sandbox-ml/blob/main/cours/02_metriques_evaluation/02_exercices.ipynb)

**Si vous ex√©cutez ce notebook sur Google Colab**, ex√©cutez la cellule suivante pour installer les d√©pendances.

In [None]:
# Installation des d√©pendances (Google Colab uniquement)
import sys
IN_COLAB = 'google.colab' in sys.modules

if IN_COLAB:
    print('üì¶ Installation des packages...')
    !pip install -q numpy pandas matplotlib seaborn scikit-learn
    print('‚úÖ Installation termin√©e !')
else:
    print('‚ÑπÔ∏è  Environnement local d√©tect√©, les packages sont d√©j√† install√©s.')

# Chapitre 02 - Exercices : M√©triques d'√âvaluation

Ce notebook contient des exercices pratiques sur les m√©triques d'√©valuation en Machine Learning.

**Objectifs** :
- Calculer et interpr√©ter les m√©triques de classification
- Utiliser les m√©triques de r√©gression
- Appliquer la validation crois√©e
- Choisir les bonnes m√©triques selon le contexte

---

## Setup

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.datasets import load_breast_cancer, load_diabetes
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.linear_model import LogisticRegression, LinearRegression
from sklearn.ensemble import RandomForestClassifier, RandomForestRegressor
from sklearn.metrics import (
    confusion_matrix, accuracy_score, precision_score, recall_score, f1_score,
    roc_curve, roc_auc_score, precision_recall_curve,
    mean_squared_error, mean_absolute_error, r2_score,
    ConfusionMatrixDisplay
)

np.random.seed(42)
sns.set_style('whitegrid')

print("‚úÖ Biblioth√®ques import√©es")

---

## Exercice 1 : Matrice de Confusion et M√©triques de Base

**Objectif** : Calculer manuellement les m√©triques de classification √† partir d'une matrice de confusion.

**Contexte** : Un syst√®me de d√©tection de fraude bancaire a les r√©sultats suivants :

```
Matrice de Confusion :
                Pr√©dit Non-Fraude  Pr√©dit Fraude
R√©el Non-Fraude       950              50
R√©el Fraude            20              80
```

**Questions** :

1. Identifiez les valeurs de TP, TN, FP, FN
2. Calculez manuellement :
   - Accuracy
   - Precision
   - Recall (Sensibilit√©)
   - Sp√©cificit√©
   - F1-Score
3. Dans ce contexte de d√©tection de fraude, quelle m√©trique est la plus importante ? Pourquoi ?
4. Le syst√®me est-il performant ? Justifiez votre r√©ponse.

In [None]:
# Votre code ici
# D√©finissez la matrice de confusion
cm = np.array([
    # √Ä compl√©ter
])

# Calculez TP, TN, FP, FN

# Calculez les m√©triques


---

## Exercice 2 : Courbe ROC et Choix du Seuil

**Objectif** : Comprendre l'impact du seuil de classification sur les performances.

**Consignes** :

1. Chargez le dataset Breast Cancer
2. Entra√Ænez un mod√®le Logistic Regression
3. Tracez la courbe ROC et calculez l'AUC
4. Testez 3 seuils diff√©rents (0.3, 0.5, 0.7) et pour chacun :
   - Calculez Precision, Recall, F1-Score
   - Affichez la matrice de confusion
5. Quel seuil choisiriez-vous pour :
   - Minimiser les faux n√©gatifs (ne pas manquer de malades) ?
   - Maximiser la pr√©cision globale ?
   - Obtenir un bon compromis ?

In [None]:
# Votre code ici
# 1. Chargez les donn√©es

# 2. Split train/test

# 3. Entra√Ænez le mod√®le

# 4. Tracez la courbe ROC


---

## Exercice 3 : M√©triques de R√©gression

**Objectif** : √âvaluer un mod√®le de r√©gression avec diff√©rentes m√©triques.

**Consignes** :

1. Chargez le dataset Diabetes
2. Entra√Ænez deux mod√®les :
   - LinearRegression
   - RandomForestRegressor
3. Pour chaque mod√®le, calculez :
   - MSE (Mean Squared Error)
   - RMSE (Root Mean Squared Error)
   - MAE (Mean Absolute Error)
   - R¬≤ (Coefficient de d√©termination)
4. Comparez les deux mod√®les
5. Visualisez les pr√©dictions vs valeurs r√©elles pour le meilleur mod√®le

In [None]:
# Votre code ici
# 1. Chargez le dataset Diabetes

# 2. Split train/test

# 3. Entra√Ænez les mod√®les

# 4. Calculez les m√©triques


---

## Exercice 4 : Validation Crois√©e

**Objectif** : Comparer la validation simple (train/test split) avec la validation crois√©e.

**Consignes** :

1. Utilisez le dataset Breast Cancer
2. **M√©thode 1** : Entra√Ænez un RandomForestClassifier avec un simple split 70/30
   - Calculez l'accuracy sur le test set
3. **M√©thode 2** : Utilisez la validation crois√©e 5-fold (`cross_val_score`)
   - Calculez la moyenne et l'√©cart-type des scores
4. **M√©thode 3** : Testez diff√©rents nombres de folds (3, 5, 10, 20)
   - Visualisez l'impact sur la variance des r√©sultats
5. Quelle m√©thode vous semble la plus fiable ? Pourquoi ?
6. Quel nombre de folds recommanderiez-vous ?

In [None]:
# Votre code ici
# 1. Chargez les donn√©es

# 2. M√©thode 1 : Simple split

# 3. M√©thode 2 : Cross-validation 5-fold

# 4. M√©thode 3 : Tester diff√©rents nombres de folds


---

## Exercice 5 : Cas Pratique - Syst√®me de Recommandation de Films

**Objectif** : Choisir les bonnes m√©triques selon le contexte m√©tier.

**Contexte** : Vous d√©veloppez un syst√®me de recommandation de films. Vous avez deux versions du mod√®le avec les r√©sultats suivants sur 1000 utilisateurs :

**Mod√®le A** :
- Films recommand√©s et regard√©s (TP) : 400
- Films recommand√©s mais non regard√©s (FP) : 100
- Films non recommand√©s mais regard√©s (FN) : 200
- Films non recommand√©s et non regard√©s (TN) : 300

**Mod√®le B** :
- Films recommand√©s et regard√©s (TP) : 500
- Films recommand√©s mais non regard√©s (FP) : 300
- Films non recommand√©s mais regard√©s (FN) : 100
- Films non recommand√©s et non regard√©s (TN) : 100

**Questions** :

1. Calculez pour chaque mod√®le : Accuracy, Precision, Recall, F1-Score
2. Quel mod√®le choisiriez-vous si :
   - Vous voulez √©viter de recommander de mauvais films (utilisateur satisfait) ?
   - Vous voulez maximiser la d√©couverte de films (ne pas manquer de bons films) ?
   - Vous voulez un compromis √©quilibr√© ?
3. Quelle m√©trique est la plus pertinente pour un syst√®me de recommandation ? Justifiez.
4. Cr√©ez une visualisation comparative des deux mod√®les

In [None]:
# Votre code ici
# 1. D√©finissez les matrices de confusion

# 2. Calculez les m√©triques

# 3. Visualisez


---

## Exercice 6 : Dataset D√©s√©quilibr√©

**Objectif** : Comprendre l'impact du d√©s√©quilibre des classes sur les m√©triques.

**Consignes** :

1. Cr√©ez un dataset d√©s√©quilibr√© synth√©tique :
   - Classe 0 (majoritaire) : 950 exemples
   - Classe 1 (minoritaire) : 50 exemples
2. Entra√Ænez un mod√®le simple (LogisticRegression)
3. Calculez et comparez :
   - Accuracy
   - Precision, Recall, F1 pour chaque classe
   - Courbe ROC et AUC
   - Courbe Precision-Recall
4. Que se passe-t-il si le mod√®le pr√©dit toujours la classe majoritaire ?
5. Quelle m√©trique est la plus r√©v√©latrice du probl√®me ?
6. **Bonus** : Testez une technique de r√©√©quilibrage (SMOTE ou class_weight)

In [None]:
# Votre code ici
from sklearn.datasets import make_classification

# 1. Cr√©ez un dataset d√©s√©quilibr√©
X, y = make_classification(
    n_samples=1000,
    n_features=20,
    weights=[0.95, 0.05],  # 95% classe 0, 5% classe 1
    random_state=42
)

# √Ä compl√©ter


---

## Exercice 7 : Bonus - M√©triques Personnalis√©es

**Objectif** : Cr√©er une m√©trique personnalis√©e adapt√©e √† un contexte sp√©cifique.

**Contexte** : Une entreprise de e-commerce veut minimiser les retours produits. Un retour produit co√ªte 20‚Ç¨ √† l'entreprise, tandis qu'une vente r√©ussie rapporte 10‚Ç¨.

**Consignes** :

1. Cr√©ez une fonction de co√ªt personnalis√©e qui calcule le b√©n√©fice/perte total
2. Utilisez cette fonction pour √©valuer plusieurs mod√®les
3. Comparez avec les m√©triques classiques (accuracy, F1)
4. Quel mod√®le choisiriez-vous selon la m√©trique de co√ªt ?

In [None]:
# Votre code ici
def custom_cost_metric(y_true, y_pred):
    """
    Calcule le b√©n√©fice total.
    
    TP (vente r√©ussie) : +10‚Ç¨
    TN (pas de vente) : 0‚Ç¨
    FP (vente avec retour) : -20‚Ç¨
    FN (opportunit√© manqu√©e) : 0‚Ç¨
    """
    # √Ä compl√©ter
    pass


---

## R√©sum√© et Points Cl√©s

√Ä la fin de ces exercices, vous devriez √™tre capable de :

‚úÖ Calculer et interpr√©ter toutes les m√©triques de classification

‚úÖ Comprendre le compromis Precision vs Recall

‚úÖ Utiliser la courbe ROC pour choisir un seuil optimal

‚úÖ √âvaluer un mod√®le de r√©gression avec MSE, MAE, R¬≤

‚úÖ Appliquer la validation crois√©e pour une √©valuation robuste

‚úÖ Adapter votre choix de m√©triques au contexte m√©tier

‚úÖ G√©rer les datasets d√©s√©quilibr√©s

---

**Prochaines √©tapes** :
- Chapitre 03 : R√©gression Lin√©aire et R√©gularisation
- Chapitre 04 : Classification Supervis√©e Avanc√©e