# 💪🏻 Métriques de performance pour la classification

Pour évaluer la qualité des prédictions d’un modèle de classification, on utilise plusieurs métriques basées sur le nombre de bonnes et mauvaises classifications. Ces métriques s’appuient sur les quatre catégories de résultats possibles : 

**TP** = Vrais positifs (bien classés comme 1)  
**TN** = Vrais négatifs (bien classés comme 0)  
**FP** = Faux positifs (prévus 1, en réalité 0)  
**FN** = Faux négatifs (prévus 0, en réalité 1)

### 🔵 Accuracy (exactitude)

Proportion de bonnes prédictions (**TP** + **TN**) parmi toutes les prédictions (**TP** + **TN** + **FP** + **FN**).


L'exactitude est définie par $\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$  

###  🔵 Precision (précision)

Proportion des cas correctement prédits positifs (**TP**) parmi tous ceux que le modèle a prédits comme positifs (**TP** + **FP**).

$\text{Precision} = \frac{TP}{TP + FP}$

La précision est utile lorsque nous voulons **minimiser les fausses alertes**, c’est-à-dire les cas où le modèle identifie à tort un élément comme positif alors qu’il ne l’est pas (par exemple : annoncer qu’une personne est malade alors qu’elle ne l’est pas).

👉🏻 La précision augmente lorsque le nombre de **faux positifs** baisse.

###  🔵 Recall (rappel ou sensibilité)

Proportion des individus correctement prédits comme positifs (**TP**) parmi tous les individus effectivement positifs (**TP** + **FN**).

$\text{Recall} = \frac{TP}{TP + FN}$

Le rappel est utile lorsque nous voulons **minimiser les cas de non-détection**, c’est-à-dire les situations où le modèle n’identifie pas un cas positif alors qu’il aurait dû le faire (par exemple : ne pas annoncer à une personne qu'elle est malade alors qu’elle l'est réellement).

👉🏻 Le rappel augmente lorsque le nombre de **faux négatifs** baisse.

###  🔵 F1-score

Moyenne harmonique entre **précision** et **rappel** (équilibre entre les deux).

$\text{F1-score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

Le F1-score est très utile lorsqu’il faut trouver un **équilibre entre les fausses alertes et les non-détections**, notamment dans des contextes où les classes sont déséquilibrées. Une faible précision ou un faible rappel fera automatiquement chuter le F1-score, ce qui en fait un bon indicateur global de performance dans des situations sensibles.


### En résumé

| Métrique  | Quand l’utiliser ?                                        |
|---------- | ----------------------------------------------------------|
|Accuracy   | Si les classes sont bien équilibrées                      |
|Precision  | S'il faut éviter les fausses alertes                      |
|Recall     | D'il faut minimiser les oublis                            |
|F1-score   | S'il faut un compromis équilibré entre Precision et Recall|
