In [1]:
import pandas as pd
import IPython.display as display

# Metriques de régression
regression_metrics = pd.DataFrame({
    "Nom": ["R² (coefficient de détermination)", "MAE (Mean Absolute Error)", "MSE (Mean Squared Error)", "RMSE (Root Mean Square Error)", "MAPE (Mean Absolute Percentage Error)"],
    "Description": [
        "Proportion de la variance expliquée par le modèle",
        "Erreur absolue moyenne entre cibles et prédictions",
        "Erreur quadratique moyenne",
        "Racine carrée de la MSE (mêmes unités que la cible)",
        "Erreur absolue relative moyenne en pourcentage"
    ],
    "Formule mathématique": [
        r"$R^2 = 1 - \frac{\sum_{i} (y_i - \hat{y}_i)^2}{\sum_{i} (y_i - \bar{y})^2}$",
        r"$\mathrm{MAE} = \frac{1}{n} \sum_{i} |y_i - \hat{y}_i|$",
        r"$\mathrm{MSE} = \frac{1}{n} \sum_{i} (y_i - \hat{y}_i)^2$",
        r"$\mathrm{RMSE} = \sqrt{\mathrm{MSE}}$",
        r"$\mathrm{MAPE} = \frac{100}{n} \sum_{i} \left| \frac{y_i - \hat{y}_i}{y_i} \right|$"
    ],
    "Signification": [
        "1 = Modèle parfait, 0 = aussi bon que la moyenne, < 0 = pire que la moyenne",
        "Toujours ≥ 0 ; 0 = parfait ; valeur faible = bon modèle",
        "Toujours ≥ 0 ; sensible aux outliers",
        "Toujours ≥ 0 ; plus proche de 0 = meilleur",
        "0% = parfait, exprimé en pourcentage"
    ],
    "Interpretation": [
        "Vers 1 : excellent, proche de 0 : moyen, < 0 : mauvais",
        "0 = parfait, petite valeur = bon modèle",
        "0 = parfait, petite valeur = bon modèle",
        "Idem MAE/MSE",
        "<10% : très bon, <20% : bon, >50% : à éviter"
    ]
})

# Metriques de classification
classification_metrics = pd.DataFrame({
    "Nom": ["Accuracy (Précision)", "Précision (Precision)", "Rappel (Recall)", "F1-score", "Log loss (cross-entropy)", "AUC ROC", "MCC (Matthews corr. coeff.)"],
    "Description": [
        "Proportion correcte de classes bien prédites",
        "Corrects parmi les positifs trouvés",
        "Pourcentage de vrais positifs trouvés",
        "Moyenne harmonique Precision/Recall",
        "Pénalise probabilités fausses/classification",
        "Aire sous la courbe ROC",
        "Mesure robuste d’équilibre entre TP/TN/FP/FN"
    ],
    "Formule mathématique": [
        r"$\mathrm{Accuracy} = \frac{TP + TN}{N}$",
        r"$\mathrm{Precision} = \frac{TP}{TP + FP}$",
        r"$\mathrm{Recall} = \frac{TP}{TP + FN}$",
        r"$F_1 = 2 \cdot \frac{precision \cdot recall}{precision + recall}$",
        r"$-\\frac{1}{N} \\sum_i [ y_i \\log(p_i) + (1 - y_i) \\log(1 - p_i)]$",
        "Mesure calculée numériquement",
        r"$\\frac{TP \\times TN - FP \\times FN}{\\sqrt{(TP+FP) (TP+FN) (TN+FP) (TN+FN)}}$"
    ],
    "Signification": [
        "0 ≤ valeurs ≤ 1 ; 1 = parfait, 0 = aléatoire",
        "0 ≤ valeurs ≤ 1 ; 1 = aucune fausse alerte",
        "0 ≤ valeurs ≤ 1 ; 1 = tous retrouvés",
        "0 ≤ valeurs ≤ 1 ; 1 = parfait équilibre",
        "Plus petit = meilleur; min = 0",
        "0.5 = hasard, 1 = parfait",
        "-1 = mauvais, 0 = hasard, 1 = parfait"
    ],
    "Interpretation": [
        ">0.9 = excellente précision, <0.6 = faible, 0.5 = hasard",
        "Haut = fiabilité, peu de faux positifs",
        "Haut = faible oubli, grande sensibilité",
        "1 = parfait, 0 = mauvais",
        "0 = parfait, croît rapidement si mauvais",
        "> 0.8 = bon modèle, 0.5 = aléatoire",
        ">0.7 = bon modèle, 0 = hasard, <0 mauvais"
    ]
})

import IPython.display as display

print("### Métriques de Régression")
display.display(regression_metrics.style.set_caption("Métriques d'évaluation pour la régression").set_table_styles([
    {'selector': 'caption', 'props': [('font-size', '16px'), ('font-weight', 'bold')]}
]))

print("### Métriques de Classification")
display.display(classification_metrics.style.set_caption("Métriques d'évaluation pour la classification").set_table_styles([
    {'selector': 'caption', 'props': [('font-size', '16px'), ('font-weight', 'bold')]}
]))


### Métriques de Régression


Unnamed: 0,Nom,Description,Formule mathématique,Signification,Interpretation
0,R² (coefficient de détermination),Proportion de la variance expliquée par le modèle,$R^2 = 1 - \frac{\sum_{i} (y_i - \hat{y}_i)^2}{\sum_{i} (y_i - \bar{y})^2}$,"1 = Modèle parfait, 0 = aussi bon que la moyenne, < 0 = pire que la moyenne","Vers 1 : excellent, proche de 0 : moyen, < 0 : mauvais"
1,MAE (Mean Absolute Error),Erreur absolue moyenne entre cibles et prédictions,$\mathrm{MAE} = \frac{1}{n} \sum_{i} |y_i - \hat{y}_i|$,Toujours ≥ 0 ; 0 = parfait ; valeur faible = bon modèle,"0 = parfait, petite valeur = bon modèle"
2,MSE (Mean Squared Error),Erreur quadratique moyenne,$\mathrm{MSE} = \frac{1}{n} \sum_{i} (y_i - \hat{y}_i)^2$,Toujours ≥ 0 ; sensible aux outliers,"0 = parfait, petite valeur = bon modèle"
3,RMSE (Root Mean Square Error),Racine carrée de la MSE (mêmes unités que la cible),$\mathrm{RMSE} = \sqrt{\mathrm{MSE}}$,Toujours ≥ 0 ; plus proche de 0 = meilleur,Idem MAE/MSE
4,MAPE (Mean Absolute Percentage Error),Erreur absolue relative moyenne en pourcentage,$\mathrm{MAPE} = \frac{100}{n} \sum_{i} \left| \frac{y_i - \hat{y}_i}{y_i} \right|$,"0% = parfait, exprimé en pourcentage","<10% : très bon, <20% : bon, >50% : à éviter"


### Métriques de Classification


Unnamed: 0,Nom,Description,Formule mathématique,Signification,Interpretation
0,Accuracy (Précision),Proportion correcte de classes bien prédites,$\mathrm{Accuracy} = \frac{TP + TN}{N}$,"0 ≤ valeurs ≤ 1 ; 1 = parfait, 0 = aléatoire",">0.9 = excellente précision, <0.6 = faible, 0.5 = hasard"
1,Précision (Precision),Corrects parmi les positifs trouvés,$\mathrm{Precision} = \frac{TP}{TP + FP}$,0 ≤ valeurs ≤ 1 ; 1 = aucune fausse alerte,"Haut = fiabilité, peu de faux positifs"
2,Rappel (Recall),Pourcentage de vrais positifs trouvés,$\mathrm{Recall} = \frac{TP}{TP + FN}$,0 ≤ valeurs ≤ 1 ; 1 = tous retrouvés,"Haut = faible oubli, grande sensibilité"
3,F1-score,Moyenne harmonique Precision/Recall,$F_1 = 2 \cdot \frac{precision \cdot recall}{precision + recall}$,0 ≤ valeurs ≤ 1 ; 1 = parfait équilibre,"1 = parfait, 0 = mauvais"
4,Log loss (cross-entropy),Pénalise probabilités fausses/classification,$-\\frac{1}{N} \\sum_i [ y_i \\log(p_i) + (1 - y_i) \\log(1 - p_i)]$,Plus petit = meilleur; min = 0,"0 = parfait, croît rapidement si mauvais"
5,AUC ROC,Aire sous la courbe ROC,Mesure calculée numériquement,"0.5 = hasard, 1 = parfait","> 0.8 = bon modèle, 0.5 = aléatoire"
6,MCC (Matthews corr. coeff.),Mesure robuste d’équilibre entre TP/TN/FP/FN,$\\frac{TP \\times TN - FP \\times FN}{\\sqrt{(TP+FP) (TP+FN) (TN+FP) (TN+FN)}}$,"-1 = mauvais, 0 = hasard, 1 = parfait",">0.7 = bon modèle, 0 = hasard, <0 mauvais"
