# Score

Le terme "score" est généralement associé à la mesure de la performance d'un modèle de machine learning ou d'apprentissage profond. Le score est une évaluation quantitative de la qualité des prédictions d'un modèle par rapport aux valeurs réelles (ou aux étiquettes) dans un ensemble de données. Le score dépend de la tâche spécifique que vous effectuez, qu'il s'agisse de classification, de régression ou d'une autre tâche.


## Score de Classification :

Dans le contexte de la classification, le "score" peut se référer à des métriques telles que l'exactitude (accuracy), la précision (precision), le rappel (recall), le score F1, etc. Ces métriques mesurent la capacité du modèle à classer correctement les exemples dans différentes catégories.
Régression :


* **Accuracy** : La fonction d'accuracy calcule la proportion d'échantillons correctement classés par le modèle. 
$$Accuracy = \frac{TP+TN}{TP+TN+FP+FN}$$
où **TP** est le nombre de vrais positifs, **TN** est le nombre de vrais négatifs, **FP** est le nombre de faux positifs et **FN** est le nombre de faux négatifs.

* **Precision** : La fonction de Precision calcule la proportion des prédictions positives qui sont correctes parmi toutes les prédictions positives. 
$$Precision = \frac{TP}{TP+FP}$$

* **Recall** : La fonction Recall calcule la proportion des vrais positifs qui sont correctement identifiés parmi tous les vrais positifs et les faux négatifs. 
$$Recall = \frac{TP}{TP+FN}$$

* **F1 Score** : La fonction F1 Score est une mesure de la précision et du recall, qui calcule la moyenne harmonique entre les deux mesures. 
$$F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}$$

    L'avantage du F1-score par rapport à simplement prendre la moyenne de la précision et du rappel réside dans le fait qu'il accorde plus de poids aux classes minoritaires. Cela signifie que le F1-score est particulièrement utile lorsque vous avez des classes déséquilibrées, car il pénalise davantage les modèles qui ont de mauvaises performances sur les classes minoritaires.

    En résumé, le F1-score est une métrique globale qui tient compte à la fois de la précision et du rappel, ce qui en fait une mesure utile pour évaluer la performance d'un modèle de classification dans des situations où l'équilibre entre les classes ou la gestion des faux positifs et des faux négatifs est essentiel.

In [None]:
from tensorflow import keras

# Créez votre modèle Keras (à titre d'exemple)
model = keras.Sequential()
# Ajoutez des couches au modèle

# Compilez le modèle avec les métriques d'intérêt
model.compile(optimizer='adam',
              loss='binary_crossentropy',  # ou la fonction de perte appropriée
              metrics=['accuracy', keras.metrics.Precision(), keras.metrics.Recall(), keras.metrics.F1Score()])

# Entraînez votre modèle avec vos données d'entraînement
# model.fit(train_data, train_labels, epochs=...)

# Évaluez votre modèle avec des métriques (précision, recall, F1-score inclus)
# scores = model.evaluate(test_data, test_labels)
# accuracy = scores[1]
# precision = scores[2]
# recall = scores[3]
# f1_score = scores[4]


## Score de régression

Dans le contexte de la régression, le "score" peut être représenté par des métriques telles que l'erreur quadratique moyenne (Mean Squared Error, MSE), l'erreur absolue moyenne (Mean Absolute Error, MAE), le coefficient de détermination (R-squared), etc. Ces métriques quantifient à quel point les prédictions du modèle correspondent aux valeurs réelles dans le cas de la régression.

* **Mean Squared Error (MSE)** : La fonction de MSE calcule la moyenne des carrés des différences entre les prédictions et les vraies valeurs. Cette fonction est couramment utilisée pour les problèmes de régression.

* **Root Mean Squared Error (RMSE)** : La fonction de RMSE calcule la racine carrée de la moyenne des carrés des différences entre les prédictions et les vraies valeurs. Cette fonction est également couramment utilisée pour les problèmes de régression.

* **R2 Score** également connu sous le nom de R-squared ($R^2$), est une mesure couramment utilisée pour évaluer la performance d'un modèle de régression. Il quantifie à quel point le modèle de régression s'ajuste aux données réelles. Le R2 score est une valeur comprise entre 0 et 1, où :

    R2 = 1 : Le modèle explique parfaitement la variation des données. Toutes les variations dans les données sont capturées par le modèle, et les prédictions correspondent exactement aux valeurs réelles. C'est le scénario idéal.
    
    R2 = 0 : Le modèle n'explique aucune variation des données. Les prédictions du modèle sont aussi bonnes que de simplement utiliser la moyenne des valeurs réelles. Cela signifie que le modèle est inefficace pour expliquer les données.
    
    0 < R2 < 1 : Le modèle explique une proportion de la variation des données. Plus R2 se rapproche de 1, plus le modèle est performant pour expliquer la variation. Une valeur de 0,5 (par exemple) indiquerait que le modèle explique la moitié de la variation des données, ce qui est généralement considéré comme un ajustement raisonnable.

$$R^2 = 1 - \frac{\sum_{i=1}^{N}(y_i - \hat{y}_i)^2}{\sum_{i=1}^{N}(y_i - \bar{y})^2}$$

avec **N** est le nombre d'échantillons dans le jeu de données, $y_i$ la vraie valeur de l'échantilon, $\hat{y}_i$ la valeur prédite et $\bar{y}$ est la moyenne des valeurs réelles $y$.

In [None]:
from tensorflow import keras

# Créez votre modèle Keras (à titre d'exemple)
model = keras.Sequential()
# Ajoutez des couches au modèle

# Compilez le modèle avec les métriques d'intérêt
model.compile(optimizer='adam',
              loss='mean_squared_error',  # ou la fonction de perte appropriée pour la régression
              metrics=['mean_absolute_error', 'mean_squared_error', keras.metrics.MeanSquaredError(), keras.metrics.MeanAbsoluteError()])

# Entraînez votre modèle avec vos données d'entraînement
# model.fit(train_data, train_labels, epochs=...)

# Évaluez votre modèle avec les métriques (MSE, MAE et R2 inclus)
# scores = model.evaluate(test_data, test_labels)
# mse = scores[1]  # MSE
# mae = scores[2]  # MAE
# r2 = calculate_r2(test_labels, model.predict(test_data))  # R2 (utilisez une fonction pour calculer R2)
