## 2.1 ***Ce qui suit : Le Rôle des Fonctions de Perte***
___

Maintenant que nous avons vu comment les réseaux de neurones utilisent des couches et des poids pour faire des prédictions, la question suivante est : **comment le réseau sait-il si ses prédictions sont correctes ?** C'est ici qu'entre en jeu le concept de **fonction de perte**.


### Qu'est-ce qu'une Fonction de Perte ?

Une fonction de perte est un moyen de mesurer dans quelle mesure les prédictions du réseau de neurones correspondent aux valeurs cibles réelles. Elle fournit une valeur numérique indiquant le degré d'erreur dans les prédictions. Plus la perte est faible, plus les prédictions du réseau sont proches des cibles réelles.


![alt text](../../Source/loss_understand.png)

Il existe de nombreuses fonctions de perte adaptées à différents cas, mais aujourd'hui nous allons nous concentrer sur l'erreur quadratique moyenne, que nous appellerons ici **Mean Squared Error (MSE)**, qui est l'une des fonctions de perte les plus simples à comprendre. Voici sa représentation mathématique :

<img src="../../Source/loss_graph.png" alt="alt text" width="450" height="300">


### Représentation Mathématique de la MSE

La Mean Squared Error (MSE) mesure la différence moyenne au carré entre les valeurs prédites et les valeurs cibles réelles. Elle est calculée à l'aide de la formule suivante :

$$
\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

Où :

- $n$ est le nombre de points de données.
- $y_i$ est la valeur cible réelle pour le $i^{\text{ème}}$ point de données.
- $ŷ_i$ est la valeur prédite pour le $i^{\text{ème}}$ point de données.

*Elle représente la différence moyenne au carré entre les valeurs prédites et les valeurs cibles réelles.*
***Voici une [vidéo](https://www.youtube.com/watch?v=VaOlkbKQFcY) pour mieux comprendre***


---
#### Essayons d'implémenter la fonction MSE !

In [None]:
import numpy as np

target_output = np.array([1.0, 0.0, 1.0, 0.0])

predicted_output = np.array([0.9, 0.5, 0.8, 0.2])

# TODO : Calculer la Mean Squared Error
mse_loss = np.mean(...)

print("Mean Squared Error", mse_loss)
assert mse_loss == 0.08499999999999999

Bien joué ! Vous comprenez maintenant comment fonctionne une fonction de perte ! PyTorch implémente de nombreuses fonctions de perte différentes, comme la **Mean Squared Error** et la **Cross-Entropy Loss**, qui est l'une des fonctions de perte les plus couramment utilisées pour les tâches de classification.

Comme vous pouvez le voir ci-dessous, voici comment vous pouvez utiliser ces fonctions de perte dans PyTorch :

**Essayez de l'implémenter !**


In [None]:
import torch
import torch.nn as nn

# Exemple utilisant la fonction de perte Mean Squared Error (MSE) de torch
mse_loss = ...

# Exemple utilisant la fonction de perte Cross-Entropy de torch
cross_entropy_loss = ...

target_output = torch.tensor([1.0, 0.0, 1.0, 0.0])
predicted_output = torch.tensor([0.9, 0.5, 0.8, 0.2])

result_mse = mse_loss(predicted_output, target_output)
print("MSE Loss :", result_mse)

result_cross_entropy = cross_entropy_loss(predicted_output, target_output)
print("Cross-Entropy Loss :", result_cross_entropy)


___
# ***Bonus***
### Comprendre la Fonction de Perte Cross-Entropy

La **Cross-Entropy Loss** est une fonction de perte cruciale, utilisée principalement pour les tâches de classification. Elle mesure la différence entre la distribution réelle des classes et la distribution prédite, ce qui en fait un excellent choix pour les tâches où l'objectif est de prédire la catégorie ou la classe à laquelle appartient une entrée.

### Comment Fonctionne la Cross-Entropy Loss

- **Représentation de la Cible** : Pour la classification, la sortie cible est souvent représentée sous forme de vecteur encodé en one-hot. Par exemple, s'il y a trois classes et que la bonne classe est la deuxième, le vecteur cible ressemblera à \([0, 1, 0]\).

- **Probabilités Prédites** : Le modèle génère un vecteur de probabilités prédites pour chaque classe, qui doit totaliser 1. Par exemple, la prédiction pourrait être \([0.2, 0.7, 0.1]\).

- **Calcul** : La Cross-Entropy Loss mesure la différence entre la classe correcte (le vecteur one-hot) et les probabilités prédites. La formule est :

  $$
  L = -\sum_{i=1}^{n} y_i \cdot \log(\hat{y}_i)
  $$

  Où :
  - $y_i$ est la valeur cible réelle (1 pour la classe correcte, 0 sinon).
  - $ŷ_i$ est la probabilité prédite pour chaque classe.

### Pourquoi Utiliser la Cross-Entropy Loss ?

- **Meilleure pour la Classification** : Contrairement à la Mean Squared Error, qui mesure les différences au carré, la Cross-Entropy Loss compare directement les distributions de probabilités, ce qui la rend plus adaptée aux problèmes de classification. Elle pénalise fortement les prédictions incorrectes, incitant le modèle à produire des prédictions précises et confiantes.

### Résumé

La Cross-Entropy Loss est un outil puissant pour l'entraînement des modèles de classification, car elle mesure directement la correspondance entre les probabilités prédites et les classes réelles. En minimisant cette perte, le modèle apprend à faire des prédictions plus précises.
