## ``INFO4127`` : OPTIMISATION II

# TP1 : Utilisation des outils de calcul symbolique sur les fonctions de perte

### Membres du groupe :
- MVOGO MONDOMAN Franck Stéphane : ``20Y058``
- ETOUNDI TSANGA ELIHU FREDERIC : ``22Y567``
- ABANDA ARMAND WILFRIED : ``21T2487``

### Introduction

**Une fonction de perte** est un processus mathématique qui quantifie la marge d'erreur entre la prédiction d'un modèle et la valeur cible réelle. Elle est un moyen mesurable d'évaluer les performances et la précision d'un modèle d'apprentissage automatique.

Dans la suite de ce notebook, pour chacune des fonctions de pertes suivantes :
- Erreur Quadratique Moyenne
- Entropie Croisée Binaire
- Entropie Croisée Catégorielle
- Perte de Huber

Nous allons à l'aide des fonctions de calcul symbolique du langage python :
1. Fournir les expressions des gradients de ces fonctions.
2. Étudier les propriétés de convexité des fonctions
3. Représenter les courbes de ses fonctions et Trouver l'équation de la tangente à l'ellipse au point de coordonnées données sur un jeu de données dédiées.
 

### Outils utilisés
- Python 3.13.5
- Sympy 1.14.0
- Matplotlib

In [None]:
# Importations des bibliothèques nécessaires
import sympy as sp
import matplotlib.pyplot as plt

### Présentations des jeux de données pour l'étude graphique

##### 1. Jeu de données pour la classification  
- **Nom** : Apples and Oranges  
- **Lien** : [Kaggle – Apples and Oranges](https://www.kaggle.com/code/raykleptzo/classification-data-apples-and-oranges/input)  
- **Colonnes** :  
  - `weight` : poids du fruit  
  - `size` : taille du fruit  
  - `class` : étiquette de classification (pomme ou orange)  
- **Taille** : 73 observations  

---

##### 2. Jeu de données pour la régression  
- **Nom** : Multiple Linear Regression Dataset  
- **Lien** : [Kaggle – Multiple Linear Regression Dataset](https://www.kaggle.com/datasets/hussainnasirkhan/multiple-linear-regression-dataset?resource=download)  
- **Colonnes** :  
  - `age` : âge de la personne  
  - `experience` : nombre d’années d’expérience  
  - `income` : revenu (variable cible pour la régression)  
- **Taille** : 20 observations  


### I. Erreur Quadratique Moyenne (MSE)

LA MSE est une est une fonction de perte qui quantifie l'ampleur de l'erreur entre la prédiction d'un algorithme d'apprentissage automatique et une sortie réelle en prenant la moyenne de la différence quadratique entre les prédictions et les valeurs cibles.
Son expression est la suivante :
**MSE = (1/n) * Σ(yᵢ - ȳ)²**

Où ?

- n est le nombre d'échantillons dans l'ensemble de données
- yᵢ est la valeur prédite pour le i-ième échantillon
- ȳ est la valeur cible pour le i-ième échantillon

In [8]:
n = sp.symbols('n', integer=True)
y = sp.symbols('y0:%d' % n)       # y0, y1, ..., y_{n-1}
y_hat = sp.symbols('y_hat0:%d' % n)  # y_hat0, ..., y_hat_{n-1}

MSE_total = sum((y[i] - y_hat[i])**2 for i in range(n)) / n

# Gradient vectoriel
MSE_grad = [sp.diff(MSE_total, y_hat[i]) for i in range(n)]

# Hessienne (matrice diagonale ici)
MSE_hessian = sp.Matrix([[sp.diff(MSE_grad[i], y_hat[j]) for j in range(n)] for i in range(n)])


In [15]:
print(f"Fonction MSE : \n {MSE_total}")
print(f"Gradient : \n {MSE_grad}")
print(f"Hessienne : \n {MSE_hessian}")

Fonction MSE : 
 Sum((y[i] - y_hat[i])**2/n, (i, 0, n - 1))
Gradient : 
 -2*y + 2*y_hat
Hessienne : 
 2


Cette fonction est convexe car la matrice hessienne est définie positive