# R√©gression Lin√©aire De Z√©ro

Dans ce notebook, vous allez apprendre √† impl√©menter la **R√©gression Lin√©aire** de z√©ro en utilisant uniquement NumPy. 

## Objectifs d'Apprentissage
- Comprendre les fondements math√©matiques de la r√©gression lin√©aire
- Impl√©menter la fonction de pr√©diction : $y = wx + b$
- Calculer l'erreur quadratique moyenne (MSE)
- Calculer les gradients en utilisant le calcul diff√©rentiel
- Impl√©menter l'optimisation par descente de gradient
- Entra√Æner un mod√®le pour pr√©dire les notes des √©tudiants en fonction du temps d'√©tude
- Sauvegarder et charger les poids du mod√®le entra√Æn√©
- Faire des pr√©dictions sur de nouvelles donn√©es

## Jeu de Donn√©es
Nous utiliserons un jeu de donn√©es sur les temps d'√©tude des √©tudiants (en minutes) et leurs notes correspondantes (0-100).

## Table des Mati√®res
- [1 - Importer les Packages](#1)
- [2 - Charger et Visualiser le Jeu de Donn√©es](#2)
- [3 - Th√©orie de la R√©gression Lin√©aire](#3)
  - [3.1 - La Formule de Pr√©diction](#3-1)
  - [3.2 - Erreur Quadratique Moyenne (MSE)](#3-2)
  - [3.3 - Calcul des Gradients](#3-3)
  - [3.4 - Descente de Gradient](#3-4)
- [4 - Impl√©mentation De Z√©ro](#4)
  - [4.1 - Fonction de Pr√©diction](#4-1)
  - [4.2 - Fonction de Perte MSE](#4-2)
  - [4.3 - Calcul des Gradients](#4-3)
  - [4.4 - Descente de Gradient](#4-4)
  - [4.5 - Fonction d'Entra√Ænement](#4-5)
- [5 - Entra√Æner le Mod√®le](#5)
- [6 - Sauvegarder les Poids du Mod√®le](#6)
- [7 - Charger les Poids du Mod√®le](#7)
- [8 - Tester sur Nouvelles Donn√©es](#8)
- [9 - Visualiser les R√©sultats](#9)
- [10 - Conclusion](#10)

<a name='1'></a>
## 1 - Importer les Packages

Commen√ßons par importer les packages n√©cessaires :
- **numpy** : Pour les calculs num√©riques
- **matplotlib** : Pour les visualisations
- **pandas** : Pour charger et manipuler le jeu de donn√©es
- **pickle** : Pour sauvegarder et charger les poids du mod√®le

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import pickle
import os

%matplotlib inline

<a name='2'></a>
## 2 - Charger et Visualiser le Jeu de Donn√©es

Chargeons notre jeu de donn√©es contenant les temps d'√©tude des √©tudiants et leurs notes correspondantes.

In [None]:
# Charger le jeu de donn√©es
data = pd.read_csv('study_grades_dataset.csv')

# Afficher les premi√®res lignes
print("Premiers 5 √©chantillons du jeu de donn√©es :")
print(data.head())

# Afficher les statistiques du jeu de donn√©es
print("\nStatistiques du Jeu de Donn√©es :")
print(data.describe())

print(f"\nNombre total d'√©chantillons : {len(data)}")

In [None]:
# Extraire les caract√©ristiques (X) et les √©tiquettes (y)
X = data['study_time_minutes'].values
y = data['grade'].values

print(f"Forme de X : {X.shape}")
print(f"Forme de y : {y.shape}")

# Visualiser le jeu de donn√©es
plt.figure(figsize=(10, 6))
plt.scatter(X, y, alpha=0.6, color='blue', edgecolors='k')
plt.xlabel('Temps d\'√âtude (minutes)', fontsize=12)
plt.ylabel('Note', fontsize=12)
plt.title('Notes des √âtudiants vs Temps d\'√âtude', fontsize=14)
plt.grid(True, alpha=0.3)
plt.show()

print("\nComme vous pouvez le constater, il y a une corr√©lation positive entre le temps d'√©tude et les notes !")

<a name='3'></a>
## 3 - Th√©orie de la R√©gression Lin√©aire

Avant d'impl√©menter, comprenons les math√©matiques derri√®re la r√©gression lin√©aire.

<a name='3-1'></a>
### 3.1 - La Formule de Pr√©diction

En r√©gression lin√©aire, nous voulons trouver une relation lin√©aire entre la caract√©ristique d'entr√©e $x$ (temps d'√©tude) et la sortie $y$ (note).

La formule de pr√©diction est :

$$\hat{y} = wx + b$$

O√π :
- $\hat{y}$ est la valeur pr√©dite
- $x$ est la caract√©ristique d'entr√©e (temps d'√©tude)
- $w$ est le poids (pente de la droite)
- $b$ est le biais (ordonn√©e √† l'origine)

Pour plusieurs √©chantillons, nous pouvons vectoriser ceci comme :

$$\hat{Y} = wX + b$$

O√π $X$ et $\hat{Y}$ sont des vecteurs de toutes les caract√©ristiques d'entr√©e et pr√©dictions.

<a name='3-2'></a>
### 3.2 - Erreur Quadratique Moyenne (MSE)

Pour entra√Æner notre mod√®le, nous devons mesurer √† quel point nos pr√©dictions sont √©loign√©es des valeurs r√©elles. Nous utilisons **l'Erreur Quadratique Moyenne (MSE)** comme fonction de perte :

$$\text{MSE} = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)})^2$$

O√π :
- $m$ est le nombre d'exemples d'entra√Ænement
- $\hat{y}^{(i)}$ est la valeur pr√©dite pour l'exemple $i$
- $y^{(i)}$ est la valeur r√©elle pour l'exemple $i$

La MSE mesure la diff√©rence quadratique moyenne entre les pr√©dictions et les valeurs r√©elles. Notre objectif est de **minimiser cette erreur** en trouvant les meilleures valeurs pour $w$ et $b$.

<a name='3-3'></a>
### 3.3 - Calcul des Gradients

Pour minimiser la MSE, nous devons savoir comment la perte change lorsque nous ajustons $w$ et $b$. Cela se fait en utilisant les **gradients** (d√©riv√©es partielles).

Le gradient de la MSE par rapport √† $w$ :

$$\frac{\partial \text{MSE}}{\partial w} = \frac{2}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)}) \cdot x^{(i)}$$

Sous forme vectoris√©e :

$$\frac{\partial \text{MSE}}{\partial w} = \frac{2}{m} X^T (\hat{Y} - Y)$$

Le gradient de la MSE par rapport √† $b$ :

$$\frac{\partial \text{MSE}}{\partial b} = \frac{2}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)})$$

Sous forme vectoris√©e :

$$\frac{\partial \text{MSE}}{\partial b} = \frac{2}{m} \sum (\hat{Y} - Y)$$

Ces gradients nous indiquent la direction et l'amplitude pour ajuster $w$ et $b$ afin de r√©duire l'erreur.

<a name='3-4'></a>
### 3.4 - Descente de Gradient

La **Descente de Gradient** est un algorithme d'optimisation qui ajuste it√©rativement les param√®tres pour minimiser la fonction de perte.

Les r√®gles de mise √† jour sont :

$$w := w - \alpha \frac{\partial \text{MSE}}{\partial w}$$

$$b := b - \alpha \frac{\partial \text{MSE}}{\partial b}$$

O√π :
- $\alpha$ est le **taux d'apprentissage** (contr√¥le la taille du pas)
- Les gradients nous indiquent dans quelle direction nous d√©placer

Nous r√©p√©tons ce processus pendant de nombreuses it√©rations jusqu'√† ce que le mod√®le converge (la perte cesse de diminuer significativement).

<a name='4'></a>
## 4 - Impl√©mentation De Z√©ro

Maintenant impl√©mentons chaque composant de la r√©gression lin√©aire de z√©ro !

<a name='4-1'></a>
### 4.1 - Fonction de Pr√©diction

D'abord, impl√©mentons la fonction de pr√©diction : $\hat{y} = wx + b$

In [None]:
def predict(X, w, b):
    """
    Calculer les pr√©dictions en utilisant la formule de r√©gression lin√©aire.
    
    Arguments :
    X -- caract√©ristiques d'entr√©e, tableau numpy de forme (m,) o√π m est le nombre d'exemples
    w -- param√®tre de poids (pente)
    b -- param√®tre de biais (ordonn√©e √† l'origine)
    
    Retourne :
    y_pred -- pr√©dictions, tableau numpy de forme (m,)
    """
    y_pred = w * X + b
    return y_pred

In [None]:
# Tester la fonction de pr√©diction
test_X = np.array([100, 200, 300])
test_w = 0.03
test_b = 40

test_predictions = predict(test_X, test_w, test_b)
print(f"Entr√©es de test : {test_X}")
print(f"Pr√©dictions de test : {test_predictions}")
print(f"\nAvec w={test_w} et b={test_b} :")
print(f"  - {test_X[0]} minutes d'√©tude ‚Üí note pr√©dite : {test_predictions[0]}")
print(f"  - {test_X[1]} minutes d'√©tude ‚Üí note pr√©dite : {test_predictions[1]}")
print(f"  - {test_X[2]} minutes d'√©tude ‚Üí note pr√©dite : {test_predictions[2]}")

<a name='4-2'></a>
### 4.2 - Fonction de Perte MSE

Maintenant impl√©mentons la fonction de perte d'Erreur Quadratique Moyenne.

In [None]:
def compute_mse(y_true, y_pred):
    """
    Calculer l'Erreur Quadratique Moyenne entre les valeurs vraies et pr√©dites.
    
    Arguments :
    y_true -- valeurs r√©elles, tableau numpy de forme (m,)
    y_pred -- valeurs pr√©dites, tableau numpy de forme (m,)
    
    Retourne :
    mse -- erreur quadratique moyenne (scalaire)
    """
    m = len(y_true)
    mse = (1/m) * np.sum((y_pred - y_true)**2)
    return mse

In [None]:
# Tester la fonction MSE
test_y_true = np.array([50, 60, 70])
test_y_pred = np.array([48, 62, 68])

test_mse = compute_mse(test_y_true, test_y_pred)
print(f"Valeurs vraies : {test_y_true}")
print(f"Valeurs pr√©dites : {test_y_pred}")
print(f"Erreur Quadratique Moyenne : {test_mse:.2f}")
print(f"\nUne MSE plus faible signifie de meilleures pr√©dictions !")

<a name='4-3'></a>
### 4.3 - Calcul des Gradients

Impl√©menter le calcul du gradient pour $w$ et $b$.

In [None]:
def compute_gradients(X, y_true, y_pred):
    """
    Calculer les gradients de la MSE par rapport √† w et b.
    
    Arguments :
    X -- caract√©ristiques d'entr√©e, tableau numpy de forme (m,)
    y_true -- valeurs r√©elles, tableau numpy de forme (m,)
    y_pred -- valeurs pr√©dites, tableau numpy de forme (m,)
    
    Retourne :
    dw -- gradient par rapport √† w (scalaire)
    db -- gradient par rapport √† b (scalaire)
    """
    m = len(y_true)
    
    # Calculer l'erreur
    error = y_pred - y_true
    
    # Calculer les gradients
    dw = (2/m) * np.sum(error * X)
    db = (2/m) * np.sum(error)
    
    return dw, db

In [None]:
# Tester la fonction de gradient
test_X = np.array([100, 200, 300])
test_y_true = np.array([50, 60, 70])
test_y_pred = np.array([48, 62, 68])

test_dw, test_db = compute_gradients(test_X, test_y_true, test_y_pred)
print(f"Gradient par rapport √† w (dw) : {test_dw:.4f}")
print(f"Gradient par rapport √† b (db) : {test_db:.4f}")
print(f"\nCes gradients nous indiquent comment ajuster w et b pour r√©duire l'erreur.")

<a name='4-4'></a>
### 4.4 - Descente de Gradient

Impl√©menter une √©tape de descente de gradient pour mettre √† jour les param√®tres.

In [None]:
def gradient_descent_step(w, b, dw, db, learning_rate):
    """
    Effectuer une √©tape de descente de gradient.
    
    Arguments :
    w -- poids actuel
    b -- biais actuel
    dw -- gradient par rapport √† w
    db -- gradient par rapport √† b
    learning_rate -- taille du pas pour les mises √† jour
    
    Retourne :
    w_new -- poids mis √† jour
    b_new -- biais mis √† jour
    """
    w_new = w - learning_rate * dw
    b_new = b - learning_rate * db
    
    return w_new, b_new

In [None]:
# Tester l'√©tape de descente de gradient
test_w = 0.03
test_b = 40
test_dw = 0.5
test_db = 2.0
test_lr = 0.01

new_w, new_b = gradient_descent_step(test_w, test_b, test_dw, test_db, test_lr)
print(f"Avant mise √† jour : w = {test_w}, b = {test_b}")
print(f"Gradients : dw = {test_dw}, db = {test_db}")
print(f"Taux d'apprentissage : {test_lr}")
print(f"Apr√®s mise √† jour : w = {new_w}, b = {new_b}")

<a name='4-5'></a>
### 4.5 - Fonction d'Entra√Ænement

Maintenant combinons tout dans une fonction d'entra√Ænement compl√®te.

In [None]:
def train_linear_regression(X, y, learning_rate=0.0001, num_iterations=1000, print_cost=True):
    """
    Entra√Æner un mod√®le de r√©gression lin√©aire en utilisant la descente de gradient.
    
    Arguments :
    X -- caract√©ristiques d'entr√©e, tableau numpy de forme (m,)
    y -- valeurs cibles, tableau numpy de forme (m,)
    learning_rate -- taux d'apprentissage pour la descente de gradient
    num_iterations -- nombre d'it√©rations d'entra√Ænement
    print_cost -- si True, afficher le co√ªt toutes les 100 it√©rations
    
    Retourne :
    w -- poids entra√Æn√©
    b -- biais entra√Æn√©
    costs -- liste des co√ªts pendant l'entra√Ænement (pour le tra√ßage)
    """
    # Initialiser les param√®tres
    w = 0.0
    b = 0.0
    
    costs = []
    
    for i in range(num_iterations):
        # Passe avant : calculer les pr√©dictions
        y_pred = predict(X, w, b)
        
        # Calculer la perte
        cost = compute_mse(y, y_pred)
        
        # Calculer les gradients
        dw, db = compute_gradients(X, y, y_pred)
        
        # Mettre √† jour les param√®tres
        w, b = gradient_descent_step(w, b, dw, db, learning_rate)
        
        # Enregistrer le co√ªt
        if i % 100 == 0:
            costs.append(cost)
            if print_cost:
                print(f"It√©ration {i} : MSE = {cost:.2f}")
    
    # Afficher les r√©sultats finaux
    if print_cost:
        print(f"\n{'='*50}")
        print(f"Entra√Ænement Termin√© !")
        print(f"MSE Finale : {cost:.2f}")
        print(f"Param√®tres appris : w = {w:.6f}, b = {b:.6f}")
        print(f"{'='*50}")
    
    return w, b, costs

<a name='5'></a>
## 5 - Entra√Æner le Mod√®le

Entra√Ænons notre mod√®le de r√©gression lin√©aire sur le jeu de donn√©es temps d'√©tude et notes !

In [None]:
# Entra√Æner le mod√®le
print("D√©but de l'entra√Ænement...\n")

w_trained, b_trained, training_costs = train_linear_regression(
    X, y,
    learning_rate=0.00001,
    num_iterations=2000,
    print_cost=True
)

In [None]:
# Tracer la courbe d'entra√Ænement
plt.figure(figsize=(10, 6))
plt.plot(range(0, len(training_costs)*100, 100), training_costs, linewidth=2, color='red')
plt.xlabel('It√©ration', fontsize=12)
plt.ylabel('Erreur Quadratique Moyenne (MSE)', fontsize=12)
plt.title('Perte d\'Entra√Ænement au Fil du Temps', fontsize=14)
plt.grid(True, alpha=0.3)
plt.show()

print("La diminution de la perte montre que notre mod√®le apprend !")

<a name='6'></a>
## 6 - Sauvegarder les Poids du Mod√®le

Maintenant que nous avons entra√Æn√© notre mod√®le, sauvegardons les poids pour pouvoir les r√©utiliser plus tard sans r√©entra√Æner.

In [None]:
# Cr√©er le dossier model s'il n'existe pas
if not os.path.exists('model'):
    os.makedirs('model')
    print("Dossier 'model' cr√©√©.")

# Sauvegarder les poids entra√Æn√©s
model_weights = {
    'w': w_trained,
    'b': b_trained
}

with open('model/linear_regression_weights.pkl', 'wb') as f:
    pickle.dump(model_weights, f)

print(f"\nPoids du mod√®le sauvegard√©s avec succ√®s !")
print(f"Fichier : model/linear_regression_weights.pkl")
print(f"Poids : w = {w_trained:.6f}, b = {b_trained:.6f}")

<a name='7'></a>
## 7 - Charger les Poids du Mod√®le

D√©montrons comment charger les poids sauvegard√©s. C'est utile lorsque vous voulez faire des pr√©dictions sans r√©entra√Æner.

In [None]:
# Charger les poids sauvegard√©s
with open('model/linear_regression_weights.pkl', 'rb') as f:
    loaded_weights = pickle.load(f)

w_loaded = loaded_weights['w']
b_loaded = loaded_weights['b']

print("Poids du mod√®le charg√©s avec succ√®s !")
print(f"Poids charg√©s : w = {w_loaded:.6f}, b = {b_loaded:.6f}")

# V√©rifier qu'ils correspondent aux poids entra√Æn√©s
print(f"\nV√©rification :")
print(f"  w correspond : {np.isclose(w_loaded, w_trained)}")
print(f"  b correspond : {np.isclose(b_loaded, b_trained)}")

<a name='8'></a>
## 8 - Tester sur Nouvelles Donn√©es

Maintenant utilisons notre mod√®le entra√Æn√© pour faire des pr√©dictions sur de nouveaux temps d'√©tude non vus !

In [None]:
# G√©n√©rer des temps d'√©tude de test al√©atoires
np.random.seed(42)
test_study_times = np.random.randint(5, 3000, size=10)
test_study_times = np.sort(test_study_times)

# Faire des pr√©dictions en utilisant les poids charg√©s
test_predictions = predict(test_study_times, w_loaded, b_loaded)

# Afficher les r√©sultats
print("Pr√©dictions sur Nouvelles Donn√©es :")
print("=" * 50)
for study_time, grade in zip(test_study_times, test_predictions):
    print(f"Temps d'√âtude : {study_time:4d} minutes ‚Üí Note Pr√©dite : {grade:.1f}")
print("=" * 50)

In [None]:
# Fonction de pr√©diction interactive
def predict_grade(study_minutes):
    """
    Pr√©dire la note pour un temps d'√©tude donn√©.
    
    Arguments :
    study_minutes -- temps d'√©tude en minutes
    
    Retourne :
    predicted_grade -- note pr√©dite (limit√©e √† 0-100)
    """
    grade = predict(np.array([study_minutes]), w_loaded, b_loaded)[0]
    # Limiter √† la plage de notes valide
    grade = np.clip(grade, 0, 100)
    return grade

# Essayer quelques exemples
print("\nPr√©dictions Interactives :")
print("=" * 50)
example_times = [60, 300, 600, 1200, 2400]
for time in example_times:
    predicted = predict_grade(time)
    print(f"Si vous √©tudiez {time:4d} minutes, note pr√©dite : {predicted:.1f}")
print("=" * 50)

print("\nüí° Astuce : Vous pouvez modifier example_times pour tester vos propres dur√©es d'√©tude !")

<a name='9'></a>
## 9 - Visualiser les R√©sultats

Visualisons √† quel point notre mod√®le s'ajuste aux donn√©es.

In [None]:
# G√©n√©rer des pr√©dictions pour l'ensemble du jeu de donn√©es
y_pred_all = predict(X, w_loaded, b_loaded)

# Cr√©er la visualisation
plt.figure(figsize=(12, 6))

# Tracer les points de donn√©es originaux
plt.scatter(X, y, alpha=0.5, color='blue', label='Donn√©es R√©elles', edgecolors='k')

# Tracer la droite de r√©gression
plt.plot(X, y_pred_all, color='red', linewidth=2, label='Ajustement de R√©gression Lin√©aire')

# Tracer les pr√©dictions de test
plt.scatter(test_study_times, test_predictions, color='green', 
            s=100, marker='*', label='Pr√©dictions de Test', 
            edgecolors='black', linewidth=1.5)

plt.xlabel('Temps d\'√âtude (minutes)', fontsize=12)
plt.ylabel('Note', fontsize=12)
plt.title('R√©gression Lin√©aire : Temps d\'√âtude vs Note', fontsize=14)
plt.legend(fontsize=10)
plt.grid(True, alpha=0.3)
plt.show()

print(f"\nLa ligne rouge montre notre mod√®le appris : Note = {w_loaded:.6f} √ó Temps_√âtude + {b_loaded:.6f}")

In [None]:
# Calculer les m√©triques de performance finales
final_mse = compute_mse(y, y_pred_all)
rmse = np.sqrt(final_mse)

# Calculer le R-carr√© (coefficient de d√©termination)
ss_res = np.sum((y - y_pred_all)**2)  # Somme des carr√©s des r√©sidus
ss_tot = np.sum((y - np.mean(y))**2)  # Somme totale des carr√©s
r_squared = 1 - (ss_res / ss_tot)

print("M√©triques de Performance du Mod√®le :")
print("=" * 50)
print(f"Erreur Quadratique Moyenne (MSE) : {final_mse:.2f}")
print(f"Racine de l'Erreur Quadratique Moyenne (RMSE) : {rmse:.2f}")
print(f"R-carr√© (R¬≤) : {r_squared:.4f}")
print("=" * 50)
print(f"\nüìä R¬≤ = {r_squared:.4f} signifie que notre mod√®le explique {r_squared*100:.2f}% de la variance des donn√©es !")

<a name='10'></a>
## 10 - Conclusion

F√©licitations ! üéâ Vous avez impl√©ment√© avec succ√®s la r√©gression lin√©aire de z√©ro !

### Ce que vous avez appris :

1. **Fondements Math√©matiques :**
   - Formule de pr√©diction : $\hat{y} = wx + b$
   - Fonction de perte Erreur Quadratique Moyenne (MSE)
   - Calcul du gradient en utilisant le calcul diff√©rentiel
   - Optimisation par descente de gradient

2. **Comp√©tences d'Impl√©mentation :**
   - Construit tous les composants de z√©ro en utilisant NumPy
   - Impl√©ment√© la passe avant (pr√©dictions)
   - Impl√©ment√© la passe arri√®re (gradients)
   - Cr√©√© une boucle d'entra√Ænement compl√®te

3. **Flux de Travail ML Pratique :**
   - Charg√© et visualis√© les donn√©es
   - Entra√Æn√© un mod√®le avec descente de gradient
   - Sauvegard√© les poids du mod√®le pour r√©utilisation
   - Charg√© les poids et fait des pr√©dictions
   - √âvalu√© la performance du mod√®le

### Insights Cl√©s :

- La r√©gression lin√©aire trouve la meilleure ligne droite √† travers les donn√©es
- La descente de gradient am√©liore it√©rativement le mod√®le en suivant le gradient n√©gatif
- Le taux d'apprentissage contr√¥le la vitesse √† laquelle le mod√®le apprend
- La MSE mesure √† quel point les pr√©dictions sont proches des valeurs r√©elles
- Les poids du mod√®le peuvent √™tre sauvegard√©s et r√©utilis√©s sans r√©entra√Æner

### Prochaines √âtapes :

- Essayer diff√©rents taux d'apprentissage et voir comment ils affectent l'entra√Ænement
- Exp√©rimenter avec diff√©rents nombres d'it√©rations
- Ajouter la normalisation des donn√©es pour am√©liorer l'entra√Ænement
- Essayer la r√©gression polynomiale pour les relations non lin√©aires
- Impl√©menter la r√©gularisation pour √©viter le surapprentissage

### Rappel :

C'est la base pour comprendre des mod√®les plus complexes comme les r√©seaux de neurones ! Les concepts que vous avez appris ici (passe avant, calcul de perte, gradients, optimisation) sont les m√™mes utilis√©s en apprentissage profond.

Continuez √† pratiquer ! üöÄ

---

## Bonus : D√©rivation Math√©matique

Pour ceux int√©ress√©s par les math√©matiques, voici comment nous d√©rivons les gradients :

### Perte MSE :
$$L = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)})^2$$

### Gradient par rapport √† w :
$$\frac{\partial L}{\partial w} = \frac{\partial}{\partial w} \left[ \frac{1}{m} \sum_{i=1}^{m} (wx^{(i)} + b - y^{(i)})^2 \right]$$

En utilisant la r√®gle de la cha√Æne :
$$\frac{\partial L}{\partial w} = \frac{2}{m} \sum_{i=1}^{m} (wx^{(i)} + b - y^{(i)}) \cdot x^{(i)}$$

### Gradient par rapport √† b :
$$\frac{\partial L}{\partial b} = \frac{\partial}{\partial b} \left[ \frac{1}{m} \sum_{i=1}^{m} (wx^{(i)} + b - y^{(i)})^2 \right]$$

En utilisant la r√®gle de la cha√Æne :
$$\frac{\partial L}{\partial b} = \frac{2}{m} \sum_{i=1}^{m} (wx^{(i)} + b - y^{(i)})$$

Ce sont les formules que nous avons impl√©ment√©es dans notre fonction `compute_gradients` !