# Modéle de démo make_regression de Scikit-learn

Régression simple basée sur un réseau de neurones à 2 couches. 

Jeux de données jeu de données `make_regression` de Scikit-learn génère des données linéaires avec un bruit, ce qui est parfait pour la régression linéaire.

- Déploiement du modèle avec Pytorch
  

# Déclaration du modèle


## Import des dépendances


In [5]:
import numpy as np
import torch
import torch.nn as nn

import matplotlib.pyplot as plt
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split

# Créer un dataset simple pour la régression avec 2 features
X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=42)

# Convertir en tensor PyTorch
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.float32).view(-1, 1)  # Reshape pour correspondre à la sortie


# Définir un modèle de régression linéaire
class LinearRegressionModel2D(nn.Module):
    def __init__(self):
        super(LinearRegressionModel2D, self).__init__()
        self.linear = nn.Linear(2, 1)  # 2 features d'entrée, 1 sortie

    def forward(self, x):
        return self.linear(x)

# Créer le modèle
model = LinearRegressionModel2D()

# Optimiseur et fonction de perte
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
criterion = nn.MSELoss()



# Entraîner le modèle
num_epochs = 1000
for epoch in range(num_epochs):
    model.train()
    
    # Forward pass
    y_pred = model(X_tensor)
    
    # Calcul de la perte
    loss = criterion(y_pred, y_tensor)
    
    # Backward pass et optimisation
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

# Affichage des résultats
y_pred = model(X_tensor).detach().numpy()

# Afficher les données et la droite ajustée
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='viridis', label='Données réelles')
plt.plot(X[:, 0], y_pred, color='red', label='Régression linéaire')
plt.title("Régression linéaire 2D avec `make_regression`")
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.colorbar(label="Label (y)")
plt.legend()
plt.show()


# Définition du modèle (create_model) :

On utilise `nn.Sequential`, qui permet de définir une séquence de couches directement dans une fonction.

- La première couche est une couche linéaire qui prend un vecteur d'entrée (input_size) et le transforme en un vecteur caché de taille hidden_size.
- Ensuite, on applique une activation ReLU pour ajouter de la non-linéarité.
- La deuxième couche est une autre couche linéaire qui réduit la taille du vecteur caché à la taille de sortie (output_size).

- Transforme l'entrée (input_size) en un vecteur caché (hidden_size).
- Activation ReLU (relu) : Introduit une non-linéarité pour améliorer l'apprentissage.

In [6]:
# Définition du modèle
def create_model(input_size, hidden_size, output_size):
    model = nn.Sequential(
        nn.Linear(input_size, hidden_size),  # Première couche linéaire
        nn.ReLU(),                           # Activation ReLU
        nn.Linear(hidden_size, output_size)  # Deuxième couche linéaire
    )
    return model

# Dénition de la Fonction de perte (compute_loss) :

Cette fonction : 
- prend le modèle, les entrées et les cibles comme arguments,
- fait une prédiction avec le modèle et calcule la perte en utilisant l'erreur quadratique moyenne (Mean Squared Error ou MSE).


In [7]:
# Fonction de perte (Mean Squared Error)
def compute_loss(model, inputs, targets):
    outputs = model(inputs)
    loss = nn.MSELoss()(outputs, targets)  # Calcul de la perte MSE
    return loss

## Fonction d'entraînement (train_model) :

On utilise un optimiseur Adam avec un taux d'apprentissage configurable pour mettre à jour les paramètres du modèle à chaque itération.

On boucle sur chaque époque d'entraînement et sur les batches d'un train_loader (qui contient les données d'entraînement sous forme de mini-lots).

À chaque itération, on fait une propagation avant, puis on calcule la perte. Ensuite, on effectue une propagation arrière (loss.backward()) pour calculer les gradients et mettre à jour les poids avec optimizer.step().


In [8]:
# Fonction d'entraînement
def train_model(model, train_loader, learning_rate=0.001, epochs=5):
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)  # Optimiseur Adam
    
    # Boucle d'entraînement
    for epoch in range(epochs):
        total_loss = 0.0
        for inputs, targets in train_loader:
            optimizer.zero_grad()  # Réinitialisation des gradients

            loss = compute_loss(model, inputs, targets)  # Calcul de la perte
            loss.backward()  # Propagation arrière des gradients

            optimizer.step()  # Mise à jour des paramètres du modèle

            total_loss += loss.item()  # Accumuler la perte pour l'afficher

        print(f"Epoch [{epoch+1}/{epochs}], Loss: {total_loss/len(train_loader)}")


# Utilisation du modèle

## Définition du modèle

In [9]:
input_size = 10  # Exemple de taille d'entrée
hidden_size = 20  # Exemple de taille de la couche cachée
output_size = 1  # Exemple de taille de sortie (régression)

model = create_model(input_size, hidden_size, output_size)


## Création d'un jeu de données d'exemple (pour l'entraînement) : Utilise un jeu de données factice pour tester le modèle.

In [10]:
from torch.utils.data import DataLoader, TensorDataset

# Création de données aléatoires pour l'exemple
X_train = torch.randn(100, input_size)  # 100 échantillons, chacun de taille `input_size`
y_train = torch.randn(100, output_size)  # 100 étiquettes correspondantes


# Ou utiliser le dataset



In [10]:
# Créer un dataset simple pour la régression avec 2 features
X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=42)

# Convertir en tensor PyTorch
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.float32).view(-1, 1)  # Reshape pour correspondre à la sortie



In [10]:
# Créer un DataLoader pour itérer sur les mini-lots
train_dataset = TensorDataset(X_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)


In [11]:
## Entraîner le modèle 

In [12]:
train_model(model, train_loader, learning_rate=0.001, epochs=5)

Epoch [1/5], Loss: 1.0275475127356393
Epoch [2/5], Loss: 1.1203798396246774
Epoch [3/5], Loss: 0.8862888855593545
Epoch [4/5], Loss: 0.9199024183409554
Epoch [5/5], Loss: 0.8545659141881126
