TP noté
======

Ce TP est noté. Il doit être fait exclusivement dans ce notebook Jupyter, que vous devrez remettre sur e-campus avant la fin de la séance.

Il s'agit d'un travail individuel, à réaliser exclusivement sur les ordinateurs de l'université.

Les outils d'IA génératifs (ChatGPT et autres) sont strictement interdits. Vous avez uniquement le droit d'accéder à ecampus et aux sites suivants: 

Langage utilisé:
- Python 3: https://docs.python.org/3/

Librairie de math:
- Numpy: https://docs.scipy.org/doc/numpy/reference/

Librairie d'affichage de données:
- Matplotilb: https://matplotlib.org/contents.html

Librairie de Deep Learning
- PyTorch: https://pytorch.org/docs/stable/index.html
- PyTorch Lightning: https://pytorch-lightning.readthedocs.io/en/stable/
- Torchvision: https://pytorch.org/vision/stable/index.html
- Torchmetrics: https://torchmetrics.readthedocs.io/en/stable/

Données d'apprentissage 
- Wine Quality: https://archive.ics.uci.edu/dataset/186/wine+quality


In [83]:
import torch
import torch.nn.functional as F
from torch import nn
from torch import Tensor
from torch.utils.data import DataLoader

import lightning.pytorch as pl
from lightning import Trainer
from lightning.pytorch.utilities.types import STEP_OUTPUT
from lightning.pytorch.callbacks.early_stopping import EarlyStopping

import torchvision
import numpy as np

import os 

from typing import Dict, Iterator, List, Optional, Tuple, TypeVar
import matplotlib.pyplot as plt

print('Version torch:',torch.__version__)
print('Versino lightning:',pl.__version__)

Version torch: 2.0.0+cu117
Versino lightning: 2.0.1


L'objectif de ce TP est de concevoir, d'entrainer et d'évaluer un réseau de neurones effectuant une tâche de régression sur le jeu de données [Wine Quality](https://archive.ics.uci.edu/dataset/186/wine+quality). 

Deux ensembles de données sont inclus, relatifs à des échantillons de "Vinho verde" rouge et blanc, provenant du nord du Portugal. Vous regrouperez ces deux ensembles en un unique ensemble. L'objectif est de modéliser la qualité du vin sur la base de tests physicochimiques. 

La valeur à régresser est le score, qui est un entier compris entre 0 et 10 mais que vous pourrez considérer comme une variable continue. Les attributs à utiliser pour régresser cette grandeur sont au nombre de 12, dont 11 valeurs continues ('fixed\_acidity', 'volatile\_acidity', 'citric\_acid', 'residual\_sugar', 'chlorides',	'free\_sulfur\_dioxide', 'total\_sulfur\_dioxide', 'density', 'pH', 'sulphates', 'alcohol') et une valeur catégorielle ('color').

Les étapes de ce TP sont les suivantes :
1. Préparer les données et les batches en créant la classe `WineDataModule` qui hérite de
`pl.LightningDataModule`.
2. Construire un modèle de réseau de neurones et les méthodes nécessaires pour l’entraîner en créant la classe `MyModel` qui hérite de `pl.LightningModule`.
3. Entraîner le modèle de l'étape 2 à l’aide des données préparées dans l’étape 1.

Les codes informatiques que vous réaliserez pour les aspects *deep learning* feront appel aux librairies `Lightning` et `PyTorch`, vues durant les TPs précédant.

# 1- Création d'un LigthningDataModule

Nous allons dans ce TP travailler sur la base [Wine Quality](https://archive.ics.uci.edu/dataset/186/wine+quality). Commencez par télécharger la base de données en cliquant sur le lien Download de la page de la base.

Afin de gérer ce dataset, nous allons implémenter une classe `WineDataModule` héritant de [pl.LightningDataModule](https://lightning.ai/docs/pytorch/stable/data/datamodule.html).

Nous allons créer cette classe progressivement dans la suite du TP. Vous reviendriez modifier le bloc suivant au cours des différentes étapes décrites par la suite. 

Commencez par créer la classe `WineDataModule` héritant de `pl.LightningDataModule`. Vous déclarez un constructeur prenant et enregistrant les paramètres suivants: 
- un nom de dossier où est sauvegardé la base de donnée,
- la taille des batches,
- la proportion du dataset à utiliser pour la validation. 
- la proportion du dataset à utiliser pour le test. 

Pour cette question, construisez uniquement le constructeur. Les autres méthodes seront détaillées par la suite.

On utilisera pas défaut des batches de 32 éléments et une répartition de 70\% des données pour l'entrainement, 15\% des données pour la validation et 15\% des données pour le test. Veuillez prévoir ces valeurs dans les arguments par défaut du constructeur.

In [101]:
from torchvision.datasets.utils import extract_archive
from torch.utils.data import TensorDataset

class WineDataModule(pl.LightningDataModule):
    
    def __init__(self, data_dir: str, batch_size: int = 32, val_split: float = 0.15, test_split: float = 0.15):
        
        super().__init__()
        
        self.data_dir = data_dir
        self.batch_size = batch_size
        self.val_split = val_split
        self.test_split = test_split
        
        self.data_train = None
        self.data_val = None
        self.data_test = None
    
    def prepare_data(self):
        
        # Verifie que le fichier zip existe
        zip_path = os.path.join(self.data_dir, "wine+quality.zip")
        if not os.path.exists(zip_path):
            print("File not found.")
            return

        # Extraire le fichier zip
        extract_archive(zip_path, self.data_dir)

        # Recuperer les deux path
        dataset_paths = []
        for file in os.listdir(self.data_dir):
            if file.endswith(".csv"):
                dataset_paths.append(os.path.join(self.data_dir, file))

        # Return paths
        return dataset_paths
    
    def setup(self, stage=None):
        
        red_data = np.genfromtxt(os.path.join(self.data_dir, "winequality-red.csv"), delimiter=";", skip_header=1)
        white_data = np.genfromtxt(os.path.join(self.data_dir, "winequality-white.csv"), delimiter=";", skip_header=1)

        # Concat
        all_data = np.concatenate((red_data, white_data), axis=0)

        # To tansor
        all_data_tensor = torch.tensor(all_data, dtype=torch.float32)
        
        # Separation
        features = all_data_tensor[:, :-1]
        labels = all_data_tensor[:, -1]

        # Decoupage
        train_size = int((1 - self.val_split - self.test_split) * len(all_data))
        val_size = int(self.val_split * len(all_data))
        test_size = int(self.test_split * len(all_data))

        train_features, train_labels = features[:train_size], labels[:train_size]
        val_features, val_labels = features[train_size:train_size + val_size], labels[train_size:train_size + val_size]
        test_features, test_labels = features[train_size + val_size:], labels[train_size + val_size:]
        
        print("Taille de train:", train_features.shape[0])
        print("Taille de val:", val_features.shape[0])
        print("Taille de test:", test_features.shape[0])
        
        # Stage Fit
        if stage == 'fit': 
            self.data_train = TensorDataset(train_features, train_labels)
            self.data_val = TensorDataset(val_features, val_labels)

        # Stage Test
        if stage == 'test':
            self.data_test = TensorDataset(test_features, test_labels)
                                           
    def train_dataloader(self):
        return DataLoader(self.data_train, batch_size=self.batch_size)

    def val_dataloader(self):
        return DataLoader(self.data_val, batch_size=self.batch_size)

    def test_dataloader(self):
        return DataLoader(self.data_test, batch_size=self.batch_size)

    def predict_dataloader(self):
        return DataLoader(self.data_test, batch_size=self.batch_size)


In [102]:
# Création d'un objet datamodule. A relancer à chaque modification de WineDataModule.
datamodule = WineDataModule(data_dir="/home/messili231/Documents/Pytorch/TP_Notee_MESSILI_Islem/data")

Ajoutez une méthode `prepare_data`. Cette méthode permet la préparation des données. Dans notre cas, elle fera la décompression de l'archive que vous avez téléchargée précédemment avec la fonction `torchvision.datasets.utils.extract_archive`.

Vérifiez que l'appel de la méthode permet bien décompresser le fichier de la base de données dans le dossier prévu à cet effet.

In [103]:
datamodule.prepare_data()

['/home/messili231/Documents/Pytorch/TP_Notee_MESSILI_Islem/data/winequality-red.csv',
 '/home/messili231/Documents/Pytorch/TP_Notee_MESSILI_Islem/data/winequality-white.csv']

In [104]:
ls data

[0m[01;32mwinequality.names[0m*    [01;32mwinequality-white.csv[0m*
[01;32mwinequality-red.csv[0m*  [01;32mwine+quality.zip[0m*


Ajoutez une méthode `setup`. Cette méthode permet de définir des [Datasets Pytorch](https://pytorch.org/tutorials/beginner/basics/data_tutorial.html). Pour cela, vous utiliserez la méthode `torch.utils.data.TensorDataset` sur un `Tensor` contenant l'ensemble des données de la base, que vous aurez préalablement construit.

La méthode `setup` à un argument nommé `stage`. Regardez dans la documentation son rôle et utilisez-le à bon escient. Cette variable pourra prendre les valeurs `None`, `test` ou `fit`. 

Vous stockerez les datasets dans les attributs: 
- data_train
- data_val
- data_test

Ces trois attributs ne sont pas nécessairement définis en fonction de la valeur de `stage`. On supposera que la valeur `None` permet de tous les définir. 

Les grandes étapes à implémenter sont les suivantes:
1) Les fichiers `winequality-red.csv` et `winequality-white`. Vous pouvez utiliser [np.genfromtxt](https://numpy.org/doc/stable/reference/generated/numpy.genfromtxt.html#numpy.genfromtxt) pour cette question. Attention, la première ligne doit être ignorée et les valeurs retournées doivent être des `float`.
2) Concaténez les deux tableaux, on ignorera la couleur des vins. Convertissez le résultat en un tableau pytorch.
3) Séparez les données et les labels à prédire. La valeur à prédire correspond à la dernière colonne des fichiers csv. 
4) Effectuez le découpage de la base en trois ensembles en fonction des répartitions passées au constructeur. Puis créez les trois tableaux demandés. 

Vous appellerez la méthode `setup` sans argument dans le bloc suivant pour tester votre code. Cette méthode ne retourne rien, mais vous pouvez vérifier la taille des datasets stocker dans les attributs dédiés.

In [105]:
datamodule.setup()

Taille de train: 4547
Taille de val: 974
Taille de test: 976


Écrivez la méthode `train_dataloader`. Cette méthode retourne un dataloader pytorch sur les données de `train`. Vous pourrez utiliser la classe [DataLoader](https://pytorch.org/docs/stable/data.html?highlight=dataloader#torch.utils.data.DataLoader) avec les arguments appropriés. 

Vérifiez le bon fonctionnement de votre méthode en affichant toutes les valeurs du premier batch. Vous pourrez utiliser les méthodes `iter` et `next` pour récupérer uniquement le premier batch. 


In [106]:
# mode fit
datamodule.setup(stage='fit')

train_dataloader = datamodule.train_dataloader()

batch_one = next(iter(train_dataloader))
features, labels = batch_one

print("Features:")
print(features)
print("Labels:")
print(labels)

Taille de train: 4547
Taille de val: 974
Taille de test: 976
Features:
tensor([[7.4000e+00, 7.0000e-01, 0.0000e+00, 1.9000e+00, 7.6000e-02, 1.1000e+01,
         3.4000e+01, 9.9780e-01, 3.5100e+00, 5.6000e-01, 9.4000e+00],
        [7.8000e+00, 8.8000e-01, 0.0000e+00, 2.6000e+00, 9.8000e-02, 2.5000e+01,
         6.7000e+01, 9.9680e-01, 3.2000e+00, 6.8000e-01, 9.8000e+00],
        [7.8000e+00, 7.6000e-01, 4.0000e-02, 2.3000e+00, 9.2000e-02, 1.5000e+01,
         5.4000e+01, 9.9700e-01, 3.2600e+00, 6.5000e-01, 9.8000e+00],
        [1.1200e+01, 2.8000e-01, 5.6000e-01, 1.9000e+00, 7.5000e-02, 1.7000e+01,
         6.0000e+01, 9.9800e-01, 3.1600e+00, 5.8000e-01, 9.8000e+00],
        [7.4000e+00, 7.0000e-01, 0.0000e+00, 1.9000e+00, 7.6000e-02, 1.1000e+01,
         3.4000e+01, 9.9780e-01, 3.5100e+00, 5.6000e-01, 9.4000e+00],
        [7.4000e+00, 6.6000e-01, 0.0000e+00, 1.8000e+00, 7.5000e-02, 1.3000e+01,
         4.0000e+01, 9.9780e-01, 3.5100e+00, 5.6000e-01, 9.4000e+00],
        [7.9000e+00, 6.

Faites de même pour les méthodes:
- `val_dataloader` : renvoye un `DataLoader` sur les données de validation,
- `test_dataloader` : renvoye un `DataLoader` sur les données de test,
- `predict_dataloader`: renvoye aussi un `DataLoader` sur les données de test.


In [107]:
# mode fit
datamodule.setup(stage='fit')

val_dataloader = datamodule.val_dataloader()

batch_one_val = next(iter(val_dataloader))
features, labels = batch_one_val

print("Features:")
print(features)
print("Labels:")
print(labels)

Taille de train: 4547
Taille de val: 974
Taille de test: 976
Features:
tensor([[6.8000e+00, 2.6000e-01, 4.8000e-01, 6.2000e+00, 4.9000e-02, 5.5000e+01,
         1.8200e+02, 9.9582e-01, 3.2100e+00, 4.5000e-01, 9.4000e+00],
        [6.0000e+00, 2.8000e-01, 5.2000e-01, 5.0000e+00, 7.8000e-02, 3.0000e+01,
         1.3900e+02, 9.9494e-01, 3.1000e+00, 3.6000e-01, 9.0000e+00],
        [6.0000e+00, 2.8000e-01, 2.5000e-01, 1.8000e+00, 4.2000e-02, 8.0000e+00,
         1.0800e+02, 9.9290e-01, 3.0800e+00, 5.5000e-01, 9.0000e+00],
        [7.2000e+00, 2.0000e-01, 2.2000e-01, 1.6000e+00, 4.4000e-02, 1.7000e+01,
         1.0100e+02, 9.9471e-01, 3.3700e+00, 5.3000e-01, 1.0000e+01],
        [6.1000e+00, 2.7000e-01, 2.5000e-01, 1.8000e+00, 4.1000e-02, 9.0000e+00,
         1.0900e+02, 9.9290e-01, 3.0800e+00, 5.4000e-01, 9.0000e+00],
        [6.0000e+00, 2.8000e-01, 2.5000e-01, 1.8000e+00, 4.2000e-02, 8.0000e+00,
         1.0800e+02, 9.9290e-01, 3.0800e+00, 5.5000e-01, 9.0000e+00],
        [6.4000e+00, 2.

In [108]:
# mode test
datamodule.setup(stage='test')

test_dataloader = datamodule.test_dataloader()

batch_one_test = next(iter(test_dataloader))
features, labels = batch_one_test

print("Features:")
print(features)
print("Labels:")
print(labels)

Taille de train: 4547
Taille de val: 974
Taille de test: 976
Features:
tensor([[6.7000e+00, 3.1000e-01, 3.0000e-01, 2.4000e+00, 3.8000e-02, 3.0000e+01,
         8.3000e+01, 9.8867e-01, 3.0900e+00, 3.6000e-01, 1.2800e+01],
        [8.6000e+00, 3.1000e-01, 3.0000e-01, 9.0000e-01, 4.5000e-02, 1.6000e+01,
         1.0900e+02, 9.9249e-01, 2.9500e+00, 3.9000e-01, 1.0100e+01],
        [8.6000e+00, 3.1000e-01, 3.0000e-01, 9.0000e-01, 4.5000e-02, 1.6000e+01,
         1.0900e+02, 9.9249e-01, 2.9500e+00, 3.9000e-01, 1.0100e+01],
        [8.6000e+00, 2.2000e-01, 3.3000e-01, 1.2000e+00, 3.1000e-02, 3.8000e+01,
         9.5000e+01, 9.9239e-01, 2.8300e+00, 3.1000e-01, 1.0300e+01],
        [6.9000e+00, 1.4000e-01, 2.9000e-01, 9.9000e+00, 5.6000e-02, 3.0000e+01,
         9.1000e+01, 9.9512e-01, 3.1900e+00, 3.3000e-01, 9.9000e+00],
        [6.5000e+00, 2.2000e-01, 3.1000e-01, 3.9000e+00, 4.6000e-02, 1.7000e+01,
         1.0600e+02, 9.9098e-01, 3.1500e+00, 3.1000e-01, 1.1500e+01],
        [6.6000e+00, 3.

In [109]:
# mode test
datamodule.setup(stage='test')

predict_dataloader = datamodule.predict_dataloader()

batch_one_predict = next(iter(predict_dataloader))
features, labels = batch_one_predict

print("Features:")
print(features)
print("Labels:")
print(labels)

Taille de train: 4547
Taille de val: 974
Taille de test: 976
Features:
tensor([[6.7000e+00, 3.1000e-01, 3.0000e-01, 2.4000e+00, 3.8000e-02, 3.0000e+01,
         8.3000e+01, 9.8867e-01, 3.0900e+00, 3.6000e-01, 1.2800e+01],
        [8.6000e+00, 3.1000e-01, 3.0000e-01, 9.0000e-01, 4.5000e-02, 1.6000e+01,
         1.0900e+02, 9.9249e-01, 2.9500e+00, 3.9000e-01, 1.0100e+01],
        [8.6000e+00, 3.1000e-01, 3.0000e-01, 9.0000e-01, 4.5000e-02, 1.6000e+01,
         1.0900e+02, 9.9249e-01, 2.9500e+00, 3.9000e-01, 1.0100e+01],
        [8.6000e+00, 2.2000e-01, 3.3000e-01, 1.2000e+00, 3.1000e-02, 3.8000e+01,
         9.5000e+01, 9.9239e-01, 2.8300e+00, 3.1000e-01, 1.0300e+01],
        [6.9000e+00, 1.4000e-01, 2.9000e-01, 9.9000e+00, 5.6000e-02, 3.0000e+01,
         9.1000e+01, 9.9512e-01, 3.1900e+00, 3.3000e-01, 9.9000e+00],
        [6.5000e+00, 2.2000e-01, 3.1000e-01, 3.9000e+00, 4.6000e-02, 1.7000e+01,
         1.0600e+02, 9.9098e-01, 3.1500e+00, 3.1000e-01, 1.1500e+01],
        [6.6000e+00, 3.

# 2- Mise en place du réseau de neurone

Nous allons dans cette partie construire le modèle en utilisant le même principe que la partie précédente. 

Commencez par créer la classe `MyModel` héritant de [pl.LightningModule](https://lightning.ai/docs/pytorch/stable/common/lightning_module.html). Vous définirez un constructeur prenant les arguments suivant: 
- lr: le *learning rate*  (0.01 par défaut),
- weight_decay: le poids de la régularisation ($10^{-5}$ par défaut),
- *args : d'autres arguments non nommés,
- **kwargs: : d'autres arguments nommés. 

Dans ce constructeur, vous effectuerez les étapes suivantes: 
- sauvegarde des paramètres d'entrées en utilisant `save_hyperparameters`.
- définition d'un réseau dont l'architecture est la suivante: 
    - couche linéaire à 8 sorties + ReLU
    - couche linéaire à 8 sorties + ReLU
    - couche linéaire à une sortie
- Définissez d'un objet de type `nn.MSELoss` pour train, val et test. 

In [124]:
import torch.nn as nn
import torch.nn.functional as F

class MyModel(pl.LightningModule):
    # init
    def __init__(self, lr=0.01, weight_decay=1e-5, *args, **kwargs):
        
        super().__init__()
        
        self.lr = lr
        
        self.weight_decay = weight_decay

        self.save_hyperparameters()

        # Architecture NN
        self.fc1 = nn.Linear(11, 8)
        self.fc2 = nn.Linear(8, 8)
        self.fc3 = nn.Linear(8, 1)

        # loss
        self.loss = nn.MSELoss()

    def forward(self, x):
        
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        
        return x

    def training_step(self, batch, num_batch):
        
        x, y = batch
        y_pred = self(x)
        loss = self.loss(y_pred, y)
        self.log('train_loss', loss)
        
        return loss

    def validation_step(self, batch, num_batch):
        
        x, y = batch
        y_pred = self(x)
        loss = self.loss(y_pred, y)
        self.log('val_loss', loss)

    def test_step(self, batch, num_batch):
        
        x, y = batch
        y_pred = self(x)
        loss = self.loss(y_pred, y)
        self.log('test_loss', loss)

    def configure_optimizers(self):
        
        optimizer = torch.optim.Adam(self.parameters(), lr=self.lr,
                                     weight_decay=self.weight_decay)
        
        return optimizer

In [125]:
# Création d'un objet MyModel. A relancer à chaque modification de MyModel.
model = MyModel()

Définissez une méthode `forward` qui calcule la sortie du réseau en fonction de son entrée. Testez votre méthode avec un tableau aléatoire de taille $(32,11)$. Vous pouvez utiliser la fonction [torch.rand](https://pytorch.org/docs/stable/generated/torch.rand.html).

In [126]:
tensor_random = torch.rand(32, 11)

output_tensor = model.forward(tensor_random)

print("Output shape:", output_tensor.shape)
print(output_tensor)

Output shape: torch.Size([32, 1])
tensor([[-0.2454],
        [-0.2241],
        [-0.2002],
        [-0.2441],
        [-0.2394],
        [-0.2207],
        [-0.2087],
        [-0.2186],
        [-0.2315],
        [-0.2345],
        [-0.2393],
        [-0.2441],
        [-0.2316],
        [-0.2256],
        [-0.2652],
        [-0.2215],
        [-0.2363],
        [-0.2274],
        [-0.2686],
        [-0.2071],
        [-0.2505],
        [-0.2187],
        [-0.2425],
        [-0.2457],
        [-0.2372],
        [-0.2397],
        [-0.2149],
        [-0.2281],
        [-0.2363],
        [-0.2287],
        [-0.2205],
        [-0.2204]], grad_fn=<AddmmBackward0>)


Définissez la méthode `training_step`. Cette méthode calcul la sortie du réseau pour un batch donné puis évalue la fonction de coût (qu'elle retournera). Vous effectuerez également les logs de la fonction de coût.  

Récupérez le premier batch avec le `datamodule` de la première partie et testez votre fonction. Le deuxième paramètre sera mis à 0 pour ce test.

Vérifiez que votre fonction retourne bien une valeur pour la loss.

In [127]:
# mode fit
datamodule.setup(stage='fit')

train_dataloader = datamodule.train_dataloader()

batch_one = next(iter(train_dataloader))

loss = model.training_step(batch_one, 0)

print("Loss:", loss.item())

Taille de train: 4547
Taille de val: 974
Taille de test: 976
Loss: 23.43031120300293


Définissez la méthode `validation_step` effectuant le traitement d'un batch sur les données de validation. Cette méthode est très similaire à la précédente hormis le fait qu'elle ne retourne rien.

Testez la méthode en la lançant. Il ne devrait rien s'afficher, mais vous ne devez pas avoir d'erreur. 

In [128]:
# mode fit
datamodule.setup(stage='fit')

val_dataloader = datamodule.val_dataloader()

batch_one_val = next(iter(val_dataloader))

model.validation_step(batch_one_val, 0)

Taille de train: 4547
Taille de val: 974
Taille de test: 976


Définissez de la même manière que précédemment la méthode `test_step`.

In [129]:
# mode test
datamodule.setup(stage='test')

test_dataloader = datamodule.test_dataloader()

batch_one_test = next(iter(test_dataloader))

model.test_step(batch_one_test, 0)

Taille de train: 4547
Taille de val: 974
Taille de test: 976


Définissez la méthode `configure_optimizers` qui retourne le ou les optimiseurs choisis pour entrainer le réseau. Nous utiliserons ici un optimiser d'[Adam](https://pytorch.org/docs/stable/generated/torch.optim.Adam.html).

Lancez votre méthode pour en vérifier le bon fonctionnement.

In [130]:
optimizer = model.configure_optimizers()

print("Optimizer:", optimizer)

Optimizer: Adam (
Parameter Group 0
    amsgrad: False
    betas: (0.9, 0.999)
    capturable: False
    differentiable: False
    eps: 1e-08
    foreach: None
    fused: None
    lr: 0.01
    maximize: False
    weight_decay: 1e-05
)


# 3- Entraînement du modèle et test

Nous avons précédemment défini tous les éléments important pour apprendre notre réseau. 
En utilisant un objet de type [Trainer](https://lightning.ai/docs/pytorch/stable/common/trainer.html), faites un apprentissage sur 5 époques.

In [134]:
# Trainer 5 époques
trainer = pl.Trainer(max_epochs=5)

# Fit
trainer.fit(model, datamodule)

GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]

  | Name | Type    | Params
---------------------------------
0 | fc1  | Linear  | 96    
1 | fc2  | Linear  | 72    
2 | fc3  | Linear  | 9     
3 | loss | MSELoss | 0     
---------------------------------
177       Trainable params
0         Non-trainable params
177       Total params
0.001     Total estimated model params size (MB)


Taille de train: 4547
Taille de val: 974
Taille de test: 976


Sanity Checking: 0it [00:00, ?it/s]

Training: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

`Trainer.fit` stopped: `max_epochs=5` reached.


In [17]:
# Trainer 5 époques
trainer = pl.Trainer(max_epochs=5)

# Fit
trainer.fit(model, datamodule)

  rank_zero_warn(
Restoring states from the checkpoint path at /home/lechervy/Documents/save-cours-m2-deep-learning/TP/TP_note/2023-2024/lightning_logs/version_0/checkpoints/epoch=4-step=715.ckpt
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]
Loaded model weights from the checkpoint at /home/lechervy/Documents/save-cours-m2-deep-learning/TP/TP_note/2023-2024/lightning_logs/version_0/checkpoints/epoch=4-step=715.ckpt
  rank_zero_warn(
  rank_zero_warn(


Testing: 0it [00:00, ?it/s]

[{'test_loss': 0.8456656336784363}]

En utilisant la méthode `test` de `Trainer` précédent, obtenez les performances sur la base de test.

In [135]:
trainer.test(datamodule=datamodule)

  rank_zero_warn(
Restoring states from the checkpoint path at /home/messili231/Documents/Pytorch/TP_Notee_MESSILI_Islem/lightning_logs/version_3/checkpoints/epoch=4-step=715.ckpt
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]
Loaded model weights from the checkpoint at /home/messili231/Documents/Pytorch/TP_Notee_MESSILI_Islem/lightning_logs/version_3/checkpoints/epoch=4-step=715.ckpt


Taille de train: 4547
Taille de val: 974
Taille de test: 976


  rank_zero_warn(


Testing: 0it [00:00, ?it/s]

  return F.mse_loss(input, target, reduction=self.reduction)


[{'test_loss': 0.6859560608863831}]

# 4- Amélioration du réseau

Plutôt que d'utiliser un nombre d'époques fixes, mettre en place un mécanisme permettant de stopper l'entrainement quand la fonction de perte mesurée sur les données de validation ne décroit plus. Utiliser par exemple la méthode proposée [ici](https://lightning.ai/docs/pytorch/stable/common/early_stopping.html). 

In [139]:
from pytorch_lightning.callbacks import EarlyStopping

early_stop = EarlyStopping(monitor='val_loss', patience=3)

trainer_early_stop = pl.Trainer(callbacks=[early_stop])

trainer.fit(model, datamodule)

ValueError: Expected a parent

Définissez `MyResModel` consistant à en une classe similaire à `MyModel`, mais en changeant le réseau de neurones précédant de manière à lui ajouter une couche résiduelle au niveau de la couche cachées ayant le même nombre de canaux d'entrée que de sortie. Mesurer à nouveau la performance.

GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]

  | Name       | Type     | Params
----------------------------------------
0 | net        | ResModel | 69.1 K
1 | loss_train | MSELoss  | 0     
2 | loss_val   | MSELoss  | 0     
3 | loss_test  | MSELoss  | 0     
----------------------------------------
69.1 K    Trainable params
0         Non-trainable params
69.1 K    Total params
0.276     Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

Training: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

Restoring states from the checkpoint path at /home/lechervy/Documents/save-cours-m2-deep-learning/TP/TP_note/2023-2024/lightning_logs/version_2/checkpoints/epoch=6-step=1001.ckpt
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]
Loaded model weights from the checkpoint at /home/lechervy/Documents/save-cours-m2-deep-learning/TP/TP_note/2023-2024/lightning_logs/version_2/checkpoints/epoch=6-step=1001.ckpt


Testing: 0it [00:00, ?it/s]

[{'test_loss': 0.8240514397621155}]