In [1]:
# -*- coding: utf-8 -*-
"""
Exemple simple de MNIST avec PyTorch
Exemple de nn.Module avec deux couches denses linéaires
Boucle d'apprentissage simple
Chargement avec torchvision.datasets.MNIST
Partage en données d'entraînement et de validation avec torch.utils.data.random_split
"""
import torch
torch.manual_seed(0) # Pour résultats reproductibles

# Fonction J d'entropie croisée
import torch.nn.functional as F
fonction_cout = F.cross_entropy

from torch import nn
# Définition de l'architecture du RNA
class RNASimple(nn.Module):
    def __init__(self):
        super().__init__()
        self.couche_lineaire1 = nn.Linear(784, 30)
        self.couche_lineaire2 = nn.Linear(30, 10)
    def forward(self, lot_X):
            lot_X = lot_X.view(lot_X.size()[0], -1)
            lot_X = F.relu(self.couche_lineaire1(lot_X))
            return self.couche_lineaire2(lot_X)
modele = RNASimple()
    
from torch import optim
optimiseur = optim.SGD(modele.parameters(), lr=0.05)

import torchvision
import torchvision.transforms as transforms

#Chargement des données
ds = torchvision.datasets.MNIST(root = "./data", train = True, download = True, transform = transforms.ToTensor())
ds_ent, ds_valid = torch.utils.data.random_split(ds, [50000, 10000])
ds_test = torchvision.datasets.MNIST(root = "./data", train = False, download = True, transform = transforms.ToTensor())

#Création du DataLoader avec le dataset
dl_ent = torch.utils.data.DataLoader(ds_ent, batch_size=100, shuffle = True)

nb_epochs = 10
# Boucle d'apprentissage
for epoch in range(nb_epochs):
    cout_total_ent = 0 
    
    # Boucle d'apprentissage par mini-lot pour une epoch
    for lot_X, lot_Y in dl_ent:
        optimiseur.zero_grad() # Remettre les dérivées à zéro
        lot_Y_predictions = modele(lot_X) # Appel de la méthode forward
        cout = fonction_cout(lot_Y_predictions, lot_Y)
        cout_total_ent +=cout
        cout.backward() # Calcul des gradiants par rétropropagation
        optimiseur.step() # Mise à jour des paramètres
        
    cout_moyen_ent = cout_total_ent/len(dl_ent)
    print(f'-------- > epoch {epoch+1}:  coût moyen entraînement = {cout_moyen_ent}')

-------- > epoch 1:  coût moyen entraînement = 0.7730959057807922
-------- > epoch 2:  coût moyen entraînement = 0.3491203486919403
-------- > epoch 3:  coût moyen entraînement = 0.3055933713912964
-------- > epoch 4:  coût moyen entraînement = 0.28082913160324097
-------- > epoch 5:  coût moyen entraînement = 0.26213064789772034
-------- > epoch 6:  coût moyen entraînement = 0.24598634243011475
-------- > epoch 7:  coût moyen entraînement = 0.23201054334640503
-------- > epoch 8:  coût moyen entraînement = 0.22012174129486084
-------- > epoch 9:  coût moyen entraînement = 0.20924298465251923
-------- > epoch 10:  coût moyen entraînement = 0.19878222048282623
