In [3]:
"""
Exemple de Cifar10 avec PyTorch
Exemple d'apprentissage pas transfert avec VGG16
Version avec GPU
"""
import torch
torch.manual_seed(0) # Pour résultats reproductibles

# Fonction J d'entropie croisée
import torch.nn.functional as F
fonction_cout = F.cross_entropy

def taux_bonnes_predictions(lot_Y_predictions, lot_Y):
    predictions_categorie = torch.argmax(lot_Y_predictions, dim=1)
    return (predictions_categorie == lot_Y).float().mean()

import torchvision
from torchvision import datasets, models, transforms

modele = models.vgg16(pretrained=True)
print("Modèle VGG16")
print(modele)

# Désactiver l'apprentissage des paramètres pour réutiliser les valeurs déjà entraînées
for parametre in modele.parameters():
    parametre.requires_grad = False        

# Modifier la dernière couche pour nouvelles données
nombre_classes = 10
from torch import nn
modele.classifier[6] = nn.Linear(4096,nombre_classes)

pretraitement = transforms.Compose([
transforms.Resize(224),
transforms.ToTensor(),
transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)])

#Chargement des données
ds = torchvision.datasets.CIFAR10(root = "./data", train = True, download = True, transform = pretraitement)
ds_ent, ds_valid = torch.utils.data.random_split(ds, [40000, 10000])

#Création du DataLoader avec le dataset
dl_ent = torch.utils.data.DataLoader(ds_ent, batch_size=100, shuffle = True)
dl_valid = torch.utils.data.DataLoader(ds_valid, batch_size=100)

print("Parametres à entraîner:")
parametres_a_entrainer = []
for nom,parametre in modele.named_parameters():
    if parametre.requires_grad == True:
        parametres_a_entrainer.append(parametre)
        print("\t",nom)

from torch import optim
optimiseur = optim.SGD(parametres_a_entrainer, lr=0.001,momentum=0.9)

# Déterminer si un GPU est disponible
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# Placer le modèle en mode GPU si possible
modele = modele.to(device)
print('Entrainement sur ',device)

import time
def entrainer_GPU(modele, dl_ent, dl_valid, optimiseur, nb_epochs=10):

    debut = time.time()

    # Listes pour les métriques par epoch
    liste_cout_moyen_ent = []
    liste_taux_moyen_ent = []
    liste_cout_moyen_valid = []
    liste_taux_moyen_valid = []
    
    # Boucle d'apprentissage
    for epoch in range(nb_epochs):
        cout_total_ent = 0 # pour cumuler les couts par mini-lot
        taux_bonnes_predictions_ent = 0 # pour cumuler les taux par mini-lot
        modele.train() # Pour certains types de couches (nn.BatchNorm2d, nn.Dropout, ...)
        
        # Boucle d'apprentissage par mini-lot pour une epoch
        for lot_X, lot_Y in dl_ent:
            
            # Les données doivent être placés en GPU pour être compatibles avec le modèle
            lot_X = lot_X.to(device)
            lot_Y = lot_Y.to(device)

            optimiseur.zero_grad() # Remettre les dérivées à zéro
            lot_Y_predictions = modele(lot_X) # Appel de la méthode forward
            cout = fonction_cout(lot_Y_predictions, lot_Y)
            cout.backward() # Calcul des gradiants par rétropropagation
            with torch.no_grad():
                cout_total_ent +=cout
                taux_bonnes_predictions_ent += taux_bonnes_predictions(lot_Y_predictions, lot_Y)
            optimiseur.step() # Mise à jour des paramètres
            # scheduler.step()
        # Calculer les moyennes par mini-lot
        with torch.no_grad():
            cout_moyen_ent = cout_total_ent/len(dl_ent)
            taux_moyen_ent = taux_bonnes_predictions_ent/len(dl_ent)
       
        modele.eval() # Pour certains types de couches (nn.BatchNorm2d, nn.Dropout, ...)
        with torch.no_grad():
            # Les données de validation doivent aussi être placés en GPU
            cout_valid = sum(fonction_cout(modele(lot_valid_X.to(device)), lot_valid_Y.to(device)) for lot_valid_X, lot_valid_Y in dl_valid)
            taux_bons_valid = sum(taux_bonnes_predictions(modele(lot_valid_X.to(device)), lot_valid_Y.to(device)) for lot_valid_X, lot_valid_Y in dl_valid)
        cout_moyen_valid = cout_valid/len(dl_valid)
        taux_moyen_valid = taux_bons_valid/len(dl_valid)
        print(f'-------- > epoch {epoch+1}:  coût moyen entraînement = {cout_moyen_ent}')
        print(f'-------- > epoch {epoch+1}:  taux moyen entraînement = {taux_moyen_ent}')
        print(f'-------- > epoch {epoch+1}:  coût moyen validation = {cout_moyen_valid}')
        print(f'-------- > epoch {epoch+1}:  taux moyen validation = {taux_moyen_valid}')
    
        liste_cout_moyen_ent.append(cout_moyen_ent)
        liste_taux_moyen_ent.append(taux_moyen_ent)
        liste_cout_moyen_valid.append(cout_moyen_valid)
        liste_taux_moyen_valid.append(taux_moyen_valid)
        
        temps_ecoule = time.time() - debut
        print('Temps écoulé : {:.0f}m {:.0f}s'.format(temps_ecoule // 60, temps_ecoule % 60))

    
    # Affichage du graphique d'évolution des métriques par epoch
    import numpy as np
    import matplotlib.pyplot as plt
    plt.plot(np.arange(0,nb_epochs),liste_cout_moyen_ent,label='Erreur entraînement')
    plt.plot(np.arange(0,nb_epochs),liste_cout_moyen_valid,label='Erreur validation')
    plt.title("Evolution du coût")
    plt.xlabel('epoch')
    plt.ylabel('moyenne par observation')
    plt.legend(loc='upper center')
    plt.show()
        
    plt.plot(np.arange(0,nb_epochs),liste_taux_moyen_ent,label='Taux bonnes réponses entraînement')
    plt.plot(np.arange(0,nb_epochs),liste_taux_moyen_valid,label='Taux bonnes réponses validation')
    plt.title("Evolution du taux")
    plt.xlabel('epoch')
    plt.ylabel('moyenne par observation')
    plt.legend(loc='center')
    plt.show()

entrainer_GPU(modele, dl_ent, dl_valid, optimiseur, nb_epochs=1)

Modèle VGG16
VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=

KeyboardInterrupt: 

In [2]:
# Code inspiré de : https://androidkt.com/how-to-visualize-feature-maps-in-convolutional-neural-networks-using-pytorch/
# Extraction des couches convolutives
nombre_couches_conv=0
couches_conv=[]
list_couches_model=list(modele.children())
for couche in list_couches_model:
  if type(couche)==nn.Conv2d:
    nombre_couches_conv+=1
    couches_conv.append(couche)
  elif type(couche)==nn.Sequential:
    for sous_couche in couche.children():
      if type(sous_couche)==nn.Conv2d:
        nombre_couches_conv+=1
        couches_conv.append(sous_couche)
print(nombre_couches_conv)

# Préparation d'une image pour la production des activations
import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as np
une_image = ds_valid[0][0]
print(une_image.shape)
plt.imshow(np.transpose(une_image,(1,2,0)))
plt.axis("off")
plt.show()
une_image=une_image.unsqueeze(0).to(device)

NameError: name 'models' is not defined

In [None]:
# Calculer les activations pour chacune des couches convolutives
activations = [couches_conv[0](une_image)]
for i in range(1, len(couches_conv)):
    activations.append(couches_conv[i](activations[-1]))

# Afficher les activations pour chacune des couches
for couche in range(len(activations)):
    plt.figure(figsize=(50, 10))
    layer_viz = activations[couche][0, :, :, :]
    layer_viz = layer_viz.data
    print("Couche ",couche+1)
    for i, filtre in enumerate(layer_viz):
        if i == 16: 
            break
        plt.subplot(2, 8, i + 1)
        plt.imshow(filtre.to("cpu"),cmap='gray')
        plt.axis("off")
    plt.show()
    plt.close()