# Classification d'images avec un réseau de neurones (pytorch)

Dans ce notebook on se propose de classifier des images à partir d'un réseau de neurones en utilisant la bibliothèque pytorch.

## Travail demandé :

Si vous n'êtes pas familiers avec pytorch, commencez par le tutoriel de prise en main, avant d'étudier le notebook ci-dessous.

Ensuite, vous devrez vous inspirer de ce tutoriel pour :
+ 1) Implémenter un exemple de réseau simple avec une couche cachée de 128 neurones et des activations `ReLU` pour classifier les images de la base mnist. (Complétez le notebook ci-dessous)
+ 2) Afficher l'évolution de la fonction de coût de l'ensemble de validation sur la même courbe que celle du coût sur l'ensemble d'entrainement. Y a-t-il surapprentissage ?
+ 3) Modifier le programme pour réduire le nombre d'images d'entrainement à 1000, et entrainez à nouveau votre modèle, en analysant les résultats d'entrainement, validation et test. Qu'observez-vous ?


### Imports python

In [None]:
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from sklearn import cluster, datasets
%matplotlib inline

#Import pytorch:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset, Subset, random_split
import torchvision
import torchvision.transforms as transforms


## 1. Chargement et visualisation des données

On commence par charger nos données et les normaliser. Les données sont déjà séparées en une base d'entrainement et une base de test.

In [None]:
# Fonction de Normalisation pour passer de [0,1] vers [-1,1]]
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))])

# Dataset
mnistTrainSet = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
mnistTestSet = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)

X_train = mnistTrainSet.data/255
X_test = mnistTestSet.data/255
Y_train = mnistTrainSet.targets
Y_test = mnistTestSet.targets
class_names = mnistTrainSet.classes

print('shape X train : ', X_train.shape)
print('shape X test : ', X_test.shape)
print('shape Y train : ', Y_train.shape)
print('shape Y test : ', Y_test.shape)

# Affichage de quelques images et label associé
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(X_train[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[Y_train[i]])

Pour utiliser moins d'images on modifiera ici dans la question 3) :

In [None]:
# Nombre d'exemples considérés (vous pouvez changer ici !) :
n_train = 10000
n_test = 10000

# TODO : utiliser un Subset de n_train exemples
# Completer pour la Question 3)
# Pour utiliser un sous-ensemble du jeu d'entrainement

## 2. Construction du modèle 



### Modèle et prédictions

On définit notre réseau de neurones dans une classe spécifique ici. La fonction `forward` réalise notre propagation en avant, pour obtenir les probabilités prédites.

Note : **la rétropropagation n'a pas besoin d'être implémentée, elle sera calculée automatiquement par pytorch lors de l'appel de la fonction `backward`**

In [None]:
# Hyperparamètres
# Choisir ici le nombre de neurones de la couche cachée :
H = 10

# Classe qui définit le réseau :
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()

        # A Completer
        )           
    def forward(self, x):
        # A Completer
        return x
    
# Pour rendre les tirages aléatoires reproductibles (facultatif)   
torch.manual_seed(0)

# Création du réseau : 
model = Net()

# Affichage de l'architecture :
print(model)

## 3. Entrainement

### Préparation à l'entrainement


In [None]:
# Hyperparamètres
N_epochs = 200
batch_size = 100
learning_rate = 0.001

#### Choix de la fonction de coût
https://pytorch.org/docs/master/nn.html#loss-functions

In [None]:
#loss_function = # A compléter

#### Choix de l'optimiseur
https://pytorch.org/docs/master/optim.html#algorithms

In [None]:
# Choix de l'optimiseur
#optimizer = # A compléter

On sépare ici le Dataset de test en un ensemble de validation et un ensemble de test (uniquement pour la visualisation de l'évolution de la généralisation !) et on créé 3 dataloader

In [None]:
# Split test Dataset
mnistValset, mnistTestSet = random_split(mnistTestSet, 
                                                            [int(0.1 * len(mnistTestSet)), 
                                                             int(0.9 * len(mnistTestSet))])

# Outil de chargement des lots de données
mnistTrainLoader = DataLoader(mnistTrainSubset, batch_size=batch_size,shuffle=True, num_workers=0)
mnistValLoader = DataLoader(mnistValset, batch_size=1000, shuffle=False, num_workers=0)
mnistTestLoader = DataLoader(mnistTestSet, batch_size=batch_size, shuffle=False, num_workers=0)

In [None]:
# Calcul de la loss de validation initiale
for features_val, labels_val in mnistValLoader: 
    labels_val_pred = model(features_val)
    val_loss = loss_function(labels_val_pred,labels_val)  

    
print('Shape du tenseur de features de validation : ', features_val.shape)

### Entrainement du réseau
L'exemple ci-dessous illustre une descente de gradient simple, mais on pourra également réaliser une descente de gradient stochastique en sélectionnant des lots de données.

In [None]:
# Nombre d'itérations
losses = []  
val_losses = []
i=0
for epoch in range(N_epochs):  # Boucle sur les époques
    running_loss = 0.0
   
    for features, labels in mnistTrainLoader:        
        
        #Propagation en avant
        # A compléter

        #Calcul du coût
        # A compléter

        #on sauvegarde la loss pour affichage futur
        #losses.append(loss.item())


        #Effacer les gradients précédents
        # A compléter
        
        #Calcul des gradients (rétro-propagation)
        # A compléter

        # Mise à jour des poids : un pas de l'optimiseur
        # A compléter
        
        # print statistics
        #running_loss += loss.item()
        #if i % 10 == 9:    
        #    print('[Epoque : %d, iteration: %5d] loss: %.3f' %
        #          (epoch + 1, i + 1, running_loss / 10))
        #    running_loss = 0.0
        #i+=1        
   
print('Entrainement terminé')

In [None]:
# Afficher l'évolution de la fonction de coût
fig, axes = plt.subplots(figsize=(8,6))
axes.plot(losses,'r-',lw=2,label='Fonction de cout')
axes.plot(val_losses,'b-',lw=2,label='Fonction de cout - validation')
axes.set_xlabel('N iterations',fontsize=18)
axes.set_ylabel('Cout',fontsize=18)
plt.legend(loc='upper right',fontsize=16)

## 5. Evaluation des performances

In [None]:
correct = 0
total = 0
# Pas besoin de calculer les gradient ici puisqu'on n'optimise plus
with torch.no_grad():
    for data in mnistTestLoader:
        images, labels = data
        # Propagation en avant pour calculer les prédictions
        outputs = model(images)         
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print('Accuracy sur les 10000 images de test : %d %%' % (
    100 * correct / total))

## 6. Predictions

In [None]:
predictions = model(X_test.type(torch.FloatTensor))
print('shape predictions : ', predictions.shape)


In [None]:
def plot_image(i, predictions_array, true_label, img):
    predictions_array, true_label, img = F.softmax(predictions_array[i]), true_label[i], img[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])  
    plt.imshow(img, cmap=plt.cm.binary)  
    predicted_label = torch.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'  
    plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*torch.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
    predictions_array, true_label = F.softmax(predictions_array[i]), true_label[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])
    thisplot = plt.bar(range(10), predictions_array.detach(), color="#777777")
    plt.ylim([0, 1])
    predicted_label = torch.argmax(predictions_array)
    thisplot[predicted_label].set_color('red')
    thisplot[true_label].set_color('blue')


# Affichage de quelques images et de leurs prédictions 
_, predicted = torch.max(predictions.data, 1)
labels = Y_test
correct = (predicted == labels)
false = (predicted != labels)
    
# Affichage de quelques exemples d'erreurs
idx_false = np.where(false)
plt.figure(figsize=(18,12))
K=0
for i in idx_false[0][0:12]:  
    plt.subplot(4,6,2*K+1)
    plot_image(i, predictions, Y_test, X_test)
    plt.subplot(4,6,2*K+2)
    plot_value_array(i, predictions,  Y_test)
    plt.xlabel(class_names[Y_test[i]])
    K=K+1
plt.show()


# Affichage de quelques exemples de prédictions correctes
idx_correct = np.where(correct)
plt.figure(figsize=(18,12))
K=0
for i in idx_correct[0][0:12]:  
    plt.subplot(4,6,2*K+1)
    plot_image(i, predictions, Y_test, X_test)
    plt.subplot(4,6,2*K+2)
    plot_value_array(i, predictions,  Y_test)
    plt.xlabel(class_names[Y_test[i]])
    K=K+1
plt.show()