# TP4

In [None]:
%matplotlib inline

# Entraîner un classificateur

Ça y est. Vous avez vu comment définir des réseaux de neurones, calculer les pertes et faire
mises à jour des poids du réseau.


## Et les données ?

Généralement, lorsque vous devez traiter des données d'image, de texte, audio ou vidéo,
vous pouvez utiliser des packages Python standard qui chargent des données dans un tableau numpy.
Ensuite, vous pouvez convertir ce tableau en ``torch.*Tensor``.

- Pour les images, des packages tels que Pillow, OpenCV sont utiles
- Pour l'audio, des packages tels que scipy et librosa


Spécifiquement pour la vision, un package appelé
``torchvision``, possède des chargeurs de données pour les ensembles de données courants tels que
ImageNet, CIFAR10, MNIST, etc. et transformateurs de données pour les images, à savoir,
``torchvision.datasets`` et ``torch.utils.data.DataLoader``. C'est très pratique !

Pour ce tutoriel, nous utiliserons l'ensemble de données CIFAR10.
Voir des exemples sur le [lien](https://www.cs.toronto.edu/~kriz/cifar.html)


## Entraîner un classificateur d'images

Nous allons suivre les étapes suivantes dans l'ordre :

1. Charger et normaliser les ensembles de données de formation et de test CIFAR10 à l'aide
   ``torchvision``
2. Définir un réseau neuronal convolutif
3. Définir une fonction de perte
4. Entraîner le réseau sur le training set
5. Testez le réseau sur les données de test


### 1. Load and normalize CIFAR10

En utilisant ``torchvision``, il est très facile de travailler avec Cifar10.


In [None]:
import torch
import torchvision
import torchvision.transforms as transforms

La sortie des ensembles de données torchvision sont des images PIL Image à valeurs dans [0, 1].
Nous les transformons en tensors normalisés à valeurs dans [-1, 1].



<div class="alert alert-info"><h4>Note</h4><p>Si vous utilisez Windows et que vous obtenez une erreur BrokenPipeError, essayez de définir
    le num_worker de torch.utils.data.DataLoader() à 0.</p></div>



In [None]:
transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

batch_size = 4

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=batch_size,
                                         shuffle=False, num_workers=2)

trainloader et testloader nous permettront d’échantillonner des lots de données.

 <font color='blue'> **Question** : Quelles sont les classes du dataset ? ([link](https://www.cs.toronto.edu/~kriz/cifar.html)) </font>

  <font color='blue'> **Question** : Combien d'images sont dans le training set ? </font>
  
  <font color='blue'> **Question** : Combien d'images sont dans le test set  ? </font>

  <font color='blue'> **Question** : Que fait ```transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))``` ? Comment cela serait-il codé pour des images en noir et blanc ? </font>

Regardons quelques images du training set



In [None]:
import matplotlib.pyplot as plt
import numpy as np

# functions to show an image


def imshow(img):
    img = img / 2 + 0.5     # unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()


# get some random training images
dataiter = iter(trainloader)
images, labels = next(dataiter)

# show images
imshow(torchvision.utils.make_grid(images))
# print labels
classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
print(' '.join(f'{classes[labels[j]]:5s}' for j in range(batch_size)))

In [None]:
images.shape

### 2. Define a Convolutional Neural Network



 <font color='blue'> **Question** : Compléter la cellule suivante </font>



In [None]:
import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(__, 120) #TODO
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, __) #TODO

    def forward(self, x):
        x = F.max_pool2d(F.relu(self.conv1(x)), 2)
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = torch.flatten(x, 1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


net = Net()

In [None]:
net(images)

### 3. Define a Loss function and optimizer




In [None]:
import torch.optim as optim
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

In [None]:
criterion = nn.CrossEntropyLoss()

### 4. Entraînement du réseau




In [None]:
for epoch in range(2):  # loop over the dataset multiple times

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        # get the inputs; data is a list of [inputs, labels]
        inputs, labels = data

        # zero the parameter gradients
        optimizer.zero_grad()

        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # print statistics
        running_loss += loss.item()
        if i % 2000 == 1999:    # print every 2000 mini-batches
            print(f'[{epoch + 1}, {i + 1:5d}] loss: {running_loss / 2000:.3f}')
            running_loss = 0.0

print('Finished Training')

In [None]:
PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)

 <font color='blue'> **Question** : Que fait la cellule précedente ?

  (Très important pour le projet !) </font>

See [here](https://pytorch.org/docs/stable/notes/serialization.html)
for more details on saving PyTorch models.

### 5. Test du réseau

Nous avons entraîné le réseau avec 2 passages sur l'ensemble de données de formation.
Vérifions si le réseau a appris quelque chose.



In [None]:
dataiter = iter(testloader)
images, labels = next(dataiter)

Ensuite, chargeons à nouveau notre modèle enregistré (remarque : sauvegarder et recharger le modèle
n'était pas nécessaire ici, nous l'avons fait uniquement pour illustrer comment procéder) :



In [None]:
net = Net()
net.load_state_dict(torch.load(PATH))

D'accord, voyons maintenant ce que le réseau neuronal pense de ces exemples ci-dessus :



In [None]:
outputs = net(images)
print(outputs)

 <font color='blue'> **Question** : Quelles sont les probabilités que la première image des « images » se trouve dans chaque classe ? </font>

In [None]:
_, predicted = torch.max(outputs, 1)

# print images
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join(f'{classes[labels[j]]:5s}' for j in range(4)))
print('Predicted: ', ' '.join(f'{classes[predicted[j]]:5s}'
                              for j in range(4)))

Observons la matrice de confusion.

 <font color='blue'> **Question** : Qu'est-ce qui est fait dans la cellule suivante ? </font>

In [None]:
all_labels = torch.tensor([])
all_predicted = torch.tensor([])
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predicted = torch.max(outputs.data, 1)

        all_labels = torch.cat((all_labels, labels))
        all_predicted = torch.cat((all_predicted, predicted))


 <font color='blue'> **Question** : Compléter la cellule ci-dessous. </font>

In [None]:
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

t_test = #TODO
t_pred = #TODO


#Classification report
print(classification_report(t_test,t_pred,target_names = classes))

#Confusion matrix
cm = confusion_matrix(t_test,t_pred)
disp = ConfusionMatrixDisplay(confusion_matrix=cm,display_labels = classes)
disp.plot()

#  <font color='blue'> Exercise </font>

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from sklearn.datasets import make_moons, make_circles, make_classification, make_blobs, make_gaussian_quantiles
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from IPython.display import display, clear_output
import torch

In [None]:
X, t = make_gaussian_quantiles(n_features=2, n_classes=3, n_samples=500)

X_train, X_test, t_train, t_test = train_test_split(X, t, test_size=.4, random_state=12)
# Number of points in each set:
N_train = X_train.shape[0]
N_test = X_test.shape[0]

figure = plt.figure(figsize=(10, 10))
plt.scatter(X_train[:, 0], X_train[:, 1], marker='o', c=t_train, s=50, edgecolor='k')
plt.scatter(X_test[:, 0], X_test[:, 1], marker='P', c=t_test, s=50, edgecolor='k');
plt.show()



In [None]:
X_train = torch.tensor(X_train, dtype=torch.float32)
t_train = torch.tensor(t_train, dtype=torch.int64)
X_test = torch.tensor(X_test, dtype=torch.float32)
t_test = torch.tensor(t_test, dtype=torch.int64)

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F

d = 5
class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(2,d)
        self.fc2 = nn.Linear(d, 3)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x


net = Net()
net2 = Net()

In [None]:
net.fc1.bias.requires_grad = False
net.fc1.weight.requires_grad = False


In [None]:


W1 =torch.randn(d,2)
b1 = torch.randn(d)
net.fc2.bias = torch.nn.Parameter(b1)
net.fc2.weight = torch.nn.Parameter(W1)
net2.fc2.bias = torch.nn.Parameter(b1)
net2.fc2.weight = torch.nn.Parameter(W1)


W2 =torch.randn(3,d)
b2 = torch.randn(3)
net.fc2.bias = torch.nn.Parameter(b2)
net.fc2.weight = torch.nn.Parameter(W2)
net2.fc2.bias = torch.nn.Parameter(b2)
net2.fc2.weight = torch.nn.Parameter(W2)

In [None]:
import torch.optim as optim
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.75)
optimizer2 = optim.SGD(net2.parameters(), lr=0.75)

In [None]:

for epoch in range(10**3):  # loop over the dataset multiple times
    # zero the parameter gradients
    optimizer.zero_grad()
    optimizer2.zero_grad()
    # forward + backward + optimize
    output = net(X_train)
    loss = criterion(output, t_train)
    loss.backward()
    optimizer.step()
    # forward + backward + optimize
    output2 = net2(X_train)
    loss2 = criterion(output2, t_train)
    loss2.backward()
    optimizer2.step()

print('Finished Training')

In [None]:
#visualize results:

x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5
h = 0.02
xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                        np.arange(y_min, y_max, h))
X_grid = np.hstack((xx.ravel(), yy.ravel()))

N_grid = xx.ravel().shape[0]
X_grid = np.c_[xx.ravel(), yy.ravel()]

feature_transform = lambda x : (net(torch.tensor(x, dtype=torch.float32).unsqueeze(0)).detach().numpy())
feature_transform2 = lambda x : (net2(torch.tensor(x, dtype=torch.float32).unsqueeze(0)).detach().numpy())


Phi_grid = feature_transform(X_grid)
Phi_grid2 = feature_transform2(X_grid)

Z =np.argmax(Phi_grid,axis=2)
Z = Z.reshape(xx.shape)

figure = plt.figure(figsize=(16, 8))
ax = plt.subplot(1,2,1)
ax.set_title("Input data")
ax.scatter(X_train[:, 0], X_train[:, 1], marker='o', c=t_train, s=50, edgecolor='k')
ax.scatter(X_test[:, 0], X_test[:, 1], marker='P', c=t_test, s=50, edgecolor='k')
ax = plt.subplot(1,2,2)
cmap = ListedColormap(['b','y','r','m','g','c'])
plt.contourf(xx,yy,Z,  cmap = cmap, alpha=.8)
ax.scatter(X_train[:, 0], X_train[:, 1], marker='o', c=t_train, s=50, edgecolor='k')
ax.scatter(X_test[:, 0], X_test[:, 1], marker='P', c=t_test, s=50, edgecolor='k')

Z2 =np.argmax(Phi_grid2,axis=2)
Z2 = Z2.reshape(xx.shape)
figure = plt.figure(figsize=(16, 8))
ax = plt.subplot(1,2,1)
ax.set_title("Input data")
ax.scatter(X_train[:, 0], X_train[:, 1], marker='o', c=t_train, s=50, edgecolor='k')
ax.scatter(X_test[:, 0], X_test[:, 1], marker='P', c=t_test, s=50, edgecolor='k')
ax = plt.subplot(1,2,2)
cmap = ListedColormap(['b','y','r','m','g','c'])
plt.contourf(xx,yy,Z2,  cmap = cmap, alpha=.8)
ax.scatter(X_train[:, 0], X_train[:, 1], marker='o', c=t_train, s=50, edgecolor='k')
ax.scatter(X_test[:, 0], X_test[:, 1], marker='P', c=t_test, s=50, edgecolor='k')

# Test image

In [None]:
!git clone 'https://github.com/emilePi/denis'

In [None]:
import io
import requests
from PIL import Image
from torchvision.transforms.functional import to_tensor
import pylab as plt
import numpy as np
img = to_tensor(Image.open('./denis/denis.jpeg'))
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0)),cmap=plt.cm.gray)
plt.show()


In [None]:
import torch
from torchvision.transforms.functional import to_tensor, to_pil_image
from IPython.display import display
from PIL import Image

im_pil = Image.open('./denis/denis.jpeg')
display(im_pil)

Si cela ne fonctionne pas :

1. Télécharger l'image à ce lien : https://github.com/emilePi/denis
2. Enregistrer-la dans le dossier de votre choix
3. Compléter la cellule ci-dessous en mettant PATH= "le chemin vers le dossier précédent". (Par exemple PATH = 'C:/Documents/Apprentissage pour l'image/Cours/TP4/')

In [None]:
PATH =

import os
os.chdir(PATH)

im_pil = Image.open('./denis.jpeg')
display(im_pil)