# Deep Learning

Execution -> Change Execution Type -> GPU

## Inicialization
---

In [1]:
# PyTorch:  https://pytorch.org/
import torch
import torch.nn as nn           # Neural Network
import torch.nn.functional as F # Convolution Functions
import torch.optim as optim     # Optimization Algorithms
import torchvision              # Package for Computer Vision:
                                #   - popular datasets;
                                #   - model architectures;
                                #   - common image transformations;

# NumPy:    https://numpy.org/
import numpy as np

# MathPlot: https://numpy.org/
import matplotlib.pyplot as plt

In [None]:
transform_mnist = torchvision.transforms.Compose([
    torchvision.transforms.Resize((32,32)),
    torchvision.transforms.ToTensor()
])

mnisttrain = torchvision.datasets.MNIST("./mnist",train=True, transform=transform_mnist, download=True)
trainloader = torch.utils.data.DataLoader(mnisttrain, batch_size=64, shuffle=True, num_workers=2)

mnisttest = torchvision.datasets.MNIST("./mnist",train=False, transform=transform_mnist, download=True)
testloader = torch.utils.data.DataLoader(mnisttest, batch_size=64, shuffle=True, num_workers=2)

### Neural Network Linear

In [4]:
class MonReseau(nn.Module):
    def __init__(self):
        super(MonReseau, self).__init__()   # search super
        
        self.linear1 = nn.Linear(1024, 1024)
        self.linear2 = nn.Linear(1024, 2048)
        self.linear3 = nn.Linear(2048, 4096)

        self.final = nn.Linear(4096,10)
      
    def forward(self, x):
        x = x.view(-1,1024)  # l'image 1 x 32 x 32 devient un vecteur 1024
        x = F.leaky_relu(self.linear1(x))   # search leaky_relu
        x = F.leaky_relu(self.linear2(x))
        x = F.leaky_relu(self.linear3(x))
        
        x = self.final(x)
        return x


monreseau = MonReseau()
monreseau = monreseau.cuda()

optimizer = optim.Adam(monreseau.parameters(), lr=0.00001)
criterion = nn.CrossEntropyLoss()
nbepoch = 5

### Neural Network Convolutional

In [None]:
class MonReseau(nn.Module):
    def __init__(self):
        super(MonReseau, self).__init__()   # search super
        
        self.conv1 = nn.Conv2d(1,  32, kernel_size=5, padding=2)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.conv3 = nn.Conv2d(64, 64, kernel_size=3, padding=1)

        self.final = nn.Linear(4096,10)
      
    def forward(self, x):                               # l'image:
        x = F.leaky_relu(self.conv1(x))                 #  1x32x32 -> 32x32x32
        x = F.max_pool2d(x, kernel_size= 2, stride=2)   #          -> 32x16x16
        
        x = F.leaky_relu(self.conv2(x))                 #          -> 64x16x16
        x = F.max_pool2d(x, kernel_size= 2, stride=2)   #          -> 64x08x08
        
        x = F.leaky_relu(self.conv3(x))                 #          -> 64x08x08
        
        x = x.view(-1,4096)                             #          -> 64x08x08
        
        x = self.final(x)
        return x


monreseau = MonReseau()
monreseau = monreseau.cuda()

optimizer = optim.Adam(monreseau.parameters(), lr=0.00001)
criterion = nn.CrossEntropyLoss()
nbepoch = 5

## Visualization
---

In [None]:
def show(img):
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1,2,0)), interpolation='nearest')

sample = next(iter(trainloader))[0]
show(torchvision.utils.make_grid(sample))
print(sample.shape)     ## 64 c'est le batch
                        ## 1 c'est du gris -- sinon ce serait 3 pour du RGB
                        ## 32x32 c'est pour la taille de l'image (petite ici)

## Trainning
---

In [None]:
import random


for epoch in range(nbepoch):
    monreseau.train()
    print("epoch", epoch)

    for inputs, targets in trainloader: ## on itere sur les données 
        inputs, targets = inputs.cuda(),targets.cuda()

        mespredictions = monreseau(inputs)      ## on les fait rentrer dans le réseau
        loss = criterion(mespredictions,targets)## on compare la sortie courante à la sortie voulue

        optimizer.zero_grad()   ## supprime les gradients courants
        loss.backward()         ## le gradient -- la magie par rapport à comment c'était long en court :-)
        optimizer.step()        ## on actualise les poids pour que la sortie courante soit plus proche que la sortie voulue

        if random.randint(0,90)==0:
            print("\tloss=",loss)   ## on affiche pour valider que ça diverge pas

Maintenant, on calcule la performance obtenue **en test**
à travers la matrice de confusion
Mij c'est le nombre de fois qu'une image de la classe i a été classé comme j

## Analysis
---

In [None]:
from sklearn.metrics import confusion_matrix

monreseau.eval()
cm = np.zeros((10,10), dtype=int)        ## ATTENTION DE BIEN ME REMETTRE A ZERO
with torch.no_grad():                   ## ici pas besoin de calculer les gradients
    for inputs, targets in testloader:
        inputs = inputs.cuda()
        outputs = monreseau(inputs)
        _,pred = outputs.max(1)
        cm += confusion_matrix(pred.cpu().numpy(),targets.cpu().numpy(),labels =list(range(10)))

print(cm)

In [44]:
def evaluateClassification(classification):
    evaluation = np.zeros( (classification.shape[0]), dtype = float)

    total = classification.sum()
    for i in range(classification.shape[0]):
        evaluation[i] = classification[i,i] / total

    return evaluation


print(evaluateClassification(cm))

[0.0964 0.1118 0.098  0.0968 0.0937 0.0839 0.0927 0.0981 0.0865 0.0941]


# CNN VS MLP

Maintenant on va s'intéresser à la différence entre un mlp et un CNN


on fait regarder ce que donne nos codes -- si on permute les pixels
ce sera évidemment une permutation **FIXE** (ce sera la même pour toutes les images train et test) qu'on peut générer calculant une permutation des lignes et une des colonnes

In [None]:
def computerandompermutation(n):
	out = list(range(n))
	random.shuffle(out)
	return out
permrow,permcol = computerandompermutation(32),computerandompermutation(32)
print(permrow)



**Q3 (moyenne) :** Coder une fonction qui prends en argument une permutation et une image et qui permute ses pixels.


*n'oubliez est pour permuter la valeur de x et y dans un tableau T il faut faire*
- tmp = T[y]
- T[y] = T[x]
- T[x] = tmp

(sinon on écrase une des 2 valeurs)

commencer par permuter une image 32x32 et créer une fonction qui l'applique 64 fois sur un batch 64x1x32x32

In [None]:
print("TODO")

**SIGNALEZ que vous avez fini la question ci dessus -- il est nécessaire d'utiliser un codage efficace des permutations pour continuer -- il vous sera fourni**


**Q4 (facile) :**
Regarder les images avant et après permutation -- pourriez vous (vous même) classer les images APRES permutation ??


In [None]:
print("TODO")

**Q5 (facile)** :
Qu'est ce que ça change pour le MLP ??
-> relancer l'apprentissage/test en ajoutant cette permutation pour valider que ça ne change rien !


In [None]:
print("TODO")

**Q6 (facile)** : relancer le lenet -> là ça va changer 

In [None]:
print("TODO")


**Q7 (moyenne) :** faites une fonction qui ajoute du bruit (pour chaque pixel, mettez le à 0 ou à 1 avec une petite probabilité - le bruit est différent pour chaque image train et test)


In [None]:
print("TODO")

**Q8 (facile)** : Regarder les images avant et après permutation -- pourriez vous (vous même) classer les images APRES permutation ??




In [None]:
print("TODO")

**Q9 (facile)** : Tester le MLP et le CNN -> cette fois c'est le CNN qui devrait être "plutôt" invariant (le bruit est +/- filtré par la convolution) alors que le MLP devrait être gêné par le bruit !

In [None]:
print("TODO")

## conclusion

**-> se souvenir que si on prend TOUS les problèmes, tous les algos de classification sont tous aussi mauvais**

**-> ce qui compte c'est qu'ils soient adaptés aux données qu'on peut réellement rencontrer**

**En comparant les images avec permutation des pixels vs avec un bruit... Vous pouvez comprendre pourquoi le CNN est plus adapté à l'image naturelle 
que le MLP !**