# TP3


# Neural Networks



Les réseaux de neurones peuvent être construits à l'aide du package ``torch.nn``.

Maintenant que vous avez eu un aperçu de « autograd », « nn » dépend de
``autograd`` pour définir des modèles et les différencier.
Un ``nn.Module`` contient des couches et une méthode ``forward(input)`` qui
renvoie la « sortie ».

Une procédure d'entraînement typique pour un réseau de neurones est la suivante :

- Définir le réseau neuronal qui possède certains paramètres à apprendre (ou
  poids)
- Itérer sur un ensemble de données d'entrées
- Calculer la perte (dans quelle mesure la sortie est-elle correcte)
- Faire de la backpropagation dans les paramètres du réseau
- Mettre à jour les poids du réseau, généralement à l'aide d'une simple règle de mise à jour :
  ``poids = poids - taux d'apprentissage * gradient``

## Définir le réseau

Définissons un réseau :

In [None]:
%matplotlib inline

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 1 input image channel, 6 output channels, 5x5 square convolution
        # kernel
        self.conv1 = nn.Conv2d(1, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        # an affine operation: y = Wx + b
        self.fc1 = nn.Linear(16 * 5 * 5, 120)  # 5*5 from image dimension
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # Max pooling over a (2, 2) window
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # If the size is a square, you can specify with a single number
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = torch.flatten(x, 1) # flatten all dimensions except the batch dimension
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


net = Net()
print(net)

 <font color='blue'> **Question** : Décrire l'architecture du réseau </font>

 <font color='blue'> **Question** : Afficher les poids et biais de la première convolution </font>

Il suffit de définir la fonction ``forward`` et la fonction ``backward``
la fonction (où les gradients sont calculés) est automatiquement définie pour vous
en utilisant ``autograd``.
Vous pouvez utiliser n'importe laquelle des opérations Tensor dans la fonction « forward ».

Les paramètres apprenables d'un modèle sont renvoyés par ``net.parameters()``



In [None]:
params = list(net.parameters())
print(len(params))
print(params[0].size())  # conv1's .weight

**Attention !**
Quand on parle du nombre de paramètres d'un réseau, on parle du nombre de nombres réels dans les matrices, biais et noyaux impliqués dans le réseau (comme dans le cours).

 <font color='blue'> **Question** : Combien de paramètres a ce réseau ? </font>

Essayons d'envoyer une image aléatoire en entrée.


 <font color='blue'> **Question** : Testez le réseau sur une entrée aléatoire qui est une image en niveaux de gris (un canal) de taille $32 \times 32$.</font>

In [None]:
input = #TODO
out = net(input)
print(out)

##  <font color='blue'> Exercice </font>

1. Nous aimerions définir un réseau qui classe les images de taille $(3,32,32)$.
Construire une classe Net() qui applique :
- une convolution avec $6$ canaux en sortie et un noyau de taille $5 \times 5$, suivi d'un ReLu
- un max pooling de taille $2 \times 2$
- une convolution avec $16$ de canaux en sortie et un noyau de taille $3 \times 3$, suivi d'un ReLu
- un  max pooling de taille $2 \times 2$
- une couche linéaire avec une taille de sortie de $120$, suivie d'un ReLu
- une couche linéaire avec une taille de sortie de $84$, suivie d'un ReLu
- une couche linéaire avec une taille de sortie de $10$

Vérifiez que cela fonctionne avec une entrée aléatoire.

2. Dessinez le réseau comme cela est fait dans les dernières slides du cours.

In [None]:
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        #TODO

    def forward(self, x):
      #TODO


net = Net()

In [None]:
x = #TODO
net(x)