<img src='https://upload.wikimedia.org/wikipedia/fr/thumb/e/ed/Logo_Universit%C3%A9_du_Maine.svg/1280px-Logo_Universit%C3%A9_du_Maine.svg.png' width="300" height="500">
<br>
<div style="border: solid 3px #000;">
    <h1 style="text-align: center; color:#000; font-family:Georgia; font-size:26px;">Introduction à l'IA</h1>
    <p style='text-align: center;'>Master Informatique</p>
    <p style='text-align: center;'>Anhony Larcher</p>
</div>

Ce premier tutoriel est une introduction à [PyTorch](https://pytorch.org/)


# Introduction a PyTorch: les classes de base

La classe de base en **PyTorch** est le tenseur; les opérations de base sur les tenseurs sont décrites dans la [documentation de **PyTorch**](https://pytorch.org/tutorials/beginner/basics/tensorqs_tutorial.html)

En Pytorch il y a deux façons de définir un réseau de neurone:
* dériver la classe **module**
* utiliser un objet **sequential**

In [1]:
import numpy
import torch

Tout calcul en PyTorch est fait sur un *device* qu'il vous appartient de définir.

Généralement, on utilise les **cpu** pour préparer les données et visualiser, et les **gpu** pour le calcul dans les réseaux.

```python
device = 'cuda' if torch.cuda.is_available() else 'cpu'
print('Using {} device'.format(device))
```

## La classe de base pour définir un réseau de neurones est la classe **module**

On dérive cette classe pour créer sa propre architecture puis on implémente la fonction **forward**.

Nous allons définir un block résiduel (pour implémenter un ResNet).

```python
class ResBlock(torch.nn.Module):
    """

    """
    expansion = 1

    def __init__(self, channels, stride=1):
        super(ResBlock, self).__init__()
        ... a completer
        
    def forward(self, x):
        ... a completer
```

La définition d'une classe héritée de `module` requiert l'implémentation de deux méthodes:
* ```__init__```
* `forward`
Le rôle de ces méthodes est détaillé ci-dessous.

### Initialisation
Instancie les composantes du module:
* couches neuronales
* fonctions d'activation
* couches et fonctions de régularisation (batchnorm, layernorm...)

### Méthode `Forward`
Définit le flux des données à travaers les couches et fonctions instanciées dans la fonction ```__init__```.


### Retour à l'exemple du ResBlock

Afin d'implémenter votre module vous devez définir son architecture.
Dans cet exemple, le bloc doit contenir dans l'ordre:

* 1 couche convolutionnelle 2D avec:
    * dimension d'entree: = *channels*
    * dimension de sortie = *channels*
    * un noyau de taille 3
    * un stride égale a celui fournis en paramètre
    * padding = 1
    * aucun biais
* une couche de batch normalization (de dimension *channels*)
* 1 activation de type *LeakyReLU*
* une autre couche convolutionnelle avec les mêmes paramètres
* une couche de batch normalization (de dimension *channels*)
* 1 activation de type *LeakyReLU*
* Une fois passé ces couches, on ajoute l'entrée non modifiée.
* 1 activation de type *LeakyReLU*

L'architecture de votre ResBlock est illustrée par la figure suivante.

<img src='https://git-lium.univ-lemans.fr/cours_m2/open_resources/-/raw/master/figures/ResBlock.png' width="300" height="500">

In [3]:
class ResBlock(torch.nn.Module):
    """

    """
    def __init__(self, channels, stride):

        self.channels = 

        self.activation = 

        self.conv1 = 
        self.conv2= 

        self.batch_norm1 = 
        self.batch_norm2 = 

    def forward(self, x):
        """

        :param x:
        :return:
        """
        ... to complete

### Bonne pratique pour l'implémentation

L'implémentation de réseaux de neurones est parfois complexe.
Le nombre de couche et la modularité des réseaux nécessite de la rigueur.
Une bonne pratique, qui vous évitera un grand nombre d'erreurs consite à vérifier les dimensions d'entrée et de sortie de chaque couche afin de s'assurer que la sortie d'une couche ou d'un module peut être utilisée en entrée du suivant.

**Pensez donc à créer un batch de fausses données (au format des vraies) afin de tester votre module au fur et à mesure de son implémentation.**

Ici vous pouvez créer un batch de données aléatoires de dimension `(1, 2, 10, 100)` qui correspond à 1 batch de 1 échantillon à 2 canaux de dimension `(10, 100)`.

In [4]:
# Initialisez un ResBlock avec deux canaux et un stride de 1
...

In [5]:
# Create 1 batch of 1 sample of 2 channels of dimension 10, 100 and test
...

In [6]:
# Test here your module
...

Shape of output= torch.Size([1, 2, 10, 100])


## Sequential

### Motivation

Un module est très flexible et permet d'implémenter des flux de données complexes.

Dans les cas ou le flux de données est simple et (unidirectionnel) il est possible de regrouper des couches ou traitements dans une structure séquentielle.

### Application

Créer maintenant une classe *ResNet* en dérivant la classe module.

Ce réseau contient 1 couche d'entrée: convolutionnelle 2D 
* dimension d'entree = 2
* dimension de sortie = 2
* un noyau de taille = 3
* un stride égale a celui fournis en paramètre
* padding = 1
* aucun biais

suivie d'une couche de batch_norm et de 5 blocks *ResBlock(2, 1)* qui sont ajoutés dans un *torch.nn.Sequential*


```python 
class ResNet(torch.nn.Module):
    """

    """
    def __init__(self):
        super(ResNet, self).__init__()
        ...
        
    def forward(self, x):
        ...
```




In [7]:
class ResNet(torch.nn.Module):
    """

    """
    def __init__(self):
        super(ResNet, self).__init__()
        self.conv1 = 
        self.bn1 = 
        self.res = torch.nn.Sequential(

        )
        self.bn2 = 
        self.avg_pool = 
        
    def forward(self, x):
        ...

In [8]:
# Instanciez un ResNet
...

In [9]:
# Créez vos données pour vérifier l'implementation de votre ResNet et testez
...

# Datasets, Dataloaders et Datasamplers

Les DataSets sont les classes qui permettent de charger et préparer les exemples.

Les dataloaders permettent de gérer les batchs

Les DataSamplers permettent de définir précisément les données fournies au réseau à chaque époque (équilibrage des batchs, ordre...)


In [11]:
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
from torch.utils.data import Sampler

Implémentez un `DataSet` qui génère une liste de 128 matrices de dimension $(10, 100)$ dont les éléments suivent une distribution normale.
Lorsque la méthode `__getitem__` est appelée, le `DataSet` retourne la matrice correspondante.

In [12]:
class RandomDataset(Dataset):
    def __init__(self):
        """
        de nombreuses transformations existent qui permettent d'augmenter les données simplement
        """
        ...

    def __len__(self):
        ...

    def __getitem__(self, idx):
        ...

In [13]:
# Instanciez et testez votre RandomDataset en affichant le 3e exemple généré
...

dimension des données: (10, 100)
label associé à cet échantillon: 3


In [25]:
# Créez un DataLoader qui utilise votre RandomDataset pour générer des batchs de 16 échantillons tirés dans un ordre aléatoire.
# Attention il est possible que l'environnement du notebook ne vous permette pas de lancer ce DataLoader.
# Si c'est le cas, pourquoi?

# Pour résoudre ce problème recopiez le code du RandomDataset dans un module python externe que vous importerez ensuite.
...


In [26]:
# Affichez le nombre de batchs générés par votre DataLoader
...

8

In [27]:
# Testez ce DataLoader
...

tensor([[[ 0.7593, -0.4458,  1.1342,  ..., -0.0183, -1.2983, -0.4538],
         [ 0.1683, -1.3665,  0.3217,  ..., -0.7085, -1.3029,  1.2522],
         [ 0.0594,  1.5714, -1.0017,  ...,  1.4760,  1.5328, -0.1920],
         ...,
         [-2.0481, -0.1349, -0.1104,  ...,  0.4932, -0.2885,  0.3159],
         [ 0.0055,  1.3177,  1.6024,  ...,  0.4468,  0.2847, -1.8891],
         [-0.9828, -0.4226,  0.1172,  ...,  0.6722,  1.5683, -0.4602]],

        [[ 0.3404, -1.7323, -0.9495,  ..., -0.0039,  0.6285, -0.0213],
         [ 0.5692,  0.7354,  1.2560,  ...,  1.1333,  0.1747,  0.6072],
         [ 0.2684, -0.5287,  0.4409,  ..., -0.5964, -0.7434,  2.2727],
         ...,
         [ 0.2176,  0.0398,  0.7649,  ..., -0.2769, -0.3210,  1.4986],
         [ 1.3290,  1.5605, -0.2678,  ...,  0.6909, -1.2123, -0.9036],
         [-0.4925, -0.4194,  1.3632,  ..., -0.7504,  0.3691, -0.9598]],

        [[ 0.5896,  0.7366,  0.8537,  ..., -1.2932, -0.6860,  1.7604],
         [-0.4621, -1.3263,  0.4329,  ..., -1

## DataSampler

Implementez un data sampler qui, parmi les 128 exemples du dataset, sélectionne ces échantillons aléatoirement

In [19]:
class BatchSampler(torch.utils.data.Sampler):
    """
    Data Sampler used to generate uniformly distributed batches
    """

    def __init__(self, batch_size):
        ...
    def __iter__(self):
        ...

    def __len__(self) -> int:
        ...

    def set_epoch(self, epoch: int) -> None:
        ...

Utilisez votre `DataSampler` avec un DataLoader qui n'effectue pas de shuffle sur vos données et vérifier son fonctionnement.

In [38]:
...

In [39]:
# Testez ce DataLoader
...

tensor([[[-0.7937,  1.4512, -0.4704,  ...,  0.0145, -0.2925,  0.9257],
         [-0.0340, -0.0792,  0.0186,  ...,  0.1165, -1.1145, -0.8483],
         [-3.5411,  0.4113, -1.2204,  ...,  1.1191, -0.2236,  0.1004],
         ...,
         [-0.7605,  0.1050,  1.8894,  ...,  0.5267,  1.4374, -0.3940],
         [ 0.3630, -0.8052,  0.9325,  ...,  0.7135,  0.6261,  0.4511],
         [ 1.2429, -0.8078, -0.5532,  ...,  0.2315, -0.7555, -0.1166]],

        [[-1.8358,  1.1586,  0.8221,  ...,  0.7761,  3.3134,  1.5142],
         [ 0.6716,  0.7796, -1.6265,  ..., -1.6118, -1.1040, -0.3088],
         [ 0.0318,  1.0291,  0.9390,  ...,  3.0728,  0.1594,  0.8606],
         ...,
         [ 0.4851,  1.0680,  1.5948,  ...,  0.2656, -0.1093,  0.3473],
         [ 1.0904,  0.6719, -0.9522,  ..., -0.9245,  0.5239, -0.9447],
         [-0.5843,  0.8847,  0.3747,  ...,  0.3761,  1.5945, -0.5665]],

        [[ 1.4093, -0.5195,  0.6137,  ..., -1.1289, -0.4026, -0.4182],
         [ 1.2400,  2.1219, -1.1617,  ..., -0

# Save and Load models

It is advised to save and load models to use the **load_state_dict** method.

Beware, saving and loading models requires to know on which device the model is loaded.

*Question: How to load a model on a selected device?*

In [None]:
# Save and Load your model here
...

# Make PyTorch deterministic

Randomness is very present in many steps of deep learning.

In order to come closer to reproducibility you need to :

In [None]:
import numpy
import random
import torch

numpy.random.seed(0)
random.seed(0)
torch.manual_seed(0)

Convolution can involve the choice of different algorithms.

**When a cuDNN convolution is called with a new set of size parameters, an optional feature can run multiple convolution algorithms, benchmarking them to find the fastest one.**

Disabling the benchmarking feature with ```torch.backends.cudnn.benchmark = False``` causes cuDNN to deterministically select an algorithm, possibly at the cost of reduced performance.

However, if you do not need reproducibility across multiple executions of your application, then performance might improve if the benchmarking feature is enabled with ```torch.backends.cudnn.benchmark = True```.


In [None]:
torch.use_deterministic_algorithms(True)

DataLoader will reseed workers following Randomness in multi-process data loading algorithm. 

Use ```worker_init_fn()``` and generator to preserve reproducibility: