# Réseaux convolutionnels pour le traitement de l'image 


## Partie A : Prise en main des CNN, introspection

Vincent Guigue

[directement inspiré de:]
Nicolas Baskiotis (nicolas.baskiotis@soronne-univeriste.fr) Benjamin Piwowarski (benjamin.piwowarski@sorbonne-universite.fr) -- MLIA/ISIR, Sorbonne Université

Les objectifs de ce module sont :
* Prise en main des réseaux convolutionnels (CNN)
* Apprentissage d'un CNN
* Introspection d'un CNN

Nous travaillerons dans un premier temps avec les données MNIST puis avec le jeu de données CIFAR d'images de 10 classes.

In [None]:
from tqdm import tqdm
import numpy as np
import matplotlib.pyplot as plt

import torch
from torch import nn
from torch.nn import functional as F
from torch import optim
from torch.utils.data import TensorDataset, DataLoader,Dataset,random_split

import time
import os


### Prise en main du module sur un exemple jouet

In [None]:
x = torch.tensor([float(i) for i in range (25)]).view(5,5)
print(x)

conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=2, bias=False) # 1 seul filtre, sans biais pour bien maitriser
# note 1: normalement, on laisse TOUJOURS le biais
# initialisation à la main pour tester (la procédure normale consiste à laisser l'init aléatoire)
poids = torch.tensor([[[[1., 2.],[1., 1.]]]])
conv.weight = nn.Parameter(poids)

print("out :", conv(x.unsqueeze(0)))

print("filtre : ", conv.weight)

# explication de la première sortie (= 13)
print("calcul à la main: ", (x[:2,:2] * poids).sum())

In [None]:
# si on veut ajouter du padding => tout autour => une dimension de plus en sortie

conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=2, bias=False,padding=1, padding_mode='zeros') # 1 seul filtre, sans biais pour bien maitriser
# initialisation à la main pour tester (la procédure normale consiste à laisser l'init aléatoire)
poids = torch.tensor([[[[1., 2.],[1., 1.]]]])
conv.weight = nn.Parameter(poids)

print("out :", conv(x.unsqueeze(0)))

In [None]:
# jouer avec les pas de déplacement de la fenêtre (stride = PAS)

conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=2, bias=False, stride = 2) # 1 seul filtre, sans biais pour bien maitriser
# initialisation à la main pour tester (la procédure normale consiste à laisser l'init aléatoire)
poids = torch.tensor([[[[1., 2.],[1., 1.]]]])
conv.weight = nn.Parameter(poids)

print("out :", conv(x.unsqueeze(0)))


In [None]:
# DILATATION - jouer avec les pas de déplacement de la fenêtre (dilation = filtre intermittent)

conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=2, bias=False, dilation = 2) # 1 seul filtre, sans biais pour bien maitriser
# initialisation à la main pour tester (la procédure normale consiste à laisser l'init aléatoire)
poids = torch.tensor([[[[1., 2.],[1., 1.]]]])
conv.weight = nn.Parameter(poids)

print("out :", conv(x.unsqueeze(0)))
