# Autoencodeur

## Introduction aux Autoencodeurs
Les autoencodeurs sont des réseaux de neurones qui apprennent à encoder des données en une représentation de dimension réduite, puis à décoder cette représentation pour reconstruire les données originales ou créer des nouvelles données.

![Auto encoder](https://raw.githubusercontent.com/Automatants/projets-de-permanence/master/image-hosting/TP3_Autoencodeur/autoencoder.png)

Les auto-encodeurs sont composés de deux parties principales: l'encodeur et le décodeur.

![Encoder Decoder](https://raw.githubusercontent.com/Automatants/projets-de-permanence/master/image-hosting/TP3_Autoencodeur/encoderdecoder.png)

Encodeur: Cette partie du réseau prend en entrée des données brutes (comme une image) et les comprime en une représentation latente. Cette représentation latente est un ensemble réduit de caractéristiques qui retient l'information essentielle de l'entrée.

Décodeur: Le décodeur prend la représentation latente générée par l'encodeur et la décode pour produire une sortie qui se rapproche le plus possible de ce qu'on veut obtenir (par exemple de la segmentation d'image, ou du débruitage d'image).

Dans ce TP, on va implémenter un autoencodeur pour faire du débruitage d'image de MNIST.

![Denoise](https://raw.githubusercontent.com/Automatants/projets-de-permanence/master/image-hosting/TP3_Autoencodeur/denoise.png)


## Préparation des données
On va télécharger le dataset MNIST puis mettre du bruit sur les images.

In [None]:
from torchvision import datasets, transforms

transform = transforms.Compose([transforms.ToTensor()])
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

X_train = train_dataset.data
X_test = test_dataset.data

print(X_train.shape)
print(X_test.shape)

## Exercice 1: Normalisation des images et ajout de bruit
Normaliser les images en [0, 1] et ajouter du bruit sur les images de train et de test.

In [None]:
X_train_normalized = ...
X_test_normalized = ...
...
X_train_noise = ...
X_test_noise = ...

## Exercice 2: Visualisation des données bruitées

In [None]:
...

## Exercice 3: Création du modèle
Voici le schéma du modèle que l'on va créer:


In [None]:
# ----------------------------------------------------------------
# Layer (type)               Output Shape
# ================================================================
# Input              [1, 28, 28]
# Conv2d             [16, 28, 28]
# MaxPool2d          [16, 14, 14]
# Conv2d             [8, 14, 14]
# MaxPool2d          [8, 7, 7]
# Conv2d             [8, 7, 7]
# MaxPool2d          [8, 3, 3]
# Conv2d             [8, 3, 3]
# ConvTranspose2d    [8, 3, 3]
# ConvTranspose2d    [8, 7, 7]
# ConvTranspose2d    [8, 14, 14]
# ConvTranspose2d    [16, 28, 28]
# ConvTranspose2d    [1, 28, 28]
# ----------------------------------------------------------------

Avec des ReLU entre chaque couche.

In [None]:
import torch
import torch.nn as nn

class AutoEncoder(nn.Module):
	def __init__(self):
		super().__init__()
		...

	def forward(self):
		...

## Exercice 4: Entraînement du modèle

Pour entraîner le modèle, on met en entrée les images bruitées et on va comparer la sortie du modèle avec les images orignales (donc X_train).

In [None]:
model = AutoEncoder()
loss_fn = ...
optimizer = ...

...

## Visualiser les résultats sur les données de test

In [None]:
...

## Améliorations

On peut améliorer le modèle en ajoutant des couches, en changeant les hyperparamètres, en changeant la learning rate, etc...
Vous pouvez aussi essayer d'accélerer l'entraînement en utilisant le GPU.

## Challenge: Denoising Dirty Documents/Remove noise from printed text

![Dirty Documents](https://raw.githubusercontent.com/Automatants/projets-de-permanence/master/image-hosting/TP3_Autoencodeur/denoisingdocument.JPG)

Lien vers le challenge: https://sharing.cs-campus.fr/compete/89