<a href="https://colab.research.google.com/github/DavidBert/TP-MAPI3/blob/master/TP3_MAPI3_Sujet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Dans ce TP nous allons voir une famille particulière de réseaux de neurones: les auto-encoders

## Auto-encoders

Pour ce premier exemple sur les auto-encodeurs nous utiliserons le jeu de donnée MNIST

In [0]:
import numpy as np
from keras.datasets import mnist
((x_train, y_train), (x_test, y_test)) = mnist.load_data()
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = np.reshape(x_train, (len(x_train), 28, 28, 1))
x_test = np.reshape(x_test, (len(x_test), 28, 28, 1)) 

Les auto-encodeurs sont des réseaux de neurones utilisés le plus souvent pour apprendre de façon non-supervisée ou faiblement supervisée une représentation (features/encodages) d'un jeu de données.  
Les auto-encodeurs sont généralement constitués de deux éléments:
* Un encodeur chargé de réprésenter les données dans un espace le plus souvent de dimension réduite
* Un décodeur capable à partir d'une donnée encodée de reconstruire la donnée initiale
![Source wikipedia](https://upload.wikimedia.org/wikipedia/commons/2/28/Autoencoder_structure.png)


Le code suivant instancie un décodeur.  
Nous avions l'habitude de construire des réseaux de neurones à l'aide de la classe ```Sequential``` de Keras.  Nous allons cette fois-ci utiliser la methode fonctionnelle en important la clase ```Model``` de Keras.  
Cette méthode offre un peu plus de souplesse qu'avec le sequential, elle permet notamment de définir un modèle comme une composition de fonctions/couches.  
Définissons le modèle de notre encodeur de cette manière.


In [0]:
from tensorflow.keras.layers import Input, Dense, Conv2D, MaxPooling2D, BatchNormalization
from tensorflow.keras.models import Model

# On commence par définir une couche d'entrées
input_img = Input(shape=(28, 28, 1))
# On definit ensuite les couches suivantes à la manière d'un graph: couche = TypeDeCouche(paramètres_de_la_couche)(CouchePrécédente)
x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_img)
x = MaxPooling2D((2, 2), padding='same')(x)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
x = MaxPooling2D((2, 2), padding='same')(x)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)
encoded = MaxPooling2D((2, 2), padding='same')(x)

# On définit alors le model à partir de sa couche d'entrée et sa couche de sortie
encoder = Model(input_img, encoded)

Regardons la dimension de la sortie de notre encodeur:

In [0]:
print(encoder.predict(x_train[:1]).shape)

Vous allez maintenant coder vous même le décodeur en utilisant l'API Model de Keras.  
Nous utiliserons une nouvelle couche proposée dans l'API de Keras, la couche [UpSampling2D](https://www.tensorflow.org/api_docs/python/tf/keras/layers/UpSampling2D) permettant d'augmenter la taille d'un tenseur en répétant ses lignes et ses colonnes.  
Le décodeur sera composé des couches suivantes:
* Une couche d'inputs faite pour recevoir des tenseurs de la dimension des encodages générés par l'encodeur
* Une couche Conv2D 8 filtres, kernel (3,3) activation ReLU et padding=same
* Une couche UpSampling2D((2,2))
* Une couche Conv2D 8 filtres, kernel (3,3) activation ReLU et padding=same
* Une couche UpSampling2D((2,2))
* Une couche Conv2D 16 filtres, kernel (3,3) activation ReLU
* Une couche UpSampling2D((2,2))
* Une couche Conv2D 1 filtre, kernel (3,3) activation Sigmoid et padding=same  

La couche de sigmoïde permettra d'obtenir des sorties comprises entre 0 et 1.

In [0]:
from tensorflow.keras.layers import UpSampling2D

input_dec = Input(shape=(...))
...
...
decoded = ...

decoder = Model(input_dec, decoded)

Vérifiez que la sortie de votre décodeur est bien de la forme (_, 28, 28, 1)


In [0]:
y = encoder.predict(x_train[:1])
decoder.predict(y).shape

Nous pouvons maintenant créer un seul model à partir des deux précédents toujours en utilisant Model de Keras

In [0]:
auto_encoder = Model(inputs=encoder.input, outputs=decoder(encoder.output))

Vérifiez que les deux models sont bien reliés.  
Vous devez obtenir une image ne contenant que du bruit. C'est normal nous n'avons rien entrainé pour le moment.

In [0]:
import matplotlib.pyplot as plt

plt.imshow(auto_encoder.predict(x_train[:1]).reshape(28, 28), cmap="gray")

Entrainons maintenant le modèle entier.  
Les images étant des pixels prennant la valeur 1 ou 0 nous utiliserons la binary_crossentropy de Keras qui sera appliquée sur chacun des pixels de l'image de sortie.

In [0]:
auto_encoder.compile(optimizer='adam', loss='binary_crossentropy')
auto_encoder.fit(x_train, x_train, epochs=25, batch_size=128, shuffle=True, validation_data=(x_test, x_test))

Nous avons entrainé le model auto-encoder, composé lui même de deux sous-models. 
L'encodeur encode donc les images dans des tenseurs de dimension (4,4,8).  
A partir de ces encodages le décodeur est capable de reconstituer l'image de départ.


In [0]:
z_test = encoder.predict(x_test)
y_pred = decoder.predict(z_test)
print(f'z_test: {z_test.shape}')
print(f'y_pred: {y_pred.shape}')

Le code suivant nous permet de visualiser le résultat de notre apprentissage sur quelques exemples:

In [0]:
plt.figure(figsize=(20, 4))
for i in range(10):
    ax = plt.subplot(2, 10, i + 1)
    plt.imshow(x_test[i].reshape(28, 28), cmap='gray')
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)

    ax = plt.subplot(2, 10, i + 11)
    plt.imshow(y_pred[i].reshape(28, 28), cmap='gray')
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
plt.show()

## Denoising auto-encoder
Nous allons maintenant utiliser des auto-encodeurs pour débruiter des images.  
Commençons pour cela par générer des images bruitées.  
Utilisez la fonction [random.normal](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.normal.html) de numpy pour rajouter un bruit gaussien sur une copie de x_train et de x_test. Utilisez un bruit centré avec un ecart type de 0.5.  
Afin que les images bruitées soient toujours comprises entre 0 et 1 utilisez la fonction [clip](https://docs.scipy.org/doc/numpy/reference/generated/numpy.clip.html) de numpy toujours pour caper les données bruitées que vous venez de générer.


In [0]:
x_train_noisy = x_train + ...
x_test_noisy = x_test + ... 
# n'oubliez pas de clipper les valeurs obtenues
x_train_noisy = ...
x_test_noisy = ...

Verifiez vos images perturbées en en affichant quelques unes

In [0]:
plt.figure(figsize=(20, 2))
for i in range(10):
    ax = plt.subplot(1, 10, i + 1)
    plt.imshow(x_test_noisy[i].reshape(28, 28), cmap='gray')
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)

Entrainez votre auto-encodeur à débruiter les images perturbées que vous venez de générer. (x: les images bruitées, target: les images non-bruitées)

In [0]:
...

Affichez le résultat de votre apprentissage en affichant quelques images bruitées et leur déébruitage par l'auto encodeur

In [0]:
decoded_imgs = auto_encoder.predict(x_test_noisy)

...

Les resultats sont un peu flous.  
Vous pouvez essayer d'améliorer les reconstructions en augmentant la capacité de vos réseaux par exemple en rajoutant des filtres lors des couches de convolutions

In [0]:
...
autoencoder = Model(input_img, decoded)
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')

autoencoder.fit(x_train_noisy, x_train,
                epochs=50,
                batch_size=128,
                shuffle=True,
                validation_data=(x_test_noisy, x_test))

Affichez vos nouveaux résultats:

In [0]:
...

## U-net
Nous allons maintenant nous concentrer sur une architecture particulière d'auto-encodeurs: les réseaux U-net.  
Les réseaux U-nets sont des auto-encodeurs ayant la particularité de posséder des connections directes entre les couches de l'encodeur et les couches du décodeur.  
![](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2019/05/Architecture-of-the-U-Net-Generator-Model.png)  
Les couches de convolutions du décodeur vont recevoir en entrées les sorties des couches qui les précèdent ainsi que la sortie des couches de convolutions correspondantes de l'encodeur.

Nous allons utiliser un réseau U-net pour recoloriser des images en noir et blanc.
Nous utiliserons le dataset [landscape](https://github.com/ml5js/ml5-data-and-models/tree/master/datasets/images/landscapes) composé de 4000 images de paysages.  
Commençons donc par télécharger le dataset.

In [0]:
!wget https://github.com/ml5js/ml5-data-and-models/raw/master/datasets/images/landscapes/landscapes_small.zip
!mkdir landscapes
!unzip landscapes_small.zip -d landscapes
!rm -r landscapes/__MACOSX

Le dataset est uniquement constitué d'images en couleurs.  
Nous allons nous même générer les images en noir et blanc à l'aide en précisiant l'option color_mode des ```
ImageDataGenerator```.  
Nous allons utiliser ici 4 générateurs: deux fournissant des images en couleurs et deux des images en noir et blanc.  
Les générateurs utiliseront la même seed afin que les images en noir et blanc et en couleurs se correspondent.


In [0]:
from keras.preprocessing.image import ImageDataGenerator

input_dir = 'landscapes'

seed = 1
 
color_datagen = ImageDataGenerator(rescale=1/255.0, validation_split=0.1)
bw_datagen = ImageDataGenerator(rescale=1/255.0, validation_split=0.1)
                                

train_color_generator = color_datagen.flow_from_directory(input_dir, class_mode=None, seed=seed, subset='training', target_size=(256, 256))
train_bw_generator = bw_datagen.flow_from_directory(input_dir, color_mode='grayscale', class_mode=None, seed=seed, subset='training', target_size=(256, 256))
valid_color_generator = color_datagen.flow_from_directory(input_dir, class_mode=None, seed=seed, subset='validation', target_size=(256, 256))
valid_bw_generator = bw_datagen.flow_from_directory(input_dir, color_mode='grayscale', class_mode=None, seed=seed, subset='validation', target_size=(256, 256))

train_generator = (pair for pair in zip(train_bw_generator, train_color_generator))
validation_generator = (pair for pair in zip(valid_bw_generator, valid_color_generator))

Regardons un exemple du de la sortie de nos générateurs

In [0]:
x, y = next(train_generator)
print(x.shape, y.shape)
print(x.min(), x.max(), y.min(), y.max())
 
fig, (ax1, ax2) = plt.subplots(1, 2)
idx = np.random.randint(0, len(x))
ax1.imshow(np.squeeze(x[idx], axis=-1), cmap='gray')
ax2.imshow(y[idx])

L'un des avantages de la construction fonctionnelle en Keras est de permettre la definition de fonctions composées facilement réutilisables.  
En voici un exemple: la fonction suivante permet de combiner une couche de convolution suivie d'une batchnormalisation en un seul appel: 

In [0]:
from tensorflow.keras.layers import BatchNormalization

def downsampling(input, filters):
    d = Conv2D(filters, kernel_size=4, strides=2, padding='same', activation='relu')(input)
    d = BatchNormalization()(d)
    return d

Codez une fonction ```upsampling(input, skip_input, filters)``` qui reçoit deux entrées:
* Une de sa couche précédente
* Une de la couche de la couche de l'encodeur correspondante  


La fonction doit alors:
* Faire un UpSampling de ```input``` suivit d'une Convolution avec fonction d'activation ReLU puis d'une Batch Normalisation.
Utilisez un ```kernel_size=4``` un ```strides=1``` et ```padding='same'``` lors de la convolution afin que la sortie soit de la même taille que ```skip_input``` 
* [Concatener](https://keras.io/layers/merge/) la sortie de la Batch Normalisation avec ```skip_input```  (exemple: ```a = Concatenate()([a, b])```  

In [0]:
from tensorflow.keras.layers import Concatenate

def upsampling(layer_input, skip_input, filters):
    ...
    return ...

Vous allez maintenant définir votre réseau U-net en vous appuyant sur le shéma suivant:
![](https://drive.google.com/uc?id=1F1uuhhRnXhV53aR1chU41Z17krRt2cuU)


In [0]:
# Image input
d0 = Input(...)
 
# Downsampling
...
 
# Upsampling
...
# Last upsampling
...
output = ...
 
model = Model(d0, output)
model.compile(optimizer='adam', loss='mse', metrics=['mse', 'mae'])
model.fit_generator(train_generator, steps_per_epoch=100, epochs=10, validation_data=validation_generator, validation_steps=10)

Affichez maintenant plusieurs exemples du résultat de votre apprentissage:


*   Image en noir et blanc
*   Image en couleur d'origine
*   Image recolorisée par le réseau



In [0]:
...

Pour aller plus loin avec les auto-encodeurs:
* Un article bien détaillé sur une amélioration des auto-encodeurs permettant de générer des nouveaux exemples: [les variationals auto-encoders](http://louistiao.me/posts/implementing-variational-autoencoders-in-keras-beyond-the-quickstart-tutorial/):
* Il y a quelques années un challenge Kaggle portait sur le débruitage de documents manuscrits: https://www.kaggle.com/c/denoising-dirty-documents/overview. Vous pouvez essayer d'utiliser des auto-encodeurs pour débruiter le dataset