# Séance 5 - GAN

L'objectif de cette séance est d'entraîner un GAN pour générer des images de chiffres manuscrit. Pour le faire, nous utiliserons le datasets MNIST et suivrons quelques astuces pour entraîner les GAN que l'on retrouve [ici](https://github.com/soumith/ganhacks). Attention, la liste n'est pas maintenue donc ce n'est peut-être pas le véritable optimum.

Commençons par importer les données.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set(style="whitegrid")

import tensorflow as tf
from tensorflow import keras

(X_train, y_train), (_, _) = keras.datasets.mnist.load_data()

**Consigne**: Il est recommandé (*Hack#1*) de normaliser les images entre -1 et 1. En sachant que les images de MNIST sont en niveau de gris entre 0 et 255, suivre la recommandation. 

La dimension de l'image générée par le générateur sera de (28, 28, 1), donc le discriminateur attend le même format. Pour le moment les images MNIST sont au format (28, 28), rajoutons donc une dimension.

In [3]:
X_train = np.expand_dims(X_train, axis=-1)

Il nous faut maintenant une dimension pour le vecteur de bruit initial. Nous choisissons ici 100.

In [4]:
random_dimension = 100

A partir du vecteur aléatoire nous pouvons produire une image de taille 7x7 puis augmenter la dimension à l'aide de la couche [Conv2DTranspose](https://keras.io/api/layers/convolution_layers/convolution2d_transpose/).

**Consigne** : Définir le modèle générateur en utilisant la couche [Conv2DTranspose](https://keras.io/api/layers/convolution_layers/convolution2d_transpose/), et suivre la recommandation (*#Hack5*) en n'utilisant pas les couches de pooling et la fonction d'activation ReLU. Utiliser à la place [LeakyReLU](https://keras.io/api/layers/activation_layers/leaky_relu/) et [BatchNormalization](https://keras.io/api/layers/normalization_layers/batch_normalization/) (*#Hack4*).

Astuce : utiliser la méthode [`summary`](https://keras.io/api/models/model/#summary-method) pour vérifier que le générateur produit bien une image de taille (28, 28, 1).

**Consigne**: Définir le modèle discriminant en utilisant la [couche de convolution](https://keras.io/api/layers/convolution_layers/convolution2d/) mais pas de pooling et [LeakyReLU](https://keras.io/api/layers/activation_layers/leaky_relu/) et [BatchNormalization](https://keras.io/api/layers/normalization_layers/batch_normalization/) (*#Hack4*).

Les modèles sont défini mais pas compilé. Les deux cherche à optimiser la [crossentropy](https://keras.io/api/losses/probabilistic_losses/#binarycrossentropy-class), mais selon le *#Hack9* les deux modèles ne doivent pas avoir le même schéma de descente de gradient :
* [Adam](https://keras.io/api/optimizers/adam/) pour le générateur
* [SGD](https://keras.io/api/optimizers/sgd/) pour le discriminateur

**Consigne**: Compiler les modèles en suivant les recommandations.

Il reste maintenant à implémenter une classe pour entraîner un GAN. 

**Consigne** : À partir de la classe `VanillaGAN`, définir puis compiler le modèle avec [Adam](https://keras.io/api/optimizers/adam/) et la [crossentropy](https://keras.io/api/losses/probabilistic_losses/#binarycrossentropy-class).

Il est conseillé de regarder en détail le code et de l'améliorer si possible. On pourra implémenter le *#Hack6* par exemple.

**Consigne** : Entraîner le modèle sur quelques époques.

On souhaite avoir une inspection visuelle du modèle.

**Consigne** : À l'aide de la méthode `generate_image` afficher une série d'image produite par le générateur.