---

## <span style='color:#0d5874'> Inttroduction  au DCAGN (Deep Convolutional Generative Adversarial Network)
    
--- 
    


<span style='color:Red'>**L’objectif de cette séance de TP est d’illustrer par la pratique le fonctionnement des réseaux de neurones génératifs antagonistes (ou Generative Adversarial Networks, GAN) avec des couches de convolutions.**</span>

Le réseau générateur d'un DCGAN contient 4 couches cachées (nous traitons la couche d'entrée comme la 1ère couche cachée pour plus de simplicité) et 1 couche de sortie. Les couches de convolution transposées sont utilisées dans les couches cachées, qui sont suivies de couches de normalisation par lots et de fonctions d'activation ReLU. La couche de sortie est également une couche de convolution transposée et Tanh est utilisée comme fonction d'activation. L'architecture du générateur est représentée dans le schéma suivant :

![Generateur.jpg](Generateur.jpg)

Les 2ème, 3ème et 4ème couches cachées et la couche de sortie ont une valeur de stride de 2. La 1ère couche a une valeur de padding de 0 et les autres couches ont une valeur de padding de 1. Comme la taille des images augmente de deux dans les couches plus profondes, le nombre de canaux diminue de moitié. Il s'agit d'une convention courante dans la conception de l'architecture des réseaux neuronaux. Toutes les tailles de noyau des couches de convolution transposées sont définies sur 4 x 4. Le canal de sortie peut être 1 ou 3, selon que vous souhaitez générer des images en niveaux de gris ou en couleurs. ou des images en couleur.



import os
import sys
import numpy as np
import torch
import torch.nn as nn
import torch.nn.parallel
import torch.backends.cudnn as cudnn
import torch.optim as optim
import torch.utils.data
import torchvision.datasets as dset
import torchvision.transforms as transforms
import torchvision.utils as vutils
device = 'cuda' if torch.cuda.is_available() else 'cpu'

In [10]:
CUDA = True
DATA_PATH = '~/Data/mnist'
OUT_PATH = 'output'
LOG_FILE = os.path.join(OUT_PATH, 'log.txt')
BATCH_SIZE = 128
IMAGE_CHANNEL = 1
Z_DIM = 100
G_HIDDEN = 64
X_DIM = 64
D_HIDDEN = 64
EPOCH_NUM = 25
REAL_LABEL = 1
FAKE_LABEL = 0
lr = 2e-4
seed = 42

In [11]:
# custom weights initialization called on netG and netD
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

Implémenter maintenant le réseau du générateur avec PyTorch:


In [13]:
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.main = nn.Sequential(
            # 1st layer
            ###### Votre code ici ########
            # 2nd layer
            ###### Votre code ici ########
            # 3rd layer
            ###### Votre code ici ########
            # 4th layer
            ###### Votre code ici ########
            # output layer
            ###### Votre code ici ########
        
    def forward(self, input):
        return self.main(input)
    
netG = Generator().to(device)
netG.apply(weights_init)
print(netG)

Generator(
  (main): Sequential(
    (0): ConvTranspose2d(100, 512, kernel_size=(4, 4), stride=(1, 1), bias=False)
    (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU(inplace=True)
    (3): ConvTranspose2d(512, 256, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (4): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (5): ReLU(inplace=True)
    (6): ConvTranspose2d(256, 128, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (7): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (8): ReLU(inplace=True)
    (9): ConvTranspose2d(128, 64, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (10): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (11): ReLU(inplace=True)
    (12): ConvTranspose2d(64, 1, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (13): Tanh()
  )
)


Le réseau discriminant d'un DCGAN consiste en 4 couches cachées et 1 couche de sortie. Des couches de convolution sont utilisées dans toutes les couches, qui sont suivies de couches de normalisation par batch, sauf que la première couche n'a pas de normalisation par batch. Les fonctions d'activation LeakyReLU sont utilisées dans les couches cachées et la fonction Sigmoid est utilisée pour la couche de sortie. L'architecture du discriminateur est présentée dans le shéma suivante :

![discrim.jpg](discrim.jpg)

Le canal d'entrée peut être 1 ou 3, selon si les images sont en niveaux de gris ou en couleurs. Toutes les couches cachées ont une valeur de stride de 2 et une valeur de padding de 1 afin que la taille de leurs images de sortie soit égale à la moitié des images d'entrée. Comme la taille des images augmente dans les couches plus profondes, le nombre de canaux est multiplié par deux. Tous les noyaux des couches de convolution ont une taille de 4 x 4. La couche de sortie a une valeur de stride de 1 et une valeur de padding de 0. Elle mappe les cartes de caractéristiques 4 x 4 en valeurs uniques afin que la fonction Sigmoïde puisse transformer la valeur en confiance de prédiction.

Implémenter maintenant le réseau du générateur avec PyTorch:

In [14]:
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.main = nn.Sequential(
            # 1st layer
            ###### Votre code ici ########
            # 2nd layer
            ###### Votre code ici ########
            # 3rd layer
            ###### Votre code ici ########
            # 4th layer
            ###### Votre code ici ########
            # output layer
            ###### Votre code ici ########
        )
    def forward(self, input):
        return self.main(input).view(-1, 1).squeeze(1)
    
netD = Discriminator().to(device)
netD.apply(weights_init)
print(netD)

Discriminator(
  (main): Sequential(
    (0): Conv2d(1, 64, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (1): LeakyReLU(negative_slope=0.2, inplace=True)
    (2): Conv2d(64, 128, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (4): LeakyReLU(negative_slope=0.2, inplace=True)
    (5): Conv2d(128, 256, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (6): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (7): LeakyReLU(negative_slope=0.2, inplace=True)
    (8): Conv2d(256, 512, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (9): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (10): LeakyReLU(negative_slope=0.2, inplace=True)
    (11): Conv2d(512, 1, kernel_size=(4, 4), stride=(1, 1), bias=False)
    (12): Sigmoid()
  )
)


In [18]:
optimizerD = optim.Adam(netD.parameters(), lr=lr, betas=(0.5, 0.999))
optimizerG = optim.Adam(netG.parameters(), lr=lr, betas=(0.5, 0.999))

In [19]:
dataset = dset.MNIST(root=DATA_PATH, download=True, transform=transforms.Compose([transforms.Resize(X_DIM),
                                                                                  transforms.ToTensor(),
                                                                                  transforms.Normalize((0.5,), (0.5,))
                                                                                 ]))
assert dataset
dataloader = torch.utils.data.DataLoader(dataset, batch_size=BATCH_SIZE,
shuffle=True, num_workers=4)

Implémenter maintenant le Gans sans fonction de validation:

In [20]:
viz_noise = torch.randn(BATCH_SIZE, Z_DIM, 1, 1, device=device)
for epoch in range(EPOCH_NUM):
    for i, data in enumerate(dataloader):
        x_real = data[0].to(device)
        real_label = ###### Votre code ici ########
        fake_label = ###### Votre code ici ########
        # Update D with real data
        netD.zero_grad()
        y_real = ###### Votre code ici ######## 
        loss_D_real = ###### Votre code ici ########
        loss_D_real.backward()

        # Update D with fake data
        z_noise = torch.randn(###### Votre code ici ########)
        x_fake = netG(z_noise)
        y_fake = netD(x_fake.detach())
        loss_D_fake = ###### Votre code ici ########
        loss_D_fake.backward()
        optimizerD.step()
        
        # Update G with fake data
        netG.zero_grad()
        y_fake_r = ###### Votre code ici ########
        loss_G = ###### Votre code ici ########
        loss_G.backward()
        optimizerG.step()  
        
        if i % 100 == 0:
            print('Epoch {} [{}/{}] loss_D_real: {:.4f} loss_D_fake: {:.4f} loss_G: {:.4f}'.format(epoch, i, len(dataloader), loss_D_real.mean().item(),
                      loss_D_fake.mean().item(),
                      loss_G.mean().item()
                 ))
            vutils.save_image(x_real, os.path.join(OUT_PATH,'real_samples.png'), normalize=True)
            with torch.no_grad():
                viz_sample = netG(viz_noise)
                vutils.save_image(viz_sample, os.path.join(OUT_PATH,'fake_samples_{}.png'.format(epoch)), normalize=True)
            torch.save(netG.state_dict(), os.path.join(OUT_PATH,'netG_{}.pth'.format(epoch)))
            torch.save(netD.state_dict(), os.path.join(OUT_PATH,'netD_{}.pth'.format(epoch)))
            

Epoch 0 [0/469] loss_D_real: 0.3328 loss_D_fake: 1.5324 loss_G: 5.9021
Epoch 0 [100/469] loss_D_real: 0.0116 loss_D_fake: 0.0059 loss_G: 7.7263
Epoch 0 [200/469] loss_D_real: 0.0599 loss_D_fake: 0.1762 loss_G: 4.9483
Epoch 0 [300/469] loss_D_real: 0.0278 loss_D_fake: 0.1385 loss_G: 4.7263
Epoch 0 [400/469] loss_D_real: 0.3488 loss_D_fake: 0.0153 loss_G: 0.9172
Epoch 1 [0/469] loss_D_real: 0.1619 loss_D_fake: 0.0614 loss_G: 2.7180
Epoch 1 [100/469] loss_D_real: 0.1693 loss_D_fake: 0.4079 loss_G: 1.8593
Epoch 1 [200/469] loss_D_real: 0.1228 loss_D_fake: 0.1377 loss_G: 2.5893
Epoch 1 [300/469] loss_D_real: 0.2785 loss_D_fake: 0.0574 loss_G: 1.7871
Epoch 1 [400/469] loss_D_real: 0.1320 loss_D_fake: 0.1623 loss_G: 2.3357
Epoch 2 [0/469] loss_D_real: 0.0568 loss_D_fake: 0.3012 loss_G: 3.4725
Epoch 2 [100/469] loss_D_real: 0.4887 loss_D_fake: 0.1665 loss_G: 1.6011
Epoch 2 [200/469] loss_D_real: 0.0962 loss_D_fake: 0.8211 loss_G: 2.3223


KeyboardInterrupt: 