# GANによる画像生成のメカニズムとDCGANの実装

commit用

```mycode/5_gan_generation/```

In [1]:
!pip list | grep scikit

scikit-image                      0.16.2             
scikit-learn                      0.22.2.post1       


In [2]:
!gpustat

[1m[37ms2                 [m  Tue Apr 14 12:08:16 2020  [1m[30m440.44[m
[36m[0][m [34mQuadro RTX 8000 [m |[1m[31m 65'C[m, [1m[32m100 %[m | [36m[1m[33m11338[m / [33m48601[m MB | [1m[30mkera[m([33m733M[m) [1m[30mtaoli[m([33m10589M[m)
[36m[1][m [34mQuadro RTX 8000 [m |[31m 26'C[m, [32m  0 %[m | [36m[1m[33m   12[m / [33m48601[m MB |
[36m[2][m [34mQuadro RTX 8000 [m |[1m[31m 68'C[m, [1m[32m100 %[m | [36m[1m[33m17045[m / [33m48601[m MB | [1m[30mtaoli[m([33m17031M[m)
[36m[3][m [34mQuadro RTX 8000 [m |[1m[31m 63'C[m, [1m[32m100 %[m | [36m[1m[33m22401[m / [33m48601[m MB | [1m[30mtaoli[m([33m22385M[m)
[36m[4][m [34mQuadro RTX 8000 [m |[1m[31m 62'C[m, [1m[32m 98 %[m | [36m[1m[33m 8859[m / [33m48601[m MB | [1m[30mhara[m([33m8847M[m)
[36m[5][m [34mQuadro RTX 8000 [m |[1m[31m 64'C[m, [1m[32m 80 %[m | [36m[1m[33m29181[m / [33m48601[m MB | [1m[30mtaoli[m([33m29165M[m)

In [3]:
import os
os.environ["CUDA_VISIBLE_DEVICES"]="1"

In [4]:
# パッケージのimport
import random
import math
import time
import pandas as pd
import numpy as np
from PIL import Image

import torch
import torch.utils.data as data
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

from torchvision import transforms
%config IPCompleter.greedy=True

## 5-1 GANによる画像生成のメカニズムとDCGANの実装

### Generatorのメカニズム
Generatorは入力乱数から目的の画像を生成するのでデータの次元を拡大していく必要がある．
このときに重要になるのが**転置畳み込み**である．
普通の畳み込みは入力データの全てのセルとカーネルの全てのセルの計算結果を集約して１つのセルにするのに対して，転置畳み込みは１つの入力セルに対して全てのカーネルのセルを作用させてその１つ１つを出力とするので結果として出力されるデータの次元は大きくなる．

### Generatorの実装
本節ではGANの中でも特に**DCGAN**と呼ばれるものを実装する．

***DCGAN：***Deep Convolution Generative Adversarial Network

実装に当たって入力する乱数の次元を```z_dim=20```にしてるがこれには特に意味はなく，生成画像の多様性が担保されればなんでも良い


In [7]:
class Generator(nn.Module):
    
    def __init__(self, z_dim = 20, image_size=64):
        super(Generator, self).__init__()
        
        # ここで out_channels = image_size*8に特別な意味は？
        self.layer1 = nn.Sequential(
            nn.ConvTranspose2d(z_dim, image_size*8, kernel_size=4, stride=1),
            nn.BatchNorm2d(image_size*8),
            nn.ReLu(inplace=True))
        
        self.layer2 = nn.Sequential(
            nn.ConvTranspose2d(image_size*8, image_size*4, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(image_size*4),
            nn.ReLu(inplace=True))
            
        self.layer2 = nn.Sequential(
            nn.ConvTranspose2d(image_size*8, image_size*4, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(image_size*4),
            nn.ReLu(inplace=True))
        
        self.layer3 = nn.Sequential(
            nn.ConvTranspose2d(image_size*4, image_size*2, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(image_size*2),
            nn.ReLu(inplace=True))
              
        self.layer4 = nn.Sequential(
            nn.ConvTranspose2d(image_size*2, image_size, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(image_size),
            nn.ReLu(inplace=True))
        
        self.last = nn.Sequential(
            nn.ConvTranspose2d(image_size, 1, kernel_size=4, stride=2, padding=1),
            nn.Tanh())
        # 白黒なので出力は1チャネル
        
        
    def forward(self, z):
        out = self.layer1(z)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.layer4(out)
        out = self.last(out)
        
        return out

In [8]:
# 実装したネットワークで出力
import matplotlib.pyplot as plt
%matplotlib inline

G = Generator(z_dim=20, image_size=64)