# **GAN tutorial**

https://github.com/dreamgonfly/GAN-tutorial/blob/master/GAN.ipynb

In [1]:
import torch
import torch.nn as nn
from torch.optim import Adam
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from torch.autograd import Variable
import pickle

In [2]:
#데이터 전처리 방식 지정
transform = transforms.Compose([
                                transforms.ToTensor(),
                                transforms.Normalize(mean=(0.5,), std=(0.5,))
])

In [3]:
#MNIST 데이터셋 불러오기. 지정한 폴더에 없을 경우 자동으로 다운로드
mnist = datasets.MNIST(root='data', download=True, transform=transform)

#데이터를 한번에 batch_size만큼 가져오는 dataloader 생성
dataloader = DataLoader(mnist, batch_size=60, shuffle=True)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to data/MNIST/raw/train-images-idx3-ubyte.gz


HBox(children=(FloatProgress(value=0.0, max=9912422.0), HTML(value='')))


Extracting data/MNIST/raw/train-images-idx3-ubyte.gz to data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to data/MNIST/raw/train-labels-idx1-ubyte.gz


HBox(children=(FloatProgress(value=0.0, max=28881.0), HTML(value='')))


Extracting data/MNIST/raw/train-labels-idx1-ubyte.gz to data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to data/MNIST/raw/t10k-images-idx3-ubyte.gz


HBox(children=(FloatProgress(value=0.0, max=1648877.0), HTML(value='')))


Extracting data/MNIST/raw/t10k-images-idx3-ubyte.gz to data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to data/MNIST/raw/t10k-labels-idx1-ubyte.gz


HBox(children=(FloatProgress(value=0.0, max=4542.0), HTML(value='')))


Extracting data/MNIST/raw/t10k-labels-idx1-ubyte.gz to data/MNIST/raw



  return torch.from_numpy(parsed.astype(m[2], copy=False)).view(*s)


In [4]:
import os
import imageio

if torch.cuda.is_available():
  use_gpu = True

leave_log = True
if leave_log:
  result_dir = 'GAN_generated_images'
  if not os.path.isdir(result_dir):
    os.mkdir(result_dir)

In [5]:
###GAN의 생성자 (Generator)
# 생성자는 랜덤 벡터 z를 입력으로 받아 가짜 이미지를 출력한다.

class Generator(nn.Module):

  #네트워크 구조
  def __init__(self):
    super(Generator, self).__init__()
    self.main = nn.Sequential(
        nn.Linear(in_features=100, out_features=256),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Linear(in_features=256, out_features=512),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Linear(in_features=512, out_features=1024),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Linear(in_features=1024, out_features=28*28),
        nn.Tanh() )
    
    # (batch_size * 100) 크기의 랜덤 벡터를 받아
    # 이미지를 (batch_size * 1 * 28 * 28) 크기로 출력한다

    def forward(self, inputs):
      return self.main(inputs).view(-1, 1, 28, 28)

In [6]:
### GAN의 구분자 (Discriminator)
# 구분자는 이미지를 입력으로 받아 이미지가 진짜인지 가짜인지 출력한다

class Discriminator(nn.Module):

  def __init__(self):
    super(Discriminator, self).__init__()
    self.main = nn.Sequential(
        nn.Linear(in_features=28*28, out_features=1024),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Dropout(inplace=True),
        ### 왜 여기서 dropout 비율 안정해주는건지?
        nn.Linear(in_features=1024, out_features=512),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Dropout(inplace=True),
        nn.Linear(in_features=512, out_features=256),
        nn.LeakyReLU(0.2, inplace=True),
        nn.Dropout(inplace=True),
        nn.Linear(in_features=256, out_features=1),
        nn.Sigmoid()    )
    
    # (batch_size * 1 * 28 * 28) 크기의 이미지를 받아
    # 이미지가 진짜일 확률을 0~1 사이로 출력

    def forward(self, inputs):
      inputs = inputs.view(-1, 28*28)
      return self.main(inputs)

In [7]:
torch.cuda.is_available()

True

In [8]:
### 생성자와 구분자 객체 만들기
G = Generator()
D = Discriminator()

if use_gpu:
  G.cuda()
  D.cuda()

#cuda와 관련하여 gpu로 런타임 유형 변경하니 에러 안뜨고 잘 실행됨

In [9]:
### 손실함수와 최적화 기법 지정하기
# Binary Cross Entropy loss
criterion = nn.BCELoss()

# 생성자의 매개변수를 최적화하는 Adam optimizer
G_optimizer = Adam(G.parameters(), lr=0.0002, betas=(0.5, 0.999))
# 구분자의 매개변수를 최적화하는 Adam optimizer
D_optimizer = Adam(D.parameters(), lr=0.0002, betas=(0.5, 0.999))

# optimizer에 대해 공부해보기

In [14]:
# 학습결과 시각화하기
%matplotlib inline
from matplotlib import pyplot as plt
import numpy as np

def square_plot(data, path):
  if type(data) == list:
    data = np.concatenate(data)
  #normalize data for display
  data = (data - data.min()) / (data.max()-data.min())
  #force the number of filters to be square
  n = int(np.ceil(np.sqrt(data.shape[0])))

  padding = (((0, n**2 - data.shape[0]), (0,1), (0,1)) + ((0,0),)*(data.ndim-3))

  data = np.pad(data, padding, mode='constant', constant_values=1)

  data = data.reshape((n, n)+data.shape[1:]).transpose((0, 2, 1, 3)+tuple(range(4, data.ndim+1)))

  data = data.reshape((n*data.shape[1], n*data.shape[3]) + data.shape[4:])

  plt.imsave(path, data, cmap='gray')

In [15]:
if leave_log:
  train_hist = {}
  train_hist['D_losses'] = []
  train_hist['G_losses'] = []
  generated_images = []

z_fixed = Variable(torch.randn(5*5, 100), volatile=True)
if use_gpu:
  z_fixed = z_fixed.cuda()

# volatile 변수가 무엇을 의미하는지 생각

  import sys


In [18]:
### 모델 학습을 위한 반복문
# 데이터셋을 100번 돌며 학습

for epoch in range(100):
  if leave_log:
    D_losses = []
    G_losses = []

    #한번에 batch_size만큼 데이터를 가져온다.
    for real_data, _ in dataloader:
      batch_size = real_data.size(0)

      #데이터를 pytorch의 변수로 변환한다.
      real_data = Variable(real_data)

      ###구분자 학습시키기

      #이미지가 진짜일때 정답 값은 1이고, 가짜일때는 0이다.
      #정답지에 해당하는 변수를 만든다.
      target_real = Variable(torch.ones(batch_size, 1))
      target_fake = Variable(torch.zeros(batch_size, 1))

      if use_gpu:
        real_data, target_real, target_fake = real_data.cuda(), target_real.cuda(), target_fake.cuda()

      #진짜 이미지를 구분자에 넣는다
      D_result_from_real = D(real_data)
      #구분자의 출력값이 정답값인 1에서 멀수록 loss가 높아진다
      D_loss_real = criterion(D_result_from_real, target_real)

      #생성자에 입력으로 줄 랜덤 벡터 z를 만든다
      z = Variable(torch.randn(batch_size, 100))

      if use_gpu:
        z = z.cuda()

      #생성자로 가짜 이미지를 만든다.
      fake_data = G(z)

      #생성자가 만든 가짜 이미지를 구분자에 넣는다.
      D_result_from_fake = D(fake_data)
      #구분자의 출력값이 정답지인 0에서 멀수록 loss가 높아진다
      D_loss_fake = criterion(D_result_from_fake, target_fake)

      # 구분자의 loss는 두 문제에서 계산된 loss의 합이다
      D_loss = D_loss_real + D_loss_fake

      #구분자의 매개 변수의 미분값을 0으로 초기화한다
      D.zero_grad()
      #역전파를 통해 매개 변수의 loss에 대한 미분값을 계산한다
      D_loss.backward()
      #최적화 기법을 이용해 구분자의 매개 변수를 업데이트한다
      D_optimizer.step()

      if leave_log:
        D_losses.append(D_loss.data[0])
      
      #train generator G
      ### 생성자 학습시키기

      #생성자에 입력으로 줄 랜덤 벡터 z를 만들기
      z = Variable(torch.randn((batch_size, 100)))

      if use_gpu:
        z = z.cuda()
      
      #생성자로 가짜 이미지를 생성한다
      fake_data = G(z)
      #생성자가 만든 가짜 이미지를 구분자에 넣는다
      D_result_from_fake = D(fake_data)
      #생성자의 입장에서 구분자의 출력값이 1에서 멀수록 loss가 높아진다
      G_loss = criterion(D_result_from_fake, target_real)

      #생성자의 매개 변수의 미분값을 0으로 초기화
      G.zero_grad()
      #역전파를 통해 매개 변수의 loss에 대한 미분값을 계산한다
      G_loss.backward()
      #최적화 기법을 이용해 생성자의 매개변수를 업데이트
      G_optimizer.step()

      if leave_log:
        G_losses.append(G_loss.data[0])
      
    if leave_log:
      true_positive_rate = (D_result_from_real > 0.5).float().mean().data[0]
      true_negative_rate = (D_result_from_fake < 0.5).float().mean().data[0]
      base_message = ("Epoch: {epoch:<3d} D Loss: {d_loss:<8.6} G Loss: {g_loss:<8.6}"
                      "True Positive Rate: {tpr:<5.1%} True Negative Rate: {tnr:<5.1%}")
      message = base_message.format(
          epoch = epoch,
          d_loss = sum(D_losses)/len(D_losses),
          g_loss = sum(G_losses)/len(G_losses),
          tpr = true_positive_rate,
          tnr = true_negative_rate
      )
      print(message)
    
    if leave_log:
      fake_data_fixed = G(z_fixed)
      image_path = result_dir + '/epoch{}.png'.format(epoch)
      square_plot(fake_data_fixed.view(25, 28, 28).cpu().data.numpy(), path=image_path)
      generated_images.append(image_path)

    if leave_log:
      train_hist['D_losses'].append(torch.mean(torch.FloatTensor(D_losses)))
      train_hist['G_losses'].append(torch.mean(torch.FloatTensor(G_losses)))

torch.save(G.state_dict(), "gan_generator.pkl")
torch.save(D.state_dict(), "gan_discriminator.pkl")
with open('gan_train_history.pkl', 'wp') as f:
  pickle.dump(train_hist, f)

generated_image_array = [imageio.imread(generated_image) for generated_image in generated_images]
imageio.mimsave(result_dir + 'GAN_generation.gif', generated_image_array, fps=5)


NotImplementedError: ignored