In [1]:
'''
GAN(Generative Adversarial Networks)을 이용한 MNIST 데이터 생성

Reference : https://github.com/TengdaHan/GAN-TensorFlow
'''

'\nGAN(Generative Adversarial Networks)을 이용한 MNIST 데이터 생성\n\nReference : https://github.com/TengdaHan/GAN-TensorFlow\n'

In [1]:
import os 
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm

In [2]:
from keras.layers import Input
from keras.models import Model, Sequential
from keras.layers.core import Dense, Dropout
from keras.layers.advanced_activations import LeakyReLU
from keras.datasets import mnist
from keras.optimizers import Adam
from keras import initializers

Using TensorFlow backend.


In [3]:
# 튜토리얼에서 나온 실험을 재현하고 동일한 결과를 얻을 수 있는지 확인하기 위해 SEED를 설정하겠다
np.random.seed(10)

# 우리의 랜덤 노이즈 벡터의 차원을 설정한다.
# latent space (Generator의 인풋이 존재하는 공간)의 차원
random_dim = 100

In [4]:
# 역시 튜토리얼에는 MNIST지.
def load_mnist_data():
    # 데이터를 로드
    (x_train, y_train), (x_test, y_test) = mnist.load_data()
    
    # 데이터를 -1 ~ 1 사이 값으로 normalize 한다.
    x_train = (x_train.astype(np.float32) - 127.5) / 127.5
    
    # x_train 의 shape을 (60000, 28, 28) 인데, 이것들을 (60000, 784)로 바꾼다.
    # 따라서 우리는 60000개의 row들과 한 row당 784 columns 을 가지는 데이터를 가진다.
    x_train = x_train.reshape(60000, 784)

    return (x_train, y_train, x_test, y_test)

In [5]:
# Adam Optimizer 를 사용
def get_optimizer():
    return Adam(lr=0.0002)

# Generator network 만들기
def get_generator(optimizer):
    generator = Sequential()
    generatortor.add(Dense(256, input_dim=random_dim, kernel_initializer=initializers.RandomNormal(stddev=0.02), activation='relu'))
    # generator의 activation 은 ReLU를 쓰는걸 권장하고 있다. generator.add(LeakyReLU(0.2))
    
    generator.add(Dense(512, activation='relu'))
    # generator.add(LeakyReLU(0.2))

    generator.add(Dense(1024, activation='relu'))
    # generator.add(LeakyReLU(0.2))

    generator.add(Dense(784, activation='tanh'))
    generator.compile(loss='binary_crossentropy', optimizer=optimizer)
    return generator

# Discriminator network 만들기
def get_discriminator(optimizer):
    discriminator = Sequential()
    discriminator.add(Dense(1024, input_dim=784, kernel_initializer=initializers.RandomNormal(stddev=0.02)))
    discriminator.add(LeakyReLU(0.2))
    discriminator.add(Dropout(0.3))

    discriminator.add(Dense(512))
    discriminator.add(LeakyReLU(0.2))
    discriminator.add(Dropout(0.3))

    discriminator.add(Dense(256))
    discriminator.add(LeakyReLU(0.2))
    discriminator.add(Dropout(0.3))

    discriminator.add(Dense(1, activation='sigmoid'))
    discriminator.compile(loss='binary_crossentropy', optimizer=optimizer)
    return discriminator

In [6]:
# 이제 Generator 와 Discriminator 를 함께 모으자.
def get_gan_network(discriminator, random_dim, generator, optimizer):
    # 우리는 Generator와 Discriminator를 동시에 학습시키고 싶으므로, trainable 을 False 로 설정한다.
    discriminator.trainable = False # [궁금] trainable 변수 뭥미
    
    # GAN 입력(노이즈)은 위에서 100차원으로 설정했었다.
    gan_input = Input(shape=(random_dim,))
    
    # Generator 의 결과는 이미지이다.
    x = generator(gan_input)
    
    # Discriminator의 결과는 이미지가 진짜인지 가짜인지에 대한 "확률"이다.
    gan_output = discriminator(x)
    
    gan = Model(inputs=gan_input, outputs=gan_output)
    gan.compile(loss='binary_crossentropy', optimizer=optimizer)
    return gan

In [7]:
def plot_generated_images(epoch, generator, examples=100, dim=(10, 10), figsize=(10, 10)):
    noise = np.random.normal(0, 1, size=[examples, random_dim])
    generated_images = generator.predict(noise)
    generated_images = generated_images.reshape(examples, 28, 28)

    plt.figure(figsize=figsize)
    for i in range(generated_images.shape[0]):
        plt.subplot(dim[0], dim[1], i+1)
        plt.imshow(generated_images[i], interpolation='nearest', cmap='gray_r')
        plt.axis('off')
    plt.tight_layout()
    plt.savefig('gan_generated_image_epoch_%d.png' % epoch)

In [9]:
def train(epochs=1, batch_size=128):
    # train 데이터와 test 데이터를 가져옵니다.
    x_train, y_train, x_test, y_test = load_minst_data()

    # train 데이터를 128 사이즈의 batch 로 나눕니다.
    batch_count = x_train.shape[0] // batch_size

    # 우리의 GAN 네트워크를 만듭니다.
    adam = get_optimizer()
    generator = get_generator(adam)
    discriminator = get_discriminator(adam)
    gan = get_gan_network(discriminator, random_dim, generator, adam)

    for e in range(1, epochs+1):
        print('-'*15, 'Epoch %d' % e, '-'*15)
        for _ in tqdm(xrange(batch_count)):
            # 입력으로 사용할 random 노이즈와 이미지를 가져옵니다.
            noise = np.random.normal(0, 1, size=[batch_size, random_dim])

            image_batch = x_train[np.random.randint(0, x_train.shape[0], size=batch_size)]

            # MNIST 이미지를 생성합니다.
            generated_images = generator.predict(noise)
            X = np.concatenate([image_batch, generated_images])

            y_dis = np.zeros(2*batch_size)
            y_dis[:batch_size] = 0.9

            # Discriminator를 학습시킵니다.
            discriminator.trainable = True
            discriminator.train_on_batch(X, y_dis)

            # Generator를 학습시킵니다.
            noise = np.random.normal(0, 1, size=[batch_size, random_dim])
            y_gen = np.ones(batch_size)
            discriminator.trainable = False
            gan.train_on_batch(noise, y_gen)

        if e == 1 or e % 20 == 0:
            plot_generated_images(e, generator)

In [None]:
train(400, 128)