In [None]:
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./mnist/data/", one_hot=True)

# 하이퍼 파라미터들을 설정
total_epoch = 100
batch_size = 100
learning_rate = 0.0002
n_hidden = 256
n_input = 28 * 28
# 생성자의 입력값으로 사용할 노이즈의 크기
n_noise = 128

# GAN 역시 비지도 학습이므로 오토인코더 처럼 Y 를 사용하지 않음
# 구분자에 넣을 이미지가 실제 이미지, 생성한 가짜 이미지 -> 총 2개, 
# 가짜 이미지는 노이즈에서 생성할 것 이므로 노이즈를 입력할 플레이스 홀더 Z 추가
X = tf.placeholder(tf.float32, [None, n_input])
Z = tf.placeholder(tf.float32, [None, n_noise])

# 생성자 신경망에 사용할 변수들 설정
# 은닉층으로 출력하기 위한 변수
G_W1 = tf.Variable(tf.random_normal([n_noise, n_hidden], stddev =0.01))
G_b1 = tf.Variable(tf.zeros([n_hidden]))
# 출력층에 사용할 변수 -> 따라서 가중치의 변수 크기는 실제 이미지의 크기와 같은 28 * 28
G_W2 = tf.Variable(tf.random_normal([n_hidden, n_input], stddev =0.01))
G_b2 = tf.Variable(tf.zeros([n_input]))

# 구분자 신경망에 사용할 변수들 설정
# 은닉층으로 출력하기 위한 변수
D_W1 = tf.Variable(tf.random_normal([n_input, n_hidden], stddev =0.01))
D_b1 = tf.Variable(tf.zeros([n_hidden]))
# 출력층에 사용할 변수 -> 따라서 가중치의 변수 크기는 실제 이미지의 크기와 같은 28 * 28
D_W2 = tf.Variable(tf.random_normal([n_hidden, 1], stddev =0.01))
D_b2 = tf.Variable(tf.zeros([1]))

# 생성자 신경망 구축
def generator(noise_z):
    hidden = tf.nn.relu(tf.matmul(noise_z, G_W1) + G_b1)
    output = tf.nn.sigmoid(tf.matmul(hidden, G_W2) + G_b2)
    return output

# 구분자 신경망 구축
def discriminator(inputs):
    hidden = tf.nn.relu(tf.matmul(inputs, D_W1) + D_b1)
    output = tf.nn.sigmoid(tf.matmul(hidden, D_W2) + D_b2)
    return output

# 무작위한 노이즈를 만들어주는 간단한 유틸리티 함수 생성
def get_noise(batch_size, n_noise):
    return np.random.normal(size=(batch_size, n_noise))

# 노이즈 Z 를 이용해 가짜 이미지를 만들 생성자 G를 만들고 
# 이 G가 만든 가짜 이미지와 진짜 이미지 X를 각각 구분자에 넣어 입력한 이미지가 진짜인지 판별하도록 함
G = generator(Z)
print(G)
D_gene = discriminator(G)
D_real = discriminator(X)

# 손실값 2개 구함 
# 생성자가 만든 이미지를 구분자가 가짜라고 판단하도록 하는 손실값(경찰 학습용)
# 진짜라고 판단하도록 하는 손실값(위조 지폐범 학습용)
# 경찰을 학습시키려면 진짜 이미지 판별값 D_real 은 1에 가까워야하고 (진짜라고 판별)
# 가짜 이미지 판별값 D_gene은 0에 가까워야함
# loss_D 를 최대화 하면 경찰 학습이 이뤄짐
loss_D = tf.reduce_mean(tf.log(D_real) + tf.log(1 - D_gene))
# D_gene를 1에 가깝게 하면됨. 즉 loss_G 를 최대화 (위조지폐범 학습)
loss_G = tf.reduce_mean(tf.log(D_gene))
# 즉 GAN은 loss_D와 loss_G를 모두 최대화 하는것 -> 하지만 서로 경쟁관계
# loss_D 를 구할 때는 구분자 신경망에 사용되는 변수들만 사용하여 최적화 -> 그래야 학습시 생성자 변하지 않음
# loss_G 를 구할 떄는 생성자 신경망에 사용되는 변수들만 사용하여 최적화 -> 그래야 학습시 구분자 변하지 않음

D_var_list = [D_W1, D_b1, D_W2, D_b2]
G_var_list = [G_W1, G_b1, G_W2, G_b2]

# 최대화를 minimize로 구하기 위해 음수부호 붙여줌
train_D = tf.train.AdamOptimizer(learning_rate).minimize(-loss_D, var_list=D_var_list)
train_G = tf.train.AdamOptimizer(learning_rate).minimize(-loss_G, var_list=G_var_list)

# 학습 시작
sess = tf.Session()
sess.run(tf.global_variables_initializer())

total_batch = int(mnist.train.num_examples / batch_size)
loss_val_D, loss_val_G = 0, 0

for epoch in range(total_epoch):
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        noise = get_noise(batch_size, n_noise)
        
        _, loss_val_D = sess.run([train_D, loss_D], feed_dict={X: batch_xs, Z: noise})
        _, loss_val_G = sess.run([train_G, loss_G], feed_dict={Z: noise})
    
    print('Epoch:', '%04d' % epoch,
          'D_loss: {:.4}'.format(loss_val_D),
          'G_loss: {:.4}'.format(loss_val_G))
    
    # 학습 결과를 확인
    # 노이즈를 만들고 이것을 생성자 G에 넣어 결괏값을 만든 뒤 
    # 이결과값들을 28*28 크기의 가짜 이미지로 만들어 samples 폴더에 저장하도록함
    if epoch == 0 or (epoch + 1) % 10 == 0:
        sample_size = 10
        noise = get_noise(sample_size, n_noise)
        samples = sess.run(G, feed_dict ={Z: noise})
        fig, ax = plt.subplots(1, sample_size, figsize=(sample_size, 1))
        
        for i in range(sample_size):
            ax[i].set_axis_off()
            ax[i].imshow(np.reshape(samples[i], (28, 28)))
        
        plt.savefig('samples/{}.png'.format(str(epoch).zfill(3)),
                   bbox_inches='tight')
        plt.close(fig)
        
print('최적화 완료')