
### 9. GAN
- 비지도 학습
- 결과물을 생성하는 모델
- 서로 대립하는 두 신경망을 경쟁시켜가며 결과물 생성 방법을 학습한다.
    - 위조지폐범(생성자)은 경찰(구분자)를 최대한 속이려고 노력하고, 경찰은 위조한 지폐를 최대한 감별하려고 노력한다.
    
    ![GAN](./img/img1.JPG)
    
1. 구분자에게 실제 이미지를 주고, 그 이미지가 진짜임을 판단하게 한다.
2. 생성자를 통해 노이즈로부터 임의의 이미지를 만들고 
3. 임의의 이미지를 같은 구분자를 통해 진짜인지 판단하게 한다.


#### 9.1 GAN 기본 모델 구현
- MNIST 손글씨를 무작위로 생성


In [2]:
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("..\data\mnist\data", one_hot=True)



Extracting ..\data\mnist\data\train-images-idx3-ubyte.gz
Extracting ..\data\mnist\data\train-labels-idx1-ubyte.gz
Extracting ..\data\mnist\data\t10k-images-idx3-ubyte.gz
Extracting ..\data\mnist\data\t10k-labels-idx1-ubyte.gz


In [3]:

###############
# 하이퍼파라미터
###############
total_epoch = 100
batch_size = 100
learning_rate = 0.0002
n_hidden = 256
n_input = 28 * 28
n_noise = 128      # 생성자의 입력값으로 사용할 노이즈 크기
                    # 랜덤한 노이즈를 입력하고, 그 노이즈에서 손글씨 이미지를 
                    # 무작위로 생성


############
# 모델 구성
###########
# 실제 이미지
X = tf.placeholder(tf.float32, [None, n_input])
# 가짜 이미지 (노이즈에서 생성)
Z = tf.placeholder(tf.float32, [None, n_noise])


# 생성자
G_W1 = tf.Variable(tf.random_normal([n_noise, n_hidden], stddev=0.01))
G_b1 = tf.Variable(tf.zeros([n_hidden]))
G_W2 = tf.Variable(tf.random_normal([n_hidden, n_input], stddev=0.01))
G_b2 = tf.Variable(tf.zeros([n_input]))


# 구분자
# 진짜와 얼마나 가까운가를 판단하는 값으로 0~1 사이의 값을 출력한다. 
D_W1 = tf.Variable(tf.random_normal([n_input, n_hidden], stddev=0.01))
D_b1 = tf.Variable(tf.zeros([n_hidden]))
D_W2 = tf.Variable(tf.random_normal([n_hidden, 1], stddev=0.01))
D_b2 = tf.Variable(tf.zeros([1]))

# 실제 이미지를 판별하는 구분자 신경망과
# 생성한 이미지를 판별하는 구분자 신경망을
# 같은 변수를 사용해야 한다. 


In [10]:
#################
# 생성자, 구분자 신경망 구성
#################

# 생성자 신경망
def generator(noise_z):
    # 노이즈를 받아 은닉층 생성
    hidden = tf.nn.relu(tf.matmul(noise_z, G_W1) + G_b1)
    # 은닉층에서 실제 이미지와 같은 크기의 결과값 출력
    output = tf.nn.sigmoid(tf.matmul(hidden, G_W2) + G_b2)
    
    return output


# 구분자 신경망
def discriminator(inputs):
    hidden = tf.nn.relu(tf.matmul(inputs, D_W1) + D_b1)
    output = tf.nn.sigmoid(tf.matmul(hidden, D_W2) + D_b2)
    
    return output

# 무작위 노이즈 생성 함수
def get_noise(batch_size, n_noise):
    return np.random.normal(size=(batch_size, n_noise))

# 노이즈 Z를 이용해 가짜 이미지를 만들 생성자 G를 만들고
G = generator(Z)
# G가 만든 가짜 이미지와 진짜 이미지 X를 각각 구분자에 넣어 
# 입력한 이미지가 진짜 이미지인지 판별하게 한다.
D_gene = discriminator(G)
D_real = discriminator(X)

In [5]:

##############
# 손실 함수 
############
# 생성자가 만든 이미지를 구분자가 가짜라고 판단하도록 하는 손실값(경찰 학습용)
# 진짜 이미지 판별값(D_real) : 1에 가까워야 함.
# 가짜 이미지 판별값(D_gene) : 0에 가까워야 함.
loss_D = tf.reduce_mean(tf.log(D_real) + tf.log(1 - D_gene))

# 진짜라고 판단하도록 만드는 손실값(위조지폐범 학습용)
# 가짜 이미지 판별값(D_gene) : 1에 가깜게 만든다.
# 즉 가짜 이미지도 진자같다고 판별해야 한다.
loss_G = tf.reduce_mean(tf.log(D_gene))


GAN 학습은 loss_D와 loss_G 모두를 최대화 하는 것이다.  
다만 서로 연관되어 있어서 두 손실값이 항상 같이 증가하지 않는다.  
loss_D ↑ -> loss_G ↓
loss_D ↓ -> loss_G ↑

![손실 그래프](./img/img2.JPG)



In [11]:

# 서로(생성자, 구분자) 학습할 때 변하지 않아야 하기 때문에
#loss_D를 구할 때는 구분자 신경망에 사용되는 변수들만 사용
D_var_list = [D_W1, D_b1, D_W2, D_b2]
# loss_G를 구할 때는 생성자 신경망에 사용되는 변수들만 사용
G_var_list = [G_W1, G_b1, G_W2, G_b2]


# 최적화 함수 구성
# 최적화에 쓸 수 있는 함수는 minimize로 음수를 붙여 최대화 한다.
train_D = tf.train.AdamOptimizer(learning_rate).minimize(-loss_D, var_list = D_var_list)
train_G = tf.train.AdamOptimizer(learning_rate).minimize(-loss_G, var_list = G_var_list)

    
    
#################
# 신경망 모델 학습
#################

sess = tf.Session()
sess.run(tf.global_variables_initializer())

total_batch = int(mnist.train.num_examples / batch_size)
# 손실값 2개 학습
loss_val_D, loss_val_G = 0, 0


for epoch in range(total_epoch):
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        noise = get_noise(batch_size, n_noise)
        
        _, loss_val_D = sess.run([train_D, loss_D],
                                feed_dict={X: batch_xs, Z: noise})
        _, loss_val_G = sess.run([train_G, loss_G],
                                feed_dict={Z: noise})
    print('Epoch::','%04d' % epoch,
         'D loss:: {:.4}'.format(loss_val_D),
         'G loss:: {:.4}'.format(loss_val_G))
    

    ############
    # 결과 확인 (for문 안에서)
    # 0, 9, 19, 29..마다 생성기로 이미지를 생성하여 확인
    ############

    # 노이즈를 만들고 생성자 G에 넣어 결과값을 만든다.
    if epoch == 0 or (epoch + 1) % 10 == 0:
        sample_size = 10
        noise = get_noise(sample_size, n_noise)
        samples = sess.run(G, feed_dict={Z: noise})


    # 노이즈 결과값을 28*28 크기의 가짜 이미지로 만들고
    fig, ax = plt.subplots(1, sample_size, figsize=(sample_size, 1))

    for i in range(sample_size):
        ax[i].set_axis_off()
        ax[i].imshow(np.reshape(samples[i], (28,28)))
    # samples 폴더에 저장
    plt.savefig('samples\{}.png'.format(str(epoch).zfill(3),
                                       bbox_inches='tight'))

    plt.close(fig)
    
print('최적화완료!')

Epoch:: 0000 D loss:: -0.5391 G loss:: -2.059
Epoch:: 0001 D loss:: -0.1612 G loss:: -2.912
Epoch:: 0002 D loss:: -0.1536 G loss:: -2.869
Epoch:: 0003 D loss:: -0.4849 G loss:: -1.636
Epoch:: 0004 D loss:: -0.494 G loss:: -1.72
Epoch:: 0005 D loss:: -0.2243 G loss:: -2.464
Epoch:: 0006 D loss:: -0.2135 G loss:: -2.969
Epoch:: 0007 D loss:: -0.3841 G loss:: -2.298
Epoch:: 0008 D loss:: -0.3373 G loss:: -2.455
Epoch:: 0009 D loss:: -0.3452 G loss:: -2.339
Epoch:: 0010 D loss:: -0.4167 G loss:: -2.406
Epoch:: 0011 D loss:: -0.3426 G loss:: -2.361
Epoch:: 0012 D loss:: -0.2847 G loss:: -2.667
Epoch:: 0013 D loss:: -0.5783 G loss:: -2.081
Epoch:: 0014 D loss:: -0.292 G loss:: -2.68
Epoch:: 0015 D loss:: -0.3525 G loss:: -2.247
Epoch:: 0016 D loss:: -0.3106 G loss:: -2.606
Epoch:: 0017 D loss:: -0.438 G loss:: -2.188
Epoch:: 0018 D loss:: -0.3761 G loss:: -2.65
Epoch:: 0019 D loss:: -0.3103 G loss:: -2.817
Epoch:: 0020 D loss:: -0.3559 G loss:: -2.7
Epoch:: 0021 D loss:: -0.3637 G loss:: -2.