In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

from tensorflow.keras.datasets import mnists
from tensorflow.keras.layers import Activation, BatchNormalization, Cocatenate, Dense, Embedding, Flatten, Input, Multiply, Reshape, LeakyReLU, Conv2D, Conv2DTranspose
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.optimizers import Adam

In [None]:
img_rows = 28
img_cols = 28
channels = 1

# 입력 이미지
img_shape = (img_rows, img_cols, channels)

# 생성자 입력으로 사용될 랜덤 잡음 벡터 크기
z_dim = 100

# MNIST 데이터셋에 있는 클래스 개수
num_classes = 10

# Generator(G)

In [None]:
def build_generator(z_dim):
    
    model = Sequential()
    
    # FC-layers 사용해서 입력을 7 x 7 x 256 텐서로 변환
    model.add(Dense(256*7*7, input_dim=z_dim))
    model.add(Reshape((7,7,256)))
    
    # 7 x 7 x 256 에서 14 x 14 x 128 텐서로 바꾸는 전치 합성곱
    model.add(Conv2DTranspose(128, kernel_size=3, strides=2, padding='same'))
    # 배치 정규화
    model.add(BatchNormalization())
    # LeakyReLU 활성화
    model.add(LeakyReLU(alpha=0.01))
    
    # 14 x 14 x 128 에서 14 x 14 x 64 텐서로 바꾸는 전치 합성곱
    model.add(Conv2DTranspose(64, kernel_size=3, strides=1, padding='same'))
    # 배치 정규화
    model.add(BatchNormalization())
    # LeakyReLU 활성화
    model.add(LeakyReLU(alpha=0.01))

    # 14 x 14 x 64 에서 28 x 28 x 1 텐서로 바꾸는 전치 합성곱
    model.add(Conv2DTranspose(1, kernel_size=3, strides=2, padding='same'))
    
    # tanh 활성화 함수
    model.add(Activation('tanh'))
    
    return model

In [None]:
def build_cgan_generator(z_dim):
    
    # 랜덤 잡음 벡터 z
    z = Input(shape=(z_dim,))
    
    # 조건(conditional) 레이블: 정수 0-9 까지 생성자가 만들 숫자
    label = Input(shape=(1,), dtype='int32')
    
    # 레이블 임베딩: 레이블을 z_dim 크기 밀집 벡터로 변환하고, (batch_size, 1, z_dim) 크기 3D 텐서를 만든다.
    label_embedding = Embedding(num_classes, z_dim, input_length=1)(label)
    
    # 임베딩된 3D 텐서를 펼쳐서 (batch_szie, z_dim) 크기 2D 텐서로 바꿈
    label_embedding = Flatten()(label_embedding)
    
    # 벡터 z와 레이블 임베딩의 원소별 곱셈
    joined_representation = Multiply()([z, label_embedding])
    
    generator = build_generator(z_dim)
    
    # 주어진 레이블에 대한 이미지 생성
    conditioned_img = generator(joined_representation)
    
    return Model([z, label], conditioned_img)

# 판별자

In [None]:
def build_discriminator(img_shape):
    model = Sequential()
    
    # 28 x 28 x 2 에서 14 x 14 x 64 로 바꾸는 합성곱 층
    model.add(Conv2D(64, kernel_size=3, strides=2, input_shape=(img_shape[0], img_shape[1], img_shape[2]+1), padding='same'))
    # LeakyReLU
    model.add(LeakyReLU(alpha=0.01))
    
    # 14 x 14 x 64 에서 7 x 7 x 64 로 바꾸는 합성곱 층
    model.add(Conv2D(64, kernel_szie=3, strides=2, padding='same'))  
    # LeakyReLU
    model.add(LeakyReLU(alpha=0.01))
    
    # 7 x 7 x 64 에서 3 x 3 x 128 로 바꾸는 합성곱 층
    model.add(Conv2D(128, kernel_szie=3, strides=2, padding='same'))
    # LeakyReLU
    model.add(LeakyReLU(alpha=0.01))
    
    # 시그모이드 활성화 함수 = 출력층
    model.add(Flatten())
    model.add(Dense(1, activation='sigmoid'))
    
    return model

In [None]:
def build_cgan_discriminator(img_shape):
    # 입력 이미지
    img = Input(shape=img_shape)
    
    # 입력 이미지의 레이블
    label = Input(shape=(1,), dtype='int32')
    
    # 레이블 임베딩: 레이블을 z_dim 크기의 밀집 벡터로 변환하고 (batch_size, 1, 28x28x1) 크기로 만든다.
    label_embedding = Embedding(num_classes, np.prod(img_shape), input_length=1)(label)
    
    # 임베딩된 텐서를 펼쳐서 (batch_size, 28x28x1) 로 만든다
    label_embedding = Flatten()(label_embedding)
    
    # 레이블 임베딩 크기를 입력 이미지 차원과 동일하게 만든다
    label_embedding = Reshape(img_shape)(label_embedding)
    
    # 이미지와 레이블 임베딩 연결
    concatenated = Concatenate(axis=1)([img, label_embedding])
    
    discriminator = build_discriminator(img_shape)
    
    # 이미지-레이블 쌍 분류
    classification = discriminator(concatenated)
    
    return Model([img, label], classification)

# 모델링

In [None]:
def build_cgan(generator, discriminator):
    # 랜덤 잡음 벡터 z
    z = Input(shape=(z_dim, ))
    
    # 이미지 레이블
    label = Input(shape=(1,))
    
    # 레이블에 맞는 이미지 생성
    img = generator([z, label])
    
    classification = discriminator([img, label])
    
    # 생성자 -> 판별자 연결 모델
    # G([z, label]) = x*
    # D(x*) = 분류
    model = Model([z, label], classification)
    
    return model

# 판별자 만들고 컴파일

In [None]:
discriminator = build_cgan_discriminator(img_shape)
discriminator.compile(loss='binary_crossentropy', optimizer=Adam(learning_rate=1e-5), metrics=['accruacy'])

# 생성자 만들고 훈련하는 동안 판별자 모델 고정

In [None]:
generator = build_cgan_generator(z_dim)
discriminator.trainable = False

# 생성자를 훈련하기 위해 고정된 판별자로 CGAN 모델 만들고 컴파일

In [None]:
cgan = build_cgan(generator, discriminator)
cgan.compile(loss='binary_crossentropy', optimizer=Adam())

# Let's train!

In [None]:
accuracies = []
losses = []

def train(iterations, batch_szie, sample_interval):
    # MNIST dataset loading
    X_train, y_train, _, _ = mnist.load_data()
    
    # scaling from [0,255] to [-1,1]
    X_train = X_train/127.5 -1.
    X_train = np.expand_dims(X_train, axis=3)
    
    # 진짜 이미지의 레이블: 모두 1
    real = np.ones((batch_size, 1))
    # 가짜 이미지의 레이블: 모두 0
    fake = np.zeros((batch_size, 1))
    
    for iteration in range(iterations):
        '''
        판별자 훈련
        '''
        # 진짜 이미지와 레이블로 이루어진 랜덤 배치 얻음
        idx = np.random.randint(0, X_train.shape[0], batch_size)
        imgs, labels = X_train[idx], y_train[idx]
        
        # 가짜 이미지 배치 생성성 (0과 1 사이)
        z = np.random.normal(0, 1, (batch_size, z_dim))
        gen_imgs = generators.predict([z, labels])
        
        # 판별자 훈련
        d_loss_real = discriminator.train_on_batch([imgs, labels], real)
        d_loss_fake = discriminator.train_on_batch([gen_imgs, labels], fake)
        d_loss = 0.5 * np.add(d_loss_real, d_loss_fake) # 0.5는 그냥 내 맘...
        
        '''
        생성자 훈련
        '''
        
        #랜덤 잡음 벡터 배치 생성
        z = np.random.normal(0,1,(batch_size, z_dim))
        
        # 랜덤한 레이블의 배치
        labels = np.random.randint(0, num_classes, batch_size).reshape(-1,1)
        
        # 생성자 훈련
        g_loss = cgan.train_on_batch([z, labels], real)
        
        if (iteration + 1) % sample_interval == 0:
            # 훈련 과정 출력 - 생략 가능
            print("%d [D loss: %f, acc.: %.2f%%] [G loss: %f]" %(iteration+1, d_loss[0], 100*d_loss[1], g_loss))
            
            # 훈련 후 그래프용 손실과 정확도
            losses.append((d_loss[0], g_loss))
            accuracies.append(100*d_loss[1])
            
            # 생성 이미지 출력 - 다음 셀에 정의
            sample_images()

In [None]:
def sample_images(image_grid_rows=2, image_grid_columns=5):
    # 랜덤 잡음 벡터 샘플링
    z = np.random.normal(0,1,(image_grid_rows * image_grid_columns, z_dim))
    
    # 0-9 사이의 이미지 레이블
    labels = np.arange(0, 10).reshape(-1,1)
    
    # z에서 이미지 생성
    gen_imgs = generator.predict([z, labels])
    
    # 이미지 픽셀 값을 [0,1] 사이로 스케일링
    gen_imgs = 0.5 * gen_imgs + 0.5
    
    # 이미지 그리드를 설정
    fig, axs = plt.subplots(image_grid_rows, image_grid_columns, figszie=(10,4), sharey=True, sharex=True)
    
    cnt = 0
    for i in range(image_grid_rows):
        for j in range(image_grid_columns):
            axs[i, j].imshow(gen_imgs[cnt, :, :, 0], cmap='gray')
            axs[i, j].axis('off')
            axs[i, j].set_title('Digit: %d' %labels[cnt])
            cnt += 1

# 훈련 과정 체크

In [None]:
iterations = 20000
batch_size = 32
sample_interval = 1000

train(iterations, batch_szie, sample_interval)

# 훈련된 CGAN 모델의 출력

In [None]:
# 그리드 차원을 설정합니다.
image_grid_rows = 10
image_grid_columns = 5

# 랜덤한 잡음을 샘플링합니다.
z = np.random.normal(0, 1, (image_grid_rows * image_grid_columns, z_dim))

# 생성할 이미지 레이블을 5개씩 준비합니다.
labels_to_generate = np.array([[i for j in range(5)] for i in range(10)])
labels_to_generate = labels_to_generate.flatten().reshape(-1, 1)

# 랜덤한 잡음에서 이미지를 생성합니다.
gen_imgs = generator.predict([z, labels_to_generate])

# 이미지 픽셀 값을 [0, 1] 사이로 스케일을 변환합니다.
gen_imgs = 0.5 * gen_imgs + 0.5

# 이미지 그리드를 설정합니다.
fig, axs = plt.subplots(image_grid_rows,
                        image_grid_columns,
                        figsize=(10, 20),
                        sharey=True,
                        sharex=True)

cnt = 0
for i in range(image_grid_rows):
    for j in range(image_grid_columns):
        # 이미지 그리드를 출력합니다.
        axs[i, j].imshow(gen_imgs[cnt, :, :, 0], cmap='gray')
        axs[i, j].axis('off')
        axs[i, j].set_title("Digit: %d" % labels_to_generate[cnt])  ## NEW
        cnt += 1