In [1]:
import tensorflow as tf

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
  try:
    # Currently, memory growth needs to be the same across GPUs
    for gpu in gpus:
      tf.config.experimental.set_memory_growth(gpu, True)
    logical_gpus = tf.config.experimental.list_logical_devices('GPU')
    print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
  except RuntimeError as e:
    # Memory growth must be set before GPUs have been initialized
    print(e)

1 Physical GPUs, 1 Logical GPUs


In [2]:
# 코드 8-29 GAN 생성자 네트워크
import keras
from keras import layers
import numpy as np

latent_dim = 32
height = 32
width = 32
channels = 3

generator_input = keras.Input(shape=(latent_dim,))

# 입력을 16 x 16 크기의 채널 128개를 가진 특성 맵으로 변환합니다
x = layers.Dense(128 * 16 * 16)(generator_input)
x = layers.LeakyReLU()(x)
x = layers.Reshape((16, 16, 128))(x)

x = layers.Conv2D(256, 5, padding="same")(x)
x = layers.LeakyReLU()(x)

# 32 x 32 크기로 업샘플링합니다
x = layers.Conv2DTranspose(256, 4, strides=2, padding="same")(x)
x = layers.LeakyReLU()(x)

x = layers.Conv2D(256, 5, padding="same")(x)
x = layers.LeakyReLU()(x)
x = layers.Conv2D(256, 5, padding="same")(x)
x = layers.LeakyReLU()(x)

# 32 x 32 크기(CIFAR10 이미지 크기)의 1개 채널을 가진 특성 맵을 생성합니다
x = layers.Conv2D(channels, 7, activation="tanh", padding="same")(x)
generator = keras.models.Model(generator_input, x)
generator.summary()

Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 32)]              0         
_________________________________________________________________
dense (Dense)                (None, 32768)             1081344   
_________________________________________________________________
leaky_re_lu (LeakyReLU)      (None, 32768)             0         
_________________________________________________________________
reshape (Reshape)            (None, 16, 16, 128)       0         
_________________________________________________________________
conv2d (Conv2D)              (None, 16, 16, 256)       819456    
_________________________________________________________________
leaky_re_lu_1 (LeakyReLU)    (None, 16, 16, 256)       0         
_________________________________________________________________
conv2d_transpose (Conv2DTran (None, 32, 32, 256)       104883

In [3]:
# 코드 8-30 GAN 판별자 네트워크
discriminator_input = layers.Input(shape = (height, width, channels))

x = layers.Conv2D(128, 3)(discriminator_input)
x = layers.LeakyReLU()(x)
x = layers.Conv2D(128, 4, strides=2)(x)
x = layers.LeakyReLU()(x)
x = layers.Conv2D(128, 4, strides=2)(x)
x = layers.LeakyReLU()(x)
x = layers.Conv2D(128, 4, strides=2)(x)
x = layers.LeakyReLU()(x)
x = layers.Flatten()(x)

x = layers.Dropout(0.4)(x) # 드롭아웃 층을 넣는 것이 아주 중요합니다

x = layers.Dense(1, activation="sigmoid")(x) # 분류층

# (32, 32, 3) 크기의 입력을 이진 분류 결정(진짜/가짜)으로 변환하는 판별자 모델 객체를 만듭니다
discriminator = keras.models.Model(discriminator_input, x)
discriminator.summary()

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_2 (InputLayer)         [(None, 32, 32, 3)]       0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 30, 30, 128)       3584      
_________________________________________________________________
leaky_re_lu_5 (LeakyReLU)    (None, 30, 30, 128)       0         
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 14, 14, 128)       262272    
_________________________________________________________________
leaky_re_lu_6 (LeakyReLU)    (None, 14, 14, 128)       0         
_________________________________________________________________
conv2d_6 (Conv2D)            (None, 6, 6, 128)         262272    
_________________________________________________________________
leaky_re_lu_7 (LeakyReLU)    (None, 6, 6, 128)         0   

In [4]:
discriminator_optimizer = keras.optimizers.RMSprop(lr = 0.0008,
                                                  clipvalue=1.0, # 옵티마이저에서 (값을 지정하여) 그래디언트 클리핑을 사용합니다
                                                  decay=1e-8) # 안정된 훈련을 위해서 학습률 감쇠를 사용합니다

In [5]:
discriminator.compile(loss = "binary_crossentropy",
                     optimizer = discriminator_optimizer)

In [6]:
# 코드 8-31 적대적 네트워크
discriminator.trainable = False # 판별자의 가중치가 훈련되지 않도록 설정합니다(gan 모델에만 적용됩니다)

gan_input = keras.Input(shape=(latent_dim,))
gan_output = discriminator(generator(gan_input))
gan = keras.models.Model(gan_input, gan_output)

gan_optimizer = keras.optimizers.RMSprop(lr=0.0004,
                                        clipvalue=1.0,
                                        decay=1e-8)
gan.compile(optimizer=gan_optimizer,
           loss="binary_crossentropy")

In [9]:
# 코드 3-32 GAN 훈련 구현하기
import os
from keras.preprocessing import image

(x_train, y_train), (_, _) = keras.datasets.cifar10.load_data() # CIFAR10 데이터를 로드합니다

x_train = x_train[y_train.flatten() == 6] # 개구리 이미지를 선택합니다(클래스 6)

# 데이터를 정규화합니다
x_train = x_train.reshape((x_train.shape[0],) + 
                          (height, width, channels)).astype("float32") / 255.

iterations = 10000
batch_size = 20
save_dir = "./deep-learning-with-python-notebooks-master/datasets/gan_images"
if not os.path.exists(save_dir):
    os.mkdir(save_dir)

start = 0
for step in range(iterations):
    
    # 잠재 공간에서 무작위로 포인트를 샘플링합니다
    random_latent_vectors = np.random.normal(size=(batch_size,
                                                  latent_dim))
    
    generated_images = generator.predict(random_latent_vectors) # 가짜 이미지를 디코딩합니다.
    
    # 진짜 이미지와 연결합니다
    stop = start + batch_size
    real_images = x_train[start : stop]
    combined_images = np.concatenate([generated_images, real_images])
    
    # 진짜와 가짜 이미지를 구분하여 레이블을 합칩니다
    labels = np.concatenate([np.zeros((batch_size, 1)),
                            np.zeros((batch_size, 1))])
    labels += 0.05 * np.random.random(labels.shape) # 레이블에 랜덤 노이즈를 추가합니다. 아주 중요합니다
    
    d_loss = discriminator.train_on_batch(combined_images, labels) # discriminator를 훈련합니다
    
    # 잠재 공간에서 무작위로 포인트를 샘플링합니다
    random_latent_vectors = np.random.normal(size=(batch_size,
                                                  latent_dim))
    
    # 모두 진짜 이미지라고 레이블을 만듭니다(사실 거짓)
    misleading_targets = np.zeros((batch_size, 1))
    
    # generator를 훈련합니다(gan 모델에서 discriminator의 가중치는 동결됩니다)
    a_loss = gan.train_on_batch(random_latent_vectors,
                               misleading_targets)
    
    start += batch_size
    if start > len(x_train) - batch_size:
        start = 0
    if step % 100 == 0: #중간중간 저장하고 그래프를 그립니다 (100번 스텝마다)
        gan.save_weights("gan.h5") # 모델 가중치를 저장합니다
        
        # 측정 지표를 출력합니다
        print("판별자 손실 :", d_loss)
        print("적대적 손실 :", a_loss)
        
        # 생성된 이미지 하나를 저장합니다
        img = image.array_to_img(generated_images[0] * 255., scale=False)
        img.save(os.path.join(save_dir,
                             "generated_frog" + str(step) + ".png"))
        
        # 비교를 위해 진짜 이미지 하나를 저장합니다
        img = image.array_to_img(real_images[0] * 255., scale=False)
        img.save(os.path.join(save_dir,
                             "real_frog" + str(step) + ".png"))
    

판별자 손실 : 9.03486156463623
적대적 손실 : 0.00669676810503006
판별자 손실 : 0.11018455028533936
적대적 손실 : 0.02641015127301216
판별자 손실 : 0.10709361732006073
적대적 손실 : 0.027330541983246803
판별자 손실 : 0.12488219887018204
적대적 손실 : 0.03627549856901169
판별자 손실 : 0.1128959059715271
적대적 손실 : 0.019954511895775795
판별자 손실 : 0.12882769107818604
적대적 손실 : 0.023252258077263832
판별자 손실 : 0.1315591037273407
적대적 손실 : 0.020732950419187546
판별자 손실 : 0.13030433654785156
적대적 손실 : 0.02358321100473404
판별자 손실 : 0.09955907613039017
적대적 손실 : 0.02396237663924694
판별자 손실 : 0.12254542112350464
적대적 손실 : 0.02542996034026146
판별자 손실 : 0.1248677596449852
적대적 손실 : 0.01261051557958126
판별자 손실 : 0.132794588804245
적대적 손실 : 0.052764348685741425
판별자 손실 : 0.1334134042263031
적대적 손실 : 0.009246744215488434
판별자 손실 : 0.1225968599319458
적대적 손실 : 0.021871108561754227
판별자 손실 : 0.09696457535028458
적대적 손실 : 0.012793360278010368
판별자 손실 : 0.1259784996509552
적대적 손실 : 0.016778601333498955
판별자 손실 : 0.11604511737823486
적대적 손실 : 0.022303469479084015
판별자 손실 : 0.1417