In [3]:
from tensorflow.keras.layers import Input, Dense, Lambda
from tensorflow.keras.models import Model
from tensorflow.keras import backend as K
from tensorflow.keras import metrics
from tensorflow.keras.datasets import mnist
import numpy as np

#### Hyperparameter 설정

28 x 28의 input size 사용, 256개의 노드를 가진 중간층 사용

In [4]:
batch_size = 100
original_dim = 784
latent_dim = 2
intermediate_dim = 256
epochs = 50
epsilon_std = 1.0

#### 인코더 정의

- 이전 출력을 매개변수로 사용하여 각 층을 호출
- h층은 x층을 입력으로 받음
- 모델을 컴파일하고 시작 지점(x)과 끝나는 지점([z_mean, z_log_var, z]) 정의
- z : 잠재 공간, 평균과 분산에 의해 정의되는 정규분포에 해당

In [5]:
x = Input(shape = (original_dim, ), name = 'input')
h = Dense(intermediate_dim, activation = 'relu', name = 'encoding')(x)
z_mean = Dense(latent_dim, name = "mean")(h)
z_log_var = Dense(latent_dim, name = 'log-variance')(h)

z_mean과 z_log_var는 노드가 2개인 Dense층에 연결되어 있고, 이 노드는 정규분포의 특징을 정의하는 평균과 분산을 의미한다.

In [6]:
def sampling(args: tuple):
    z_mean, z_log_var = args
    epsilon = K.random_normal(shape = (K.shape(z_mean)[0], latent_dim), mean = 0., stddev = epsilon_std)
    return z_mean + K.exp(z_log_var / 2) * epsilon

하나의  z가 샘플링 함수를 통해 z_mean, z_log_var와 연결되어 있고, 이는 평균과 표준편차를 학습하는 것을 의미한다.

In [8]:
z = Lambda(sampling, output_shape = (latent_dim, ))([z_mean, z_log_var])
encoder = Model(x, [z_mean, z_log_var, z], name = 'encoder')

#### 디코더 정의