In [None]:
from keras import layers, models

모델링 클래스

input - hidden - output구조의 3개 layer 구조이다.

In [None]:
class AE(models.Model):
    def __init__(self, x_nodes=784, z_dim=36):
        x = layers.Input(shape=(x_nodes,))
        z = layers.Dense(units=z_dim, activation='relu')(x)
        y = layers.Dense(units=x_nodes, activation='sigmoid')(z)
        
        # def __init__(self, inputs, outputs, name=None):
        super().__init__(inputs=x, outputs=y) #이걸 호출해줘야 아래 compile()에서 에러 안남(self.outputs가 설정이 된다.)
        
        self.x = x
        self.z = z
        self.z_dim = z_dim
        
        '''
        TODO : 'mse'로 하면 training속도는 빠른데 복원된 이미지가 더 나쁘다
        추후 확인해 볼 것.
        https://m.blog.naver.com/PostView.nhn?blogId=wjddudwo209&logNo=220863078509&proxyReferer=https%3A%2F%2Fwww.google.com%2F
        '''
        self.compile(optimizer='adadelta', loss='binary_crossentropy', metrics=['accuracy'])
        
    def enc(self):
        return models.Model(self.x, self.z)
    
    def dec(self):
        z = layers.Input(shape=(self.z_dim, ))
        y_layer = self.layers[-1] #마지막 layer
        y = y_layer(z)
        return models.Model(z, y)

MNIST 데이터를 준비.
label은 필요 없으므로 버리고, fc로 사용할 것이므로 (-1, 28, 28)을 (-1, 784)로 편다.

In [None]:
from keras.datasets import mnist
import numpy as np

(X_train, _), (X_test, _) = mnist.load_data() #label은 필요 없으므로 별도 변수를 할당하지 않는다.

# 0~1 사이로 변경
X_train = X_train.astype('float32') / 255. 
X_test = X_test.astype('float32') / 255.

print(X_train.shape)
print(X_test.shape)

# 2차원 이미지를 1차원 배열로 변경.
# 아래 코드는 np.prod(...)대신에 -1을 넣어도 동일하다.
# np.prod()는 넘겨받은 배열의 element들을 다 곱한 값을 돌려준다.
X_train = X_train.reshape((len(X_train), np.prod(X_train.shape[1:])))
X_test = X_test.reshape((len(X_test), np.prod(X_test.shape[1:])))
print(X_train.shape)
print(X_test.shape)

학습 효과 분석

In [None]:
from utils.skeras import plot_loss, plot_acc
import matplotlib.pyplot as plt

# AE 동작 확인
def show_ae(ae):
    enc = ae.enc()
    dec = ae.dec()
    
    # X_test 이미지를 encoder 통과시켜서 인코딩 한다.
    encoded_imgs = enc.predict(X_test)
    '''
    784 -> 36으로 줄어들어 있다.
    '''
    print("encoded_imgs.shape : ", encoded_imgs.shape) # (10000, 36)
    decoded_imgs = dec.predict(encoded_imgs) # decoder가 복원하게 한다.
    
    n = 10
    plt.figure(figsize=(20,6)) # figure 생성(그래프를 그리는 이미지 영역이라고 생각하면 된다.)
    for i in range(n):
        # test 원본출력
        ax = plt.subplot(3, n, i + 1) #nrows, ncols, index
        plt.imshow(X_test[i].reshape(28, 28))
        plt.gray()
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)
        
        # 인코딩된 값들을 그래프에 찍어서 보여준다.
        ax = plt.subplot(3, n, i + 1 + n)
        plt.stem(encoded_imgs[i].reshape(-1))
        plt.gray()
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)
        
        ax = plt.subplot(3, n, i + 1 + n + n)
        plt.imshow(decoded_imgs[i].reshape(28, 28))
        plt.gray()
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)
        
        
    plt.show()
    


학습

In [None]:
def main():
    x_nodes = 784
    z_dim = 36
    
    autoencoder = AE(x_nodes, z_dim)
    '''
    autoencoder에서 training에서는 encoder-decoder 전체 네트워크를 사용한다.
    입/출력 모두 X_train을 넣으므로 autoencoder로 encoding후 decoding된 이미지와 원본간 차이가 loss가 된다.
    '''
    history = autoencoder.fit(X_train, X_train, epochs=10, batch_size=256, shuffle=True, validation_data=(X_test, X_test))
    
    plot_acc(history)
    plt.show()
    plot_loss(history)
    plt.show()

    show_ae(autoencoder)
    plt.show()

In [None]:
if __name__ == '__main__':
    main()