# 오토인코더(Autoencoder, AE)
- 입력을 저차원 잠재공간으로 인코딩한 후 디코딩하여 복원하는 네트워크  

## Fashon MNIST Dataset

- 코드 참조 : https://www.tensorflow.org/tutorials/generative/autoencoder?hl=ko

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Dense, Flatten, Reshape
from tensorflow.keras.losses import MeanSquaredError

### 데이터 로드

In [None]:
(X_train, _), (X_test, _) = fashion_mnist.load_data()

In [None]:
# 정규화
X_train = X_train.astype(np.float32) / 255.
X_test = X_test.astype('float32') / 255. 
X_train.shape, X_test.shape, np.min(X_train), np.max(X_train)

### 모델 정의

- 이미지를 64 차원 잠재 벡터로 압축하는 encoder 및 잠재 공간에서 원본 이미지를 재구성하는 decoder 라는 두 개의 Dense 레이어로 오토 encoder 정의

- Keras Model Subclassing API를 사용

In [None]:
LATENT_DIM = 64

class AutoEncoder(Model):
    def __init__(self, latent_dim=LATENT_DIM):
        super(AutoEncoder, self).__init__()
        self.latent_dim = latent_dim
        self.encoder = Sequential([Flatten(),
                                   Dense(latent_dim, activation='relu')])
        self.decoder = Sequential([Dense(784, activation='sigmoid'),
                                   Reshape((28,28))])
        
    def call(self, x):
        encoded = self.encoder(x)
        decoded = self.decoder(encoded)
        return decoded

### 모델 생성 및 컴파일

In [None]:
ae = AutoEncoder(LATENT_DIM)
ae.compile(optimizer='adam', loss=MeanSquaredError())

### 모델 학습
- x_train 을 입력과 목표 모두로 사용하여 모델을 훈련

- encoder 는 데이터 세트를 784 차원에서 잠재 공간으로 압축하는 방법을 배우고,  
  decoder 는 원본 이미지를 재구성하는 방법을 배움

In [None]:
ae.summary()

In [None]:
ae.fit(X_train, X_train, epochs=30, validation_data=(X_test, X_test))

### 모델 테스트

In [8]:
encoded_imgs = ae.encoder(X_test).numpy()
decoded_imgs = ae.decoder(encoded_imgs).numpy()

In [None]:
plt.figure(figsize=(16,4))
for i in range(10):
    plt.subplot(2,10,i+1)
    plt.imshow(X_test[i], cmap='gray')
    plt.title('Org (28,28)')
    plt.axis('off')

    plt.subplot(2,10,i+11)
    plt.imshow(decoded_imgs[i], cmap='gray')
    plt.title('64 -> (28,28)')
    plt.axis('off')  
plt.show()  

- Latent dim: 100, Epoch: 30

In [10]:
ae2 = AutoEncoder(100)
ae2.compile(optimizer='adam', loss=MeanSquaredError())

In [None]:
ae2.fit(X_train, X_train, epochs=30, validation_data=(X_test, X_test))

In [12]:
encoded_imgs2 = ae2.encoder(X_test).numpy()
decoded_imgs2 = ae2.decoder(encoded_imgs2).numpy()

- Latent dim: 40, Epoch: 30

In [None]:
ae3 = AutoEncoder(40)
ae3.compile(optimizer='adam', loss=MeanSquaredError())
ae3.fit(X_train, X_train, epochs=30, validation_data=(X_test, X_test), verbose=1)

In [14]:
encoded_imgs3 = ae3.encoder(X_test).numpy()
decoded_imgs3 = ae3.decoder(encoded_imgs3).numpy()

- Latent dim: 64, Epoch: 50

In [None]:
ae4 = AutoEncoder(64)
ae4.compile(optimizer='adam', loss=MeanSquaredError())
ae4.fit(X_train, X_train, epochs=50, validation_data=(X_test, X_test), verbose=1)

In [16]:
encoded_imgs4 = ae4.encoder(X_test).numpy()
decoded_imgs4 = ae4.decoder(encoded_imgs4).numpy()

- 종합 비교

In [None]:
imgs = [X_test, decoded_imgs, decoded_imgs2, decoded_imgs3, decoded_imgs4]
titles = ['Original','30, 64nodes','30, 100nodes','30, 40nodes','50, 64nodes']
plt.figure(figsize=(16,10))
for i, img in enumerate(imgs):
    for k in range(10):
        plt.subplot(5, 10, i*10 + k + 1)
        plt.imshow(img[k], cmap='gray')
        plt.title(titles[i]), plt.axis('off')
plt.show()