# Lab 10: Autoencodery pomocou konvolúcie

Na minulom cvičení ste vytvorili niekoľko autoencoderov, tie ale obsahovali iba tradičné plne prepojené vrstvy. Cieľom tohto cvičenia je definovať a natrénovať autoencoder pomoocu konvolučných vrstiev. Kostru riešenia nájdete [na tomto odkaze](https://github.com/ianmagyar/dl-course/blob/master/labs/sources/lab10.py).

## 1. Načítanie potrebných knižníc

V riešení využijeme najmä známe knižnice a triedy. Novinkou pre nás je vrstva `UpSampling2D`, ktorý slúži na "dekonvolúciu", teda o rozšírenie dimenzií obrazu.

In [None]:
from keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D
from keras.models import Model
from keras.datasets import mnist
import numpy as np
import matplotlib.pyplot as plt

## 2. Vizualizácia výsledkov

Tak ako minulý týždeň, aj tento týždeň chceme otestovať fungovanie nášho autoencodera a porovnať rekonštruovaný obraz s originálom. Na tento účel sme zadefinovali funkciu `plot_results`, ktorý zobrazí ukážkové vstupy a výstupy autoencodera.

In [None]:
def plot_results(x_test, decoded_imgs, n=10):
    plt.figure(figsize=(40, 4))
    for i in range(n):
        # display original
        ax = plt.subplot(3, n, i + 1)
        plt.imshow(x_test[i].reshape(28, 28))
        plt.gray()
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)

        # display reconstruction
        ax = plt.subplot(3, n, i + 1 + n * 2)
        plt.imshow(decoded_imgs[i].reshape(28, 28))
        plt.gray()
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)
    plt.show()

## 3. Príprava údajov

Ďalším krokom v riešení je úprava údajov z datasetu MNIST tak, aby sme ich vedeli použiť pre našu sieť. Tak ako aj minulý týždeň, najprv hodnoty pretypujeme na float hodnoty a normalizujeme ich na interval 0 až 1. Labely z datasetu stále nepotrebujeme, použijeme iba vstupné hodnoty.

Ďalej potrebujeme trénovaciu aj testovaciu množinu upraviť do tvaru, s ktorým vie naša sieť pracovať. Keďže samotný dataset už obsahuje fotky s rozmerom *28x28*, nepotrebujeme vykonať veľké zmeny, dataset iba rozšíreme o jednu dimenziu.

In [None]:
x_train = # TODO: make type float32, normalize to interval 0 to 1
x_test = # TODO: make type float32, normalize to interval 0 to 1
x_train = # TODO: reshape
x_test = # TODO: reshape

## 4. Definícia autoencodera

V ďalšom kroku zadefinujeme náš autoencoder. Vstupná vrstva je definovaná trénovacou množinou, ale okrem toho môžete navrhnúť ľubovoľnú topológiu. Kostra riešenia je ale napísaná pre nasledujúcu štruktúru, s kernelom *3x3*:

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
_________________________________________________________________
input_1 (InputLayer)         (None, 28, 28, 1)         0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 28, 28, 16)        160       
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 14, 14, 16)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 14, 14, 8)         1160      
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 7, 7, 8)           0         
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 7, 7, 8)           584       
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 4, 4, 8)           0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 4, 4, 8)           584       
_________________________________________________________________
up_sampling2d_1 (UpSampling2 (None, 8, 8, 8)           0         
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 8, 8, 8)           584       
_________________________________________________________________
up_sampling2d_2 (UpSampling2 (None, 16, 16, 8)         0         
_________________________________________________________________
conv2d_6 (Conv2D)            (None, 14, 14, 16)        1168      
_________________________________________________________________
up_sampling2d_3 (UpSampling2 (None, 28, 28, 16)        0         
_________________________________________________________________
conv2d_7 (Conv2D)            (None, 28, 28, 1)         145       
_________________________________________________________________
Total params: 4,385
Trainable params: 4,385
Non-trainable params: 0

In [None]:
input_img = # define input layer

encoded_1 = # define first convolution, activation relu, padding same
encoded_2 = # define max pooling layer, padding same
encoded_3 = # define second convolution, activation relu, padding same
encoded_4 = # define max pooling layer, padding same
encoded_5 = # define third convolution, activation relu, padding same
encoded = # define max pooling layer, padding same

decoded_1 = # define first decoding convolution, activation relu, padding same
decoded_2 = # define first upsampling layer
decoded_3 = # define second decoding convolution, activation relu, padding same
decoded_4 = # define second upsampling layer
decoded_5 = # define third decoding convolution, activation relu
decoded_6 = # define third upsampling layer
decoded = # define final decoding convolution, activation sigmoid, padding same

autoencoder = Model(input_img, decoded)

## 5. Trénovanie a testovanie modelu

Keď už máte definovanú sieť, nezostáva nič iné len sieť natrénovať a otestovať. Keďže trénovanie môže trvať dlhší čas, našu sieť otestujeme po každej epoche, práve preto zadefinujeme cyklus, ktorý v každej iterácii vykoná iba jednu epochu a následne zobrazí ukážkové vstupy a výstupy pomocou volania funkciue `plot_results`.

Vo funkcii `fit` nastavte nasledujúce parametre:
* input - vstup autoencodera
* output - očakávaný výstup autoencodera
* epochs - 1
* batch_size - napr. 128
* shuffle - nastavte na True pre náhodné poradie v trénovacej množine
* verbose - nastavte na 1

In [None]:
autoencoder.compile(# optimizer adadelta, loss function binary_crossentropy
    )

EPOCH_NO = 25
for x in range(EPOCH_NO):
    autoencoder.fit(# define parameters
        )

    decoded_imgs = autoencoder.predict(x_test)

    plot_results(x_test, decoded_imgs)