# Dvouvrstvý perceptron pro obrázků CIFAR10

- Úkolem cvičení je naprogramovat **dvouvrstvý perceptron** pro klasifikaci obrázků na datasetu CIFAR-10.
- Jediný rozdíl oproti minulému cvičení, kde jsme trénovali lineární model, je tedy použitý klasifikátor.

In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
import sys
sys.path.append('..')  # import tests, ans

import numpy as np
import matplotlib.pyplot as plt
import PIL
import torch

import ans
from tests import test_two_layer_perceptron

# Data

## Preprocessing

- Preprocessing dat provedeme shodně s úlohou [`linear_classification`](linear_classification.ipynb).

### TODO: implementuje funkci `preprocess`.

In [None]:
def preprocess(img: PIL.Image) -> torch.Tensor:
    """
    Args:
        img: image of type PIL.Image
    Returns:
        x: 1-dimensional tensor; shape (num_pixels * num_channels,), dtype float32
    """
    
    ########################################
    # TODO: implement
    
    raise NotImplementedError
    
    # ENDTODO
    ########################################
    
    return x

In [None]:
test_two_layer_perceptron.TestPreprocess.eval(preprocess_fn=preprocess)

# Dvouvrstvý perceptron

- Model bude optimalizovat křížovou entropii
  $$
  l_n = -\log\frac{\exp{s_{n,y_n}}}{\sum_{k=1}^{K}{\exp{s_{n,k}}}}
  $$
  kde skóre $\boldsymbol{s}_n$ bude výsledek dopředného průchodu dvouvrstvého perceptronu se sigmoidou $\sigma(\cdot)$ jako aktivační funkcí
  $$
  \begin{align*}
  \boldsymbol{r}_n &= \boldsymbol{x}_n \cdot \boldsymbol{w}^{(1)} + \boldsymbol{b}^{(1)} \\
  \boldsymbol{h}_n &= \sigma(\boldsymbol{r}_n) \\
  \boldsymbol{s}_n &= \boldsymbol{x}_n \cdot \boldsymbol{w}^{(2)} + \boldsymbol{b}^{(2)} \\
  \end{align*}
  $$
- Klasifikátor bude implementován jako třída [`ans.classification.TwoLayerPerceptron`](../ans/classification.py).
- Třída obsahuje parametry klasifikátoru jako atributy
  | atribut   | značení                                                            | rozměr       |
  | --------- | ------------------------------------------------------------------ | ------------ |
  | `weight1` | $\boldsymbol{w}^{(1)} = \left[w_{d,k}^{(1)}\right]$                | $D \times H$ |
  | `bias1`   | $\boldsymbol{b}^{(1)} = \left[b_1^{(1)}, \ldots, b_H^{(1)}\right]$ | $H$          |
  | `weight2` | $\boldsymbol{w}^{(2)} = \left[w_{d,k}^{(2)}\right]$                | $H \times K$ |
  | `bias2`   | $\boldsymbol{b}^{(2)} = \left[b_1^{(2)}, \ldots, b_K^{(2)}\right]$ | $K$          |
- Třída bude mít shodné tři metody `__init__`, `train_step` a `val_step` jako `ans.classification.LinearSoftmaxModel`.
- Rozdílem bude pouze jejich vnitřní implementace.

### TODO: implementuje metodu [`ans.classification.TwoLayerPerceptron.__init__`](../ans/classification.py).

In [None]:
test_two_layer_perceptron.TestInit.eval()

### TODO: implementuje funkci [`ans.classification.TwoLayerPerceptron.train_step`](../ans/classification.py).

In [None]:
test_two_layer_perceptron.TestTrainStep.eval()

### TODO: implementuje funkci [`ans.classification.TwoLayerPerceptron.val_step`](../ans/classification.py).

In [None]:
test_two_layer_perceptron.TestValStep.eval()

# Trénování klasifikátoru

- Nejlepší model uložte jako
  ``` python
  model.save('../output/two_layer_perceptron_weights.pt')
  ```

### TODO: Natrénujte dvouvrstvý perceptron tak, aby dosáhl alespoň 45 % (bonusově 50%) *validační* accuracy.

In [None]:
ans.utils.seed_everything(0)

########################################
# TODO: implement

raise NotImplementedError

# ENDTODO
########################################

In [None]:
test_two_layer_perceptron.TestValAccuracy45.eval(preprocess_fn=preprocess)

In [None]:
test_two_layer_perceptron.TestValAccuracy50.eval(preprocess_fn=preprocess)