# Вариант 1
### О задании

В этом задании мы будем применять метод k-ближайших соседей (kNN) для классификации изображений. Идея в том, чтобы сравнить различные векторные представления изображений между собой. Будем работать с одним из самых распространенных датасетов с картинками &mdash; CIFAR10. В качестве метрики качества выберем accuracy.

In [None]:
import torch
from torch import nn
from torchvision.datasets import CIFAR10
from sklearn.preprocessing import StandardScaler

In [None]:
train_set = CIFAR10('CIFAR10', train=True, download=True)
test_set = CIFAR10('CIFAR10', train=False, download=True)

## 1. Исходные изображения (1 балл)

Начнем с того, что попробуем использовать сами изображения в качестве признаковых описаний (то есть вытягиваем картинки в длинный вектор). 

In [None]:
X_train = train_set.data.reshape(50000, -1)
y_train = np.array(train_set.targets)

X_test = test_set.data.reshape(10000, -1)
y_test = np.array(test_set.targets)

scaler = StandardScaler().fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

Обучите метод k-ближайших соседей из `sklearn` на картинках как на длинных векторах, подберите оптимальное число соседей по кросс-валидации. Насколько качество получилось лучше, чем у случайного прогноза?

In [None]:
# YOUR CODE HERE ᕕ( ᐛ )ᕗ

## 2. Предобученный классификатор (2.5 балл)

Теперь попробуем использовать сверточную нейросеть, предобученную на ImageNet. Выберите архитектуру из `torchvision`, которая вам по душе, и используйте выход предпоследнего слоя как признаковое описание картинки. Проще всего будет найти поле класса модели, которое отвечает за последний слой (классификационную голову) и заменить его на болванку `nn.Identity` (у вас должно получиться что-то вроде `model.classifier = nn.Identity()`). В зависимости от архитектуры название этого поля может меняться, это можно уточнить в исходниках `torchvision` (смотрите документацию `torchvision.models`).

Посчитайте эмбеддинги для обучающих и тестовых картинок, не забудьте использовать правильную трансформацию данных для ImageNet, а также перевести модель в `eval` режим. Обучите kNN для получившихся представлений (все так же с подбором гиперпараметра $k$). Прокомментируйте полученные результаты. 

In [None]:
# YOUR CODE HERE ᕕ( ᐛ )ᕗ

## 3. PCA (1.5 балла)

Теперь будем пробовать разные методы для понижения размерности. Начнем с простейшего &mdash; обучите PCA из `sklearn` и используйте его выход в качестве признаков для kNN. Ради чистоты эксперимента возьмите число компонент равным размерности представлений из прошлого пункта. Не забываем про подбор гиперпараметра :)

In [None]:
# YOUR CODE HERE ᕕ( ᐛ )ᕗ

## 4. Автокодировщик (5 баллов)

Теперь обратимся к нелинейным методам понижения размерности: будем экспериментировать с автокодировщиками. Обучите две вариации модели: полносвязную и сверточную. Первая будет работать с изображениями как с длинными векторами, вторая &mdash; как полагается. Рекомендуется пользоваться шаблонами, приведенными ниже (но если они уж очень вам не нравится, то это не обязательно). Как и прежде, возьмите размерность скрытого слоя равной размеру представлений из предобученного классификатора. Обязательно рисуйте графики лосса при обучении.

Сравните, как восстанавливают изображения два автокодировщика (для этого зафиксируйте несколько тестовых картинок и нарисуйте их восстановленные версии). Сделайте выводы.

Теперь по нашему стандартному протоколу: обучаем kNN, подбираем параметр числа соседей и смотрим на качество. Получилось ли качество лучше, чем при линейном понижении размерности? А чем при использовании предобученного классификатора? Попытайтесь объяснить, почему так происходит.

In [None]:
class Autoencoder(nn.Module):
    '''
    Base autoencoder class
    '''        
    def encode(self, x):
        '''
        Encode batch of images
        param x: batch of input images
        return z: batch of latent vectors
        '''
        # YOUR CODE HERE ᕕ( ᐛ )ᕗ
        pass
    
    def decode(self, z):
        '''
        Decode batch of latent vectors
        param z: batch of latent vectors
        return x_hat: batch of reconstructed images
        '''
        # YOUR CODE HERE ᕕ( ᐛ )ᕗ
        pass

    def forward(self, x):
        '''
        Forward pass of the autoencoder
        param x: batch of input images
        return x_hat: batch of reconstructed images
        '''
        # YOUR CODE HERE ᕕ( ᐛ )ᕗ
        pass


class FCAutoencoder(Autoencoder):
    '''
    Fully-connected autoencoder architecture
    '''
    def __init__(self, n_components):
        '''
        param n_components: dim of latent vectors
        '''
        super().__init__()
        # YOUR CODE HERE ᕕ( ᐛ )ᕗ
        pass


class CNNAutoencoder(Autoencoder):
    '''
    Convolutional autoencoder architecture
    '''
    def __init__(self, n_components):
        '''
        param n_components: dim of latent vectors
        '''
        super().__init__()
        # YOUR CODE HERE ᕕ( ᐛ )ᕗ
        pass

In [None]:
# YOUR CODE HERE ᕕ( ᐛ )ᕗ