# NN training

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/m12sl/dl-hse-2021/blob/master/03-training/homework.ipynb)

В этой тетрадке мы решим нашу первую серьезную задачу - [Imagenette](https://github.com/fastai/imagenette#imagenette-1) 
(сабсет ImageNet) и поиграем с подбором гиперпараметров.

**Всегда поможет:**

* [PyTorch docs](https://pytorch.org/docs/stable/index.html)

In [None]:
# import torch
# import torch.nn as nn
# import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader

# Data

Для обучения мы будем использовать облегченную версию датасета Imagenette с минимальной стороной равной 160 пикселям.  
Следующие две ячейки должны скачать и распаковать данные, после чего в текущей директории появится 
директория `imagenette2-160` со следующей структурой:

- ./imagenette2-160/
    - train/
        - {CLASS_ID}/{IMAGE_ID}.jpeg
    - val/
        - {CLASS_ID}/{IMAGE_ID}.jpeg

In [None]:
# download tar archive

! wget https://s3.amazonaws.com/fast-ai-imageclas/imagenette2-160.tgz

In [None]:
# extract files from archive

! tar -zxf imagenette2-160.tgz

## Задание 1
**(0.2 балла)** Напишите класс `ImagenetteDataset`, который мы будем использовать для обучения сетки.  

*Hints:* 

1. Нужно унаследоваться от класса `Dataset` и переопределить методы `__getitem__` и `__len__`. 
Первый должен возвращать картинку и ее лейбл, а второй количество примеров в датасете.
(На самом деле второй метод не обязателен для самого датасета, но он необходим для
[семплера](https://pytorch.org/docs/stable/data.html#torch.utils.data.RandomSampler),
который используется даталоадером)
(см. [PyTorch docs](https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset),
[PyTorch tutorual](https://pytorch.org/tutorials/recipes/recipes/custom_dataset_transforms_loader.html?highlight=dataset)).
1. Для работы с картинками лучше использовать OpenCV: `pip install opencv-python-headless`.
1. Обратите внимание на то, что возвращает функция `cv2.imread`. 
Какой порядок каналов в полученном массиве?
1. В батче не может быть тензоров разного размера.

In [None]:
class ImagenetteDataset(Dataset):
    def __init__(self):
        pass

    def __len__(self):
        pass
    
    def __getitem__(self, index):
        pass

## Задание 2
**(0.1 балла)** Перенесите свой класс `Trainer` и создайте его инстанс.

*Hints:*

1. Можете взять любую архитектуру сети из предыдущей домашки/семинара или из `torchvision.models`: 
[link](https://pytorch.org/vision/stable/models.html#classification)

## Задание 3
**(0.1 балла)** Проведите LR Range Test и выберите LR в оптимальных границах.

*Requirement:* график в осях LR - loss должен быть в аутпуте ячейки.

## Задание 4
**(0.2 балла)** Обучите сеть с выбранным LR. Остальные гиперпараметры выберите по своему усмотрению.

*Requirements:*
1. Логи экспериментов должен быть в отдельных папках, чтобы их можно было сравнить в тензорборде
(см. аргумент `log_dir` в [docs](https://pytorch.org/docs/stable/tensorboard.html#torch.utils.tensorboard.writer.SummaryWriter)).
1. Метрика `Accuracy`.
1. На этапе валидации метрика должна считаться по всем валидационным объектам, а не отдельно по каждому батчу. 
В тензорборде после валидации должна появиться одна точка.

## Задание 5
**(0.4+ балла)** Попробуйте различные гиперпараметры при обучении. Что дает набольший эффект?  
За каждый эксперимент с гиперпараметром из списка дается 0.1 балл:

1. Optimizer: adam, sgd, etc.
1. Batch size.
1. LR scheduler.
1. Freeze weights. Если вы используете предобученную сеть, то попробуйте заморозить тушку (body) и обучать только голову.
1. Weight initialization: zeros, ones, normal, uniform, etc.

*Requirement:* сделайте скриншот тензорборда (несколько, если считаете нужным) с кривыми обучения
(лоссы/метрики на трейне/валидации) проведенных экспериментов и приложите вместе с готовым ноутбуком в anytask.
Из скриншота должно быть понятно в чем заключался эксперимент и как проходило обучение.

*Hint 1:* не меняйте несколько гиперпараметров в одном эксперименте - так непонятно какой из них сыграл.  
*Hint 2:* для заморозки весов, нужно пробежать по параметрам и поставить флаг `param.requires_grad = False` 
(см. [PyTorch discuss](https://discuss.pytorch.org/t/how-the-pytorch-freeze-network-in-some-layers-only-the-rest-of-the-training/7088/2)).  
*Hint 3:* для инициализации придется итерироваться по параметрам. 
Менять их значения можно с помощью уже готовых функций: [PyTorch docs](https://pytorch.org/docs/stable/nn.init.html?highlight=init).

## Задание 6 (бонус)
**(0.2 балла, бонус)** Покажите на каких классах лучшая сеть ошибается сильнее всего.

*Requirement:* выведите матрицу ошибок в виде heatmap.