# Кошки против собак!

Вы когда-нибудь задумывались, как сложно отличить простых кошек и собак на фотках? Например, вы можете сказать, это кошка или собака?

![Кошбака](https://www.lifewithdogs.tv/wp-content/uploads/2016/11/11.10.16-People-Are-Doing-a-Double-Take-Over-This-Cat-Who-Looks-Like-a-Dog3.jpg)

Вот и мы не уверены! Поэтому давайте попробуем сделать классификатор животных, который по изображению скажет, кто изображен на картинке. Данные мы возьмем с [соревнования на Kaggle: Dogs vs. Cats](https://www.kaggle.com/c/dogs-vs-cats)!

Наш классификатор должен принимать на вход картинку, а на выходе отвечать на вопрос, кто изображён на этой картинке - кошка или собака? 

Для разработки с высоты своего опыта классифицируйте, какая задача решается и как нужно организовать выход - вы уже матёрые разработчики! А мы перейдём к списку задач, которые рассмотрим в этой лабораторной!

Для работы с данными нам потребуется фреймворк для загрузки и обработки данных, вы можете воспользоваться:
- либо `skimage` (который ставится через `scikit-image`) - [доки](https://scikit-image.org/docs/stable/), 
- либо `cv2` (который устанавливается через `opencv-python`) - [доки](https://docs.opencv.org/3.4.11/).

`skimage` загружает данные как обычно в формате `RGB`, а вот `cv2` загружает данные в формате `BGR`, поэтому при работе с ним нужно приводить к стандартному формату `RGB`:
```python
img = cv2.imread('./images/my_image.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
```


## Задачи

- Организуйте код скачивания данных с Kaggle и разархивирования;
- Проведите анализ данных, просмотрите некоторые изображения каждого класса;
- Отделите выборку для теста и валидации;
- Организуйте код Dataset, преобразование данных в нём, подготовка тензора, отладьте и проверьте код;
  > Картинки имеют разный размер, поэтому нужно при подготовке делать resize изображений к единому размеру входа сети - оба фреймворка `cv2` и `skimage` имеют необходимые функции;
- Напишите модуль сверточной нейросети (из блоков - свертки, активации Tanh, maxpool), протестируйте код;
- Выберите необходимые оптимизатор и функцию потерь;
- Напишите цикл обучения и валидации, отладьте код;
- Произведите обучение модели и оцените, достаточно ли выбрано эпох для обучения и подходит ли коэффициент обучения;
- Обучите модель и оцените работу модели на тестовой выборке, отобразите историю обучения (показатели Loss и метрик на каждой эпохе);

После организации кода экспериментируем:
- Замените активацию на [ReLU](https://pytorch.org/docs/stable/generated/torch.nn.ReLU.html) в каждом блоке, сравните результаты обучения;
- После каждого блока свертки (после активации) добавьте нормализацию [BatchNorm2d](https://pytorch.org/docs/stable/generated/torch.nn.BatchNorm2d.html), в которой `num_features` - это выходное количество каналов этого блока (после которого ставится BatchNorm), обучите и сравните с ранее полученными результатами;
- Замените `SGD` на [Adam](https://pytorch.org/docs/stable/optim.html#torch.optim.Adam), обучите и сравните с ранее полученными результатами;
- К циклу обучения добавьте планировщик коэффициента обучения [ReduceLROnPlateau](https://pytorch.org/docs/stable/optim.html#torch.optim.lr_scheduler.ReduceLROnPlateau), разберитесь с его параметрами и примените в работе, обучите модель и сравните с ранее полученными результатами;
  > Планировщик коэффициента обучения `ReduceLROnPlateau` работает по принципу снижения коэффициента обучения, если показатель на валидации не становится ниже, поэтому для удобства можно сохранить на каждой эпохе значение `lr` с помощью функции:
  ```python
  def get_lr(optimizer):
    for param_group in optimizer.param_groups:
        return param_group['lr']
  ```
- Измените архитектуру нейронной сети и с применением инструментов постарайтесь получить наилучшую точность на тестовой выборке!
- Попробуйте применить внутри своей модели готовую сеть [ResNet18](https://pytorch.org/vision/stable/models.html) из фреймворка [torchvision](https://pytorch.org/vision/stable/index.html).

<p align="center"><img src="https://raw.githubusercontent.com/AleksDevEdu/ml_edu/master/assets/good_luck.jpeg" width=400/></p>

## Вопросы

- Почему мы не загружаем все изображения, чтобы затем разделить на выборки и хранить в памяти, а работаем лишь с путями до файлов?
- Как влияет значение коэффициента обучения на скорость обучения?
- Как определить, что количество эпох и коэффициент обучения достаточны для обучения?
- Сколько потребовалось эпох, чтобы обучить модель?
- В чем отличие оптимизатора SGD от Adam?
- Для чего применяется нормализация батчей (BatchNorm)? Как его введение отражается на результатах обучения?
- Для чего применяется планировщик коэффициента обучения? Какие виды планировщика имеется в PyTorch?