<img src="https://s8.hostingkartinok.com/uploads/images/2018/08/308b49fcfbc619d629fe4604bceb67ac.jpg" width=500, height=450>
<h3 style="text-align: center;"><b>Физтех-Школа Прикладной математики и информатики (ФПМИ) МФТИ</b></h3>

---

<h2 style="text-align: center;"><b>Детектирование объектов с помощью YOLOv3</b></h2>

<img src="https://i.ytimg.com/vi/s8Ui_kV9dhw/maxresdefault.jpg" width=600 height=450>

<h4 style="text-align: center;"><b>Составитель: Илья Захаркин (ФИВТ МФТИ, NeurusLab). По всем вопросам в Telegram: <a>@ilyazakharkin</a></b></h4>

На семинаре мы запускали SSD и Mask-RCNN из Tensorflow Object Detection API. На лекции же подробно разбирался алгоритм YOLOv3, давайте же теперь этот самый детектор и попробуем применить на практике.

<h2 style="text-align: center;"><b>YOLOv3</b></h2>

**Идея детекторов:** использовать сильную свёрточную нейросеть, натренированную на классификации, чтобы извлечь признаки из изображения, потом использовать свёрточные слои для регрессии точек боксов и классификации объектов внутри них.

Напомним, что архитектура у YOLOv3 следующая:

<img src="https://camo.githubusercontent.com/5c561504c1b01ee565764785efe5572156d4cd61/68747470733a2f2f692e696d6775722e636f6d2f546f45626c6a5a2e706e67">

Словами:

1. Картинка подаётся на вход
2. Она сжимается до размера 300х300х3
3. Пропускается через backbone-нейросеть, которая извлекает признаки -- *Darknet53*
4. Идут несколько свёрточных слоёв со свёртками 1х1 и 3х3
5. После них идёт yolo-слой: свёртка 1х1х(1 + 4 + NUM_CLASSES)
6. Далее происходит upsampling (увеличение по ширине и высоте) в 2 раза и конкатенация с feature map'ами, которые были до upsampling'а (чтобы улучшить качество)
7. Шаги 4-6 повторяются ещё 2 раза, чтобы улучшить качество детектирования мелких объектов

При обучении также: 
8. Финальный feature map специальным образом подаётся в Loss для подсчёта ошибки
9. Распространятся градиенты, как в обычном backpropagation, обновляются веса сети

В слоях используются LeakyReLU активации. Перед YOLO-слоями используются линейные активации (то есть нет нелинейности).

Как вся архитектура выглядит в коде вы можете посмотреть в этом файле: https://github.com/akozd/tensorflow_yolo_v3/blob/master/models/yolo_v3.py

Оригинальная статья с arxiv.org: https://arxiv.org/abs/1804.02767

***Примечание:*** Вы можете спросить: "Почему именно YOLOv3, ведь много других хороших детекторов?". Да, но на данный момент у YOLOv3 лучшее соотношение скорость/качество из широко применяемых нейросетевых детекторов. В этом плане он State-of-the-Art.

<h2 style="text-align: center;"><b>Задание (10 баллов)</b></h2>

***Предполагается, что Вы знакомы с TensorFlow и  свёрточными нейросетями***

Лучше выполнять этот ноутбук локально, поставив TensorFlow: `pip install tensorflow` (CPU-версия, но слишком долго работать не будет, так как обучения в задании нет, только предсказание).

Если Вы выполняете на Google Colab, то будьте готовы активно использовать переходы в подпапки (`os.chdir(*path*)`), как было на семинаре.

<img src="http://blog.yavuzz.com/image.axd?picture=/resimler/sayit.jpg">

Писать свой нейросетевой детектор с нуля -- весьма непростая задача, поэтому сейчас просто используем код человека, который смог: https://github.com/akozd/tensorflow_yolo_v3

Напомню, что скачать с Github весь репозиторий можно командой: `git clone *адрес репозитория*`. Например, репозиторий, который нужен в этом задании, скачивается так: `git clone https://github.com/akozd/tensorflow_yolo_v3`

### Этап 1 (2 балла): первичное ознакомлене с репозиторием

Прочитать README этого репозитория: https://github.com/akozd/tensorflow_yolo_v3

***Вопрос по `README.md` (1 балл)***: что автор репозитория предлагает для того, чтобы улучшить качество предсказания боксов пр обучении на собственных данных?

In [0]:
<Ответ>

In [0]:
...

Прочитайте файл `train.py`

***Вопрос по `train.py` (1 балл)***: за что отвечает аргумент скрипта `train.py` под названием `--test_model_overfit`?

In [0]:
<Развёрнутый ответ>

In [0]:
...

### Этап 2 (3 балла): чтение кода репозитория

Теперь нужно прочитать код автора и понять, что в нём происходит. Этот репозиторий был выбран не спроста -- весь код хорошо документирован и исправно работает.  

Ваша задача состоит в том, чтобы понять, как связаны файлы друг с другом, какие файлы используются для обучения, какие для предсказания, какие вовсе не используются. Хорошая стратегия: основываясь на README.md начать разбираться с тем, как работает `detect.py`, то есть что принимает на вход и что на выход, какие сторонние файлы использует.

<img src="https://thefreshtoast.com/wp-content/uploads/2017/02/bbc-new-meme-hood-documentary.jpg" width=400 height=300>

***Задача (3 балла)***: подробно опишите структуру репозитория, пояснив, для чего нужен каждый файл. Чем более подробно вы опишите, что происходит внутри файла (можно прямо в виде "..в строчках 15-20 производится предсказание боксов по изображению.."), тем больше баллов получите.

In [0]:
<Подробное описание структуры репозитория>

In [0]:
...

### Этап 3 (5 баллов): установка нужных зависимостей, скачивание весов (`.ckpt`) и запуск `detect.py` на ваших изображениях

Разомнём пальцы и позапускаем код из репозитория на ваших изображениях (любых, однако желательно, чтобы на них были объекты из [этого списка](https://github.com/nightrome/cocostuff/blob/master/labels.md), так как изначально детектор обучен на COCO датсете).

<img src="http://static.hdw.eweb4.com/media/wallpapers_dl/1/89/882736-adventure-time-with-finn-and-jake.jpg" width=400 height=300>

Сначала убедитесь, что у вас (или на Colab) стоят все нужные зависимости (5 ссылок в разделе Dependencdies в README.md).  
Потом либо скриптом `.sh`, либо по ссылке, данной в ридми, скачайте в папку `model_weights` веса обученной на датасете COCO YOLOv3-модели.

Баллы в этом задании ставятся следующим образом:

* (1 балл) получены предсказания на любом вашем изображении (этот пункт служит подтверждением того, что у вас всё запустилось и вы смогли скачать и настроить репозиторий у себя/в колабе)  
* (1 балл) найдена кратинка, где у нейросети есть ложные срабатывания (false positives)  
* (1 балл) найдена картинка, где у нейросети есть пропуски в детекции (false negatives)  
* (1 балл) найдена картинка, где сеть детектировала успешно все объекты, хотя они сильно перекрыватся
* (1 балл) предыдущий пункт, но наоброт -- нейросеть справляется плохо

In [0]:
<Вашы попытки здесь>

In [0]:
<и здесь>

In [0]:
...

### * Дополнительный этап 4 (10 баллов): обучение детектора на собственной выборке

<img src="https://i.ytimg.com/vi/Zdf7Afgfq8Q/maxresdefault.jpg" width=500 height=300>

В этом задании Вы по-желанию можете обучить свой детектор. Чтобы упростить задачу, вот примеры небольших датасетов, на которых можно обучить и протестировать (**10 баллов ставится за один из двух вариантов, за оба варианта двойной балл ставиться не будет**):

***1). Датасет игровых карт: https://github.com/EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10***  

Репозиторий состоит из туториала по обучению детектора с помощью TF Object Detection API. Вы можете либо взять датасет из папки `/images` этого репозитория и обучить текущий YOLOv3 с помощью `train.py` (готовьтесь, предстоит повозиться с переводом разметки данных в нужный формат), либо же пройти тот туториал и обучить любую модель из TF Object Detection API на этом датасете.  

Главное: продемонстрировать работу вашего детектора не тестовых примерах с картами.

In [0]:
...

In [0]:
<Ты сможешь!>

In [0]:
...

**2). Датасет из картинок со снитчем из Гарри Поттера, ссылка на статью с подробным описанием задачи: https://apptractor.ru/develop/syigraem-v-kviddich-s-tensorflow-object-detection-api.html**

В качестве результата нужно показать тестовые изображения, на которых верно детектирован снитч.

In [0]:
...

In [0]:
<Торжественно клянусь, что совершаю только шалость>

In [0]:
...

<h3 style="text-align: center;"><b>Полезные ссылки</b></h3>

1. https://github.com/qqwweee/keras-yolo3
2. https://github.com/ayooshkathuria/pytorch-yolo-v3
3. https://github.com/eriklindernoren/PyTorch-YOLOv3
4. https://github.com/maiminh1996/YOLOv3-tensorflow
5. https://github.com/ultralytics/yolov3
6. https://www.analyticsvidhya.com/blog/2018/12/practical-guide-object-detection-yolo-framewor-python/?utm_source=feedburner&utm_medium=email&utm_campaign=Feed%3A+AnalyticsVidhya+%28Analytics+Vidhya%29