# Convolutional Neural Networks

## CNN

Схема сверточной нейронной сети выглядит следующим образом:

![](https://adeshpande3.github.io/assets/Cover.png)

---

![](https://ujwlkarn.files.wordpress.com/2016/08/screen-shot-2016-08-07-at-4-59-29-pm.png?w=1493)

---

![](https://cdn-images-1.medium.com/max/1600/1*NQQiyYqJJj4PSYAeWvxutg.png)

---

*To get started*:
* [Примеры нейросетей](https://keras.io/getting-started/sequential-model-guide/)
* [Sequnetial Model](https://keras.io/models/sequential/) - модель, на которой все строится

Об основных слоях сверточной сети можно прочитать в официальной документации *keras*:
* [Core Layers](https://keras.io/layers/core/) - наибольший интерес представляют слои *Dense*, *Dropout*, *Flatten*
* [Convolutional Layers](https://keras.io/layers/convolutional/) - мы работаем с *Conv2D*
* [Pooling Layers](https://keras.io/layers/pooling/) - самый популярный вариант *MaxPooling2D*

Другие полезные ссылки:
* [Функции потерь](https://keras.io/losses/) - для задачи классификации применяется *categorical_crossentropy*
* [Метрики качества](https://keras.io/metrics/) - мы чаще всего используем *accuracy*
* [Оптимизатор](https://keras.io/optimizers/) - алгоритм, который будет искать минимум функции потерь; популярный выбор - *rmsprop* или *adam*
* [Функции активации](https://keras.io/activations/) - после таких слоев как *Dense* и *Conv2D* необходимо ставить нелинейность; для задачи классификации в последнем *Dense* слое должна быть выбрана функция активации *softmax*

## FashionMNIST

**Задание.** Улучшите свой *score* в [соревновании](https://www.kaggle.com/c/multiclassification). Используйте CNN.

## Modern Architectures

### AlexNet

Статьи по теме:
* [Оригинальная статья](https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf)
* [Основные выдержки](https://medium.com/@smallfishbigsea/a-walk-through-of-alexnet-6cbd137a5637)

![](https://cdn-images-1.medium.com/max/1600/1*qyc21qM0oxWEuRaj-XJKcw.png)

Главные фишки:
* Использование *ReLU* вместо стандарта 2012 года - *tanh*. Позволило ускорить скорость обучения в 6 раз
* Использование *Dropout* для борьбы с переобучением

### VGG

Статьи по теме:
* [Оригинальная статья](https://arxiv.org/pdf/1409.1556v6.pdf)
* [Статья о самостоятельной реализации VGG](https://hackernoon.com/learning-keras-by-implementing-vgg16-from-scratch-d036733f2d5)

![](https://www.pyimagesearch.com/wp-content/uploads/2017/03/imagenet_vgg16.png)

Главные фишки:
* Использование нескольких сверток с маленьким размером ядра вместо одного большого фильтра 

### GoogleNet

Статьи по теме:
* [Оригинальная статья](https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Szegedy_Going_Deeper_With_2015_CVPR_paper.pdf)
* [Tensorflow, deep learning and modern convolutional neural nets, without a PhD by Martin Görner](https://www.youtube.com/watch?v=vaL1I2BD_xY?t=36m2s)

![](https://adeshpande3.github.io/assets/GoogLeNet.png)

---

![](https://i.stack.imgur.com/Xqv0n.png)

---

![](https://adeshpande3.github.io/assets/GoogleNet.gif)

#### Inception Module

[Объясняющее видео](https://www.youtube.com/watch?v=VxhSouuSZDY)

![](https://adeshpande3.github.io/assets/GoogLeNet3.png)

Основные фишки:
* Использование одновременно (параллельно) нескольких фильтров малого размера
* Отказ от *Dense* слоев в сторогу *AveragePooling*

### ResNet

Статьи по теме:
* [Оригинальная статья](https://arxiv.org/pdf/1512.03385v1.pdf)

![](https://adeshpande3.github.io/assets/ResNet.gif)

#### Residual Block

![](https://adeshpande3.github.io/assets/ResNet.png)

Основные фишки:
* Использование *Residual Blocks* позволяет решить проблему *vanishing gradient*

## Дополнительно

Полезные ссылки:
* [Короткое описание каждой из архитектур](https://adeshpande3.github.io/adeshpande3.github.io/The-9-Deep-Learning-Papers-You-Need-To-Know-About.html)
* [Другой обзор архитектур](http://cv-tricks.com/cnn/understand-resnet-alexnet-vgg-inception/)