<p style="align: center;"><img align=center src="https://s8.hostingkartinok.com/uploads/images/2018/08/308b49fcfbc619d629fe4604bceb67ac.jpg" width=500/></p>

<h3 style="text-align: center;"><b>Физтех-Школа Прикладной математики и информатики (ФПМИ) МФТИ</b></h3>

---

В этом ноутбке мы научимся писать свои свёрточные нейросети на фреймворке PyTorch, и протестируем их работу на датасетах MNIST и CIFAR10. 

**ВНИМАНИЕ:** Рассматривается ***задача классификации изображений***.

(Подразумевается, что читатель уже знаком с многослойной нейроннной сетью).  

***Свёрточная нейросеть (Convolutional Neural Network, CNN)*** - это многослойная нейросеть, имеющая в своей архитектуре помимо *полносвязных слоёв* (а иногда их может и не быть) ещё и **свёрточные слои (Conv Layers)** и **pooling-слои (Pool Layers)**.  

Собственно, название такое эти сети получили потому, что в основе их работы лежит операция **свёртки**. 


Сразу же стоит сказать, что свёрточные нейросети **были придуманы прежде всего для задач, связанных с картинками**, следовательно, на вход они тоже "ожидают" картинку.

Расмотрим их устройство более подробно:

* Вот так выглядит неглубокая свёрточная нейросеть, имеющая такую архитектуру:  
`Input -> Conv 5x5 -> Pool 2x2 -> Conv 5x5 -> Pool 2x2 -> FC -> Output`

<img src="https://camo.githubusercontent.com/269e3903f62eb2c4d13ac4c9ab979510010f8968/68747470733a2f2f7261772e6769746875622e636f6d2f746176677265656e2f6c616e647573655f636c617373696669636174696f6e2f6d61737465722f66696c652f636e6e2e706e673f7261773d74727565" width=800>

Свёрточные нейросети (обыкновенные, есть и намного более продвинутые) почти всегда строятся по следующему правилу:  

`INPUT -> [[CONV -> RELU]*N -> POOL?]*M -> [FC -> RELU]*K -> FC`  

то есть:  

1). ***Входной слой*** (batch картинок `HxWxC`)  

2). $M$ блоков (M $\ge$ 0) из свёрток и pooling-ов, причём именно в том порядке, как в формуле выше. Все эти $M$ блоков вместе называют ***feature extractor*** свёрточной нейросети, потому что эта часть сети отвечает непосредственно за формирование новых, более сложных признаков, поверх тех, которые подаются (то есть, по аналогии с MLP, мы опять же переходим к новому признаковому пространству, однако здесь оно строится сложнее, чтем в обычных многослойных сетях, поскольку используется операция свёртки)  

3). $K$ штук FullyConnected-слоёв (с активациями). Эту часть из $K$ FC-слоёв называют ***classificator***, поскольку эти слои отвечают непосредственно за предсказание нужно класса (сейчас рассматривается задача классификации изображений).


<h3 style="text-align: center;"><b>Свёрточная нейросеть на PyTorch</b></h3>

Ешё раз напомним про основные компоненты нейросети:

- непосредственно, сама **архитектура** нейросети (сюда входят типы функций активации у каждого нейрона);
- начальная **инициализация** весов каждого слоя;
- метод **оптимизации** нейросети (сюда ещё входит метод изменения `learning_rate`);
- размер **батчей** (`batch_size`);
- количетсво итераций обучения (`num_epochs`);
- **функция потерь** (`loss`);  
- тип **регуляризации** нейросети (для каждого слоя можно свой);  

То, что связано с ***данными и задачей***:  
- само **качество** выборки (непротиворечивость, чистота, корректность постановки задачи);  
- **размер** выборки;  

Так как мы сейчас рассматриваем **архитектуру CNN**, то, помимо этих компонент, в свёрточной нейросети можно настроить следующие вещи:  

- (в каждом ConvLayer) **размер фильтров (окна свёртки)** (`kernel_size`)
- (в каждом ConvLayer) **количество фильтров** (`out_channels`)  
- (в каждом ConvLayer) размер **шага окна свёртки (stride)** (`stride`)  
- (в каждом ConvLayer) **тип padding'а** (`padding`)  


- (в каждом PoolLayer) **размер окна pooling'a** (`kernel_size`)  
- (в каждом PoolLayer) **шаг окна pooling'а** (`stride`)  
- (в каждом PoolLayer) **тип pooling'а** (`pool_type`)  
- (в каждом PoolLayer) **тип padding'а** (`padding`)

Какими их берут обычно -- будет показано в примере ниже. По крайней мере, можете стартовать с этих настроек, чтобы понять, какое качество "из коробки" будет у простой модели.

Посмотрим, как работает CNN на MNIST'е и на CIFAR'е:

<img src="http://present5.com/presentation/20143288_415358496/image-8.jpg" width=500>

**MNIST:** это набор из 70k картинок рукописных цифр от 0 до 9, написанных людьми, 60k из которых являются тренировочной выборкой (`train` dataset)), и ещё 10k выделены для тестирования модели (`test` dataset).

In [2]:
!pip install torchvision

Collecting torchvision
[?25l  Downloading https://files.pythonhosted.org/packages/ca/0d/f00b2885711e08bd71242ebe7b96561e6f6d01fdb4b9dcf4d37e2e13c5e1/torchvision-0.2.1-py2.py3-none-any.whl (54kB)
[K    100% |████████████████████████████████| 61kB 3.5MB/s 
[?25hCollecting pillow>=4.1.1 (from torchvision)
[?25l  Downloading https://files.pythonhosted.org/packages/62/94/5430ebaa83f91cc7a9f687ff5238e26164a779cca2ef9903232268b0a318/Pillow-5.3.0-cp36-cp36m-manylinux1_x86_64.whl (2.0MB)
[K    100% |████████████████████████████████| 2.0MB 8.4MB/s 
[?25hCollecting torch (from torchvision)
[?25l  Downloading https://files.pythonhosted.org/packages/49/0e/e382bcf1a6ae8225f50b99cc26effa2d4cc6d66975ccf3fa9590efcbedce/torch-0.4.1-cp36-cp36m-manylinux1_x86_64.whl (519.5MB)
[K    100% |████████████████████████████████| 519.5MB 27kB/s 
tcmalloc: large alloc 1073750016 bytes == 0x59ea2000 @  0x7f9af12472a4 0x594e17 0x626104 0x51190a 0x4f5277 0x510c78 0x5119bd 0x4f5277 0x4f3338 0x510fb0 0x5119bd 0x

In [0]:
import torch
import torchvision
from torchvision import transforms

import numpy as np
import matplotlib.pyplot as plt  # для отрисовки картиночек
%matplotlib inline

Скачаем и загрузим в `loader`'ы:

**Обратите внимание на аргумент `batch_size`:** именно он будет отвечать за размер батча, который будет подаваться при оптимизации нейросети

In [4]:
transform = transforms.Compose(
    [transforms.ToTensor()])

trainset = torchvision.datasets.MNIST(root='./data', train=True, 
                                      download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.MNIST(root='./data', train=False,
                                     download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
                                         shuffle=False, num_workers=2)

classes = tuple(str(i) for i in range(10))

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Processing...
Done!


Сами данные лежат в полях `trainloader.dataset.train_data` и `testloader.dataset.test_data`:

In [0]:
trainloader.dataset.train_data.shape

In [0]:
testloader.dataset.test_data.shape

Выведем первую картинку:

In [0]:
trainloader.dataset.train_data[0]

Посмотрим, как она выглядит:

In [0]:
# преобразовать тензор в np.array
numpy_img = trainloader.dataset.train_data[0].numpy()

In [0]:
numpy_img.shape

In [0]:
plt.imshow(numpy_img);

In [0]:
plt.imshow(numpy_img, cmap='gray');

Отрисовка заданной цифры:

In [0]:
# случайный индекс от 0 до размера тренировочной выборки
i = np.random.randint(low=0, high=60000)

plt.imshow(trainloader.dataset.train_data[i].numpy(), cmap='gray');

Как итерироваться по данным с помощью `loader'`а? Очень просто:

In [0]:
for data in trainloader:
    print(data)
    break

То есть мы имеем дело с кусочками данных размера batch_size (в данном случае = 4), причём в каждом батче есть как объекты, так и ответы на них (то есть и $X$, и $y$).

Теперь вернёмся к тому, что в PyTorch есть две "парадигмы" построения нейросетей -- `Functional` и `Seuquential`. Со второй мы уже хорошенько разобрались в предыдущих ноутбуках по нейросетям, теперь мы испольузем именно `Functional` парадигму, потому что при построении свёрточных сетей это намного удобнее:

In [0]:
import torch.nn as nn
import torch.nn.functional as F  # Functional

In [0]:
# ЗАМЕТЬТЕ: КЛАСС НАСЛЕДУЕТСЯ ОТ nn.Module
class SimpleConvNet(nn.Module):
    def __init__(self):
        # вызов конструктора предка
        super(SimpleConvNet, self).__init__()
        # необходмо заранее знать, сколько каналов у картинки (сейчас = 1),
        # которую будем подавать в сеть, больше ничего
        # про входящие картинки знать не нужно
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5)
        self.fc1 = nn.Linear(4 * 4 * 16, 120)  # !!!
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        # print(x.shape)
        x = x.view(-1, 4 * 4 * 16)  # !!!
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

**Важное примечание:** Вы можете заметить, что в строчках с `#!!!` есть не очень понятный сходу 4 `*` 4 `*` 16. Это -- размерность картинки перед FC-слоями (H x W x C), тут её приходиться высчитывать вручную (в Keras, например, `.Flatten()` всё делает за Вас). Однако есть один *лайфхак* -- просто сделайте в `forward()` `print(x.shape)` (закомментированная строка). Вы увидите размер `(batch_size, C, H, W)` -- нужно перемножить все, кроме первого (batch_size), это и будет первая размерность `Linear()`, и именно в C * H * W нужно "развернуть" x перед подачей в `Linear()`.  

То есть нужно будет запустить цикл с обучением первый раз с `print()` и сделать после него `break`, посчитать размер, вписать его в нужные места и стереть `print()` и `break`.

Код обучения слоя:

In [0]:
from tqdm import tqdm as tqdm_notebook

In [10]:
# объявляем сеть
net = SimpleConvNet()

# выбираем функцию потерь
loss_fn = torch.nn.CrossEntropyLoss()

# выбираем алгоритм оптимизации и learning_rate
learning_rate = 1e-4
optimizer = torch.optim.Adam(net.parameters(), lr=learning_rate)

# итерируемся
for epoch in tqdm_notebook(range(3)):

    running_loss = 0.0
    for i, batch in enumerate(tqdm_notebook(trainloader)):
        # так получаем текущий батч
        X_batch, y_batch = batch
        
        # обнуляем веса
        optimizer.zero_grad()

        # forward + backward + optimize
        y_pred = net(X_batch)
        loss = loss_fn(y_pred, y_batch)
        loss.backward()
        optimizer.step()

        # выведем текущий loss
        running_loss += loss.item()
        # выведем качество каждые 2000 батчей
        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

print('Обучение закончено')

  0%|          | 0/3 [00:00<?, ?it/s]
  0%|          | 0/15000 [00:00<?, ?it/s][A
  0%|          | 1/15000 [00:00<26:43,  9.35it/s][A
  0%|          | 17/15000 [00:00<19:10, 13.02it/s][A
  0%|          | 33/15000 [00:00<13:53, 17.95it/s][A
  0%|          | 49/15000 [00:00<10:11, 24.43it/s][A
  0%|          | 64/15000 [00:00<07:38, 32.61it/s][A
  1%|          | 80/15000 [00:00<05:49, 42.70it/s][A
  1%|          | 95/15000 [00:00<04:35, 54.06it/s][A
  1%|          | 109/15000 [00:00<03:44, 66.22it/s][A
  1%|          | 124/15000 [00:00<03:08, 78.76it/s][A
  1%|          | 138/15000 [00:01<02:44, 90.18it/s][A
  1%|          | 153/15000 [00:01<02:26, 101.69it/s][A
  1%|          | 169/15000 [00:01<02:11, 112.84it/s][A
  1%|          | 184/15000 [00:01<02:05, 117.71it/s][A
  1%|▏         | 199/15000 [00:01<01:59, 124.17it/s][A
  1%|▏         | 214/15000 [00:01<01:56, 127.43it/s][A
  2%|▏         | 229/15000 [00:01<01:51, 132.96it/s][A
  2%|▏         | 244/15000 [00:01<01:47

[1,  2000] loss: 0.989



 14%|█▎        | 2040/15000 [00:14<01:22, 156.24it/s][A
 14%|█▎        | 2057/15000 [00:14<01:21, 158.79it/s][A
 14%|█▍        | 2073/15000 [00:14<01:21, 157.88it/s][A
 14%|█▍        | 2090/15000 [00:14<01:20, 160.89it/s][A
 14%|█▍        | 2107/15000 [00:14<01:20, 161.05it/s][A
 14%|█▍        | 2124/15000 [00:14<01:19, 161.20it/s][A
 14%|█▍        | 2141/15000 [00:14<01:19, 161.40it/s][A
 14%|█▍        | 2158/15000 [00:15<01:19, 161.12it/s][A
 14%|█▍        | 2175/15000 [00:15<01:20, 159.66it/s][A
 15%|█▍        | 2191/15000 [00:15<01:21, 157.75it/s][A
 15%|█▍        | 2207/15000 [00:15<01:21, 157.53it/s][A
 15%|█▍        | 2223/15000 [00:15<01:22, 154.39it/s][A
 15%|█▍        | 2240/15000 [00:15<01:21, 157.39it/s][A
 15%|█▌        | 2256/15000 [00:15<01:20, 157.85it/s][A
 15%|█▌        | 2273/15000 [00:15<01:19, 160.30it/s][A
 15%|█▌        | 2290/15000 [00:15<01:19, 160.81it/s][A
 15%|█▌        | 2307/15000 [00:15<01:18, 161.08it/s][A
 15%|█▌        | 2324/15000 [0

[1,  4000] loss: 0.360



 27%|██▋       | 4041/15000 [00:26<01:04, 168.99it/s][A
 27%|██▋       | 4060/15000 [00:26<01:03, 172.39it/s][A
 27%|██▋       | 4078/15000 [00:26<01:03, 172.91it/s][A
 27%|██▋       | 4096/15000 [00:26<01:03, 171.90it/s][A
 27%|██▋       | 4114/15000 [00:26<01:03, 171.30it/s][A
 28%|██▊       | 4132/15000 [00:26<01:03, 170.72it/s][A
 28%|██▊       | 4150/15000 [00:27<01:04, 167.49it/s][A
 28%|██▊       | 4167/15000 [00:27<01:04, 166.82it/s][A
 28%|██▊       | 4184/15000 [00:27<01:05, 165.58it/s][A
 28%|██▊       | 4201/15000 [00:27<01:05, 164.32it/s][A
 28%|██▊       | 4219/15000 [00:27<01:04, 167.17it/s][A
 28%|██▊       | 4236/15000 [00:27<01:04, 167.10it/s][A
 28%|██▊       | 4254/15000 [00:27<01:03, 168.54it/s][A
 28%|██▊       | 4271/15000 [00:27<01:04, 167.59it/s][A
 29%|██▊       | 4288/15000 [00:27<01:05, 163.46it/s][A
 29%|██▊       | 4305/15000 [00:28<01:05, 163.35it/s][A
 29%|██▉       | 4322/15000 [00:28<01:05, 163.80it/s][A
 29%|██▉       | 4339/15000 [0

[1,  6000] loss: 0.263



 40%|████      | 6044/15000 [00:38<00:55, 162.12it/s][A
 40%|████      | 6062/15000 [00:38<00:54, 165.19it/s][A
 41%|████      | 6080/15000 [00:39<00:53, 167.26it/s][A
 41%|████      | 6097/15000 [00:39<00:53, 166.29it/s][A
 41%|████      | 6114/15000 [00:39<00:53, 164.94it/s][A
 41%|████      | 6131/15000 [00:39<00:53, 166.06it/s][A
 41%|████      | 6148/15000 [00:39<00:53, 167.00it/s][A
 41%|████      | 6166/15000 [00:39<00:52, 168.05it/s][A
 41%|████      | 6183/15000 [00:39<00:53, 164.41it/s][A
 41%|████▏     | 6200/15000 [00:39<00:54, 161.10it/s][A
 41%|████▏     | 6217/15000 [00:39<00:55, 158.68it/s][A
 42%|████▏     | 6233/15000 [00:39<00:55, 158.79it/s][A
 42%|████▏     | 6250/15000 [00:40<00:54, 160.26it/s][A
 42%|████▏     | 6267/15000 [00:40<00:53, 162.78it/s][A
 42%|████▏     | 6284/15000 [00:40<00:53, 163.36it/s][A
 42%|████▏     | 6301/15000 [00:40<00:53, 163.99it/s][A
 42%|████▏     | 6318/15000 [00:40<00:53, 163.23it/s][A
 42%|████▏     | 6335/15000 [0

[1,  8000] loss: 0.216



 54%|█████▎    | 8045/15000 [00:51<00:44, 156.05it/s][A
 54%|█████▎    | 8061/15000 [00:51<00:44, 156.87it/s][A
 54%|█████▍    | 8077/15000 [00:51<00:44, 155.95it/s][A
 54%|█████▍    | 8093/15000 [00:51<00:45, 153.31it/s][A
 54%|█████▍    | 8110/15000 [00:51<00:44, 156.19it/s][A
 54%|█████▍    | 8126/15000 [00:51<00:44, 153.51it/s][A
 54%|█████▍    | 8143/15000 [00:51<00:43, 156.20it/s][A
 54%|█████▍    | 8160/15000 [00:51<00:42, 159.60it/s][A
 55%|█████▍    | 8177/15000 [00:52<00:42, 159.26it/s][A
 55%|█████▍    | 8194/15000 [00:52<00:42, 161.09it/s][A
 55%|█████▍    | 8211/15000 [00:52<00:42, 161.10it/s][A
 55%|█████▍    | 8228/15000 [00:52<00:41, 162.80it/s][A
 55%|█████▍    | 8245/15000 [00:52<00:41, 161.91it/s][A
 55%|█████▌    | 8262/15000 [00:52<00:41, 162.98it/s][A
 55%|█████▌    | 8279/15000 [00:52<00:41, 163.88it/s][A
 55%|█████▌    | 8296/15000 [00:52<00:41, 161.96it/s][A
 55%|█████▌    | 8313/15000 [00:52<00:41, 160.76it/s][A
 56%|█████▌    | 8330/15000 [0

[1, 10000] loss: 0.185



 67%|██████▋   | 10039/15000 [01:03<00:31, 158.80it/s][A
 67%|██████▋   | 10056/15000 [01:03<00:30, 160.25it/s][A
 67%|██████▋   | 10073/15000 [01:03<00:30, 162.24it/s][A
 67%|██████▋   | 10090/15000 [01:03<00:30, 159.94it/s][A
 67%|██████▋   | 10107/15000 [01:03<00:30, 158.61it/s][A
 67%|██████▋   | 10124/15000 [01:04<00:30, 160.31it/s][A
 68%|██████▊   | 10141/15000 [01:04<00:30, 161.04it/s][A
 68%|██████▊   | 10159/15000 [01:04<00:29, 164.54it/s][A
 68%|██████▊   | 10177/15000 [01:04<00:29, 166.26it/s][A
 68%|██████▊   | 10194/15000 [01:04<00:29, 162.65it/s][A
 68%|██████▊   | 10211/15000 [01:04<00:29, 162.39it/s][A
 68%|██████▊   | 10228/15000 [01:04<00:29, 161.53it/s][A
 68%|██████▊   | 10245/15000 [01:04<00:29, 161.65it/s][A
 68%|██████▊   | 10262/15000 [01:04<00:29, 160.03it/s][A
 69%|██████▊   | 10279/15000 [01:04<00:29, 160.40it/s][A
 69%|██████▊   | 10296/15000 [01:05<00:30, 155.15it/s][A
 69%|██████▊   | 10312/15000 [01:05<00:30, 155.72it/s][A
 69%|██████▉ 

[1, 12000] loss: 0.173



 80%|████████  | 12035/15000 [01:15<00:18, 161.44it/s][A
 80%|████████  | 12052/15000 [01:15<00:18, 160.62it/s][A
 80%|████████  | 12069/15000 [01:16<00:18, 162.39it/s][A
 81%|████████  | 12086/15000 [01:16<00:18, 161.65it/s][A
 81%|████████  | 12104/15000 [01:16<00:17, 164.53it/s][A
 81%|████████  | 12121/15000 [01:16<00:18, 157.49it/s][A
 81%|████████  | 12138/15000 [01:16<00:17, 159.29it/s][A
 81%|████████  | 12156/15000 [01:16<00:17, 162.99it/s][A
 81%|████████  | 12174/15000 [01:16<00:17, 165.42it/s][A
 81%|████████▏ | 12191/15000 [01:16<00:17, 164.53it/s][A
 81%|████████▏ | 12208/15000 [01:16<00:17, 161.98it/s][A
 82%|████████▏ | 12225/15000 [01:16<00:16, 163.87it/s][A
 82%|████████▏ | 12242/15000 [01:17<00:16, 164.69it/s][A
 82%|████████▏ | 12259/15000 [01:17<00:16, 165.54it/s][A
 82%|████████▏ | 12276/15000 [01:17<00:16, 165.76it/s][A
 82%|████████▏ | 12293/15000 [01:17<00:16, 159.46it/s][A
 82%|████████▏ | 12311/15000 [01:17<00:16, 164.39it/s][A
 82%|████████

[1, 14000] loss: 0.156



 94%|█████████▎| 14051/15000 [01:27<00:05, 168.57it/s][A
 94%|█████████▍| 14068/15000 [01:28<00:05, 167.71it/s][A
 94%|█████████▍| 14085/15000 [01:28<00:05, 166.07it/s][A
 94%|█████████▍| 14102/15000 [01:28<00:05, 161.65it/s][A
 94%|█████████▍| 14119/15000 [01:28<00:05, 159.37it/s][A
 94%|█████████▍| 14136/15000 [01:28<00:05, 160.77it/s][A
 94%|█████████▍| 14154/15000 [01:28<00:05, 164.10it/s][A
 94%|█████████▍| 14171/15000 [01:28<00:05, 161.95it/s][A
 95%|█████████▍| 14188/15000 [01:28<00:05, 157.97it/s][A
 95%|█████████▍| 14204/15000 [01:28<00:05, 156.94it/s][A
 95%|█████████▍| 14220/15000 [01:29<00:05, 155.58it/s][A
 95%|█████████▍| 14236/15000 [01:29<00:04, 155.90it/s][A
 95%|█████████▌| 14254/15000 [01:29<00:04, 160.90it/s][A
 95%|█████████▌| 14271/15000 [01:29<00:04, 161.47it/s][A
 95%|█████████▌| 14288/15000 [01:29<00:04, 163.59it/s][A
 95%|█████████▌| 14305/15000 [01:29<00:04, 164.33it/s][A
 95%|█████████▌| 14322/15000 [01:29<00:04, 164.53it/s][A
 96%|████████

[2,  2000] loss: 0.124



 14%|█▎        | 2048/15000 [00:12<01:19, 162.46it/s][A
 14%|█▍        | 2066/15000 [00:12<01:18, 165.55it/s][A
 14%|█▍        | 2083/15000 [00:12<01:18, 164.04it/s][A
 14%|█▍        | 2100/15000 [00:12<01:19, 163.22it/s][A
 14%|█▍        | 2117/15000 [00:12<01:18, 164.95it/s][A
 14%|█▍        | 2135/15000 [00:12<01:16, 167.71it/s][A
 14%|█▍        | 2152/15000 [00:13<01:17, 166.44it/s][A
 14%|█▍        | 2170/15000 [00:13<01:16, 167.85it/s][A
 15%|█▍        | 2187/15000 [00:13<01:17, 166.12it/s][A
 15%|█▍        | 2204/15000 [00:13<01:17, 166.10it/s][A
 15%|█▍        | 2221/15000 [00:13<01:18, 163.56it/s][A
 15%|█▍        | 2238/15000 [00:13<01:17, 164.01it/s][A
 15%|█▌        | 2255/15000 [00:13<01:19, 159.61it/s][A
 15%|█▌        | 2272/15000 [00:13<01:18, 161.45it/s][A
 15%|█▌        | 2289/15000 [00:13<01:18, 161.82it/s][A
 15%|█▌        | 2306/15000 [00:14<01:18, 161.47it/s][A
 15%|█▌        | 2324/15000 [00:14<01:16, 164.87it/s][A
 16%|█▌        | 2341/15000 [0

[2,  4000] loss: 0.117



 27%|██▋       | 4048/15000 [00:24<01:07, 162.31it/s][A
 27%|██▋       | 4065/15000 [00:24<01:06, 163.46it/s][A
 27%|██▋       | 4082/15000 [00:24<01:07, 161.60it/s][A
 27%|██▋       | 4099/15000 [00:25<01:07, 161.02it/s][A
 27%|██▋       | 4116/15000 [00:25<01:07, 162.03it/s][A
 28%|██▊       | 4133/15000 [00:25<01:07, 161.97it/s][A
 28%|██▊       | 4150/15000 [00:25<01:06, 162.00it/s][A
 28%|██▊       | 4167/15000 [00:25<01:07, 160.04it/s][A
 28%|██▊       | 4185/15000 [00:25<01:05, 163.97it/s][A
 28%|██▊       | 4202/15000 [00:25<01:06, 161.35it/s][A
 28%|██▊       | 4220/15000 [00:25<01:05, 164.61it/s][A
 28%|██▊       | 4237/15000 [00:25<01:05, 165.24it/s][A
 28%|██▊       | 4255/15000 [00:25<01:04, 167.84it/s][A
 28%|██▊       | 4272/15000 [00:26<01:04, 166.13it/s][A
 29%|██▊       | 4290/15000 [00:26<01:03, 169.52it/s][A
 29%|██▊       | 4307/15000 [00:26<01:03, 167.15it/s][A
 29%|██▉       | 4324/15000 [00:26<01:04, 166.67it/s][A
 29%|██▉       | 4341/15000 [0

[2,  6000] loss: 0.120



 40%|████      | 6041/15000 [00:37<00:55, 161.29it/s][A
 40%|████      | 6059/15000 [00:37<00:54, 164.76it/s][A
 41%|████      | 6076/15000 [00:37<00:54, 162.89it/s][A
 41%|████      | 6093/15000 [00:37<00:54, 164.19it/s][A
 41%|████      | 6110/15000 [00:37<00:53, 165.76it/s][A
 41%|████      | 6127/15000 [00:37<00:53, 165.57it/s][A
 41%|████      | 6144/15000 [00:37<00:54, 161.74it/s][A
 41%|████      | 6161/15000 [00:37<00:54, 162.43it/s][A
 41%|████      | 6178/15000 [00:37<00:55, 159.52it/s][A
 41%|████▏     | 6195/15000 [00:37<00:54, 160.40it/s][A
 41%|████▏     | 6212/15000 [00:38<00:56, 154.97it/s][A
 42%|████▏     | 6229/15000 [00:38<00:55, 158.38it/s][A
 42%|████▏     | 6246/15000 [00:38<00:54, 160.42it/s][A
 42%|████▏     | 6263/15000 [00:38<00:53, 162.09it/s][A
 42%|████▏     | 6281/15000 [00:38<00:52, 164.86it/s][A
 42%|████▏     | 6298/15000 [00:38<00:53, 162.77it/s][A
 42%|████▏     | 6315/15000 [00:38<00:53, 163.58it/s][A
 42%|████▏     | 6332/15000 [0

[2,  8000] loss: 0.116



 54%|█████▎    | 8050/15000 [00:49<00:41, 168.32it/s][A
 54%|█████▍    | 8067/15000 [00:49<00:42, 164.70it/s][A
 54%|█████▍    | 8084/15000 [00:49<00:42, 163.46it/s][A
 54%|█████▍    | 8101/15000 [00:49<00:43, 158.41it/s][A
 54%|█████▍    | 8117/15000 [00:49<00:43, 156.91it/s][A
 54%|█████▍    | 8133/15000 [00:49<00:43, 157.52it/s][A
 54%|█████▍    | 8149/15000 [00:50<00:44, 155.64it/s][A
 54%|█████▍    | 8166/15000 [00:50<00:42, 159.16it/s][A
 55%|█████▍    | 8183/15000 [00:50<00:42, 161.44it/s][A
 55%|█████▍    | 8201/15000 [00:50<00:41, 164.23it/s][A
 55%|█████▍    | 8218/15000 [00:50<00:41, 162.69it/s][A
 55%|█████▍    | 8235/15000 [00:50<00:41, 164.70it/s][A
 55%|█████▌    | 8252/15000 [00:50<00:41, 162.30it/s][A
 55%|█████▌    | 8269/15000 [00:50<00:41, 163.83it/s][A
 55%|█████▌    | 8286/15000 [00:50<00:41, 161.18it/s][A
 55%|█████▌    | 8303/15000 [00:51<00:41, 160.48it/s][A
 55%|█████▌    | 8320/15000 [00:51<00:41, 159.53it/s][A
 56%|█████▌    | 8337/15000 [0

[2, 10000] loss: 0.113



 67%|██████▋   | 10041/15000 [01:01<00:30, 162.40it/s][A
 67%|██████▋   | 10058/15000 [01:01<00:30, 164.22it/s][A
 67%|██████▋   | 10075/15000 [01:01<00:29, 164.42it/s][A
 67%|██████▋   | 10092/15000 [01:01<00:29, 164.28it/s][A
 67%|██████▋   | 10109/15000 [01:02<00:29, 164.10it/s][A
 68%|██████▊   | 10126/15000 [01:02<00:29, 164.86it/s][A
 68%|██████▊   | 10143/15000 [01:02<00:29, 164.91it/s][A
 68%|██████▊   | 10160/15000 [01:02<00:29, 164.21it/s][A
 68%|██████▊   | 10177/15000 [01:02<00:29, 161.77it/s][A
 68%|██████▊   | 10194/15000 [01:02<00:29, 163.21it/s][A
 68%|██████▊   | 10211/15000 [01:02<00:29, 160.37it/s][A
 68%|██████▊   | 10228/15000 [01:02<00:29, 162.86it/s][A
 68%|██████▊   | 10245/15000 [01:02<00:28, 164.68it/s][A
 68%|██████▊   | 10262/15000 [01:03<00:28, 163.67it/s][A
 69%|██████▊   | 10279/15000 [01:03<00:28, 165.19it/s][A
 69%|██████▊   | 10297/15000 [01:03<00:28, 167.17it/s][A
 69%|██████▉   | 10314/15000 [01:03<00:28, 166.75it/s][A
 69%|██████▉ 

[2, 12000] loss: 0.093



 80%|████████  | 12039/15000 [01:14<00:18, 159.58it/s][A
 80%|████████  | 12055/15000 [01:14<00:18, 158.88it/s][A
 80%|████████  | 12071/15000 [01:14<00:18, 157.28it/s][A
 81%|████████  | 12088/15000 [01:14<00:18, 159.95it/s][A
 81%|████████  | 12105/15000 [01:14<00:18, 160.48it/s][A
 81%|████████  | 12122/15000 [01:14<00:18, 159.75it/s][A
 81%|████████  | 12139/15000 [01:14<00:17, 161.97it/s][A
 81%|████████  | 12156/15000 [01:14<00:17, 161.84it/s][A
 81%|████████  | 12173/15000 [01:14<00:17, 164.04it/s][A
 81%|████████▏ | 12190/15000 [01:14<00:17, 162.95it/s][A
 81%|████████▏ | 12207/15000 [01:15<00:17, 162.33it/s][A
 81%|████████▏ | 12224/15000 [01:15<00:17, 162.34it/s][A
 82%|████████▏ | 12241/15000 [01:15<00:17, 161.97it/s][A
 82%|████████▏ | 12258/15000 [01:15<00:16, 162.77it/s][A
 82%|████████▏ | 12275/15000 [01:15<00:17, 158.49it/s][A
 82%|████████▏ | 12291/15000 [01:15<00:17, 157.70it/s][A
 82%|████████▏ | 12307/15000 [01:15<00:17, 158.05it/s][A
 82%|████████

[2, 14000] loss: 0.103



 94%|█████████▎| 14034/15000 [01:26<00:06, 160.20it/s][A
 94%|█████████▎| 14051/15000 [01:26<00:05, 161.82it/s][A
 94%|█████████▍| 14068/15000 [01:26<00:05, 163.46it/s][A
 94%|█████████▍| 14085/15000 [01:26<00:05, 158.00it/s][A
 94%|█████████▍| 14101/15000 [01:26<00:05, 156.25it/s][A
 94%|█████████▍| 14117/15000 [01:26<00:05, 152.88it/s][A
 94%|█████████▍| 14133/15000 [01:27<00:05, 150.38it/s][A
 94%|█████████▍| 14149/15000 [01:27<00:05, 149.87it/s][A
 94%|█████████▍| 14165/15000 [01:27<00:05, 150.96it/s][A
 95%|█████████▍| 14181/15000 [01:27<00:05, 152.64it/s][A
 95%|█████████▍| 14197/15000 [01:27<00:05, 153.50it/s][A
 95%|█████████▍| 14213/15000 [01:27<00:05, 154.01it/s][A
 95%|█████████▍| 14229/15000 [01:27<00:05, 152.98it/s][A
 95%|█████████▍| 14245/15000 [01:27<00:04, 153.73it/s][A
 95%|█████████▌| 14261/15000 [01:27<00:04, 152.44it/s][A
 95%|█████████▌| 14278/15000 [01:27<00:04, 155.06it/s][A
 95%|█████████▌| 14294/15000 [01:28<00:04, 153.88it/s][A
 95%|████████

[3,  2000] loss: 0.091



 14%|█▎        | 2042/15000 [00:12<01:21, 159.05it/s][A
 14%|█▎        | 2059/15000 [00:12<01:20, 159.79it/s][A
 14%|█▍        | 2075/15000 [00:12<01:23, 155.28it/s][A
 14%|█▍        | 2091/15000 [00:12<01:22, 156.19it/s][A
 14%|█▍        | 2108/15000 [00:12<01:21, 159.02it/s][A
 14%|█▍        | 2124/15000 [00:13<01:22, 155.23it/s][A
 14%|█▍        | 2140/15000 [00:13<01:24, 152.35it/s][A
 14%|█▍        | 2156/15000 [00:13<01:23, 153.84it/s][A
 14%|█▍        | 2173/15000 [00:13<01:22, 155.88it/s][A
 15%|█▍        | 2189/15000 [00:13<01:22, 155.95it/s][A
 15%|█▍        | 2206/15000 [00:13<01:20, 158.32it/s][A
 15%|█▍        | 2223/15000 [00:13<01:20, 159.38it/s][A
 15%|█▍        | 2239/15000 [00:13<01:21, 157.31it/s][A
 15%|█▌        | 2256/15000 [00:13<01:19, 160.50it/s][A
 15%|█▌        | 2274/15000 [00:13<01:17, 163.74it/s][A
 15%|█▌        | 2291/15000 [00:14<01:16, 165.48it/s][A
 15%|█▌        | 2308/15000 [00:14<01:16, 166.12it/s][A
 16%|█▌        | 2325/15000 [0

[3,  4000] loss: 0.085



 27%|██▋       | 4040/15000 [00:24<01:07, 162.91it/s][A
 27%|██▋       | 4057/15000 [00:24<01:07, 162.02it/s][A
 27%|██▋       | 4076/15000 [00:24<01:05, 167.71it/s][A
 27%|██▋       | 4093/15000 [00:25<01:04, 167.88it/s][A
 27%|██▋       | 4110/15000 [00:25<01:05, 165.87it/s][A
 28%|██▊       | 4129/15000 [00:25<01:03, 171.33it/s][A
 28%|██▊       | 4147/15000 [00:25<01:03, 170.57it/s][A
 28%|██▊       | 4165/15000 [00:25<01:03, 170.24it/s][A
 28%|██▊       | 4183/15000 [00:25<01:04, 167.56it/s][A
 28%|██▊       | 4200/15000 [00:25<01:04, 167.85it/s][A
 28%|██▊       | 4217/15000 [00:25<01:04, 168.22it/s][A
 28%|██▊       | 4234/15000 [00:25<01:03, 168.41it/s][A
 28%|██▊       | 4251/15000 [00:26<01:04, 166.52it/s][A
 28%|██▊       | 4268/15000 [00:26<01:04, 165.56it/s][A
 29%|██▊       | 4285/15000 [00:26<01:05, 164.78it/s][A
 29%|██▊       | 4304/15000 [00:26<01:03, 169.65it/s][A
 29%|██▉       | 4322/15000 [00:26<01:02, 170.35it/s][A
 29%|██▉       | 4340/15000 [0

[3,  6000] loss: 0.081



 40%|████      | 6045/15000 [00:36<00:54, 163.07it/s][A
 40%|████      | 6063/15000 [00:36<00:53, 167.00it/s][A
 41%|████      | 6080/15000 [00:37<00:53, 165.97it/s][A
 41%|████      | 6097/15000 [00:37<00:53, 165.22it/s][A
 41%|████      | 6114/15000 [00:37<00:54, 164.47it/s][A
 41%|████      | 6131/15000 [00:37<00:54, 163.25it/s][A
 41%|████      | 6149/15000 [00:37<00:53, 165.80it/s][A
 41%|████      | 6166/15000 [00:37<00:53, 164.30it/s][A
 41%|████      | 6183/15000 [00:37<00:53, 164.39it/s][A
 41%|████▏     | 6200/15000 [00:37<00:54, 161.97it/s][A
 41%|████▏     | 6217/15000 [00:37<00:53, 163.88it/s][A
 42%|████▏     | 6234/15000 [00:38<00:54, 162.22it/s][A
 42%|████▏     | 6251/15000 [00:38<00:54, 161.16it/s][A
 42%|████▏     | 6268/15000 [00:38<00:53, 162.00it/s][A
 42%|████▏     | 6285/15000 [00:38<00:53, 163.04it/s][A
 42%|████▏     | 6302/15000 [00:38<00:52, 164.30it/s][A
 42%|████▏     | 6319/15000 [00:38<00:52, 165.82it/s][A
 42%|████▏     | 6336/15000 [0

[3,  8000] loss: 0.085



 54%|█████▎    | 8047/15000 [00:49<00:44, 157.29it/s][A
 54%|█████▍    | 8063/15000 [00:49<00:44, 157.27it/s][A
 54%|█████▍    | 8079/15000 [00:49<00:44, 156.17it/s][A
 54%|█████▍    | 8097/15000 [00:49<00:42, 160.63it/s][A
 54%|█████▍    | 8114/15000 [00:49<00:43, 157.38it/s][A
 54%|█████▍    | 8130/15000 [00:49<00:44, 155.38it/s][A
 54%|█████▍    | 8146/15000 [00:49<00:44, 153.92it/s][A
 54%|█████▍    | 8163/15000 [00:49<00:43, 157.61it/s][A
 55%|█████▍    | 8180/15000 [00:49<00:42, 160.01it/s][A
 55%|█████▍    | 8197/15000 [00:50<00:42, 161.82it/s][A
 55%|█████▍    | 8215/15000 [00:50<00:41, 164.38it/s][A
 55%|█████▍    | 8232/15000 [00:50<00:41, 164.21it/s][A
 55%|█████▍    | 8249/15000 [00:50<00:40, 165.21it/s][A
 55%|█████▌    | 8266/15000 [00:50<00:40, 166.34it/s][A
 55%|█████▌    | 8283/15000 [00:50<00:40, 165.44it/s][A
 55%|█████▌    | 8300/15000 [00:50<00:40, 165.42it/s][A
 55%|█████▌    | 8317/15000 [00:50<00:41, 162.31it/s][A
 56%|█████▌    | 8334/15000 [0

[3, 10000] loss: 0.075



 67%|██████▋   | 10039/15000 [01:01<00:33, 149.12it/s][A
 67%|██████▋   | 10056/15000 [01:01<00:32, 153.24it/s][A
 67%|██████▋   | 10073/15000 [01:01<00:31, 157.56it/s][A
 67%|██████▋   | 10089/15000 [01:02<00:31, 156.53it/s][A
 67%|██████▋   | 10106/15000 [01:02<00:30, 157.97it/s][A
 67%|██████▋   | 10123/15000 [01:02<00:30, 159.30it/s][A
 68%|██████▊   | 10140/15000 [01:02<00:30, 161.41it/s][A
 68%|██████▊   | 10158/15000 [01:02<00:29, 164.56it/s][A
 68%|██████▊   | 10175/15000 [01:02<00:29, 164.31it/s][A
 68%|██████▊   | 10192/15000 [01:02<00:29, 163.34it/s][A
 68%|██████▊   | 10209/15000 [01:02<00:29, 160.21it/s][A
 68%|██████▊   | 10226/15000 [01:02<00:29, 160.56it/s][A
 68%|██████▊   | 10244/15000 [01:03<00:28, 164.08it/s][A
 68%|██████▊   | 10261/15000 [01:03<00:29, 160.12it/s][A
 69%|██████▊   | 10278/15000 [01:03<00:30, 156.56it/s][A
 69%|██████▊   | 10294/15000 [01:03<00:30, 154.77it/s][A
 69%|██████▊   | 10310/15000 [01:03<00:30, 153.20it/s][A
 69%|██████▉ 

[3, 12000] loss: 0.077



 80%|████████  | 12036/15000 [01:14<00:20, 144.66it/s][A
 80%|████████  | 12054/15000 [01:14<00:19, 152.14it/s][A
 80%|████████  | 12071/15000 [01:14<00:18, 155.83it/s][A
 81%|████████  | 12088/15000 [01:14<00:18, 159.20it/s][A
 81%|████████  | 12105/15000 [01:14<00:18, 160.81it/s][A
 81%|████████  | 12122/15000 [01:14<00:17, 160.89it/s][A
 81%|████████  | 12139/15000 [01:14<00:17, 161.29it/s][A
 81%|████████  | 12156/15000 [01:14<00:17, 160.98it/s][A
 81%|████████  | 12173/15000 [01:15<00:17, 160.38it/s][A
 81%|████████▏ | 12190/15000 [01:15<00:17, 160.10it/s][A
 81%|████████▏ | 12207/15000 [01:15<00:17, 159.94it/s][A
 81%|████████▏ | 12224/15000 [01:15<00:17, 159.86it/s][A
 82%|████████▏ | 12240/15000 [01:15<00:17, 158.27it/s][A
 82%|████████▏ | 12256/15000 [01:15<00:17, 158.73it/s][A
 82%|████████▏ | 12272/15000 [01:15<00:17, 157.61it/s][A
 82%|████████▏ | 12288/15000 [01:15<00:17, 157.13it/s][A
 82%|████████▏ | 12304/15000 [01:15<00:17, 156.46it/s][A
 82%|████████

[3, 14000] loss: 0.083



 94%|█████████▎| 14043/15000 [01:26<00:05, 164.29it/s][A
 94%|█████████▎| 14061/15000 [01:26<00:05, 167.73it/s][A
 94%|█████████▍| 14078/15000 [01:26<00:05, 165.58it/s][A
 94%|█████████▍| 14095/15000 [01:26<00:05, 166.12it/s][A
 94%|█████████▍| 14112/15000 [01:27<00:05, 164.24it/s][A
 94%|█████████▍| 14129/15000 [01:27<00:05, 160.58it/s][A
 94%|█████████▍| 14146/15000 [01:27<00:05, 161.68it/s][A
 94%|█████████▍| 14163/15000 [01:27<00:05, 159.23it/s][A
 95%|█████████▍| 14181/15000 [01:27<00:05, 162.64it/s][A
 95%|█████████▍| 14198/15000 [01:27<00:05, 158.83it/s][A
 95%|█████████▍| 14214/15000 [01:27<00:04, 158.75it/s][A
 95%|█████████▍| 14230/15000 [01:27<00:04, 158.53it/s][A
 95%|█████████▍| 14247/15000 [01:27<00:04, 159.54it/s][A
 95%|█████████▌| 14263/15000 [01:28<00:04, 157.50it/s][A
 95%|█████████▌| 14280/15000 [01:28<00:04, 158.99it/s][A
 95%|█████████▌| 14297/15000 [01:28<00:04, 161.05it/s][A
 95%|█████████▌| 14314/15000 [01:28<00:04, 162.33it/s][A
 96%|████████

Обучение закончено





Протестируем на всём тестовом датасете, используя метрику accuracy_score:

In [11]:
class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))

with torch.no_grad():
    for data in testloader:
        images, labels = data
        y_pred = net(images)
        _, predicted = torch.max(y_pred, 1)
        c = (predicted == labels).squeeze()
        for i in range(4):
            label = labels[i]
            class_correct[label] += c[i].item()
            class_total[label] += 1


for i in range(10):
    print('Accuracy of %5s : %2d %%' % (
        classes[i], 100 * class_correct[i] / class_total[i]))

Accuracy of     0 : 99 %
Accuracy of     1 : 99 %
Accuracy of     2 : 99 %
Accuracy of     3 : 97 %
Accuracy of     4 : 99 %
Accuracy of     5 : 98 %
Accuracy of     6 : 98 %
Accuracy of     7 : 97 %
Accuracy of     8 : 95 %
Accuracy of     9 : 94 %


Два свёрточных слоя побили многослойную нейросеть. Не магия ли?

---

### Задача 1

Протестируйте эту нейросеть на отдельных картинках из тестового датасета: напишите функцию, которая принимает индекс картинки в тестовом датасете, отрисовывает её, потом запускает на ней модель (нейросеть) и выводит результат предсказания.

In [0]:
# Ваш код здесь

---

<h3 style="text-align: center;"><b>CIFAR10</b></h3>

<img src="https://raw.githubusercontent.com/soumith/ex/gh-pages/assets/cifar10.png" width=500>

**CIFAR10:** это набор из 60k картинок 32х32х3, 50k которых составляют обучающую выборку, и оставшиеся 10k - тестовую. Классов в этом датасете 10: `'plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'`.

Скачаем и загрузим в `loader`'ы:

**Обратите внимание на аргумент `batch_size`:** именн он будет отвечать за размер батча, который будет подаваться при оптимизации нейросети

In [0]:
transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
                                         shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

In [0]:
# случайный индекс от 0 до размера тренировочной выборки
i = np.random.randint(low=0, high=50000)

plt.imshow(trainloader.dataset.train_data[i], cmap='gray');

То есть мы имеем дело с кусочками данных размера batch_size (в данном случае = 4), причём в каждом батче есть как объекты, так и ответы на них (то есть и $X$, и $y$).

Данные готовы, мы даже на них посмотрели. **Однако учтите** - при подаче в нейросеть мы будем разворачивать картинку 32х32х3 в строку 1х(32`*`32`*`3) = 1х3072, то есть мы считаем пиксели (значения интенсивности в пикселях) за признаки нашего объекта (картинки).  

К делу:

### Задача 2

Напишите свою свёрточную нейросеть для предсказания на CIFAR10.

In [0]:
# ЗАМЕТЬТЕ: КЛАСС НАСЛЕДУЕТСЯ ОТ nn.Module
class MyConvNet(nn.Module):
    def __init__(self):
        # вызов конструктора предка
        super(MyConvNet, self).__init__()
        # Ваш код здесь
        pass

    def forward(self, x):
        # Ваш код здесь
        pass

Обучим:

In [0]:
from tqdm import tqdm_notebook

In [0]:
# пример взят из официального туториала: 
# https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html

net = MyConvNet()

loss_fn = torch.nn.CrossEntropyLoss()

learning_rate = 1e-4
optimizer = torch.optim.Adam(net.parameters(), lr=learning_rate)

# итерируемся
for epoch in tqdm_notebook(range(3)):

    running_loss = 0.0
    for i, batch in enumerate(tqdm_notebook(trainloader)):
        # так получаем текущий батч
        X_batch, y_batch = batch
        
        # РАЗВОРАЧИВАЕМ КАРТИНКУ В СТРОКУ
        X_batch = X_batch.view(4, -1)

        # обнуляем веса
        optimizer.zero_grad()

        # forward + backward + optimize
        y_pred = net(X_batch)
        loss = loss_fn(y_pred, y_batch)
        loss.backward()
        optimizer.step()

        # выведем текущий loss
        running_loss += loss.item()
        # выводем качество каждые 2000 батчей
        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

print('Обучение закончено')

Посмотрим на accuracy на тестовом датасете:

In [0]:
class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))

with torch.no_grad():
    for data in testloader:
        images, labels = data
        y_pred = net(images.view(4, -1))
        _, predicted = torch.max(y_pred, 1)
        c = (predicted == labels).squeeze()
        for i in range(4):
            label = labels[i]
            class_correct[label] += c[i].item()
            class_total[label] += 1


for i in range(10):
    print('Accuracy of %5s : %2d %%' % (
        classes[i], 100 * class_correct[i] / class_total[i]))

Как думаете, этого достаточно?

### Задача 3  

Улучшите свёрточную нейросеть: поэкспериментируйте с архитектурой (количество слоёв, порядок слоёв), с гиперпараметрами слоёв (размеры kernel_size, размеры pooling'а, количество kernel'ов в свёрточном слое) и с гиперпараметрами, указанными в "Компоненты нейросети" (см. памятку выше).

In [0]:
# Ваш код здесь

(Ожидаемый результат -- скорее всего, сходу Вам не удастся выжать из Вашей сетки больше, чем ~70% accuracy (в среднем по всем классам). Если это что-то в этом районе - Вы хорошо постарались).

<h3 style="text-align: center;"><b>Полезные ссылки</b></h3>

1). *Примеры написания нейросетей на PyTorch (офийиальные туториалы) (на английском): https://pytorch.org/tutorials/beginner/pytorch_with_examples.html#examples  
https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html*

2). ***Один из самых подробных и полных курсов по deep learning на данный момент - это курс Стэнфордского Университета (он вообще сейчас один из лидеров в области ИИ, его выпускники работают в Google, Facebook, Amazon, Microsoft, в стартапах в Кремниевой долине):  http://cs231n.github.io/***  

3). Практически исчерпывающая информация по основам свёрточных нейросетей (из cs231n) (на английском):  

http://cs231n.github.io/convolutional-networks/  
http://cs231n.github.io/understanding-cnn/  
http://cs231n.github.io/transfer-learning/

4). Видео о Computer Vision от Andrej Karpathy: https://www.youtube.com/watch?v=u6aEYuemt0M