# Многослойная нейронная сеть

Задание: создать модель используя нейронную сеть с полносвязными слоями, подобрать гиперпараметры и протестировать на тестовой выборке.

Порядок выполнения:
1. Загрузить базу данных по варианту;
1. Разделить данные на выборки: обучающую, проверочную и тестовую;
1. Провести предварительную обработку данных;
1. Используя фреймворк PyTorch создать нейронную сеть;
1. Обучить нейронную сеть;
1. Подобрать гиперпараметры;
1. Оценить результаты лучшей модели на тестовой выборке.

Ссылки:
1. [Официальная документация](https://pytorch.org/docs/stable/index.html)
1. [Туториал по PyTorch](https://neurohive.io/ru/tutorial/glubokoe-obuchenie-s-pytorch/)

## Варианты


Вариант1 - Kuzushiji-MNIST [Unown-MNIST на github](https://github.com/lopeLH/unown-mnist)2

Вариант2 - DermaMNIST [MedMNIST v2 на github](https://github.com/MedMNIST/MedMNIST)3

Вариант3 - CINIC-10 [CINIC-10 на github](https://github.com/BayesWatch/cinic-10)4

Вариант4 - Simpsons-MNIST-Grayscale [Simpsons-MNIST на Github](https://github.com/alvarobartt/simpsons-mnist)5

In [None]:
# Импортируйте PyTorch и необходимые модули для работы с фреймворком



In [None]:
# Загрузите данные

# Ваш код

# Создайте объекты DataLoader для ваших выборок, размер пакета (batch) выбирите 32, 64 или 128

train_dataloader =  # DataLoader()
val_dataloader = # DataLoader()
test_dataloader = # DataLoader()

In [None]:
# Напишите ответ какого ранга тензор, содержащий 1 пакет ваших данных и укажите размерности этого тензора

# Ваш ответ

In [None]:
# Код для получения доступных устройств, которые потом можно задействовать при обучении

device = (
    "cuda"
    if torch.cuda.is_available()
    else "mps"
    if torch.backends.mps.is_available()  # Для mps device enables high-performance training on GPU for MacOS devices with Metal programming framework
    else "cpu"
)
print(f"Используется {device}")

In [None]:
# Напишите вашу реализацию NeuralNetwork для нейронной сети
# Не забудьте преобразовать ваши данные в одномерный тензор с помощью flatten()

class NeuralNetwork(nn.Module):
    def __init__(self):
        super().__init__()
        
        # Ваш код
        pass

    def forward(self, x):

        # Ваш код
        pass

In [None]:
# Для экземпляра вашей нейронной сети можно использовать метод .to(device), чтобы перенести на GPU, если она доступна
# Если вы используете .to(device) для модели, то не забудьте батчи и метки тоже перенести.

model = NeuralNetwork()  # .to(device)
print(model)

In [None]:
# попробуйте сперва обучить модель с этими гиперпараметрами
learning_rate = 1e-3
epochs = 3

# выбирите функцию потерь для вашей задачи
loss_fn = None

# выбирите один из оптимизаторов и укажите подходящие параметры
optimizer = None

In [None]:
def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    # Переключим модель в режим обучния
    model.train()
    for batch, (X, y) in enumerate(dataloader):
        # Вычислите предсказание, потери и метрики точности
        # Сохраните значение потерь и точности для построения графика
        # Ваш код

        # Обратное распространение ошибки, не забудьте обнулить градиенты
        # Ваш код


def test_loop(dataloader, model, loss_fn):
    # Переключим модель в режим оценки
    model.eval()
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss, correct = 0, 0

    # Оценка модели в контексте torch.no_grad() гарантирует, что в тестовом режиме градиенты не будут вычисляться.
    with torch.no_grad():
        for X, y in dataloader:
            # Напишите код для расчета предсказаний, потерь и метрики точности
            # Сохраните значение потерь и точности для построения графика
            # Ваш код

In [None]:
for t in range(epochs):
    train_loop(train_dataloader, model, loss_fn, optimizer)
    test_loop(test_dataloader, model, loss_fn)

# Постройте графики потерь и точности на обучающей и валидационной выборках.
# По графикам оцените как шло обучение модели.

## Подбор гиперпараметров

In [None]:
# Задание: подберите гиперпараметры сети используя валидационную выборку. 
# Попробуйте разные варианты архитектуры (глубина, ширина), количество эпох, скорость обучения.
# Возможно нормализация данных поможет повысить точность.
# Из не менее 6 вариантов модели выбирите лучшую и сохраните в best_net

# Ваш код

best_net = None # сохраните лучший экземпляр вашей сети

## Установка модуля для оценки модели

С помощью модуля torchinfo оцените размер вашей модели и количество параметров

[torchinfo на github](https://github.com/TylerYep/torchinfo)

Команды для выполнения в терминале
```
pip install torchinfo
```

```
conda install -c conda-forge torchinfo
```

```
mamba install -c conda-forge torchinfo
```

Если необходимо выполнить команду в самой среде Jupyter то перед командой добавьте !, например:

```
!pip install torchinfo
```

In [None]:
from torchinfo import summary
summary(best_net, input_size=(None))  # в input_size укажите правильные размерности 1 пакета данных

### Запуск на тестовой выборке

Осталось получить финальные показатели точности для лучшей модели на **тестовой выборке**

In [None]:
test_acc =  # Ваш код
print('Точность на тестовой выборке: ', test_acc)

In [None]:
# Постройте матрицу смешения (confusion matrix)
# Опишите гипотезу о возможных проблемах вашей модели

In [None]:
# Можете сохранить модель и переиспользовать ее в будущем.

# torch.save(model, 'model.pth')

## Контрольные вопросы

1. Что такое гиперпараметры модели?
2. Как можно осуществлять подбор гиперпараметров?
3. Зачем данные передавать пакетами (batch)?
3. На что влияет размер пакета (batch)?
4. Расскажите основные этапы цикла обучения (train loop)
5. Из каких модулей строится модель в Pytorch?
6. Какая или какие функции потерь подходят для задачи классификации?
7. Какую информацию вы можете извлечь из графиков потерь и точности?