# Полносвязная (искусственная) нейронная сеть

В этом задании вам предстоит реализовать полносвязную двухслойную нейронную сеть с помощью библиотеки Numpy и применить её для классификации.

Архитектура сети будет выглядеть следующим образом:

Входные данные $→$ Линейный слой $→$ Функция активации $→$ Линейный слой $→$ Softmax $→$ Loss

# 1. Датасет

Для задачи будем использовать датасет CIFAR-10 [[ссылка](https://www.cs.toronto.edu/~kriz/cifar.html)]. Загрузим датасет, приведем значения пикселей к интервалу $[0, 1]$, а также осуществим one-hot кодирование целевого вектора.

Отобразите несколько изображений и соответствующие им классы.

In [None]:
import numpy as np
from torchvision import datasets

# Загрузка датасета
trainset = datasets.CIFAR10(root='./data', train=True, download=True)
valset = datasets.CIFAR10(root='./data', train=False, download=True)
num_classes = 10

x_train = np.stack([np.array(img)/255. for img, _ in trainset])  # (N, H, W, C)
x_train = x_train.reshape(-1, 32*32*3) # (N, H*W*C)
y_train = np.array([label for _, label in trainset], dtype=int)
# one hot representation
y_train = np.eye(num_classes)[y_train]

x_val = np.stack([np.array(img)/255. for img, _ in valset])
x_val = x_val.reshape(-1, 32*32*3)
y_val = np.array([label for _, label in valset], dtype=int)
# one hot representation
y_val = np.eye(num_classes)[y_val]


# YOUR CODE HERE

# 2. Реализация слоев нейронной сети
В этом пункте необходимо реализовать forward pass и backward pass для используемых слоев (см. `nn_numpy_funcs.py`). Функции должны возвращать либо результат действия слоя на входные данные, либо, если `get_grad=True`, градиент(ы).

1. **Линейный слой**
$$ f(x, W, b) = xW + b $$


2. **ReLU**

В качестве функции активации будем использовать ReLU:
$$ ReLU(x) = max(x, 0)$$


3. **Softmax + Cross-entropy loss**

$$s_i(x) = \frac{e^{x_i}}{\sum\limits_{j}^K e^{x_j}} $$
$$CE(y, \hat{y}) = - \frac{1}{N}\sum\limits_i^N \sum\limits_j^K y_j \ln\hat{y_j}$$
где $K-$количество классов, $N-$ количество объектов.

Если мы используем Softmax вместе с функцией потерь в виде кросс-энтропии, то удобно объединить их вместе в один слой из-за удобства получаемых выражений. Напишите выражения для функции потерь и для градиента (можно без полного вывода) и реализуйте функцию аналогично прошлым пунктам.

# 3. Обучение
До начала обучения необходимо сделать еще несколько шагов:

- **Инициализация весов**. Начальные значения матриц весов могут сильно влиять на ход обучения. Инициализируйте матрицы $W$ и $b$ случайными числами из нормального распределения (функция `init_weights()`).
- Выбор **темпа обучения (learning rate)**. Гиперпараметр, отвечающий за размер шага в алгоритме градиентного спуска.
- Выбор **количества нейронов в скрытом слое**
- **Размер батча**. В глубоком обучении через нейронную сеть редко пропускают сразу весь датасет. Вместо этого входные данные делят на части, которые называются **батчи (batch)**, и пропускают по очереди через сеть, обновляя веса после каждой итерации. Когда все батчи из датасета были использованы для forward и backward проходов, заканчивается **эпоха обучения**. Такой подход позволяет избежать проблем с памятью (датасет может не помещаться в память целиком), а также улучшить сходимость (обновляем веса после каждого батча, а не только один раз после прохода всего датасета).

    Выберите размер батча и разбейте датасет на части (функция `get_batches()`).
- Метрика **accuracy** будет использоваться как оценка качества модели (функция `accuracy()`)

Реализуйте процесс обучения сети с заданными параметрами. В конце каждой эпохи выводите значения тренировочного и валидационного **лосса**, а также метрики
**Accuracy** (функция `accuracy()`). Для удобства и стабильности перед обновлением весов следует разделить значения градиентов на размер батча. В конце обучения постройте зависимости лоссов и метрик от номера эпохи.

Вам необходимо достичь значения Accuracy на валидационном датасете в 50% или более.

In [None]:
NUM_EPOCH =
BATCH_SIZE_TRAIN =
BATCH_SIZE_VAL =

INPUT_SIZE = 32 * 32 * 3 # размер картинки
HIDDEN_SIZE =
OUTPUT_SIZE = 10 # 10 классов
LR =

# YOUR CODE HERE

# for epochs

    # for train batches
    

    # for val batches

## **Перед отправкой сохраните файлы в следующем формате: 02_Фамилия.ipynb и nn_numpy_funcs.py**