# <center> Классификация рукописных цифр
<img src='imgs/mnist_examples.png' width=80%>

# Подготовка

#### Импортируем библиотеки

In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
import torch
from source.network import NNClassifier
from source.helpme import show_history, show_image, load_mnist
import numpy as np

#### Загрузим датасет

In [None]:
X, y = load_mnist(shape='vector') # X - картинки, y - ответы (классы)

In [None]:
# посмотрим как выглядит картинка (преобразовав вектор в матрицу)
show_image(X[0])

In [None]:
# а вот как выглядит та же картинки в виде вектора (раскоментируйте следующую строку)
# print(X[0])

In [None]:
# посмотрим какие размерности у наших данных
print(X.shape, y.shape)

# Полносвязная нейросеть (1 слой)

In [None]:
class Softmax_layer(torch.nn.Module):
    def __init__(self):
        super().__init__()
    
    def forward(self, x):
        e = torch.exp(x - x.max(1, True)[0] )
        summ = e.sum(1, True)[0]
        return e / summ

In [None]:
one_layer_net = torch.nn.Sequential(torch.nn.Linear(28*28, 10))

<br>
Используем класс NNClassifier, который имеет следующие методы:
- **fit(X, y, epochs, batch_size, valid_data)** - обучает нейросеть
- **predict_proba(X, batch_size)** - предсказывает вероятности
- **predict(X, batch_size)** - предсказывает к какому классу относится каждый объект
- **evaluate_score(X, y, batch_size)** - возвращает долю угаданных объектов
- **loss(X, y, batch_size)** - рассчитывает ошибку
<br>
<br>
<br>
*batch_size* - это количество данных, которые нейросеть обрабатывает за один раз<br>
*valid_data* - это данные для валидации работы нейросети

In [None]:
# создадим объект класса NNClassifier, передав архитектуру нейросети и learning rate (шаг обучения)
model_1 = NNClassifier(one_layer_net, lr=1e-4)

In [None]:
# разобьем датасет на три части: тренировочная, валидационная и тестовая
X_train = X[:10000]
y_train = y[:10000]

X_valid = X[10000:10500]
y_valid = y[10000:10500]

X_test = X[-50000:]
y_test = y[-50000:]

In [None]:
# обучим нейросеть на тренировочных данных, фиксируя результат классификации на валидационной части датасета
model_1.fit(X_train, y_train, epochs=75, batch_size=256, 
          valid_data=(X_valid, y_valid))

In [None]:
# посмотрим на графики ошибок на тренировочной и валидационной частях
show_history(model_1.train_history, model_1.valid_history)

In [None]:
# посмотрим на процент долю ответов
acc = model_1.evaluate_score(X_test, y_test)

print("Правильно угадано %d%% картинок" % (int(acc * 100)))

# Полносвязная нейросеть (2 слоя)

In [None]:
two_layer_net = torch.nn.Sequential(torch.nn.Linear(28*28, 128),
                                    torch.nn.ReLU(),
                                    torch.nn.Linear(128, 10))

In [None]:
# создадим объект класса NNClassifier, передав архитектуру нейросети и learning rate (шаг обучения)
model_2 = NNClassifier(two_layer_net, lr=1e-4)

In [None]:
# обучим нейросеть на тренировочных данных, фиксируя результат классификации на валидационной части датасета
model_2.fit(X_train, y_train, epochs=75, batch_size=256, 
          valid_data=(X_valid, y_valid))

In [None]:
# посмотрим на графики ошибок на тренировочной и валидационной частях
show_history(model_2.train_history, model_2.valid_history)

In [None]:
# посмотрим на процент долю ответов
acc = model_2.evaluate_score(X_test, y_test)

print("Правильно угадано %d%% картинок" % (int(acc * 100)))

# Полносвязная нейросеть (3 слоя)

In [None]:
three_layer_net = torch.nn.Sequential(torch.nn.Linear(28*28, 128),
                                    torch.nn.ReLU(),
                                    
                                    torch.nn.Linear(128, 128),
                                    torch.nn.ReLU(),
                                    
                                    torch.nn.Linear(128, 10))

In [None]:
# создадим объект класса NNClassifier, передав архитектуру нейросети и learning rate (шаг обучения)
model_3 = NNClassifier(three_layer_net, lr=1e-4)

In [None]:
# обучим нейросеть на тренировочных данных, фиксируя результат классификации на валидационной части датасета
model_3.fit(X_train, y_train, epochs=75, batch_size=256, 
          valid_data=(X_valid, y_valid))

In [None]:
# посмотрим на графики ошибок на тренировочной и валидационной частях
show_history(model_3.train_history, model_3.valid_history)

In [None]:
# посмотрим на процент долю ответов
acc = model_3.evaluate_score(X_test, y_test)

print("Правильно угадано %d%% картинок" % (int(acc * 100)))

# Полносвязная нейросеть (3 слоя + Batch Normalization)

In [None]:
three_layer_net_bn = torch.nn.Sequential(torch.nn.Linear(28*28, 128),
                                      torch.nn.ReLU(), 
                                      torch.nn.BatchNorm1d(128),
                                    
                                      torch.nn.Linear(128, 128),
                                      torch.nn.ReLU(),
                                      torch.nn.BatchNorm1d(128),
                                    
                                      torch.nn.Linear(128, 10))

In [None]:
# создадим объект класса NNClassifier, передав архитектуру нейросети и learning rate (шаг обучения)
model_3_bn = NNClassifier(three_layer_net_bn, lr=1e-4)

In [None]:
# обучим нейросеть на тренировочных данных, фиксируя результат классификации на валидационной части датасета
model_3_bn.fit(X_train, y_train, epochs=75, batch_size=256)

In [None]:
# посмотрим на графики ошибок на тренировочной и валидационной частях
show_history(model_3_bn.train_history, model_3_bn.valid_history)

In [None]:
# посмотрим на процент долю ответов
acc = model_3_bn.evaluate_score(X_test, y_test)

print("Правильно угадано %d%% картинок" % (int(acc * 100)))

# Ваша нейросеть

In [None]:
# net = torch.nn.Sequential()

In [None]:
# model = NNClassifier(net, lr=1e-4)

In [None]:
# model.fit(X_train, y_train, epochs=, batch_size=256, valid_data=(X_valid, y_valid))

In [None]:
# show_history(model.train_history, model.valid_history)

In [None]:
# посмотрим на процент долю ответов
# acc = model.evaluate_score(X_test, y_test)

# print("Правильно угадано %d%% картинок" % (int(acc * 100)))