# Импорт Библиотек

In [310]:
import pandas as pd

import torch
from torch import nn
import torch.optim as optim
from torch.utils.data import TensorDataset, DataLoader

from sklearn.model_selection import train_test_split

# Установим сиды для рандома

In [311]:
seed = 42

torch.manual_seed(seed)
torch.cuda.manual_seed_all(seed)

torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False

#A.seed_everything(seed)

# Установим устройство (CPU или GPU)

In [312]:
torch.cuda.is_available(), torch.backends.cudnn.enabled

(True, True)

In [313]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda')

# Импорт Данных

То, на чем будем учиться

In [314]:
train = pd.read_csv('train.csv')

In [315]:
print(train.shape)
train.head()

(42000, 785)


Unnamed: 0,label,pixel0,pixel1,pixel2,pixel3,pixel4,pixel5,pixel6,pixel7,pixel8,...,pixel774,pixel775,pixel776,pixel777,pixel778,pixel779,pixel780,pixel781,pixel782,pixel783
0,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
1,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
2,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
3,4,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
4,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


То, на чем будем сдавать в самом конце для kaggle

In [316]:
finaltest = pd.read_csv('test.csv')

In [317]:
print(finaltest.shape)
finaltest.head()

(28000, 784)


Unnamed: 0,pixel0,pixel1,pixel2,pixel3,pixel4,pixel5,pixel6,pixel7,pixel8,pixel9,...,pixel774,pixel775,pixel776,pixel777,pixel778,pixel779,pixel780,pixel781,pixel782,pixel783
0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
1,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
2,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
3,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
4,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


Пример того, как надо сдавать результаты

In [318]:
sample_submission = pd.read_csv('sample_submission.csv')

In [319]:
sample_submission.head()

Unnamed: 0,ImageId,Label
0,1,0
1,2,0
2,3,0
3,4,0
4,5,0


# Подготовка Данных

Извлекаем отдельно признаки и отдельно целевые значения

In [320]:
features_np = train.iloc[:, 1:].values
targets_np = train.label.values

Производим нормировку признаков

In [321]:
features_norm_np = features_np / 255

In [322]:
# Проверка, что нормировка проведена успешно
features_norm_np.min(), features_norm_np.max()

(0.0, 1.0)

Разделяем данные для обучения и для тестирования

In [323]:
test_size = 0.3
stratify = targets_np

features_train, features_test, targets_train, targets_test = train_test_split(
    features_norm_np,
    targets_np,
    test_size=test_size,
    stratify=stratify,
    random_state=seed
)

Проверяем, что разделилось все правильно

In [324]:
# 42_000 * 0.7 = 29_400
features_train.shape, targets_train.shape

((29400, 784), (29400,))

In [325]:
# 42_000 - 29_400 = 12_600
features_test.shape, targets_test.shape

((12600, 784), (12600,))

Подгоним размерности для сверточных слоев

In [326]:
features_train = features_train.reshape(features_train.shape[0], 1, 28, 28)
features_test = features_test.reshape(features_test.shape[0], 1, 28, 28)

Переводим в тензоры

In [327]:
features_train_tn = torch.from_numpy(features_train).float()
targets_train_tn = torch.from_numpy(targets_train).long()

features_test_tn = torch.from_numpy(features_test).float()
targets_test_tn = torch.from_numpy(targets_test).long()

Проверяем, что все перевелось правильно

In [328]:
type(features_train_tn), type(targets_train_tn), type(features_test_tn), type(targets_test_tn)

(torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor)

Создаем Датасеты и Даталоудеры

In [329]:
# ГДЕ-ТО здесь надо создать датасет и трансформации

In [330]:
batch_size = 64
num_workers = 2

train_ds = TensorDataset(features_train_tn, targets_train_tn)
test_ds = TensorDataset(features_test_tn, targets_test_tn)

train_loader = DataLoader(
    train_ds,
    batch_size=batch_size,
    num_workers=num_workers,
    shuffle=True,
    drop_last=True,
    pin_memory=(device.type=='cuda')
)
test_loader = DataLoader(
    test_ds,
    batch_size=batch_size,
    num_workers=num_workers,
    drop_last=True,
    pin_memory=(device.type=='cuda')
)

Проверяем, что все создалось правильно

In [331]:
train_ds, test_ds

(<torch.utils.data.dataset.TensorDataset at 0x18fb4bd05f0>,
 <torch.utils.data.dataset.TensorDataset at 0x18fb43ab8c0>)

In [332]:
train_loader, test_loader 

(<torch.utils.data.dataloader.DataLoader at 0x18fb41c54f0>,
 <torch.utils.data.dataloader.DataLoader at 0x18fb41c6ff0>)

# Создаем Сам Классификатор

In [333]:
class DigitClassifier(nn.Module):
    def __init__(self):
        super().__init__()
        # Компоненты классификатора
        self.conv_block = nn.Sequential(
            nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(32),
            nn.ReLU(inplace=True),
            nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2) 
        )
        
        self.linear_block = nn.Sequential(
            nn.Dropout(p=0.5),
            nn.Linear(128*7*7, 128),
            nn.BatchNorm1d(128),
            nn.ReLU(inplace=True),
            nn.Dropout(0.5),
            nn.Linear(128, 64),
            nn.BatchNorm1d(64),
            nn.ReLU(inplace=True),
            nn.Dropout(0.5),
            nn.Linear(64, 10)
        )
        
    def forward(self, x):
        x = self.conv_block(x)
        x = x.view(x.size(0), -1)
        x = self.linear_block(x)
        
        return x

# Обучение

Подготовка

In [334]:
model = DigitClassifier()

loss_function = nn.CrossEntropyLoss()

learning_rate = 0.001
weight_decay = 1e-4
optimizer = optim.Adam(
    params=model.parameters(),
    lr=learning_rate,
    weight_decay=weight_decay
)

exp_lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

epochs = 25

Переведем все, что можно нужное устройство

In [335]:
if device.type == 'cuda':
    model.cuda()
    loss_function.cuda()

Главный цикл обучения

In [336]:
model.train()
for epoch in range(epochs):
    for images, labels in train_loader:
        images = images.to(device, non_blocking=True)
        labels = labels.to(device, non_blocking=True)
        
        logits_ps = model(images)
        loss = loss_function(logits_ps, labels)
        
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
    exp_lr_scheduler.step()

Валидация

In [337]:
correct = 0
test_size = len(test_loader.dataset)

with torch.no_grad():
    model.eval()
    for images, labels in test_loader:
        images = images.to(device, non_blocking=True)
        labels = labels.to(device, non_blocking=True)
        
        logits_ps = model(images)
        loss = loss_function(logits_ps, labels)

        predictions = torch.argmax(logits_ps, dim=1)

        correct += (predictions == labels).sum().item()

Получившаяся точность

In [338]:
accuracy = correct / test_size
print(f'Test Accuracy: {accuracy * 100:.2f}')

Test Accuracy: 98.85


# Подготовка Данных Для Сдачи

Переводим в пандас

In [339]:
finaltest_np = finaltest.values
type(finaltest_np)

numpy.ndarray

Нормируем

In [340]:
finaltest_norm_np = finaltest_np / 255

Проверяем

In [341]:
finaltest_norm_np.min(), finaltest_norm_np.max()

(0.0, 1.0)

In [342]:
finaltest_norm_np.shape

(28000, 784)

Подгоняем размерности под сверточные слои

In [343]:
finaltest_norm_np = finaltest_norm_np.reshape(finaltest_norm_np.shape[0], 1, 28, 28)

Проверяем

In [344]:
finaltest_norm_np.shape

(28000, 1, 28, 28)

Переводим в тензор

In [345]:
finaltest_tn = torch.from_numpy(finaltest_norm_np).float()

Проверяем

In [346]:
type(finaltest_tn)

torch.Tensor

Производим прогнозирование на финальных данных

In [347]:
labels = []

model.eval()
with torch.no_grad():
    for data in finaltest_tn:
        data = data.to(device, non_blocking=True)
        
        logits_ps = model(data.unsqueeze(1))
        
        prediction = torch.argmax(logits_ps).item()
        
        labels.append(prediction)

Сохраняем метки для сдачи в соответствующий датафрейм

In [348]:
sample_submission['Label'] = labels

Проверка, что все занеслось правильно

In [349]:
sample_submission.head()

Unnamed: 0,ImageId,Label
0,1,2
1,2,0
2,3,9
3,4,0
4,5,3


Запись в файл для сдачи

In [356]:
sample_submission.to_csv('submission.csv', index=False)

Проверяем, что файл записался

In [357]:
result = pd.read_csv('submission.csv')
print(result.shape)
result.head()

(28000, 2)


Unnamed: 0,ImageId,Label
0,1,2
1,2,0
2,3,9
3,4,0
4,5,3
