# Классификация дорожных знаков

### В этом ноутбуке будем классифицировать дорожные знаки Швеции. 
Вики: https://commons.wikimedia.org/wiki/Road_signs_in_Sweden
### Рассмотрим:
    - как загружать реальные данные в pytorch
    - с какими проблемами можно столкнуться при работе с реальными данными
    - способы проверки работоспособности сети(validation)

In [None]:
# Установим размер классифицируемых изображений
PIC_SIZE = 50
# Путь к предобработанным данным
data_path = 'data//preprocessed//'
# Путь, куда сохраним модель
model_save_path = 'signs_classifier.pth'

In [None]:
import pandas as pd
import numpy as np
import torch
import os
from PIL import Image
import torchvision
import matplotlib.pyplot as plt

### Создадим класс-обёртку для нашего датасета

In [None]:
import torchvision.transforms as transforms
from torch.utils.data import Dataset

class SignsDataset(Dataset):
    """Road signs dataset."""

    def __init__(self, csv_file, root_dir, transform=None):
        """
        Args:
            csv_file (string): Path to the csv file with annotations.
            root_dir (string): Directory with all the images.
            transform (callable, optional): Optional transform to be applied
                on a sample.
        """
        self.signs_frame = pd.read_csv(csv_file)
        self.root_dir = root_dir
        self.transform = transform
        
        # Cоздаём массив label->index и массив index->label
        self.labels = self.signs_frame['label'].unique()
        self.label_indexes = {}
        for i, label in enumerate(self.labels):
            self.label_indexes[label] = i

    def __len__(self):
        return len(self.signs_frame)

    def __getitem__(self, idx):
        # Загрузим изображение и приведём к размеру 50х50
        # Названия файлов лежат в self.sings_frame
        # На выходе ожидается ровно одно изображение
        
        ## ВАШ КОД ЗДЕСЬ
        image = 
        
        ###############################################################################
        
        # В роли ответа будем давать номер label
        # массив label->index создан в конструкторе 
        ## ВАШ КОД ЗДЕСЬ
        label = 
        
        # Применим преобразования изображения (например аугментацию)
        if self.transform:
            image = self.transform(image)
            
        sample = {'image': image, 'label': label}
        return sample

### Создадим DataLoader'ы, облегчающие закрузку и сэмплинг данных

In [None]:
from torch.utils.data.sampler import SubsetRandomSampler
from torch.utils.data import DataLoader

# Инициализируем загрузчик датасета (класс выше)
dataset = SignsDataset(data_path + 'labels.csv', 
                       data_path, 
                       torchvision.transforms.ToTensor())

indicies = np.arange(len(dataset))

# Некоторые кадры идут подряд и почти совпадают
# Нужно ли включать shuffle? Сделайте ваш выбор :)
#np.random.seed(0)
#np.random.shuffle(indicies)

# Разбиение датасета на train и validation
train_sampler = SubsetRandomSampler(indicies[:int(len(dataset)*0.5)])
validation_sampler = SubsetRandomSampler(indicies[int(len(dataset)*0.5):])

# DataLoader достаёт данные из dataset батчами
signsTrainLoader = DataLoader(dataset, batch_size=16, sampler=train_sampler)
signsValidationLoader = DataLoader(dataset, batch_size=32, sampler=validation_sampler)

### Взглянем на данные

In [None]:
# Преобразование из torch.Tensor к PIL Image(это функция)
ToPIL = transforms.ToPILImage()

# Посмотрим, что выдаёт одна итерация DataLoader
# DataLoader является генератором, получите один элемент и выведите на экран


## Ваш код здесь

img =
label_index = 

print(dataset.labels[label_index])
plt.imshow(ToPIL(img))

### Данные сильно несбалансированы (unbalanced dataset)
### Задача
    Взгляните на количество представителей каждого класса. Что не так?
    К чему это может привести?
    Подумайте о вариантах исправления проблемы.

In [None]:
df = dataset.signs_frame
classes_number = df['label'].nunique()
print('Classes number:', classes_number)
df.groupby('label')['file_name'].nunique()

## Создаём и обучаем сеть

In [None]:
import torch.nn as nn
import torch.nn.functional as F  # Functional

<img src="https://camo.githubusercontent.com/269e3903f62eb2c4d13ac4c9ab979510010f8968/68747470733a2f2f7261772e6769746875622e636f6d2f746176677265656e2f6c616e647573655f636c617373696669636174696f6e2f6d61737465722f66696c652f636e6e2e706e673f7261773d74727565" width=800, height=600>

### Реализуйте сеть примерно следующей архитектуры:
    conv -> max_pool -> conv -> fc -> fc -> fc

In [None]:
# Класс свёрточной нейронной сети
class SimpleConvNet(nn.Module):
    def __init__(self, class_number):
        # вызов конструктора предка
        super(SimpleConvNet, self).__init__()
        # необходмо заранее знать, сколько каналов у картинки (сейчас = 3),
        # которую будем подавать в сеть, больше ничего
        # про входящие картинки знать не нужно
        
        
        ## Ваш код здесь

        
    def forward(self, x):
        
        
        ## Ваш код здесь
        
        
        return x

In [None]:
# Создаём сеть
cnn = SimpleConvNet(classes_number)

In [None]:
# Взглянем на вывод
batch = next(iter(signsTrainLoader))
cnn(batch['image'])[0]

In [None]:
from tqdm import tqdm_notebook

# С помощью этого увидим, как сеть обучалась
history = {'loss':[], 'val_loss':[]}

# Выбираем функцию потерь
loss_fn = torch.nn.CrossEntropyLoss()

# Выбираем алгоритм оптимизации и learning_rate
learning_rate = 1e-4
optimizer = torch.optim.Adam(cnn.parameters(), lr=learning_rate)

# Цикл обучения
i = 0
for epoch in tqdm_notebook(range(100)):

    running_loss = 0.0
    for batch in signsTrainLoader:
        # Так получаем текущий батч
        X_batch, y_batch = batch['image'], batch['label']
        
        # Обнуляем веса
        optimizer.zero_grad()

        # forward + backward + optimize
        y_pred = cnn(X_batch)
        loss = loss_fn(y_pred, y_batch)
        loss.backward()
        optimizer.step()
        
        
        ###### Дальнейший код нужен для логирования #####
        # Выведем текущий loss
        running_loss += loss.item()
        
        # Пишем в лог каждые 50 батчей
        if i % 50 == 49:
            batch = next(iter(signsValidationLoader))
            X_batch, y_batch = batch['image'], batch['label']
            y_pred = cnn(X_batch)
            
            history['loss'].append(loss.item())
            history['val_loss'].append(loss_fn(y_pred, y_batch).item())
        
        # Выведем качество каждые 1000 батчей
        if i % 1000 == 999:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 1000))
            running_loss = 0
        i += 1

# Сохраним модель
torch.save(cnn.state_dict(), model_save_path)
print('Обучение закончено')

#### Загрузка обученной модели (для семинара)

In [None]:
cnn = SimpleConvNet(classes_number)
cnn.load_state_dict(torch.load(model_save_path))

### Начертим кривые обучения

In [None]:
# Скользящее среднее
def smooth_curve(points, factor=0.9):
    smoothed_points = []
    for point in points:
        if smoothed_points:
            previous = smoothed_points[-1]
            smoothed_points.append(previous * factor + point * (1 - factor))
        else:
            smoothed_points.append(point)
    return smoothed_points

plt.clf()
loss_values = smooth_curve(history['loss'])
val_loss_values = smooth_curve(history['val_loss'])
epochs = np.arange(len(loss_values))
plt.plot(epochs, loss_values, 'bo', label='Training loss')
plt.plot(epochs, val_loss_values, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

### Задача
    Оцените, насколько сеть переобучилась
    Что изменится, если применить 
        - аугментацию?
        - регуляризацию?

#### Должно получиться так

In [None]:
Image.open('curves.png')

### Выведем confusion matrix

In [None]:
import itertools
    
# Воспользуемся функцией из документации matplotlib, выводящей confusion matrix 
# Source https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html    
def plot_confusion_matrix(cm, classes,
                          normalize=False,
                          title='Confusion matrix',
                          cmap=plt.cm.Blues):
    """
    This function prints and plots the confusion matrix.
    Normalization can be applied by setting `normalize=True`.
    """
    cm = cm.T
    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')

    #print(cm)
    plt.figure(figsize=(16,11))
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=90)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    plt.ylabel('True label')
    plt.xlabel('Predicted label')

    plt.tight_layout()

In [None]:
from sklearn.metrics import confusion_matrix

y_test_all = torch.Tensor().long()
predictions_all = torch.Tensor().long()

# Пройдём по всему validation датасету и запишем ответы сети
## Добавьте в y_test_all и predictions_all все истинные ответы и предсказания сети на Validation set'e,
## чтобы на основе этих данных оценить точность сети (в вашем распоряжении signsValidationLoader)

    ## Ваш код здесь

## Функция torch.cat - аналог append для обычного списка в питоне
## tensor = torch.cat((tensor, other_tensor), 0)       

feature_names = signsTrainLoader.dataset.labels

y_test_all = y_test_all.numpy()
predictions_all = predictions_all.numpy()

# Функция из sklearn, создаёт confusion матрицу
cm = confusion_matrix(y_test_all, predictions_all, np.arange(classes_number))
# Выведем её
plot_confusion_matrix(cm, dataset.labels, normalize=True)

### Задача
    - какие выводы можно сделать из confusion matrix?
    - как связаны результаты с распределением данных в датасете?

### Выведем точность для каждого класса

In [None]:
class_correct = [0 for i in range(classes_number)]
class_total = [0 for i in range(classes_number)]

c = (predictions_all == y_test_all).squeeze()
for i in range(len(predictions_all)):
    label = predictions_all[i]            
    class_correct[label] += c[i].item()
    class_total[label] += 1

print(class_total)

for i in range(classes_number):
    print('Accuracy of %5s : %2d %%' % (
        (dataset.labels[i], (100 * class_correct[i] / class_total[i]) if class_total[i] != 0 else -1)))

### Задача
    - какая связь между confusion matrix и accuracy для каждого класса?

### Оценим качество на отдельных кадрах из validation'а

In [None]:
batch = next(iter(signsValidationLoader))
predictions = cnn(batch['image'])
y_test = batch['label']


#print(predictions, y_test)
_, predictions = torch.max(predictions, 1)
plt.imshow(ToPIL(batch['image'][0]))
print('Gound-true:', dataset.labels[batch['label'][0]])
print('Prediction:', dataset.labels[predictions[0]])

# Полезные ссылки

Лучшее руководство по matplotlib: https://matplotlib.org/faq/usage_faq.html