### Part 5. Dogs classification (2+ points)
__Disclaimer__: Это опциональная часть задания. Здесь придется экспериментировать, подбирать оптимальную структуру сети для решения задачи и активно искать подскзаки в сети.

Предлагаем вам решить задачу классификации пород собак. Вы можете обучить сеть с нуля или же воспользоваться методом fine-tuning'а. Полезная ссылка на [предобученные модели](https://pytorch.org/docs/stable/torchvision/models.html).

Данные можно скачать [отсюда](https://www.dropbox.com/s/vgqpz2f1lolxmlv/data.zip?dl=0). Датасет представлен 50 классами пород собак, которые можно найти в папке train в соответствующих директориях. При сдаче данной части задания вместе с ноутбуком необходимо отправить .csv-файл с предсказаниями классов тестовой выборки в формате: <имя изображения>,<метка класса> по одному объекту на строку. Ниже приведите код ваших экспериментов и короткий вывод по их результатам.

Будут оцениваться качество классификации (accuracy) на тестовой выборке (2 балла) и проведенные эксперименты (1 балл).
Разбалловка следующая:
* $>=$93% - 2 points
* $>=$84% - 1.5 points
* $>=$70% - 0.75 points

In [None]:
%pip install torchmetrics

In [None]:
import torch
from torchvision import transforms
from torchsummary import summary
import torchvision
import torch.nn as nn
import torch.nn.functional as F
from torchmetrics import Accuracy

from matplotlib import pyplot as plt
import numpy as np
import time
from collections import defaultdict
from tqdm.auto import tqdm

import os
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

In [None]:
DATA_PATH = r"data/data"
NUM_WORKERS = 2
SIZE_H = SIZE_W = 96
NUM_CLASSES = 50
EPOCH_NUM = 30
BATCH_SIZE = 256
image_mean = [0.485, 0.456, 0.406]
image_std  = [0.229, 0.224, 0.225]
EMBEDDING_SIZE = 128

In [None]:
transformer = transforms.Compose([
    transforms.Resize((SIZE_H, SIZE_W)),
    transforms.ToTensor(),
    transforms.Normalize(image_mean, image_std)
])

In [None]:
dataset = torchvision.datasets.ImageFolder(os.path.join(DATA_PATH, 'train'), transform=transformer)

In [None]:
len(dataset), len(dataset.classes)

(7166, 50)

In [None]:
train_dataset, val_dataset = torch.utils.data.random_split(dataset=dataset, lengths=(0.8, 0.2))

In [None]:
len(train_dataset), len(val_dataset)

(5733, 1433)

In [None]:
test_dataset = torchvision.datasets.ImageFolder(os.path.join(DATA_PATH, 'test'), transform=transformer)
len(test_dataset)

FileNotFoundError: ignored

In [None]:
class Runner():
    def __init__(self, model, opt, device, criterion, metric, checkpoint_name=None):
        self.model = model
        self.opt = opt
        self.device = device
        self.criterion = criterion
        self.metric = metric
        self.checkpoint_name = checkpoint_name
        self.epoch = 0
        self.train_phase = True
        self.logits = None
        self._top_val_score = -1
        self.log_dict = {
            "train_loss": [],
            "val_loss": [],
            "train_score": [],
            "val_score": []}

    def forward(self, X_batch):
        logits = self.model(X_batch)
        return logits

    def _run_batch(self, batch):
        X_batch, y_batch = batch
        X_batch = X_batch.to(self.device)
        self.logits = self.forward(X_batch)

    def _run_criterion(self, batch):
        X_batch, y_batch = batch
        y_batch = y_batch.to(self.device)
        loss = self.criterion(self.logits, y_batch)
        y_pred = torch.max(F.softmax(self.logits, dim=1), dim=1)[1]
        score = self.metric(y_pred, y_batch)
        return loss, score

    def _run_epoch(self, loader):
        ep_loss = []
        ep_score = []
        _phase_description = 'Training' if self.train_phase else 'Evaluation'
        for batch in tqdm(loader, desc=_phase_description, leave=False):
            self._run_batch(batch)

            with torch.set_grad_enabled(self.train_phase):
                loss, score = self._run_criterion(batch)

            if self.train_phase:
                loss.backward()
                self.opt.step()
                self.opt.zero_grad()

            ep_loss.append(loss.item())
            ep_score.append(score.item())

        if self.train_phase:
            self.log_dict['train_loss'].append(np.mean(ep_loss))
            self.log_dict['train_score'].append(np.mean(ep_score))
        else:
            self.log_dict['val_loss'].append(np.mean(ep_loss))
            self.log_dict['val_score'].append(np.mean(ep_score))

    def train(self, train_loader, val_loader, n_epochs, model=None, opt=None, criterion=None, metric=None):
        self.opt = (opt or self.opt)
        self.model = (model or self.model)
        self.criterion = (criterion or self.criterion)
        self.metric = (metric or self.metric)

        for _epoch in range(n_epochs):
            start_time = time.time()
            self.epoch += 1
            print(f"epoch {self.epoch:3d}/{n_epochs:3d} started")

            self.train_phase = True
            self._run_epoch()





In [None]:
# Your experiments here