## How to train your own model

Zacznijmyd od podstawowych importów i sprawdzenia jakie mamy możliwe środki do trenowania

In [None]:
import torch
import torchvision
import matplotlib.pyplot as plt
from tqdm import tqdm

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

## Dataset
Dzisiaj będziemy pracować z bardziej skomplikowanym przykładem jakim jest [CIFAR10](https://www.cs.toronto.edu/~kriz/cifar.html). Jest to zbiór obrazów o rozmiarze 32x32 pikseli, zawierający 10 klas obiektów. Możemy go pobrać z biblioteki torchvision.

In [None]:
train_dataset = torchvision.datasets.CIFAR10(
    root="./data",
    train=True,
    download=True,
    transform=torchvision.transforms.ToTensor(),
)
test_dataset = torchvision.datasets.CIFAR10(
    root="./data",
    train=False,
    download=True,
    transform=torchvision.transforms.ToTensor(),
)

In [None]:
# teraz chcemy ustawić wielkość batcha i learning rate do trenowania

# TODO: spróbuj pozmieniać wartości tych parametrów
batch_size = 128
learning_rate = 0.001
num_epochs = 10

# i przygotować dataset do załadowania

train_dataloader = torch.utils.data.DataLoader(
    train_dataset, batch_size=batch_size, shuffle=True, num_workers=1
)

test_dataloader = torch.utils.data.DataLoader(
    test_dataset, batch_size=batch_size, shuffle=False, num_workers=1
)

## Wizualizacja danych
Zobaczmy jak wyglądają nasze dane. W tym celu użyjemy biblioteki matplotlib, aby wyświetlić kilka obrazów wraz z podpisami z naszego zbioru danych.

In [None]:
def show_images(images: torch.Tensor, labels: torch.Tensor, classes: list[str]) -> None:
    plt.figure(figsize=(10, 10))
    for i in range(len(images)):
        plt.subplot(1, len(images), i + 1)
        plt.imshow(images[i].permute(1, 2, 0))  # permute to change from CxHxW to HxWxC
        plt.title(classes[labels[i]])
        plt.axis("off")
    plt.show()

In [None]:
# zobaczmy pierwsze 10 obrazków z naszego datasetu

images, labels = next(iter(train_dataloader))
show_images(images[:8], labels[:8], train_dataloader.dataset.classes)

In [None]:
class SimpleModel(torch.nn.Module):
    def __init__(self) -> None:
        super(SimpleModel, self).__init__()
        ### TODO: zdefiniuj prostą sieć neuronową z 2 ukrytymi warstwami o rozmiarach 128 i 64
        self.layer1 = torch.nn.Linear(32 * 32 * 3, 128)
        self.layer2 = torch.nn.Linear(128, 64)
        self.layer3 = torch.nn.Linear(64, 10)

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        ### TODO: zaimplementuj funkcję forward z użyciem aktywacji ReLU pomiędzy warstwami, pamiętaj o spłaszczeniu wejścia

In [None]:
def validation_loop(
    ### TODO: czego potrzebujemy do walidacji?
) -> tuple[float, float]:
    ### TODO: validacja modelu - zwróć średnią stratę i dokładność na zbiorze walidacyjnym

def training_loop(
    ### TODO: czego potrzebujemy do trenowania?
) -> None:
    ### TODO: implementacja pętli trenowania z użyciem tqdm do wizualizacji postępu

In [None]:
### TODO: trenowanie najmniejszego modelu


In [None]:
class SequentialModel(torch.nn.Module):
    def __init__(self, layers: list[int]) -> None:
        super(SequentialModel, self).__init__()

        ### TODO: zdefiniuj model sekwencyjny na podstawie podanej listy rozmiarów warstw, użyj aktywacji ReLU pomiędzy warstwami,
        ### hint: użyj torch.nn.Sequential oraz torch.nn.Linear

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        ### TODO: zaimplementuj funkcję forward z użyciem spłaszczenia wejścia

In [None]:
model_bigger = SequentialModel([256, 128, 128, 128, 64]).to(device)
#### TODO: trenowanie większego modelu

## Strategia z ostatnich zajęć - konwolucje

In [None]:
class ConvolutionModel(torch.nn.Module):
    def __init__(self, channels: list[int]) -> None:
        super(ConvolutionModel, self).__init__()

        ### TODO: zdefiniuj model konwolucyjny na podstawie podanej listy rozmiarów kanałów,
        ### Między konwolucjami użyj aktywacji ReLU oraz MaxPool2d z kernel_size=2
        ### Na koniec dodaj warstwę Linear do klasyfikacji na 10 klas
        ### Hint: użyj torch.nn.Sequential oraz torch.nn.Conv2d

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        ### TODO: zaimplementuj funkcję forward

In [None]:
conv_model = ConvolutionModel([32, 64, 128]).to(device)
### TODO: trenowanie modelu konwolucyjnego

## Krok dalej - dlaczego mamy trenować od nowa?

In [None]:
resnet18 = torchvision.models.resnet18(weights=torchvision.models.ResNet18_Weights.DEFAULT)
print(resnet18)

In [None]:
class ResNetModel(torch.nn.Module):
    def __init__(self, base_model: torch.nn.Module) -> None:
        super(ResNetModel, self).__init__()
        ### TODO: zdefiniuj model na bazie podanego modelu bazowego

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        ### TODO: zaimplementuj funkcję forward


In [None]:
final_model = ResNetModel(resnet18).to(device)