In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Pytorch Intro

Diese Übung basiert auf dem offiziellen PyTorch Tutorial: https://pytorch.org/tutorials/beginner/basics/intro.html


## Lernziele

- Tensoren: Erstellen, Operationen, Eigenschaften
- Daten: Erstelle, Iterieren, Batches
- Modelle: Definieren, Optimieren, Speichern & Laden

In [None]:
import os
from pathlib import Path

from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
from PIL import Image
import torch
from tqdm.notebook import tqdm

DATA_PATH = Path('./data')

## Tensoren

Sie können die folgenden Aufgaben mit Hilfe dieses Tutorials lösen: https://pytorch.org/tutorials/beginner/basics/tensorqs_tutorial.html

Lesen Sie das Bild `${DATA_PATH}/cat_small.jpg` ein mit PIL.Image. Stellen Sie das Bild dar.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie aus dem Bild einen `torch.tensor`. Zeigen Sie dessen `shape` (Dimensionalität).

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Berechnen Sie den Mittelwert über die Farbkanäle.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Ziehen Sie die Mittelwerte der Farbkanäle den entsprechenden Farbkanälen ab (mean centering). Berechnen Sie dann wieder den Mittlwert um zu zeigen, dass es funktioniert hat.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Daten

Das Definieren von Datensätzen mit denen ein Modell trainiert werden kann ist ein wichtiger Schritt beim Modellieren von Daten. Im Folgenden werden Sie PyTorch-Klassen verwenden um solche Datensätze zu erstellen.

Die folgenden Aufgaben können Sie mit folgender Hilfe lösen: https://pytorch.org/tutorials/beginner/basics/data_tutorial.html

Insbesondere sollten Sie die Klassen [`torch.utils.data.Dataset`](https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset) und [`torch.utils.data.DataLoader`](https://pytorch.org/docs/stable/data.html#torch.utils.data.DataLoader) kennen, verstehen und benutzen können.

Lösen Sie die folgenden Aufgaben:

In [None]:
from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor

Erstellen Sie ein `torch.utils.data.Dataset` mit Hilfe von `torchvision.datasets.FashionMNIST`.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Visualisieren Sie die ersten 9 samples. Plotten Sie das Label jeden Samples. Schauen Sie sich den [Source Code](https://pytorch.org/vision/stable/_modules/torchvision/datasets/mnist.html#FashionMNIST) an um die Labels von Int auf Text zu mappen. Verwenden Sie keine manuell definierte Mapping-Tabelle wie im PyTorch Tutorial.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

### Custom Datasets

Generieren Sie einen Datensatz von Bildern von Katzen und Hunden. Die Bilder sind in `${DATA_ROOT}/cats_vs_dogs.zip` abgelegt. Es sollen sowohl die Bilder, wie auch die Labels ausgegeben werden.

Als erstes extrahieren wir die Bilder, z.B. mit der folgenden Zelle.

In [None]:
%%bash
unzip ./data/cats_vs_dogs.zip -d ./data

Erstellen Sie eine Klasse `CatsAndDogs` die von [`torch.utils.data.Dataset`](https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset) erbt. Implementieren Sie die Methoden `__len__` und `__getitem__`.  `__getitem__` soll ein Tuple zurückgeben (np.array, np,array) mit Bild und Label. Erstellen Sie danach ein Objekt der Klasse.

In [None]:
class CatsAndDogs(Dataset):
    def __init__(self, image_dir):
        # YOUR CODE HERE
        raise NotImplementedError()

    def __len__(self):
        # YOUR CODE HERE
        raise NotImplementedError()

    def __getitem__(self, idx):
        # YOUR CODE HERE
        raise NotImplementedError()

ds = CatsAndDogs(image_dir=DATA_PATH.joinpath('cats_vs_dogs'))

Instanzieren Sie nun ein Objekt der Klasse `torch.utils.data.Dataloader` mit dem gerade erstellten Datensatz. Setzen Sie `batch_size=1` und plotten Sie das erste Bild, welches vom DataLoader zurückgegeben wird.

Erhöhen Sie die Batch-Size und probieren Sie das letzte Bild im Batch zu plotten. Was passiert? Warum?

In [None]:
from torch.utils.data import DataLoader

# YOUR CODE HERE
raise NotImplementedError()

## Transformationen

Schauen Sie sich [_transforms_](https://pytorch.org/vision/main/transforms.html) an. Erweitern Sie anschliessend die Klasse `CatsAndDogs` so dass _transforms_ angewendet werden können. Diese sind wichtig für `DataAugmentation` und um Inputs zu `normalisieren`. Dadurch werden Modelle typischerweise schneller trainiert und generalisieren besser.

Erstellen Sie eine `torchvision.transforms.Compose` Pipeline mit folgenden Transformationen:

- Konvertieren Sie das Bild in einen Tensor, in den Bereich [0, 1]
- Rotieren Sie die Bilder zufällig bis zu 45 Grad
- Flippen Sie das Bild horizontal, zufällig mit einer Wahrscheinlichkeit von 50%
- Normalisieren Sie die Bilder mit folgenden $\mu$ und $\sigma$ - Vektoren: (0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261)
- Resizen Sie die Bilder auf (128, 128)


In [None]:
from torchvision import transforms
# YOUR CODE HERE
raise NotImplementedError()

Erweitern Sie die Klasse `CatsAndDogs`, sodass Sie transformationen anwenden können. Erstellen Sie danach ein `Dataset` mit den Transformationen und plotten Sie 9 Bilder.

In [None]:
class CatsAndDogs(Dataset):
    def __init__(self, image_dir, transform=None, target_transform=None):
        # YOUR CODE HERE
        raise NotImplementedError()

    def __len__(self):
        # YOUR CODE HERE
        raise NotImplementedError()

    def __getitem__(self, idx):
        # YOUR CODE HERE
        raise NotImplementedError()

ds = CatsAndDogs(image_dir=DATA_PATH.joinpath('cats_vs_dogs'), transform=composed_transforms)

# YOUR CODE HERE
raise NotImplementedError()

## Implementing a Multi-Layer Perceptron

In der folgenden Aufgabe implementieren Sie ein Multi-Layer Perceptron. Danach versuchen Sie den FashionMNIST Datensatz damit zu modellieren.

Definieren Sie eine Klasse, die von `torch.nn.Module` erbt und definieren Sie Ihr Netzwerk. Erstellen Sie einen Hidden-Layer mit 128 Nodes und Sigmoid Aktivierungs-Funktion. Verwenden Sie eine `Softmax-Aktivierung` für den Output-Layer. Instanzieren Sie das Netzwerk und printen Sie das Objekt.

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F

# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie einen FashionMNIST Datensatz [`datasets.FashionMNIST`](https://pytorch.org/vision/stable/generated/torchvision.datasets.FashionMNIST.html) und initialisieren Sie einen DataLoader. 

Führen Sie danach einen ersten Forward-Pass durch indem Sie einen Batch mit Ihrem MLP prozessieren. 

Verifizieren Sie, dass die Summer über die Samples jeweils 1 ergibt (d.h. dass die Softmax-Transformation funktioniert hat wie erwartet).

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Optimierung / Modell Training

Dieser Teil beruht auf: https://pytorch.org/tutorials/beginner/basics/autogradqs_tutorial.html und https://pytorch.org/tutorials/beginner/basics/optimization_tutorial.html

Sie werden nun die Parameter vom MLP optimieren / trainieren.

Instanzieren Sie eine geeignete [Loss-Funktion](https://pytorch.org/docs/stable/nn.html#loss-functions).

Instanzieren Sie danach einen Stochastic Gradient Descent [Optimizer](https://pytorch.org/docs/stable/optim.html#algorithms). Setzten Sie passende Hyper-Parameter falls nötig (z.B. die `learning_rate`).

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie einen Loop der über die Batches vom dataloader iteriert. Innerhalb vom Loop soll folgendes gemacht werden:

- Forward Pass
- Loss berechnen
- Backpropagation
- Parameter-Updates
- Print von Loss und Accuracy (z.B. mit tqdm package für progress-bars)

Erstellen Sie eine Funktion die das Modell für eine Epoche trainiert (`train_one_epoch()`).

Trainieren Sie danach das Modell für 1 Epoche.

In [None]:
def train_one_epoch(dataloader, net, optimizer, loss_fn):
    # YOUR CODE HERE
    raise NotImplementedError()

train_one_epoch(dataloader, net, optimizer, loss_fn)

Implementieren Sie einen Loop über mehrere Epochen und trainieren Sie das Modell für 3 Epochen.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Model Save / Load

Dieser Teil beruht auf: https://pytorch.org/tutorials/beginner/basics/saveloadrun_tutorial.html

Hier noch weitere Infos zum `state_dict`: https://pytorch.org/tutorials/recipes/recipes/what_is_state_dict.html

Speichern Sie ihr trainiertes Modell und den Optimizer.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Löschen Sie nun Modell und Optimizer Objekt. Danach erstellen Sie die Objekte wieder und laden die Parameter.


Trainieren Sie das Modell danach für eine weitere Epoche. Das Modell sollte dort weiterlernen wo es vorhin aufgehört hat.

In [None]:
del net; del optimizer
# YOUR CODE HERE
raise NotImplementedError()
train_one_epoch(dataloader, net, optimizer, loss_fn)

## Weitere Themen

GPU-Training: So nutzen Sie Ihre GPU: https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#training-on-gpu