## FHNW bverI - HS2023

In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Pytorch Intro & Neuronale Netzwerke

## Lernziele

- Tensoren: Erstellen, Operationen, Eigenschaften
- Daten: Datensätze erstellen, Iterieren, Batches
- Neuronale Netzwerke: Definieren, Optimieren, Speichern & Laden

## Setup

Im Folgenden installieren und laden wir die benötigten Python packages. Danach setzten wir die Pfade für den Zugriff auf Daten und spezifizieren einen Output-Folder.

In [None]:
import os
from pathlib import Path

Mount your google drive to store data and results.

In [None]:
try:
  import google.colab
  IN_COLAB = True
except:
  IN_COLAB = False

print(f"In colab: {IN_COLAB}")

In [None]:
if IN_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')

Modifizieren Sie die folgenden Pfade bei Bedarf.

In [None]:
if IN_COLAB:
    DATA_PATH = Path('/content/drive/MyDrive/bverI/data')
else:
    DATA_PATH = Path('../data')

Install packages not in base Colab environment.

In [None]:
if IN_COLAB:
    os.system("pip install torchshow gdown")

## PyTorch Basics

PyTorch ist eine beliebte Deep Learning Library. [`torch.Tensor`](https://pytorch.org/docs/stable/tensors.html) sind multi-dimensionale Arrays und ist die zentrale Datenstruktur in PyTorch um Daten zu repräsentieren und um Berechnungen auszuführen. Im Wesentlichen sehr ähnlich wie `numpy.Array`. Ein `torch.Tensor` kann jedoch einfach auf verschiedene Devices, wie z.B. GPUs geladen werden. 

Ein guter Blog-Post über die "Internals" von PyTorch finden Sie hier: [PyTorch internals](http://blog.ezyang.com/2019/05/pytorch-internals/)

In [None]:
import numpy as np
import torch

### Tensoren erstellen

Man kann Tensoren auf verschiedene Arten erzeugen. Zum Beispiel aus Listen:

In [None]:
x = torch.tensor([1, 2, 3, 4])
print(x)

In [None]:
x = torch.tensor([[1, 2], [3, 4]])
print(x)

Man kann Tensoren auch aus einem `numpy.Array` erstellen.

In [None]:
a = np.array([[1, 2], [2, 4]])
b = torch.from_numpy(a)
print(b)

Man kann zufällige Tensoren erstellen.

In [None]:
x = torch.rand(2, 3)  # Creates a 2x3 tensor with random values between 0 and 1
print(x)

### Tensor Operationen

Man kann Tensoren miteinander addieren (elementweise).

In [None]:
x = torch.tensor([1, 2, 3])
y = torch.tensor([4, 5, 6])
z = x + y
print(z)

Tensor Multiplikation (elementweise).

In [None]:
z = x * y
print(z)

Matrix Multiplikation.

In [None]:
mat1 = torch.tensor([[1, 2], [3, 4]])
mat2 = torch.tensor([[2, 0], [0, 2]])
mat_product = torch.mm(mat1, mat2)
print(mat_product)

Arithmetische Operationen.

In [None]:
x = torch.tensor([[1, 2], [3, 4]])
print(x)

# Summe über die Zeilen (axis=1 reduziert die Achse 1)
x.sum(axis=1)

Konvertieren von Datentypen. Dies ist wichtig, weil Neuronale Netzwerke typischerweise mit `float32`oder  `float16` operieren und nicht mit `int`.

In [None]:
x = torch.tensor([[1, 2], [3, 4]])
print(x.dtype)

x = x.to(torch.float32)

print(x)
print(x.dtype)

Reshaping von Tensoren.

In [None]:
initial_tensor = torch.rand(4, 2)
print(initial_tensor)

reshaped_tensor = initial_tensor.view(2, 4)  # Reshape to 2x4
print(reshaped_tensor)

flattened_tensor = initial_tensor.view(-1)  # Flatten the tensor
print(flattened_tensor)


Tensoren werden als 1-D arrays abgespeichert. Dabei bestimmt der Stride `x.stride()` wie über die Elemente iteriert wird. Wird ein Tensor reshaped, wird nur der Stride angepasst. Es wird kein neues Objekt generiert.

In [None]:
x = torch.rand(2, 3)
print(x)
x.storage()
x.stride()

In [None]:
y = x.view(3, 2)
print(y)
y.storage()
y.stride()

Insgesamt gibt es über 100 Operationen, die auf einem Tensor ausgeführt werden können. Die gesamte Liste befindet sich hier: [Link](https://pytorch.org/docs/stable/torch.html)


### Gradienten berechnen

Berechnung von Gradienten.

In [None]:
# Create a tensor and specify that we want to compute gradients with respect to it
x = torch.tensor(2.0, requires_grad=True)

# Define a function of x
y = x**3

# Compute the gradient of y with respect to x (dy/dx)
y.backward()

# Print the gradient
print(x.grad)


### Eigenschaften von Tensoren

Die Eigenschaften von einem Tensor kann man inspizieren.

In [None]:
x = torch.rand(3,4)

print(f"Shape of tensor: {x.shape}")
print(f"Datatype of tensor: {x.dtype}")
print(f"Device tensor is stored on: {x.device}")

### Tensor Slicing

In [None]:
tensor = torch.ones(4, 4)
print(f"First row: {tensor[0]}")
print(f"First column: {tensor[:, 0]}")
print(f"Last column: {tensor[:, -1]}")
tensor[:,1] = 0
print(tensor)

## Bilder & Bild-Datensätze

In diesem Teil geht es darum Bilder einzulesen und Bild-Datensätze zu erstellen.

In [None]:
import requests

from matplotlib import pyplot as plt
from PIL import Image

from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor

### Bilder einlesen

In [None]:
url = "https://github.com/pytorch/vision/blob/main/gallery/assets/dog2.jpg?raw=true"
r = requests.get(url, allow_redirects=True)
_ = open(DATA_PATH.joinpath("dog.jpg"), 'wb').write(r.content)

1. Lesen Sie das Bild `${DATA_PATH}/dog.jpg` ein mit `PIL.Image.open()`

2. Stellen Sie das Bild dar


In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie aus dem Bild einen `torch.tensor`. Zeigen Sie dessen `shape` (Dimensionalität).

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Berechnen Sie den Mittelwert über die Farbkanäle. Sie müssen dazu die Achsen spezifizieren, welche Sie wegaggregieren möchten.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Ziehen Sie die Mittelwerte der Farbkanäle den entsprechenden Farbkanälen ab (mean centering). Berechnen Sie dann wieder den Mittelwert um zu zeigen, dass es funktioniert hat.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

### Datensätze

Das Definieren von Datensätzen mit denen ein Modell trainiert werden kann ist ein wichtiger Schritt beim Modellieren von Daten. Im Folgenden werden Sie PyTorch-Klassen verwenden um solche Datensätze zu erstellen.

Die folgenden Aufgaben können Sie mit folgender Hilfe lösen: https://pytorch.org/tutorials/beginner/basics/data_tutorial.html

Insbesondere sollten Sie die Klassen [`torch.utils.data.Dataset`](https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset) und [`torch.utils.data.DataLoader`](https://pytorch.org/docs/stable/data.html#torch.utils.data.DataLoader) kennen, verstehen und benutzen können.

Lösen Sie die folgenden Aufgaben:

Erstellen Sie ein `torch.utils.data.Dataset` mit Hilfe von `torchvision.datasets.CIFAR10`.

In [None]:
import torchvision

# Transform data to tensor
transform = transforms.Compose([
    transforms.ToTensor(),
])

# Load CIFAR-10 dataset
trainset = torchvision.datasets.CIFAR10(
    root=DATA_PATH, train=True, download=True, transform=transform)
testset = torchvision.datasets.CIFAR10(
    root=DATA_PATH, train=False, download=True, transform=transform)

classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

Visualisieren Sie die ersten 9 samples. Plotten Sie das Label jeden Samples. Schauen Sie sich den [Source Code](https://pytorch.org/vision/stable/_modules/torchvision/datasets/mnist.html#FashionMNIST) an um die Labels von Int auf Text zu mappen. Verwenden Sie keine manuell definierte Mapping-Tabelle wie im PyTorch Tutorial.

In [None]:
images, labels = next(iter(torch.utils.data.DataLoader(trainset, batch_size=16, shuffle=False)))

ts.show(images)

### Custom Datasets

Generieren Sie einen Datensatz von Bildern von Katzen und Hunden. Die Bilder sind in `${DATA_ROOT}/cats_vs_dogs.zip` abgelegt. Es sollen sowohl die Bilder, wie auch die Labels ausgegeben werden.

Als erstes laden wir die Bilder runter.

In [None]:
import gdown

file_id = "1WLO1LOwIp82ZTyf3eKjRAo65FBMaAfuo"
url = f"https://drive.google.com/uc?id={file_id}"

gdown.download(url, str(DATA_PATH.joinpath("cats_vs_dogs.zip")), quiet=False)


Als erstes extrahieren wir die Bilder, z.B. mit der folgenden Zelle.

In [None]:
CMD = f"unzip {str(DATA_PATH.joinpath('cats_vs_dogs.zip'))} -d {DATA_PATH}"
os.system(CMD)

Erstellen Sie eine Klasse `CatsAndDogs` die von [`torch.utils.data.Dataset`](https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset) erbt. Implementieren Sie die Methoden `__len__` und `__getitem__`.  `__getitem__` soll ein Tuple zurückgeben (np.array, np,array) mit Bild und Label. Erstellen Sie danach ein Objekt der Klasse.

In [None]:
class CatsAndDogs(Dataset):
    def __init__(self, image_dir):
        self.image_dir = image_dir
        self.images = os.listdir(image_dir)
        self.labels = [f.split(".")[0] for f in self.images]

    def __len__(self):
        return len(self.images)

    def __getitem__(self, idx):
        image_path = os.path.join(self.image_dir, self.images[idx])
        
        # this method should return the image and the label of item idx
        # image = 
        # label = 
        # YOUR CODE HERE
        raise NotImplementedError()
        
        return image, label
        

ds = CatsAndDogs(image_dir=DATA_PATH.joinpath('cats_vs_dogs'))

Instanzieren Sie nun ein Objekt der Klasse `torch.utils.data.Dataloader` mit dem gerade erstellten Datensatz. Setzen Sie `batch_size=1` und plotten Sie das erste Bild, welches vom DataLoader zurückgegeben wird mit `torchshow.show()`

Erhöhen Sie die Batch-Size und probieren Sie das letzte Bild im Batch zu plotten. Was passiert? Warum?

In [None]:
from torch.utils.data import DataLoader
import torchshow as ts

# YOUR CODE HERE
raise NotImplementedError()

for x, y in dataloader:
    break

ts.show(x[0,: ,: ,: ])

## Transformationen

Schauen Sie sich [_transforms_](https://pytorch.org/vision/main/transforms.html) an. Erweitern Sie anschliessend die Klasse `CatsAndDogs` so dass _transforms_ angewendet werden können. Diese sind wichtig für `DataAugmentation` und um Inputs zu `normalisieren`. Dadurch werden Modelle typischerweise schneller trainiert und generalisieren besser.

Erstellen Sie eine `torchvision.transforms.Compose` Pipeline mit folgenden Transformationen:

- Konvertieren Sie das Bild in einen Tensor, in den Bereich [0, 1]
- Rotieren Sie die Bilder zufällig bis zu 45 Grad
- Flippen Sie das Bild horizontal, zufällig mit einer Wahrscheinlichkeit von 50%
- Normalisieren Sie die Bilder mit folgenden $\mu$ und $\sigma$ - Vektoren: (0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261)
- Resizen Sie die Bilder auf (128, 128)


In [None]:
from torchvision import transforms
# YOUR CODE HERE
raise NotImplementedError()

Erweitern Sie die Klasse `CatsAndDogs`, sodass Sie transformationen anwenden können. Erstellen Sie danach ein `Dataset` mit den Transformationen und plotten Sie 9 Bilder.

In [None]:
class CatsAndDogs(Dataset):
    def __init__(self, image_dir, transform=None):
        self.image_dir = image_dir
        self.images = os.listdir(image_dir)
        self.labels = [f.split(".")[0] for f in self.images]
        self.transform = transform

    def __len__(self):
        return len(self.images)

    def __getitem__(self, idx):
        
        image_path = os.path.join(self.image_dir, self.images[idx])
        image = np.array(Image.open(image_path))
        label = self.labels[idx]
        # YOUR CODE HERE
        raise NotImplementedError()
        return image, label
        

ds = CatsAndDogs(image_dir=DATA_PATH.joinpath('cats_vs_dogs'), transform=composed_transforms)

# shorter way to plot images but not quite accurate because scaling is not reversed
# though, it is good enough to get an idea about the transformations

# images = [ds[i][0] for i in range(0, 5*5)]
# ts.show(images, nrows=5)

fig, axes = plt.subplots(figsize=(10, 10), nrows=5, ncols=5)
for i, ax in enumerate(axes.flatten()):
    img, y = ds[i]
    img = img.permute(1, 2, 0).numpy()
    img *= (0.247, 0.243, 0.261)
    img += (0.4914, 0.4822, 0.4465)
    img = np.clip(img, 0, 1)
    ax.set_axis_off()
    ax = ax.imshow(img)

## Implementing a Multi-Layer Perceptron

In der folgenden Aufgabe implementieren Sie ein Multi-Layer Perceptron. Danach versuchen Sie den `CIFAR10` Datensatz damit zu modellieren.

Hier gibt es gute Videos um mit MLPs vertraut zu werden, falls Sie ihr Wissen auffrischen möchten:

[3blue1brown: Aber was *ist* nun ein neuronales Netzwerk?](https://youtu.be/aircAruvnKk?feature=shared) - Es gibt 3 Teile.


Um die folgenden Aufgaben zu bewältigen können Sie das folgende Tutorial zu Hilfe nehmen:

[PyTorch Tutorial Building Model](https://pytorch.org/tutorials/beginner/basics/buildmodel_tutorial.html)

Definieren Sie eine Klasse, die von `torch.nn.Module` erbt und definieren Sie Ihr Netzwerk. Erstellen Sie einen Hidden-Layer mit 128 Nodes und ReLU Aktivierungs-Funktion. Verwenden Sie eine `Softmax-Aktivierung` für den Output-Layer. Instanzieren Sie das Netzwerk und printen Sie das Objekt.

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F

# YOUR CODE HERE
raise NotImplementedError()

net = MLP()
print(net)
import torchinfo
print(torchinfo.summary(net, input_size=(1, 3, 32, 32)))


Erstellen Sie einen `CIFAR10` Datensatz und initialisieren Sie einen DataLoader. 


In [None]:
# Transform data to tensor
transform = transforms.Compose([
    transforms.ToTensor(),
])

# Load CIFAR-10 dataset
training_data = torchvision.datasets.CIFAR10(
    root=DATA_PATH, train=True, download=True, transform=transform)
test_data = torchvision.datasets.CIFAR10(
    root=DATA_PATH, train=False, download=True, transform=transform)

classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')


Führen Sie danach einen ersten Forward-Pass durch indem Sie einen Batch mit Ihrem MLP prozessieren. 

Verifizieren Sie, dass die Summer über die Samples jeweils 1 ergibt (d.h. dass die Softmax-Transformation funktioniert hat wie erwartet).

In [None]:
# dataloader = 
# YOUR CODE HERE
raise NotImplementedError()

for x, y in dataloader:
    break

y_hat = net(x)

# Verify sum over all samples

# YOUR CODE HERE
raise NotImplementedError()

## Optimierung / Modell Training

Dieser Teil beruht auf: https://pytorch.org/tutorials/beginner/basics/autogradqs_tutorial.html und https://pytorch.org/tutorials/beginner/basics/optimization_tutorial.html

Sie werden nun die Parameter vom MLP optimieren / trainieren.

Instanzieren Sie eine geeignete [Loss-Funktion](https://pytorch.org/docs/stable/nn.html#loss-functions).

Instanzieren Sie danach einen Stochastic Gradient Descent [Optimizer](https://pytorch.org/docs/stable/optim.html#algorithms). Setzten Sie passende Hyper-Parameter falls nötig (z.B. die `learning_rate`).

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie einen Loop der über die Batches vom dataloader iteriert. Innerhalb vom Loop soll folgendes gemacht werden:

- Forward Pass
- Loss berechnen
- Backpropagation
- Parameter-Updates
- Print von Loss und Accuracy (z.B. mit tqdm package für progress-bars)

Erstellen Sie eine Funktion die das Modell für eine Epoche trainiert (`train_one_epoch()`).

Trainieren Sie danach das Modell für 1 Epoche.

In [None]:
from tqdm.notebook import tqdm 

torch.manual_seed(123)

def train_one_epoch(dataloader, net, optimizer, loss_fn):
    
    with tqdm(dataloader, unit="batch") as tepoch:
        correct_epoch = 0
        total_epoch = 0
        for i, (X, y) in enumerate(tepoch):

            # Compute prediction and loss
            # YOUR CODE HERE
            raise NotImplementedError()

            # Backpropagation und Weight Updates
            # YOUR CODE HERE
            raise NotImplementedError()

            # Compute Batch Metric
            y_hat = probs.argmax(dim=1, keepdim=True).squeeze()
            correct = (y_hat == y).sum().item()
            accuracy = correct / X.shape[0]

            # Compute Epoch Metric
            correct_epoch += correct
            total_epoch += X.shape[0]
            accuracy_epoch = correct_epoch / total_epoch

            tepoch.set_postfix(loss=loss.item(), accuracy_batch= accuracy * 100, accuracy_epoch = accuracy_epoch * 100)
    

train_one_epoch(dataloader, net, optimizer, loss_fn)

Implementieren Sie einen Loop über mehrere Epochen und trainieren Sie das Modell für 3 Epochen.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Model Save / Load

Dieser Teil beruht auf: https://pytorch.org/tutorials/beginner/basics/saveloadrun_tutorial.html

Hier noch weitere Infos zum `state_dict`: https://pytorch.org/tutorials/recipes/recipes/what_is_state_dict.html

Speichern Sie ihr trainiertes Modell und den Optimizer.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Löschen Sie nun Modell und Optimizer Objekt. Danach erstellen Sie die Objekte wieder und laden die Parameter.


Trainieren Sie das Modell danach für eine weitere Epoche. Das Modell sollte dort weiterlernen wo es vorhin aufgehört hat.

In [None]:
del net; del optimizer
# YOUR CODE HERE
raise NotImplementedError()
train_one_epoch(dataloader, net, optimizer, loss_fn)

## Modell Selektion

Ein wichtiges Thema in Machine Learning ist die Modell-Selektion. Dabei geht es darum das best mögliche Modell für ein Problem zu identifizieren. Dabei vergleicht man verschiedene Modelle (z.B. mit unterschiedlicher Architektur) miteinander und wählt das beste aus. Dazu benötigt man ein Validation Set, mit dem die Modelle miteinander verglichen werden.

Die folgende Funktion illustriert wie man ein Modell evaluieren kann.

In [None]:
dataloader = DataLoader(test_data, batch_size=32, shuffle=True, drop_last=False)

def evaluate(model, dataloader, criterion):
    model.eval()
    total_loss = 0.0
    correct = 0
    total = 0
    with torch.no_grad():
        for images, labels in dataloader:
            outputs = model(images)
            loss = criterion(outputs, labels)
            total_loss += loss.item()
            _, predicted = outputs.max(1)
            total += labels.size(0)
            correct += predicted.eq(labels).sum().item()
    accuracy = 100 * correct / total
    return total_loss / len(dataloader), accuracy

criterion = nn.CrossEntropyLoss()
test_loss, test_accuracy = evaluate(net, dataloader, criterion)
print(f"Test Loss: {test_loss:.2f}%, Test Accuracy: {test_accuracy:.2f}%")

## Weitere Themen

GPU-Training: So nutzen Sie Ihre GPU: https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#training-on-gpu

## (Optional) Weitere Aufgaben

- Passen Sie ihr MLP an und versuchen Sie eine höhere Accuracy zu erreichen. Achtung: Auf CPU dauert das Training dann eventuell ziemlich lange.
- Trainieren Sie das Modell auch etwas länger falls nötig.