## FHNW bverI - HS2023

In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Image Classification

Diese Übung basiert zum Teil auf: [https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html](https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html)


## Lernziele

- CNNs: Definieren, Optimieren, Inspizieren
- Klassifikation: Definieren, Evaluieren

## Setup

Im Folgenden installieren und laden wir die benötigten Python packages. Danach setzten wir die Pfade für den Zugriff auf Daten und spezifizieren einen Output-Folder.

In [None]:
import os
from pathlib import Path

from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
from PIL import Image
import torch
import torchshow as ts
from tqdm.notebook import tqdm

Mount your google drive to store data and results.

In [None]:
try:
  import google.colab
  IN_COLAB = True
except:
  IN_COLAB = False

print(f"In colab: {IN_COLAB}")

In [None]:
if IN_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')

Modifizieren Sie die folgenden Pfade bei Bedarf.

In [None]:
if IN_COLAB:
    DATA_PATH = Path('/content/drive/MyDrive/bverI/data')
else:
    DATA_PATH = Path('../data')

Install packages not in base Colab environment.

In [None]:
if IN_COLAB:
    os.system("pip install torchshow torchinfo gdown")

## Datensatz

Als erstes bereiten wir den CIFAR10 Datensatz vor.

In [None]:
import torchvision
import torchvision.transforms as transforms

Benutzen Sie `torchvision.datasets.CIFAR10` um zwei `torch.utils.data.Dataset` zu erstellen. 

- Eines für den Trainings-Datensatz
- Eines für den Test-Datensatz

Instanzieren Sie dann jweils einen`torch.utils.data.Dataloader` um über die Daten zu iterieren.

Erstellen Sie `torchvision.transforms` Transformationen um die Daten in Tensoren `transforms.ToTensor()` zu konvertieren und die Daten so mit `transforms.Normalize` zu skalieren, dass diese im Interval [-1, 1] liegen.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()


Benutzen Sie `torchshow.show()` um die Bilder eines Batches anzuzeigen. Plotten Sie zusätzlich die Labels.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()


## Definition CNN

Definieren Sie ein CNN mit folgender Sequenz:

- Input Shape: (3, 32, 32)
- Convolution: 8 Filters, Kernel-Size 5x5
- Pooling: Stride 2, Kernel-Size 2
- Convolution: 16 Filter, Kernel-Size 5x5
- Pooling: Stride 2, Kernel-Size 2
- FC: 120 Neuronen
- FC: 84 Neuronen
- FC: 10 Neuronen (für 10 Klassen)

Benutzen Sie ReLU Aktivierungen nach jedem Layer.

Definieren Sie eine Klasse, die von `torch.nn.Module` erbt und instanzieren Sie Ihr Netzwerk.

In [None]:
import torchinfo
import torch.nn as nn
import torch.nn.functional as F

# YOUR CODE HERE
raise NotImplementedError()



## Trainieren eines CNN

Erstellen Sie eine Objekt für die [_cross entropy_](https://pytorch.org/docs/stable/generated/torch.nn.CrossEntropyLoss.html) Kostenfunktion und instanzieren Sie einen _optimizer_ aus [torch.optim](https://pytorch.org/docs/stable/optim.html).

In [None]:
import torch.optim as optim
# YOUR CODE HERE
raise NotImplementedError()

Erstellen Sie einen Trainings-Loop und trainieren Sie ihr Modell für 2 Epochen. Printen Sie den Loss in regelmässigen Abständen.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Speichern Sie ihr Modell ab.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Visualisieren Sie die gelernten _filters_ im ersten Layer des CNNs. Sie können diese via `net.parameters()` finden. Benutzen Sie `torchshow.show()` für die Visualisierung.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Evaluieren eines CNN

Wir möchten unser Modell nun auf dem Test-Set Evaluieren. Als erstes erzeugen wir _predictions_ für einen Batch von Test-Bildern:

- Benutzen Sie den dataloader um 16 Bilder zu laden.

- Erstellen Sie Predictions für die 16 Bilder mit einem forward-pass durch das Modell.

- Vergleichen Sie die Predictions mit dem wahren Label.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Evaluieren Sie nun den gesamten Test-Datensatz. Benutzen Sie `torch.no_grad()` um keinen Graphen aufzubauen. Berechnen Sie die Accuracy und printen Sie diese.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

### Confusion-Matrix

Plotten Sie eine _confusion matrix_. Benutzen Sie 

- [confusion_matrix](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html)
- [ConfusionMatrixDisplay](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.ConfusionMatrixDisplay.html#sklearn.metrics.ConfusionMatrixDisplay)

Welche Klassen werden stark verwechselt?

In [None]:
from sklearn.metrics import confusion_matrix
from sklearn.metrics import ConfusionMatrixDisplay

# YOUR CODE HERE
raise NotImplementedError()

## Pre-Trained Models

Wir verwenden nun ein vortrainiertes Modell. Lesen Sie dazu die Dokumentation: [https://pytorch.org/vision/0.8/models.html](https://pytorch.org/vision/0.8/models.html).

Laden Sie ResNet18 mit vortrainierten Gewichten.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Visualisieren Sie die gelernten Filter im ersten Convolutional Layer.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Wir laden nun Bilder von Katzen und Hunden.

In [None]:
import gdown

file_id = "1WLO1LOwIp82ZTyf3eKjRAo65FBMaAfuo"
url = f"https://drive.google.com/uc?id={file_id}"

download_path = DATA_PATH / "cats_vs_dogs.zip"
if not download_path.exists():
    gdown.download(url, str(download_path), quiet=False)


In [None]:
if not (DATA_PATH / "cats_vs_dogs").exists():
    CMD = f"unzip {str(download_path)} -d {DATA_PATH}"
    os.system(CMD)

Lesen Sie die Bilder:
- `DATA_PATH / "cats_vs_dogs" / "dog.4.jpg`
- `DATA_PATH / "cats_vs_dogs" / "cat.38.jpg`

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

Erzeugen Sie _predictions_ für die beiden Bilder. Achtung: Sie müssen die Dokumentation in [torchvision](https://pytorch.org/vision/0.8/models.html) genau lesen. Sind Sie zufrieden?

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

## Inspektion von Activation Maps

Wir schauen uns nun die _activation maps_ an, die während dem _forward-pass_ erstellt werden. Wir benutzen dazu einen _hook_: https://web.stanford.edu/~nanbhas/blog/forward-hooks-pytorch/

Sie können diesen folgendermassen registrieren:

```
activation = {}
def getActivation(name):
  # the hook signature
  def hook(model, input, output):
    activation[name] = output.detach()
  return hook
  
 hook = list(net.modules())[30].register_forward_hook(getActivation('conv'))
```

Visualisieren Sie die _activation maps_ mit den grössten _activations_.list(net.modules())

In [None]:
# YOUR CODE HERE
raise NotImplementedError()