<img src="https://www.th-ab.de/typo3conf/ext/th_ab/Resources/Public/assets/logo-th-ab.svg" alt="TH-AB Logo" width="200"/>

Prof. Dr. Möckel, Prof. Dr. Radke, Katharina Kuhnert

Maschinelles Lernen Schwerpunkt Data Science<br>
SoSe 2024

# Übung 7: Convolutional Neural Networks (CNN) in PyTorch

### Bibliotheken importieren und PyTorch Umgebung prüfen

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import time

# PyTorch
try:
    import torch
    import torchvision
    import torchmetrics
except:
    !pip install torch
    !pip install torchvision
    !pip install torchmetrics
    import torch
    import torchvision
    import torchmetrics

from torch import nn
from torchvision import datasets
from torchvision.transforms import ToTensor

In [None]:
# PyTorch Version überprüfen
if (torch.__version__ < "2.0.0"):
    raise Exception("Wrong PyTorch version")
else:
    print("PyTorch Version:", torch.__version__)

### Datasets aus MNIST laden und für maschinelles Lernen in Teildatensätze aufteilen 
* Training dataset
* Non-training dataset (Validierung und Test)

In [None]:
# Dataset für Training
ds_train = datasets.FashionMNIST(
    root="data", # Zielpfad für Datendownload
    train=True, # Trainingsdaten laden
    download=True,
    transform=ToTensor(), # Transformiere Features (Bilddaten) zu Tensoren
    target_transform=None # Keine Transformierung für Labels (Targets)
)

# Dataset für Validierung und Test
ds_non_train = datasets.FashionMNIST(
    root="data",
    train=False, # Keine Trainingsdaten laden
    download=True,
    transform=ToTensor()
)

### Aufgabe 1: Splitten Sie das ds_non_train Dataset:

* 70% für Validierung (Modellvalidierung)
* 30% für Tests

In [None]:
# Splitting des non-train Dataset in:
# 70% für Validierung (Modellvalidierung)
# 30% für Tests
total_count = len(ds_non_train)
valid_count = 
test_count = 

# Splitte non-Train Dataset
ds_valid, ds_test = 

### Aufgabe 2: Initiierung der DataLoader

Das schrittweise Laden der Daten aus dem Datensatz in Abschnitten (batches) wird durch Datenloader realisiert.

Legen Sie eine sinnvolle Batchgröße fest und erstellen Sie je eine Instanz "DataLoader" für die Validierung und Test:

**Frage**: Welchen Einfluss hat die Batchgröße auf die Performanz des Modells?

**Antwort**: Zu kleine oder zu große Batchgrößen (hier z.B. 2 bzw. 500) können die Performanz des Modells massiv reduzieren.

In [None]:
from torch.utils.data import DataLoader

# Nutze eine Batch-größe
BATCH_SIZE = 

# Die DataLoader Klasse ermöglicht die Iteration durch die
# Features eines Datasets.
train_dataloader = DataLoader(ds_train,
    batch_size=BATCH_SIZE,

    # Zufällige Auswahl für jedes Batch
    shuffle=True
)

# DataLoader für Validierung
valid_dataloader = 

# DataLoader für Tests
test_dataloader = 

# Ausgabe der Dataloader
print("Größe train_dataloader:", len(train_dataloader), "Batches aus", BATCH_SIZE)
print("Größe valid_dataloader:", len(valid_dataloader), "Batches aus", BATCH_SIZE)
print("Größe test_dataloader:", len(test_dataloader), "Batches aus", BATCH_SIZE)

### Aufgabe 3: Lassen Sie sich die Labels aus dem Trainingsdataset ausgeben

Da das Dataset für die Klassifikation von Ziffern gedacht ist entsprechen die Labels die Bezeichnungen der jeweiligen Ziffern. Die Klassen des Datasets lassen sich über das Property `.classes` ermitteln:

In [None]:
# Lade beliebiges Image aus Trainingsdataset
image, label = ds_train[0]

# Bestimme Datenformat
color_channels = image.shape[0]
print(f"Image shape: {image.shape}")

# Lade Klassenbezeichnungen
class_names = ds_train.classes
print()

### Aufgabe 4: Plotten Sie sich einige beliebige Bilder aus dem Trainingsdataset mit dem dazugehörigen Label:

*Tip:* Nutzen Sie die Funktion .squeeze() um ein Bild für imshow() plotten zu lassen

In [None]:
# Setze den Seed für die Generierung von Zufallszahlen
# für reproduzierbare Ergebnisse
torch.manual_seed(42)

# Plotte eine Matrix aus zufälligen Features und Labels des Datasets
fig = plt.figure(figsize=(9, 9))
rows, cols = 4, 4

for i in range(1, rows * cols + 1):
    random_idx = torch.randint(0, len(ds_train), size=[1]).item()
    img, label = ds_train[random_idx]
    fig.add_subplot(rows, cols, i)
    plt.imshow(img.squeeze(), cmap="gray")
    plt.title(class_names[label])
    plt.axis(False)

## Einfaches CNN Modell

### Aufgabe 5: Definieren Sie ein einfaches CNN

Nutzen Sie die Kommentare als Orientierung welche Schritte im Modell durchlaufen werden sollen.

In [None]:
# Definiere CNN Modell
class CNN_model(nn.Module):
    def __init__(self, input_shape: int, hidden_units: int, output_shape: int):
        # Konstruktor der Basisklasse aufrufen
        super().__init__()

        # (1) Feature extraction:

        # Konstruiere 1. Block (Input Conv2d -> ReLU -> Hidden Conv2d -> ReLU -> MaxPool2d)
        self.block_1 = nn.Sequential(
        )

        # Konstruiere 2. Block (Hidden Conv2d -> ReLU -> Hidden Conv2d -> ReLU -> MaxPool2d)
        self.block_2 = nn.Sequential(
        )

        # (2) Klassifizierer 
        self.classifier = nn.Sequential(
            # Schritt 1: ReLU Aktivierungsfunktion
            nn.ReLU(),
            # Schritt 2: Umwandeln in Vektor
            nn.Flatten(),
            # Schritt 3: Verknüpfen von Hidden Layers mit Output
            nn.Linear(in_features=hidden_units*7*7, out_features=output_shape)
        )
    
    def forward(self, x):
        # Durchlaufe Block 1
        x = self.block_1(x)
        # Durchlaufe Block 2
        x = self.block_2(x)
        # Durchlaufe Klassifizierer
        x = self.classifier(x)

        return x

### Aufgabe 6: Erzeugen Sie eine Instanz vom Typ CNN_model als Modell. Vergleichen Sie die Modellperformance durch Änderung der Neuronenanzahl *hidden_units*:

Festlegung der freien Parameter der Topologie

In [None]:
torch.manual_seed(42)

# Erzeuge konkretes CNN Modell über Angabe der Parameter
model_0 = CNN_model(
    input_shape = ,

    # Erzeuge Neuronen im Hidden Layer
    hidden_units = ,

    # Output-Layer des NN hat für jeden Klassenname ein Neuron
    output_shape = 
)

# Weise dem Modell die CPU zu.
model_0.to("cpu")

## Auswahl der Fehler- (Loss) bzw. Kostenfunktion (Cost) 

Verwendung der Kreuzentropie

In [None]:
# Verwende Cross Entropy als Loss Funktion
loss_fn = nn.CrossEntropyLoss()

## Auswahl des Optimierers 

Angabe der den Optimierer betreffenden Hyperparameter

### Aufgabe 7: Legen Sie eine sinnvolle Lernrate fest und vergleichen Sie wie diese die Modellperformanz beeinflusst.

In [None]:
# Hyperparameter Lernrate
LEARN_RATE = 

# Nutze Stochastic Gradient Descent als Optimierfunktion
optimizer = torch.optim.SGD(params=model_0.parameters(), lr=LEARN_RATE)

## Training des CNNs

### Aufgabe 8: Welchen Einfluss hat die Anzahl der Epochen auf die Modellperformanz? Beginnen Sie mit Epoche 2 und erhöhen Sie diese.

In [None]:
# Initiierung der trainierbaren Parameter durch Zufallszahlen
torch.manual_seed(42)

# Hyperparameter Zahl der Epochen
EPOCHS = 2

# Merke Trainingfehler jeder Epoche für Plotting
t_loss = []

for epoch in range(EPOCHS):
    print("Epoch:", epoch, end="\n-------\n")

    train_loss = 0

    for batch, (X, y) in enumerate(train_dataloader):

        # Initiiere Modell in den Trainingsmodus (kein Training! Nur Modus setzen.)
        model_0.train() 

        # NN 1. Anwendung des Modells auf Feature
        y_pred = model_0(X)

        # NN 2. Berechne loss für die aktuelle Batch
        loss = loss_fn(y_pred, y)

        # Merke Training loss über die aktuelle Epoche
        train_loss += loss

        # NN 3. Initiiere Optimizer Gradients auf 0
        optimizer.zero_grad()

        # NN 4. Initiiere Rückwärtspropagation des Fehlers
        loss.backward()

        # NN 5. Optimiere
        # Veränderung der Gewichte im Neuronalen Netz durch Zuweisung von Anteilen des Gesamtfehlers
        optimizer.step()

        # Ausgabe der bisher verarbeiteten Samples (Bild + Label)
        if batch % 400 == 0:
            print("Samples verarbeitet:", batch * len(X), "/", len(train_dataloader.dataset))

    # Ausgabe des durchschnittlichen Fehlers
    train_loss /= len(train_dataloader)

    # Speichere Trainingfehler
    t_loss.append(train_loss)

    print("Trainingsfehler: {:.5f}".format(train_loss))

### Darstellung des Fehlers auf den Trainingsdaten

In [None]:
# Lambda um Liste aus Tensoren in Liste aus Float umzuwandeln
y_loss = lambda b : [x.tolist() for x in b]

# Lambda um y-Werte für Plot zu erzeugen
x_loss = lambda b : [ x for x in range(0, b)]

plt.figure(figsize=(18, 8))
plt.plot(x_loss(EPOCHS), y_loss(t_loss))
plt.xlabel("Epoche")
plt.ylabel("Trainingsfehler")
plt.title("Trainingsverlauf")
plt.xticks(x_loss(EPOCHS))
plt.show()


## Beurteilung des Trainingserfolgs __Confusion matrix__:

In [None]:
y_test = []
y_pred = []

# Abschalten der Gradientenberechnung (nicht notwendig bei Evaluation)
with torch.no_grad():
    # Umschalten vom Training- in den Evaluationsmodus
    # Alternative: model_0.train(False) 
    model_0.eval()

    # loop for each data
    for X,y in test_dataloader:
        # STEP 1: forward pass
        output = model_0(X)
        # STEP 2: get predicted label
        _, pred_label = torch.max(output, dim=1)
        # STEP 3: append actual and predicted label
        y_test += y.numpy().tolist()
        y_pred += pred_label.numpy().tolist()

In [None]:
print(y_test)
print(y_pred)

## Confusion Matrix

In [None]:
from sklearn.metrics import confusion_matrix
import seaborn as sns

plt.subplots(figsize=(10, 8))
ax = sns.heatmap(confusion_matrix(y_test, y_pred), annot=True, fmt="d")
ax.xaxis.set_ticks_position("top")
ax.xaxis.set_label_position("top")
ax.set_xlabel("Predicted Label")
ax.set_ylabel("Actual Label")
plt.title("Classification Results", fontsize=16, fontweight='bold')
plt.show()

Aggregierte Fehlermetriken für einzelne Klassen:

In [None]:
from sklearn.metrics import classification_report, auc, roc_curve
print(classification_report(y_test, y_pred))