### Hausarbeit 8

• Modifizieren Sie das ResNet Beispiel aus dem Buch so, dass es dem
Netzwerk aus dem Paper “Wide Residual Networks” von Zagoruyko et al.
entspricht <br>
• Verwenden Sie die gleichen Augmentation Methods wie in dem Paper
(RandomHorizontalFlip und RandomCrop)<br>
• Vergleichen Sie die Accuracy (Erkennungsraten) für Trainings- und
Validierungsdaten mit dem Beispiel aus dem Buch<br>
• Das Netzwerk dabei nur für die Klassifikation von Vögeln und Flugzeugen
trainieren.<br>
• Verwenden Sie 28 B(3,3) Blöcke mit k=2, [WRN-28-2-B(3,3)]<br>

#### 1.Schritt: Laden der notwendigen Bibliotheken

In [20]:
# Laden der notwendigen Bibliotheken
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
import os
import collections
os.environ['KMP_DUPLICATE_LIB_OK']='True'
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import datetime
import torch
import time
import random

torch.set_printoptions(edgeitems=2)
torch.manual_seed(123)

<torch._C.Generator at 0x7fdde0d312d0>

#### 2.Schritt: Laden der Bilddaten aus dem CIFAR10-Datensatz. Klassen: Vögel und Flugzeuge

In [21]:
# Definition der einzelnen Klassen
class_names_bird_plane = ['airplane','automobile','bird','cat','deer',
               'dog','frog','horse','ship','truck']

# Laden des Datensatzes: Umwandlung in einen Tensor und Normalisierung der Daten
data_path = '../data-unversioned/p1ch6/'

# Trainingsdatensatz
cifar10 = datasets.CIFAR10(
    data_path, train=True, download=True,
    transform=transforms.Compose([
        transforms.RandomHorizontalFlip(),
        transforms.RandomCrop(32),
        transforms.ToTensor(),
        transforms.Normalize((0.4915, 0.4823, 0.4468),
                     (0.2470, 0.2435, 0.2616))
    ]))

# Validierungsdatensatz
cifar10_val = datasets.CIFAR10(
    data_path, train=False, download=True,
    transform=transforms.Compose([
        transforms.RandomHorizontalFlip(),
        transforms.RandomCrop(32),
        transforms.ToTensor(),
        transforms.Normalize((0.4915, 0.4823, 0.4468),
                             (0.2470, 0.2435, 0.2616))
    ]))

# Bildung eines neuen Datensatzes, nur mit Bird und Flugzeug Bildern
label_map = {0: 0, 2: 1}
class_names_bird_plane = ['airplane', 'bird']

# Trainingsdatensatz
cifar2 = [(img, label_map[label])
          for img, label in cifar10
          if label in [0, 2]]

# Validierungsdatensatz
cifar2_val = [(img, label_map[label])
              for img, label in cifar10_val
              if label in [0, 2]]

Files already downloaded and verified
Files already downloaded and verified


#### 3.Schritt: Definition des ursprünglichen Modells mit dem 3x3-Kernel (Residual-Block aus dem Buch):


In [23]:
# Definition Residual-Block für ein neuronales Netzwerk
class ResBlock(nn.Module):
    def __init__(self, n_chans):

        # Zur Initialisierung des RES-Blocks Pbjekts wird ein Konstruktor gebildet.
        super(ResBlock, self).__init__()

        # 2D-Faltungsoperation mit einer 3x3 Kernel-Größe und einem Padding von 1.
        # n_chans = Eingangskanäle und Ausgangskanäle
        self.conv = nn.Conv2d(n_chans, n_chans, kernel_size=3,
                              padding=1, bias=False)

        # Definition einer Batch-Normalisierung, die auf n_features angewendet wird.
        self.batch_norm = nn.BatchNorm2d(num_features=n_chans)

        # Gewichtung der Faltung mit der Kaiming-Normalisierung --> Abgestimmt auf die ReLU-Aktivierungsfunktion
        torch.nn.init.kaiming_normal_(self.conv.weight,
                                      nonlinearity='relu')

        # Gewichte der Batch-Normalisierung werden auf den Wert 0.5 gesetzt.
        torch.nn.init.constant_(self.batch_norm.weight, 0.5)

        # Biases der Batch-Normalisierung werden gleich 0 gesetzt.
        torch.nn.init.zeros_(self.batch_norm.bias)

# Definition der Forward-Methode
    def forward(self, x):

        # 1. Layer
        # Der Eingabetensor x wird durch die Faltung (self.conv) geleitet,
        # um eine Zwischenausgabe out zu erhalten.
        out = self.conv(x)
        # 2. Layer
        # Die Zwischenausgabe out wird durch die Batch-Normalisierung
        # (self.batch_norm) geleitet, um normierte Features zu erhalten.
        out = self.batch_norm(out)
        # 3. Layer
        # Die normierten Features werden durch die ReLU-Aktivierungsfunktion
        # geleitet (torch.relu).
        out = torch.relu(out)

        # Die Zwischenausgabe out wird mit dem Eingabetensor x addiert,
        # um den Residual-Verbindung zu implementieren.
        return out + x

# Definition des neuronalen Netzwerks mit Residualblöcken
class NetResDeep(nn.Module):

    def __init__(self, n_chans1=32, n_blocks=10):

        # Konstrukur, um das NetResDeep-Objekt zu initialisieren
        super().__init__()

        # Festlegung der Kanäle (Channels), die in der ersten Faltungsschicht verwendet werden sollen.
        # Hier = 32
        self.n_chans1 = n_chans1

        # Definition einer 2D-Faltungsschicht, die einen Eingabetensor mit 3 Kanälen (RGB-Bild) nimmt und
        # n_channel Ausgangskanäle erzeugt.
        # Kernel: 3x3 und Padding: 1
        self.conv1 = nn.Conv2d(3, n_chans1, kernel_size=3, padding=1)

        # Definition einer Sequenz von Residual-Blöcken
        # Die Sequenz: es wird n_blocks-mal ein Residualblock mit n_chans1 Kanälen
        # erstellt und in die Sequenz eingefügt.
        self.resblocks = nn.Sequential(
            *(n_blocks * [ResBlock(n_chans=n_chans1)]))

        # Definition eines vollständig verbundenen Layers
        # Unter der Annahme, dass der Input nach dem Pooling 8x8 groß ist.
        # Ausgabevektor ist danach 32-Groß
        self.fc1 = nn.Linear(8 * 8 * n_chans1, 32)

        # Definition zweiter vollständig verbundener Layer
        # Eingabevektor = 32 und Ausgabevektor = 2
        self.fc2 = nn.Linear(32, 2)

# Definition der Forward-Methode
    def forward(self, x):
        # Der Eingabetensor x wird durch die erste Faltung (self.conv1)
        # geleitet und dann mit der ReLU-Aktivierungsfunktion und einer
        # 2x2-Max-Pooling-Operation verarbeitet.
        out = F.max_pool2d(torch.relu(self.conv1(x)), 2)

        # Die verarbeiteten Features werden durch die Sequenz von
        # Residualblöcken (self.resblocks) geleitet.
        out = self.resblocks(out)

        # Die resultierenden Features werden erneut mit einer
        # 2x2-Max-Pooling-Operation verarbeitet.
        out = F.max_pool2d(out, 2)

        # Die resultierenden Features werden in einen Vektor umgeformt
        # (out.view(-1, 8 * 8 * self.n_chans1)), um sie für
        # den vollständig verbundenen Layer vorzubereiten.
        out = out.view(-1, 8 * 8 * self.n_chans1)

        # Der umgeformte Vektor wird durch den ersten vollständig verbundenen
        # Layer (self.fc1) mit ReLU-Aktivierung geleitet.
        out = torch.relu(self.fc1(out))

        # Die resultierenden Features werden durch den zweiten vollständig
        # verbundenen Layer (self.fc2) geleitet, um den endgültigen Ausgabevektor zu erhalten.
        out = self.fc2(out)

        # Der Ausgabevektor wird zurückgegeben.
        return out

# Definition des Trainingloops
def training_loop(n_epochs, optimizer, model, loss_fn, train_loader):
    for epoch in range(1, n_epochs + 1):
        loss_train = 0.0

        for imgs, labels in train_loader:
            imgs = imgs.to(device=device)  # <1>
            labels = labels.to(device=device)
            outputs = model(imgs)
            loss = loss_fn(outputs, labels)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            loss_train += loss.item()

        if epoch == 1 or epoch % 1 == 0:
            print('{} Epoch {}, Training loss {}'.format(
                datetime.datetime.now(), epoch,
                loss_train / len(train_loader)))

# Trainieren des Modells
train_loader = torch.utils.data.DataLoader(cifar2, batch_size=64,
                                           shuffle=True)

model_Net_Res = NetResDeep(n_chans1=32, n_blocks=10).to(device=device)
optimizer = optim.SGD(model_Net_Res.parameters(), lr=1e-2)
loss_fn = nn.CrossEntropyLoss()

training_loop(
    n_epochs = 100,
    optimizer = optimizer,
    model = model_Net_Res,
    loss_fn = loss_fn,
    train_loader = train_loader,
)

# Berechnung der Genauigkeit des Modells für die Trainings und Validierungsdaten:
train_loader = torch.utils.data.DataLoader(cifar2, batch_size=64,
                                           shuffle=False)
val_loader = torch.utils.data.DataLoader(cifar2_val, batch_size=64,
                                         shuffle=False)
all_acc_dict = collections.OrderedDict()

def validate(model, train_loader, val_loader):
    accdict = {}
    for name, loader in [("train", train_loader), ("val", val_loader)]:
        correct = 0
        total = 0

        with torch.no_grad():
            for imgs, labels in loader:
                imgs = imgs.to(device=device)  # <1>
                labels = labels.to(device=device)
                outputs = model(imgs)
                _, predicted = torch.max(outputs, dim=1) # <1>
                total += labels.shape[0]
                correct += int((predicted == labels).sum())

        print("Accuracy {}: {:.2f}".format(name , correct / total))


validate(model_Net_Res, train_loader, val_loader)

2023-06-19 11:30:40.244843 Epoch 1, Training loss 0.5254586413977252
2023-06-19 11:30:41.067804 Epoch 2, Training loss 0.3711422786211512
2023-06-19 11:30:41.892674 Epoch 3, Training loss 0.33534020555626814
2023-06-19 11:30:42.708603 Epoch 4, Training loss 0.30953430104407537
2023-06-19 11:30:43.525190 Epoch 5, Training loss 0.29186353590458064
2023-06-19 11:30:44.345746 Epoch 6, Training loss 0.2817312352311839
2023-06-19 11:30:45.187596 Epoch 7, Training loss 0.26892885328478117
2023-06-19 11:30:46.004616 Epoch 8, Training loss 0.25347367583946057
2023-06-19 11:30:46.809688 Epoch 9, Training loss 0.24761364879501854
2023-06-19 11:30:47.632964 Epoch 10, Training loss 0.23509505001982306
2023-06-19 11:30:48.462002 Epoch 11, Training loss 0.22021974794044616
2023-06-19 11:30:49.283427 Epoch 12, Training loss 0.20918062580808713
2023-06-19 11:30:50.232600 Epoch 13, Training loss 0.20579675703671327
2023-06-19 11:30:51.180515 Epoch 14, Training loss 0.18839915163198095
2023-06-19 11:30:5

#### 4.Schritt: WRN: Wide Residual Network

**Anforderungen an das Netzwerk:**
- Augmentation Methoden: RandomHorizontalFlip und RandomCrop

- Sie 28 B(3,3) Layers mit k=2, [WRN-28-2-B(3,3)]


In [19]:
# Definition des Residual-Blocks für das neuronale Netzwerk
class WRN_Block(nn.Module):
    # Übergabe der Anzahl der Channels und des Strides
    def __init__(self, in_channels, out_channels, stride=1):
        super(WRN_Block, self).__init__()
        # Batch-Normalisierung der Anzahl der in_channels
        self.bn1 = nn.BatchNorm2d(in_channels)
        # ReLU-Aktivierungsfunktion
        self.relu1 = nn.ReLU(inplace=True)
        # 1. Convolutional-Layer im Block.
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)
        # Batch-Normalisierung definiert mit der Anzahl der out_channels
        self.bn2 = nn.BatchNorm2d(out_channels)
        # RelU-Aktivierungsfunktion
        self.relu2 = nn.ReLU(inplace=True)
        # 2. Convolutional-Layer im Block
        self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False)
        # Anpassung, falls in_channels != out_channels
        self.adjust = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, bias=False),)

        torch.nn.init.kaiming_normal_(self.conv1.weight,
                                      nonlinearity='relu')
        torch.nn.init.kaiming_normal_(self.conv2.weight,
                                      nonlinearity='relu')

        torch.nn.init.constant_(self.bn1.weight, 0.5)
        torch.nn.init.constant_(self.bn2.weight, 0.5)

        torch.nn.init.constant_(self.bn1.bias, 0.0)
        torch.nn.init.constant_(self.bn2.bias, 0.0)

    # Definition der Forward-Methode
    def forward(self, input):
        #input = x

        # Anwendung der ersten Batch-Normalisierung
        out = self.bn1(input)
        # Anwendung der ersten ReLU-Aktivierungsfunktion
        out = self.relu1(out)
        # Anwendung des ersten Convolutional Layers
        out = self.conv1(out)
        # Anwendung der zweiten Batch-Normalisierung
        out = self.bn2(out)
        # Anwendung der zweiten ReLU-Aktivierungsfuntkion
        out = self.relu2(out)
        # Anwendung des zweiten Convolutional Layers
        out = self.conv2(out)

        # Anpassung der Eingabe, sodass zwischen den Blöcken keine Probleme mit unterschiedlich großen Eingabewerten entsteht.
        if input.size() != out.size():
            # Anwendung des zusätzlichen Convolutional Layers, falls die Dimensionen zwischen den Blöcken nicht passen.
            input = self.adjust(input)

        return out + input

# Definition des künstlichen neuronalen Netzes
class WRN(nn.Module):
    # Übergabe der Anzahl der Blöcke, der Weite der Layers und die Anzahl der vorhandenen Klassen
    def __init__(self, num_blocks=4, k=2, num_classes=2):
        super(WRN, self).__init__()
        # Anzahl der input-Channels
        self.in_channels = 16
        # Definition des ersten Convolutional-Layers vor den Residual-Blöcken (convolutional group 1: 16)
        self.conv1 = nn.Conv2d(3, self.in_channels, kernel_size=3, stride=1, padding=1, bias=False)
        # Definition der ReLU-Aktivierungsfunktion
        self.relu = nn.ReLU(inplace=True)

        ### Definition der Übergabeparameter für die Blöcke
        # Convolutional group 2: 16*k, num_blocks: Anzahl von Blöcken innerhalb der Gruppe.
        self.group_conv2 = self.block(16*k, num_blocks)
        # Convolutional group 3: 32*k
        self.group_conv3 = self.block(32*k, num_blocks, stride=2)
        # Convolutional group 4: 64*k
        self.group_conv4 = self.block(64*k, num_blocks, stride=2)

        # Definition der Batch-Normalisierung
        self.bn = nn.BatchNorm2d(64*k)
        # Definition des Average Poolings
        self.avg_pool = nn.AvgPool2d(8, stride=1)
        # Definition des Linearisierungsfunktion, mit 64*k Neuronen, die zu num_classes = 2 transferiert werden.
        self.fc = nn.Linear(64*k, num_classes)

    # Erzeugung einer Sequenz aus mehreren (num_blocks) Residual Blöcken
    # Übergabe der Anzahl der Output-Channels und der Anzahl der N-Residual Blöcken
    def block(self, out_channels, num_blocks=4, stride=1):
        # Leere Liste für die einzelnen Residual-Blöcke
        layers = []
        layers.append(WRN_Block(self.in_channels, out_channels, stride))
        self.in_channels = out_channels
        for _ in range(1, num_blocks):
            layers.append(WRN_Block(out_channels, out_channels))
        return nn.Sequential(*layers)
        # Die Sequenz enthält alle erstellten Wide Residual Blocks, die in der richtigen Reihenfolge
        # ausgeführt werden, wenn der forward-Methode des WideResidualNetworks aufgerufen wird.

    def forward(self, x):

        input = x
        # 1. Convolutional-Layer vor den Blöcken
        out_group_conv1 = self.conv1(input)
        # 2. Gruppe: Conv2 - 16*k
        out_group_conv2 = self.group_conv2(out_group_conv1)
        # 3. Gruppe: Conv3 - 32*k
        out_group_conv3 = self.group_conv3(out_group_conv2)
        # 4. Gruppe: Conv4 - 64*k
        out_group_conv4 = self.group_conv4(out_group_conv3)

        # Anwendung der Batch-Normalisierung auf das Ergebnis nach den Blöcken
        out = self.bn(out_group_conv4)
        # Anwendung der ReLU-Aktivierungsfunktion
        out = self.relu(out)
        # Anwendung des Avg-Poolings
        out = self.avg_pool(out)
        out = out.view(out.size(0), -1)
        # Anwendung der Linearisierungsfunktion
        out = self.fc(out)
        return out




def training_loop(n_epochs, optimizer, model, loss_fn, train_loader):
    for epoch in range(1, n_epochs + 1):
        loss_train = 0.0

        for imgs, labels in train_loader:
            imgs = imgs.to(device=device)  # <1>
            labels = labels.to(device=device)
            outputs = model(imgs)
            loss = loss_fn(outputs, labels)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            loss_train += loss.item()

        if epoch == 1 or epoch % 1 == 0:
            print('{} Epoch {}, Training loss {}'.format(
                datetime.datetime.now(), epoch,
                loss_train / len(train_loader)))

device = torch.device('cuda')
train_loader = torch.utils.data.DataLoader(cifar2, batch_size=64, shuffle=True)
val_loader = torch.utils.data.DataLoader(cifar2_val, batch_size=64, shuffle=False)
all_acc_dict = collections.OrderedDict()

model = WRN().to(device=device)
lr = 0.001
optimizer = optim.SGD(model.parameters(), lr=lr)
loss_fn = nn.CrossEntropyLoss()

training_loop(
    n_epochs = 200,
    optimizer = optimizer,
    model = model,
    loss_fn = loss_fn,
    train_loader = train_loader,
)

def validate(model, train_loader, val_loader):
    accdict = {}
    for name, loader in [("train", train_loader), ("val", val_loader)]:
        correct = 0
        total = 0

        with torch.no_grad():
            for imgs, labels in loader:
                imgs = imgs.to(device=device)  # <1>
                labels = labels.to(device=device)
                outputs = model(imgs)
                _, predicted = torch.max(outputs, dim=1) # <1>
                total += labels.shape[0]
                correct += int((predicted == labels).sum())

        print("Accuracy {}: {:.2f}".format(name , correct / total))
        accdict[name] = correct / total
    return accdict

print("Number of free parameters in the model:",sum(p.numel() for p in model.parameters()))

2023-06-19 10:14:21.289097 Epoch 1, Training loss 0.6734805722145518
2023-06-19 10:14:23.468085 Epoch 2, Training loss 0.6095718187131699
2023-06-19 10:14:25.680898 Epoch 3, Training loss 0.571550208102366
2023-06-19 10:14:27.854666 Epoch 4, Training loss 0.5420037718715182
2023-06-19 10:14:30.038029 Epoch 5, Training loss 0.5232469234496925
2023-06-19 10:14:32.211222 Epoch 6, Training loss 0.5099179317617113
2023-06-19 10:14:34.363320 Epoch 7, Training loss 0.49577421348565703
2023-06-19 10:14:36.588148 Epoch 8, Training loss 0.4839676960258727
2023-06-19 10:14:38.750957 Epoch 9, Training loss 0.47254138273797974
2023-06-19 10:14:40.917973 Epoch 10, Training loss 0.4627764114908352
2023-06-19 10:14:43.081495 Epoch 11, Training loss 0.4540910512019115
2023-06-19 10:14:45.231417 Epoch 12, Training loss 0.4455526864073079
2023-06-19 10:14:47.431838 Epoch 13, Training loss 0.4413351940501268
2023-06-19 10:14:49.627835 Epoch 14, Training loss 0.4330986434487021
2023-06-19 10:14:51.819093 E