# Jupyter Notebook: Einfaches CNN und AlexNet Implementierung mit CIFAR-10

In diesem Notebook lernst du, wie du ein einfaches Convolutional Neural Network (CNN) auf dem CIFAR-10-Datensatz trainierst. Du wirst die Trainings- und Validierungsverluste nach jeder Epoche plotten und eine Heatmap-Funktion auf ein Beispielbild aus dem Validierungsdatensatz anwenden, um aktivierte Bildregionen zu visualisieren. Im zweiten Teil wirst du angeleitet, AlexNet anhand eines Bildes der Architektur selbst zu implementieren.

## 1. Datensatz vorbereiten

Du wirst den CIFAR-10-Datensatz verwenden, der 60.000 32x32-Farbbilder in 10 Klassen enthält. Der Trainingsdatensatz wird in 80% Training und 20% Validierung aufgeteilt.

## 2. Einfaches CNN definieren

Definiere ein einfaches CNN mit zwei Convolutional Layers und drei Fully Connected Layers.

## 3. Training des Modells

Trainiere das Modell mit dem Adam-Optimizer und der Cross-Entropy Loss-Funktion. Nach dem Training werden die Verluste geplottet.

In [None]:
import matplotlib.pyplot as plt

def plot_losses(train_losses, val_losses):
    plt.figure(figsize=(8, 6))
    plt.plot(range(1, len(train_losses) + 1), train_losses, label='Train Loss', marker='o')
    plt.plot(range(1, len(val_losses) + 1), val_losses, label='Val Loss', marker='s')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.title('Trainings- und Validierungsverluste')
    plt.legend()
    plt.grid(True)
    plt.show()

## 4. Evaluation auf Testdatensatz

Evaluiere das Modell auf dem Testdatensatz, um die endgültige Leistung zu überprüfen.

## 5. AlexNet implementieren

In diesem Abschnitt wirst du AlexNet anhand eines Bildes der Architektur implementieren. Deine Aufgabe ist es, die Architektur in PyTorch zu programmieren, indem du die Schichten und Verbindungen aus dem Bild nachbaust.

Bild der AlexNet-Architektur



### Anleitung zur Implementierung

Um AlexNet zu implementieren, folge diesen Schritten:
**1. Analysiere das Bild**:
_ Schaue dir die Schichten der Architektur genau an. Beachte die Anzahl der Convolutional Layers, Pooling Layers und Fully Connected Layers.
- Identifiziere die Anzahl der Filter, Kernel-Größen, Strides, Padding-Werte und Aktivierungsfunktionen (z.B. ReLU).
- Achte auf Dropout-Schichten und die Größe der Fully Connected Layers.

**2. Erstelle das Modell in PyTorch**:
- Definiere eine Klasse AlexNet, die von nn.Module erbt
- Implementiere die Convolutional Layers mit nn.Conv2d, Pooling Layers mit nn.MaxPool2d und Fully Connected Layers mit nn.Linear.
- Füge ReLU-Aktivierungen (F.relu oder nn.ReLU) und Dropout (nn.Dropout) hinzu, wie im Bild angegeben.
- Stelle sicher, dass die Eingabegröße (32x32 für CIFAR-10) mit der Architektur kompatibel ist. Du musst möglicherweise Kernel-Größen oder Strides anpassen, da AlexNet ursprünglich für 224x224-Bilder entwickelt wurde.

**3. Forward-Pass**:
- Implementiere die forward-Methode, die die Eingabe durch die Schichten führt.
- Achte darauf, die Dimensionen nach den Convolutional Layers zu flatten (z.B. mit x.view), bevor du die Fully Connected Layers anwendest.

**4. Training**:
- Trainiere dein AlexNet-Modell ähnlich wie das einfache CNN oben. Verwende den gleichen trainloader, valloader und testloader, die Adam-Optimizer und Cross-Entropy Loss.
- Du kannst die gleichen Funktionen (validate_model, plot_losses, create_heatmap) wiederverwenden, um Verluste zu plotten und Heatmaps zu erstellen.

### Tipps
- **Dimensionen überprüfen**: Berechne die Ausgabegrößen jeder Schicht, um sicherzustellen, dass die Fully Connected Layers die richtige Eingabegröße erhalten. Für CIFAR-10 (32x32) musst du die Parameter anpassen, da AlexNet für größere Bilder ausgelegt ist.
- **Debugging**: Teste dein Modell mit einem einzelnen Batch, um sicherzustellen, dass die Dimensionen korrekt sind (z.B. output = model(torch.randn(1, 3, 32, 32).to(device))).
- **Anpassungen**: Falls die ursprüngliche AlexNet-Architektur zu komplex ist, kannst du die Anzahl der Filter oder Schichten reduzieren, um sie für CIFAR-10 zu optimieren.

### Beispiel für den Anfang

Hier ist ein Gerüst, um dir den Einstieg zu erleichtern, ohne die vollständige Implementierung zu verraten:

In [None]:
import torch.nn as nn
import torch.nn.functional as F

class AlexNet(nn.Module):
    def __init__(self, num_classes=10):
        super(AlexNet, self).__init__()
        # Definiere hier die Schichten basierend auf dem Bild
        self.features = nn.Sequential(
            # Beispiel: nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding),
            # Füge weitere Schichten hinzu
        )
        self.classifier = nn.Sequential(
            # Beispiel: nn.Linear(in_features, out_features),
            # Füge weitere Schichten hinzu
        )

    def forward(self, x):
        # Implementiere den Forward-Pass
        x = self.features(x)
        # Flattening
        x = x.view(x.size(0), -1)
        x = self.classifier(x)
        return x

# Modell initialisieren und auf GPU verschieben
model = AlexNet().to(device)

Aufgabe: Fülle die features und classifier Abschnitte basierend auf dem Bild der Architektur aus. Trainiere das Modell anschließend mit der gleichen Trainingsschleife wie beim einfachen CNN und überprüfe die Leistung auf dem Testdatensatz.