# Projektdokumentation: Katzen vs. Hunde CNN Klassifikation

### 1. Beschreibung und Klassifizierung des Problems
Unsere gestellte Fragestellung dieses Projekts war die Erkennung von Hunden- und Katzenfotos und deren Klassifizierung als solche. Hierzu haben wir ein freiverfügbares Dataset auf Kaggle.com mit verschiedenen Hund- und Katzenfotos genutzt. Dieses Dataset hat den Vorteil, dass die dazugehörigen Bilder verschiedene Pixelgrößen enthalten, dass die Tiere in verschiedenen Kontexten abgebildet wurden, als auch dass von beiden Tierarten verschiedene Rassen abgebildet sind. 

### 2. Planung des Lösungswegs
Zur Lösung des Klassifikationsproblems wurde ein Convolutional Neural Network (CNN) implementiert. Im ersten Schritt haben wir die Datenvorverarbeitung definiert und einen Teildatensatz erstellt, um einen Forward Pass durch das Modell zu ermöglichen. Danach wurde das Modell mit einer geeigneten Verlustfunktion trainiert, um die Klassifikationsgenauigkeit zu optimieren.

### 3. Planung der benötigten Module
Folgende Hauptmodule werden benötigt:
- PyTorch für Deep Learning
- Torchvision für Bildverarbeitung und Datentransformationen
- PIL für grundlegende Bildoperationen
- NumPy für numerische Berechnungen
- Matplotlib für eventuelle Visualisierungen

### 4. Laden oder Erstellung des Datasets
Die Bilder wurden aus lokalen Dateien geladen:
```python
datensatz = './data'
trainingssatz = datasets.ImageFolder(root=datensatz, transform=transformation_anpassung)
```

Da einige Bilder im Datensatz beschädigt waren, haben wir eine benutzerdefinierte Klasse FilteredDataset erstellt, um diese Bilder zu filtern und zu überspringen:

```python 
class FilteredDataset(Dataset):
    # Implementierung des Filtermechanismus
```

### 5. Transformation der Daten
Die Datentransformation umfasste die Größenanpassung, die Umwandlung in Tensoren und die Normalisierung der Bilder:

```python
transformation_anpassung = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])
```

### 6. Erstellung der Netzwerkarchitektur
Ursprünglich wurde ein Feed-Forward-Netzwerk implementiert, das jedoch nur eine Genauigkeit von 49 % erreichte. 
(
```python
class NeuralNetwork(nn.Module):
    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(128 * 128 * 3, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 1)
        )
```
)
Deshalb haben wir auf ein Convolutional Neural Network (CNN) umgestellt, das für Bildklassifikationsaufgaben besser geeignet ist und eine Genauigkeit von 82 % erzielte:

```python
class CNN(nn.Module):
    # Definition der CNN-Architektur
```

### 7. Festlegung der Loss Function
Zur Optimierung des Modells wurde die Binary Cross-Entropy Loss verwendet:

```python
criterion = nn.BCEWithLogitsLoss()
```

### 8. Training oder "Finetuning" des Netzwerks
Das Training des Netzwerks erfolgte über mehrere Epochen mit dem Adam-Optimizer:
```python
optimizer = optim.Adam(model.parameters(), lr=0.001)
for e in range(epoch_size):
    for i, data in enumerate(training_loader, 0):
        # Trainingsschleife
```

### 9. Evaluation des Netzwerks
Die Evaluierung erfolgte auf einem separaten Testdatensatz:
```python
(test_size = len(gefiltertes_dataset) - train_size)
(train_set, test_set = random_split(gefiltertes_dataset, [train_size, test_size]))
with torch.no_grad():
    # Evaluationsschleife
```

### 10. Einbettung und Anwendung des Netzwerks im gewählten Kontext
Das trainierte Modell wird gespeichert und kann für Vorhersagen auf neuen Bildern verwendet werden:
```python
torch.save(model.state_dict(), path)
# Später laden und anwenden:
model.load_state_dict(torch.load(path))
outputs = model(images.to(device))
```

### 11. Fazit
Das implementierte CNN konnte die Klassifikation von Katzen- und Hundebildern erfolgreich durchführen und erreichte auf dem Testdatensatz eine akzeptable Genauigkeit. 

Zur weiteren Verbesserung der Modellleistung könnten Techniken wie Cross-Validation angewendet werden, um eine robustere Schätzung der Generalisierungsfähigkeit zu erhalten. Zusätzliche Optimierungen könnten die Implementierung von Datenaugmentierung, das Experimentieren mit komplexeren Netzwerkarchitekturen oder die Anwendung von Techniken zur Vermeidung von Überanpassung umfassen.
