# Einführung in Generative KI

Dieser Kurs bietet eine praxisorientierte Einführung in Generative Künstliche Intelligenz (KI), bei der praktische Umsetzung mit grundlegender Theorie kombiniert wird. Einige mathematische Konzepte werden behandelt, um zentrale Prinzipien zu erläutern, jedoch liegt der Fokus klar auf praktischen Fähigkeiten und realitätsnahen Anwendungen.

Im Verlauf des Kurses lernst du gängige generative Modelle, zentrale Konzepte, bewährte Vorgehensweisen und Industriestandards kennen, um dich auf die professionelle Entwicklung und Anwendung generativer KI-Lösungen vorzubereiten.

## Voraussetzungen

Es wird vorausgesetzt, dass du mit grundlegenden Konzepten des Deep Learning vertraut bist, darunter neuronale Netze, Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), Optimierungstechniken und Trainingsschleifen.

Bevor du die Notebooks lokal ausführst, stelle sicher, dass deine Umgebung korrekt eingerichtet ist:

```bash
# Virtuelle Umgebung erstellen und aktivieren
python -m venv genai-env
source genai-env/bin/activate  # Unter Windows: genai-env\Scripts\activate

# Benötigte Pakete installieren
pip install torch torchvision matplotlib numpy wandb scikit-learn
```

## Generative KI vs. traditionelle Ansätze

In der klassischen (traditionellen) maschinellen Lernmethodik besteht das Hauptziel darin, Datenpunkte in bestimmte Kategorien zu **klassifizieren** oder **vorherzusagen**, beispielsweise kontinuierliche Werte auf Basis von Eingabedaten. Solche Methoden beruhen oft auf **gelabelten Datensätzen** (überwachtes Lernen) und optimieren die Vorhersagegenauigkeit.

Im Gegensatz dazu zielt Generative KI nicht nur darauf ab, Muster zu erkennen, sondern auch neue, realistische Daten zu erzeugen, die den Trainingsdaten ähneln. Statt nur zu klassifizieren oder vorherzusagen, erzeugen generative Modelle vollständig neue Beispiele – etwa Bilder, Texte, Audiodateien oder Videos.

Zum Beispiel soll bei der Bildklassifikation ein Bild $x$ als Katze oder Hund klassifiziert werden.

<img src="https://ambolt.io/wp-content/uploads/classification-object-detection.png" width="600" style="display: block; margin: auto;">

*Bildquelle: [ambolt.io](https://ambolt.io/en/image-classification-and-object-detection/)*

**Generative KI**-Modelle hingegen lernen die zugrunde liegende Wahrscheinlichkeitsverteilung $p^{*}(x)$ der Daten, sodass neue, synthetische Daten erzeugt werden können, die den Trainingsbeispielen ähneln — durch Ziehen von Stichproben aus $ x \sim p^{*}(x) $.

<img src="./images/AI_generated_kitten.webp" width="300" style="display: block; margin: auto;">

*Bildquelle: [Dall-E](https://openai.com/dall-e-3)*

## Latent Spaces (Latente Räume)

Ein **latenter Raum** ist eine vereinfachte, komprimierte Darstellung von Daten, in der ähnliche Elemente näher beieinander liegen. Er fängt verborgene Muster oder Merkmale ein, die die Struktur der Daten definieren. Man kann ihn sich wie eine Landkarte vorstellen, die komplexe Informationen in bedeutungsvolle, niedrigdimensionale Koordinaten überführt.

<img src="./images/2D_latent_space.png" width="500" style="display: block; margin: auto;">