# Teil 3: Neuronales Netz

## Überwachtes Lernen

Im letzten Teil hat K-Means Gruppen gefunden, **ohne die Antworten zu kennen**. Das war beeindruckend - aber wir HABEN ja die richtigen Antworten! Wir wissen, welche Blume zu welcher Art gehört.

**Warum dieses Wissen nicht nutzen?**

Ein **neuronales Netz** lernt aus Beispielen MIT den richtigen Antworten:
1. Wir zeigen der KI eine Blume und sagen: "Das ist eine Setosa"
2. Die KI merkt sich, welche Messungen zu Setosa gehören
3. Nach vielen Beispielen kann sie neue Blumen selbst erkennen

Das nennt man **überwachtes Lernen** - wie ein Schüler, der von einem Lehrer lernt.

---

## Module und Daten laden

In [None]:
import sys
import warnings
warnings.filterwarnings("ignore", message=".*as_object_map.*")

if "pyodide" in sys.modules:
    import piplite
    await piplite.install(["numpy", "pandas", "matplotlib", "scikit-learn"])

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, confusion_matrix

df = pd.read_csv("data/iris.csv")
print(f"Daten geladen: {len(df)} Blumen")

## Schritt 1: Daten aufteilen

### Das Prüfungs-Prinzip

Stell dir vor, du lernst für eine Mathe-Prüfung:
- Du übst mit **Übungsaufgaben** (= Trainingsdaten)
- Die Prüfung hat **neue Aufgaben** (= Testdaten)

Wenn die Prüfung die gleichen Aufgaben hätte wie beim Üben, wüssten wir nicht, ob du Mathe wirklich verstanden hast - oder nur auswendig gelernt hast!

**Genau so bei der KI:**
- **80% der Blumen** = Trainingsdaten (zum Lernen)
- **20% der Blumen** = Testdaten (für die "Prüfung")

Die KI sieht die Testblumen erst ganz am Schluss!

In [None]:
X = df[["sepal_length", "sepal_width", "petal_length", "petal_width"]]
y = df["species"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Trainingsdaten: {len(X_train)} Blumen | Testdaten: {len(X_test)} Blumen")

### Aufgabe 1: Warum Daten aufteilen?

1. Erkläre in deinen eigenen Worten, warum es unfair wäre, wenn eine Prüfung genau die gleichen Aufgaben hätte wie die Übungen.

2. Was würde passieren, wenn wir die KI mit ALLEN 150 Blumen trainieren und dann mit den gleichen testen?

3. **Overfitting**: Wenn eine KI die Trainingsdaten "auswendig lernt" statt Muster zu erkennen. Erkläre das mit einem Schul-Beispiel.

### Deine Antworten zu Aufgabe 1

**1. Warum wäre es unfair?**

*Doppelklicke hier und schreibe deine Antwort...*

**2. Was würde passieren?**

*Doppelklicke hier und schreibe deine Antwort...*

**3. Overfitting-Beispiel:**

*Doppelklicke hier und schreibe deine Antwort...*

---

## Schritt 2: Normalisierung

### Warum brauchen wir das?

Stell dir vor, du vergleichst:
- Körpergrösse: 170 cm
- Schuhgrösse: 42

Die KI könnte denken: "170 ist viel grösser als 42, also ist Körpergrösse wichtiger!" Das stimmt aber nicht.

**Normalisierung** bringt alle Werte auf eine ähnliche Skala (ungefähr zwischen -2 und +2). So sind alle Messungen gleich wichtig.

In [None]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print(f"Vorher:  {X_train.iloc[0].values}")
print(f"Nachher: {X_train_scaled[0].round(2)}")

## Schritt 3: Neuronales Netz erstellen

### Was ist ein neuronales Netz?

Das Gehirn besteht aus Milliarden von **Neuronen** (Nervenzellen), die miteinander verbunden sind. Ein neuronales Netz in der Informatik funktioniert ähnlich - aber viel einfacher.

### Die Team-Analogie

Stell dir ein Team von Experten vor:
1. **Eingangsteam (4 Personen):** Nimmt die 4 Messungen entgegen
2. **Denkteam 1 (10 Personen):** Kombiniert die Informationen
3. **Denkteam 2 (10 Personen):** Verfeinert die Entscheidung
4. **Ausgangsteam (3 Personen):** Gibt die Wahrscheinlichkeit für jede Blumenart aus

```
[4 Eingänge] → [10 Neuronen] → [10 Neuronen] → [3 Ausgänge]
   Messungen       "Denken"       "Denken"      Blumenarten
```

Jede Person (Neuron) ist mit allen Personen der nächsten Stufe verbunden. Beim Training lernt das Netz, wie stark jede Verbindung sein soll.

In [None]:
model = MLPClassifier(hidden_layer_sizes=(10, 10), max_iter=1000, random_state=42)
print("Netz erstellt: [4] → [10] → [10] → [3]")

## Schritt 4: Training

### Wie lernt die KI?

Das Training läuft in vielen Runden (hier bis zu 1000):

1. **Raten:** Die KI schaut sich eine Blume an und rät die Art
2. **Feedback:** Wir sagen ihr, ob sie richtig oder falsch lag
3. **Anpassen:** Sie verstärkt die Verbindungen, die zur richtigen Antwort führten
4. **Wiederholen:** Das macht sie mit allen 120 Trainingsblumen, immer wieder

Mit jeder Runde wird die KI ein bisschen besser - wie ein Schüler, der immer wieder übt!

In [None]:
model.fit(X_train_scaled, y_train)
print("Training abgeschlossen!")

## Schritt 5: Die grosse Prüfung!

Jetzt zeigen wir der KI die 30 Testblumen, die sie noch NIE gesehen hat.

In [None]:
y_pred = model.predict(X_test_scaled)
accuracy = accuracy_score(y_test, y_pred)

print(f"Ergebnis: {(y_test == y_pred).sum()}/{len(y_test)} richtig = {accuracy*100:.1f}% Genauigkeit")

## Einzelne Vorhersagen anschauen

In [None]:
print("Die ersten 10 Vorhersagen:\n")
for i in range(min(10, len(y_test))):
    actual, predicted = y_test.iloc[i], y_pred[i]
    status = "Richtig" if actual == predicted else f"Fehler ({predicted})"
    print(f"Blume {i+1}: {actual} → {status}")

## Confusion Matrix

Die **Confusion Matrix** (Verwirrungsmatrix) zeigt uns genau, wo die KI Fehler macht.

### Wie liest man sie?

- **Zeilen** = Die echten Blumenarten
- **Spalten** = Was die KI geraten hat
- **Diagonale** (von oben-links nach unten-rechts) = Richtig erkannt!
- **Daneben** = Fehler (Verwechslungen)

In [None]:
cm = confusion_matrix(y_test, y_pred)
species_names = df["species"].unique()

fig, ax = plt.subplots(figsize=(7, 5))
im = ax.imshow(cm, cmap="Blues")

ax.set(xticks=range(3), yticks=range(3), xticklabels=species_names, yticklabels=species_names,
       xlabel="Vorhergesagt", ylabel="Tatsächlich", title="Confusion Matrix")

for i in range(3):
    for j in range(3):
        ax.text(j, i, cm[i, j], ha="center", va="center", 
                color="white" if cm[i, j] > cm.max()/2 else "black", fontsize=16, fontweight="bold")

plt.colorbar(im)
plt.tight_layout()
plt.show()

print("Diagonale = richtig erkannt, daneben = Fehler")

### Aufgabe 2: Die Confusion Matrix lesen

1. **Zähle zusammen:** Wie viele Blumen wurden insgesamt RICHTIG erkannt?

2. **Fehler finden:** Welche Blumenarten wurden verwechselt?

3. **Genauigkeit berechnen:** Accuracy = Richtige / Gesamt x 100%. Stimmt dein Ergebnis?

### Deine Antworten zu Aufgabe 2

**1. Anzahl richtig erkannter Blumen:**

*Doppelklicke hier und schreibe deine Antwort...*

**2. Welche Arten wurden verwechselt?**

*Doppelklicke hier und schreibe deine Antwort...*

**3. Deine Genauigkeits-Berechnung:**

*Doppelklicke hier und schreibe deine Antwort...*

---

## Teste die KI mit einer neuen Blume!

Ändere die Werte und führe die Zelle nochmal aus!

In [None]:
# Format: [Kelchblatt-Länge, Kelchblatt-Breite, Blütenblatt-Länge, Blütenblatt-Breite]
neue_blume = np.array([[5.1, 3.5, 1.4, 0.2]])

neue_blume_scaled = scaler.transform(neue_blume)
vorhersage = model.predict(neue_blume_scaled)
proba = model.predict_proba(neue_blume_scaled)[0]

print(f"Messungen: Kelchblatt {neue_blume[0][0]}x{neue_blume[0][1]} cm, Blütenblatt {neue_blume[0][2]}x{neue_blume[0][3]} cm")
print(f"\nVorhersage: {vorhersage[0]}")
print(f"\nWahrscheinlichkeiten:")
for species, p in zip(df["species"].unique(), proba):
    print(f"   {species}: {'█' * int(p*20)} {p*100:.1f}%")

### Experimentiere selbst!

```python
# Typische Setosa (kleine Blütenblätter):
neue_blume = np.array([[5.0, 3.5, 1.3, 0.3]])

# Typische Versicolor (mittlere Grösse):
neue_blume = np.array([[6.0, 2.7, 4.5, 1.5]])

# Typische Virginica (grosse Blütenblätter):
neue_blume = np.array([[6.5, 3.0, 5.5, 2.0]])
```

---

## Zusammenfassung

### Was wir in allen drei Notebooks gelernt haben

| Begriff | Bedeutung |
|---------|----------|
| **Maschinelles Lernen** | Computer lernen aus Daten statt durch Programmierung |
| **Features** | Die Merkmale/Eingaben (unsere 4 Messungen) |
| **Labels** | Die richtigen Antworten (Blumenarten) |
| **Unüberwachtes Lernen** | KI sucht Muster ohne Antworten (K-Means) |
| **Überwachtes Lernen** | KI lernt aus Beispielen MIT Antworten (Neuronales Netz) |
| **Trainingsdaten** | Daten zum Lernen (80%) |
| **Testdaten** | Daten für die "Prüfung" (20%) |
| **Normalisierung** | Alle Werte auf gleiche Skala bringen |
| **Overfitting** | Auswendig lernen statt Muster verstehen |
| **Accuracy** | Wie oft liegt die KI richtig? (Anzahl richtige / Gesamt) |

### Der Unterschied

| | K-Means | Neuronales Netz |
|-|---------|----------------|
| **Lernt aus** | Nur den Daten | Daten + richtige Antworten |
| **Braucht** | Anzahl Gruppen (K) | Trainingsbeispiele mit Labels |
| **Kann** | Gruppen finden | Neue Daten klassifizieren |
| **Typisch für** | Unbekannte Daten sortieren | Bekannte Kategorien erkennen |

---

### Glückwunsch!

Du hast gerade:
- Einen echten Datensatz aus dem Jahr 1936 analysiert
- K-Means Clustering ausprobiert (unüberwachtes Lernen)
- Ein neuronales Netz trainiert (überwachtes Lernen)
- Die Qualität mit Testdaten überprüft

**Das ist genau der Prozess, den auch professionelle Data Scientists verwenden!**