# 🌳 Woche 3: Bäume, Nachbarn und Clustering - AMALEA Kernkonzepte

**Integration der ursprünglichen AMALEA-Notebooks:**
- "Willkommen in der Baumschule!" → Decision Trees
- "Schöne Nachbarschaft" → K-Nearest Neighbors  
- "K-Means-Clustering" → Unsupervised Learning

## 📚 Was du heute lernst

- **Decision Trees** 🌳 - Wie Computer Entscheidungen treffen
- **K-Nearest Neighbors (KNN)** 👥 - Lernen von den Nachbarn
- **K-Means Clustering** 🎯 - Gruppen in Daten finden
- **Supervised vs. Unsupervised Learning** unterscheiden
- **Streamlit-Apps** für alle drei Algorithmen erstellen

---

## 🎯 Kernkonzepte aus dem ursprünglichen AMALEA-Kurs

### Decision Trees 🌳
> **Idee**: Wie Menschen Entscheidungen treffen - durch eine Serie von Ja/Nein-Fragen

**Beispiel aus dem ursprünglichen Kurs:**
```
Ist es sonnig?
├─ JA → Gehe spazieren
└─ NEIN → Ist es regnerisch?
    ├─ JA → Bleibe zu Hause
    └─ NEIN → Gehe joggen
```

**Vorteile:**
- ✅ Leicht interpretierbar
- ✅ Keine Daten-Normalisierung nötig
- ✅ Arbeitet mit kategorialen und numerischen Daten

**Nachteile:**
- ❌ Kann zu Overfitting neigen
- ❌ Instabil bei kleinen Datenänderungen

### K-Nearest Neighbors (KNN) 👥
> **Idee**: "Sage mir, wer deine Nachbarn sind, und ich sage dir, wer du bist"

**Funktionsweise:**
1. Finde die k nächsten Nachbarn
2. Schaue, welche Klasse am häufigsten ist
3. Treffe Vorhersage basierend auf Mehrheit

**Parameter k:**
- k=1: Sehr flexibel, aber anfällig für Noise
- k=groß: Glatter, aber weniger Details
- k=ungerade: Vermeidet Unentschieden

### K-Means Clustering 🎯
> **Idee**: Finde natürliche Gruppen in den Daten (ohne Labels!)

**Unterschied zu Supervised Learning:**
- **Supervised** (Decision Trees, KNN): Haben Labels/Targets
- **Unsupervised** (K-Means): Keine Labels, finde Muster selbst

## 🎬 Original AMALEA Videos: Advanced Algorithms Deep-Dive

**Diese drei Algorithmus-Videos sind Klassiker und perfekt für das tiefe Verständnis! 🌳**

### 📹 **Video 1: "Willkommen in der Baumschule!" (Decision Trees)**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4`
- **Dauer:** ~20 Minuten
- **Inhalt:** Decision Trees, Entropy, Information Gain, Pruning
- **Warum wichtig:** Versteht, wie Entscheidungsbäume "denken"
- **Fun Fact:** Der Titel ist Kult! 🌳

### 📹 **Video 2: "Schöne Nachbarschaft" (K-Nearest Neighbors)**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4`
- **Dauer:** ~15 Minuten
- **Inhalt:** KNN-Algorithmus, Distance Metrics, k-Wahl
- **Warum wichtig:** Einfachster ML-Algorithmus, aber mächtig!
- **Quote:** "Sag mir wer deine Nachbarn sind..." 🏠

### 📹 **Video 3: "K-Means-Clustering"**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4`
- **Dauer:** ~18 Minuten
- **Inhalt:** Unsupervised Learning, Centroids, Elbow Method
- **Warum wichtig:** Findet versteckte Muster in Daten
- **Anwendung:** Customer Segmentation, Market Research

> **🎯 Pro-Tipp:** Die Videos erklären die Algorithmen besser als jedes Lehrbuch. Schaut sie → dann implementiert sie unten!

**Diese Algorithmen sind die Basis für viele moderne ML-Systeme. Versteht ihr sie, versteht ihr ML! 💪**

---

## 🎬 Video-Serie: Original AMALEA Advanced Algorithms

**📼 Diese Video-Trilogie stammt aus dem Original AMALEA-Kurs (KIT 2021) und erklärt die wichtigsten ML-Algorithmen!**

---

### 🌳 Video 1: Willkommen in der Baumschule! (Decision Trees)
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4`  
**⏱️ Dauer:** ~25 Minuten  
**🎯 Algorithmus:** Decision Trees & Random Forest

**📚 Was lernst du:**
- Wie Decision Trees "denken"
- Gini Impurity vs. Information Gain
- Pruning - Warum weniger manchmal mehr ist
- Random Forest als Ensemble-Methode
- Overfitting bei Bäumen vermeiden

**🌟 Highlight:** Visualisierung von Entscheidungsbäumen - endlich verstehen, wie sie funktionieren!

---

### 👥 Video 2: Schöne Nachbarschaft (K-Nearest Neighbors)
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4`  
**⏱️ Dauer:** ~20 Minuten  
**🎯 Algorithmus:** K-Nearest Neighbors (KNN)

**📚 Was lernst du:**
- Das einfachste ML-Algorithmus der Welt?
- Curse of Dimensionality verstehen
- Wie wähle ich das richtige K?
- Distance Metrics: Euclidean vs. Manhattan
- Lazy Learning vs. Eager Learning

**💡 Fun Fact:** KNN ist so einfach, dass es schon 1951 erfunden wurde!

---

### 🎯 Video 3: K-Means Clustering
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4`  
**⏱️ Dauer:** ~30 Minuten  
**🎯 Algorithmus:** K-Means & Clustering-Methoden

**📚 Was lernst du:**
- Unsupervised Learning in Aktion
- Lloyd's Algorithm Schritt für Schritt
- Elbow-Method für optimales K
- Silhouette Score verstehen
- Clustering vs. Classification

**🚀 Anwendung:** Customer Segmentation, Datenexploration, Anomaly Detection

---

## 🎯 Empfohlene Lernstrategie:

### 📋 **Option A: Video-First Approach**
1. **🎬 Alle 3 Videos schauen** (~75 Minuten)
2. **💻 Notebook durcharbeiten** 
3. **🔬 Eigene Experimente starten**

### 📋 **Option B: Interaktives Lernen**
1. **🎬 Video 1 → 💻 Decision Tree Code**
2. **🎬 Video 2 → 💻 KNN Code**  
3. **🎬 Video 3 → 💻 K-Means Code**

### 📋 **Option C: Deep Dive**
1. **🎬 Alle Videos**
2. **💻 Code verstehen**
3. **📊 Eigene Daten testen**
4. **🎬 Videos nochmal für Details**

---

> 🏆 **Pro-Tipp:** Diese 3 Algorithmen sind die "Big 3" des Machine Learning! Verstehst du sie, verstehst du 80% aller ML-Projekte.

---

> 🎓 **Akademische Qualität:** Original KIT-Produktion bedeutet Uni-Level Erklärungen - perfekt für IU Informatik!

---