# 🌳 Woche 3: Bäume, Nachbarn und Clustering - AMALEA Kernkonzepte

**Integration der ursprünglichen AMALEA-Notebooks:**
- "Willkommen in der Baumschule!" → Decision Trees
- "Schöne Nachbarschaft" → K-Nearest Neighbors  
- "K-Means-Clustering" → Unsupervised Learning

## 📚 Was du heute lernst

- **Decision Trees** 🌳 - Wie Computer Entscheidungen treffen
- **K-Nearest Neighbors (KNN)** 👥 - Lernen von den Nachbarn
- **K-Means Clustering** 🎯 - Gruppen in Daten finden
- **Supervised vs. Unsupervised Learning** unterscheiden
- **Streamlit-Apps** für alle drei Algorithmen erstellen

---

## 🎯 Kernkonzepte aus dem ursprünglichen AMALEA-Kurs

### Decision Trees 🌳
> **Idee**: Wie Menschen Entscheidungen treffen - durch eine Serie von Ja/Nein-Fragen

**Beispiel aus dem ursprünglichen Kurs:**
```
Ist es sonnig?
├─ JA → Gehe spazieren
└─ NEIN → Ist es regnerisch?
    ├─ JA → Bleibe zu Hause
    └─ NEIN → Gehe joggen
```

**Vorteile:**
- ✅ Leicht interpretierbar
- ✅ Keine Daten-Normalisierung nötig
- ✅ Arbeitet mit kategorialen und numerischen Daten

**Nachteile:**
- ❌ Kann zu Overfitting neigen
- ❌ Instabil bei kleinen Datenänderungen

### K-Nearest Neighbors (KNN) 👥
> **Idee**: "Sage mir, wer deine Nachbarn sind, und ich sage dir, wer du bist"

**Funktionsweise:**
1. Finde die k nächsten Nachbarn
2. Schaue, welche Klasse am häufigsten ist
3. Treffe Vorhersage basierend auf Mehrheit

**Parameter k:**
- k=1: Sehr flexibel, aber anfällig für Noise
- k=groß: Glatter, aber weniger Details
- k=ungerade: Vermeidet Unentschieden

### K-Means Clustering 🎯
> **Idee**: Finde natürliche Gruppen in den Daten (ohne Labels!)

**Unterschied zu Supervised Learning:**
- **Supervised** (Decision Trees, KNN): Haben Labels/Targets
- **Unsupervised** (K-Means): Keine Labels, finde Muster selbst

## 🎬 Original AMALEA Videos: Advanced Algorithms Deep-Dive

**Diese drei Algorithmus-Videos sind Klassiker und perfekt für das tiefe Verständnis! 🌳**

### 📹 **Video 1: "Willkommen in der Baumschule!" (Decision Trees)**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4`
- **Dauer:** ~20 Minuten
- **Inhalt:** Decision Trees, Entropy, Information Gain, Pruning
- **Warum wichtig:** Versteht, wie Entscheidungsbäume "denken"
- **Fun Fact:** Der Titel ist Kult! 🌳

### 📹 **Video 2: "Schöne Nachbarschaft" (K-Nearest Neighbors)**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4`
- **Dauer:** ~15 Minuten
- **Inhalt:** KNN-Algorithmus, Distance Metrics, k-Wahl
- **Warum wichtig:** Einfachster ML-Algorithmus, aber mächtig!
- **Quote:** "Sag mir wer deine Nachbarn sind..." 🏠

### 📹 **Video 3: "K-Means-Clustering"**
- **Datei:** `../Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4`
- **Dauer:** ~18 Minuten
- **Inhalt:** Unsupervised Learning, Centroids, Elbow Method
- **Warum wichtig:** Findet versteckte Muster in Daten
- **Anwendung:** Customer Segmentation, Market Research

## 🎬 Ergänzende Videos: Advanced Algorithms

**📼 Original AMALEA Video-Serie (KIT 2021):**

### 🌳 Video 1: Willkommen in der Baumschule! (Decision Trees)  
`Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4` (~25 min)
- Wie Decision Trees "denken"
- Gini Impurity vs. Information Gain
- Random Forest als Ensemble-Methode

### 👥 Video 2: Schöne Nachbarschaft (K-Nearest Neighbors)  
`Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4` (~20 min)
- K-Nearest Neighbors (KNN) Algorithmus
- Curse of Dimensionality
- Distance Metrics: Euclidean vs. Manhattan

### 🎯 Video 3: K-Means Clustering  
`Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4` (~30 min)
- Unsupervised Learning in Aktion
- Lloyd's Algorithm Schritt für Schritt
- Elbow-Method für optimales K

💡 **Tipp:** Diese 3 Algorithmen sind die "Big 3" des Machine Learning - verstehst du sie, verstehst du 80% aller ML-Projekte!

> **🎯 Pro-Tipp:** Die Videos erklären die Algorithmen besser als jedes Lehrbuch. Schaut sie → dann implementiert sie unten!

**Diese Algorithmen sind die Basis für viele moderne ML-Systeme. Versteht ihr sie, versteht ihr ML! 💪**

---

## 🎬 Video-Serie: Original AMALEA Advanced Algorithms

**📼 Diese Video-Trilogie stammt aus dem Original AMALEA-Kurs (KIT 2021) und erklärt die wichtigsten ML-Algorithmen!**

---

### 🌳 Video 1: Willkommen in der Baumschule! (Decision Trees)
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4`  
**⏱️ Dauer:** ~25 Minuten  
**🎯 Algorithmus:** Decision Trees & Random Forest

**📚 Was lernst du:**
- Wie Decision Trees "denken"
- Gini Impurity vs. Information Gain
- Pruning - Warum weniger manchmal mehr ist
- Random Forest als Ensemble-Methode
- Overfitting bei Bäumen vermeiden

**🌟 Highlight:** Visualisierung von Entscheidungsbäumen - endlich verstehen, wie sie funktionieren!

---

### 👥 Video 2: Schöne Nachbarschaft (K-Nearest Neighbors)
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4`  
**⏱️ Dauer:** ~20 Minuten  
**🎯 Algorithmus:** K-Nearest Neighbors (KNN)

**📚 Was lernst du:**
- Das einfachste ML-Algorithmus der Welt?
- Curse of Dimensionality verstehen
- Wie wähle ich das richtige K?
- Distance Metrics: Euclidean vs. Manhattan
- Lazy Learning vs. Eager Learning

**💡 Fun Fact:** KNN ist so einfach, dass es schon 1951 erfunden wurde!

---

### 🎯 Video 3: K-Means Clustering
**📁 Datei:** `../Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4`  
**⏱️ Dauer:** ~30 Minuten  
**🎯 Algorithmus:** K-Means & Clustering-Methoden

**📚 Was lernst du:**
- Unsupervised Learning in Aktion
- Lloyd's Algorithm Schritt für Schritt
- Elbow-Method für optimales K
- Silhouette Score verstehen
- Clustering vs. Classification

**🚀 Anwendung:** Customer Segmentation, Datenexploration, Anomaly Detection

---

## 🎯 Empfohlene Lernstrategie:

### 📋 **Option A: Video-First Approach**
1. **🎬 Alle 3 Videos schauen** (~75 Minuten)
2. **💻 Notebook durcharbeiten** 
3. **🔬 Eigene Experimente starten**

### 📋 **Option B: Interaktives Lernen**
1. **🎬 Video 1 → 💻 Decision Tree Code**
2. **🎬 Video 2 → 💻 KNN Code**  
3. **🎬 Video 3 → 💻 K-Means Code**

### 📋 **Option C: Deep Dive**
1. **🎬 Alle Videos**
2. **💻 Code verstehen**
3. **📊 Eigene Daten testen**
4. **🎬 Videos nochmal für Details**

---

> 🏆 **Pro-Tipp:** Diese 3 Algorithmen sind die "Big 3" des Machine Learning! Verstehst du sie, verstehst du 80% aller ML-Projekte.

---

> 🎓 **Akademische Qualität:** Original KIT-Produktion bedeutet Uni-Level Erklärungen - perfekt für IU Informatik!

---

In [None]:
# 🎬 DIREKTE VIDEO-PLAYER: Advanced Algorithms Trilogie  
from IPython.display import HTML, Video
import os

# Advanced Algorithms Video-Suite
algorithms_videos = {
    "w3v2": {
        "path": "../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4",
        "title": "🌳 Willkommen in der Baumschule! (Decision Trees)",
        "duration": "~25 min",
        "algorithm": "Decision Trees & Random Forest",
        "concepts": ["Gini Impurity", "Information Gain", "Pruning", "Random Forest", "Overfitting vermeiden"],
        "color": "#4CAF50"
    },
    "w3v3": {
        "path": "../Kurs-Videos/amalea-kit2021-w3v3 (1080p).mp4",
        "title": "👥 Schöne Nachbarschaft (K-Nearest Neighbors)", 
        "duration": "~20 min",
        "algorithm": "K-Nearest Neighbors (KNN)",
        "concepts": ["Distance Metrics", "Curse of Dimensionality", "K-Wahl", "Lazy vs. Eager Learning", "Skalierung"],
        "color": "#FF9800"
    },
    "w3v4": {
        "path": "../Kurs-Videos/amalea-kit2021-w3v4 (1080p).mp4",
        "title": "🎯 K-Means Clustering",
        "duration": "~30 min", 
        "algorithm": "K-Means & Clustering",
        "concepts": ["Lloyd's Algorithm", "Elbow Method", "Silhouette Score", "Unsupervised Learning", "Customer Segmentation"],
        "color": "#9C27B0"
    }
}

print("🎬 ADVANCED ALGORITHMS - INTERACTIVE VIDEO SUITE")
print("=" * 65)
print("🏆 Die 'Big 3' des Machine Learning mit KIT-Qualität!")
print()

for video_id, info in algorithms_videos.items():
    print(f"🚀 {info['algorithm']}")
    print(f"📺 {info['title']}")
    print(f"⏱️ {info['duration']}")
    
    if os.path.exists(info['path']):
        print("✅ Video ready to play!")
        
        # Erweiterte HTML5 Player mit Algorithmus-spezifischem Design
        html_player = f"""
        <div style="
            border: 3px solid {info['color']}; 
            border-radius: 12px; 
            margin: 25px 0; 
            padding: 20px; 
            background: linear-gradient(135deg, #ffffff 0%, #f8f9fa 100%);
            box-shadow: 0 4px 8px rgba(0,0,0,0.1);
        ">
            <div style="display: flex; align-items: center; margin-bottom: 15px;">
                <h3 style="color: {info['color']}; margin: 0; flex-grow: 1;">
                    {info['title']}
                </h3>
                <span style="
                    background-color: {info['color']}; 
                    color: white; 
                    padding: 5px 12px; 
                    border-radius: 20px; 
                    font-size: 12px; 
                    font-weight: bold;
                ">
                    {info['algorithm']}
                </span>
            </div>
            
            <div style="margin-bottom: 15px;">
                <strong>⏱️ Dauer:</strong> {info['duration']} | 
                <strong>🎓 Level:</strong> Advanced | 
                <strong>🏫 Quelle:</strong> KIT AMALEA 2021
            </div>
            
            <video 
                width="100%" 
                height="400" 
                controls 
                preload="metadata"
                style="border-radius: 8px; margin-bottom: 15px;"
                poster=""
            >
                <source src="{info['path']}" type="video/mp4">
                Dein Browser unterstützt HTML5 Video nicht. 
                <a href="{info['path']}" style="color: {info['color']};">Video herunterladen</a>
            </video>
            
            <div style="
                background: linear-gradient(90deg, {info['color']}15 0%, {info['color']}05 100%); 
                padding: 15px; 
                border-radius: 8px; 
                border-left: 4px solid {info['color']};
            ">
                <strong>🧠 Key Concepts:</strong>
                <div style="display: grid; grid-template-columns: repeat(auto-fit, minmax(200px, 1fr)); gap: 10px; margin-top: 8px;">
                    {"".join(f'<span style="background: white; padding: 8px; border-radius: 5px; border: 1px solid {info["color"]}30; font-size: 14px;">• {concept}</span>' for concept in info['concepts'])}
                </div>
            </div>
        </div>
        """
        
        display(HTML(html_player))
        
    else:
        print(f"❌ Video nicht gefunden: {info['path']}")
    
    print("-" * 50)

print("\n🎯 INTERAKTIVE LERNSTRATEGIE:")
print("1. 🎬 Video schauen → 2. 💻 Code verstehen → 3. 🔬 Experimentieren → 4. 🎬 Nochmal schauen")
print("\n💡 EINZELNE VIDEOS LADEN:")
print("Video('../Kurs-Videos/amalea-kit2021-w3v2 (1080p).mp4', width=800, height=450)")

# Bonus: Quick-Load Funktion für einzelne Videos
def load_video(video_name, width=800, height=450):
    """Quick-Load Funktion für einzelne Videos"""
    video_map = {
        'trees': algorithms_videos['w3v2']['path'],
        'knn': algorithms_videos['w3v3']['path'], 
        'kmeans': algorithms_videos['w3v4']['path']
    }
    
    if video_name in video_map:
        return Video(video_map[video_name], width=width, height=height, embed=True)
    else:
        print(f"❌ Video '{video_name}' nicht gefunden!")
        print(f"Verfügbare Videos: {list(video_map.keys())}")

print(f"\n🚀 BONUS: Quick-Load Videos mit load_video('trees'), load_video('knn'), load_video('kmeans')")