# 🐳 Docker für Data Science – Einfach erklärt
 
**Lernziel:** Du verstehst, was Docker ist und warum es für Data Science unverzichtbar ist.
 
---
 
## 🤔 Was ist Docker?
 
Stell dir vor, du willst ein komplexes Gericht kochen. Dafür brauchst du:
- Bestimmte Zutaten (z. B. Python-Bibliotheken)
- In genau den richtigen Mengen (Versionen)
- Mit speziellen Küchengeräten (Betriebssystem, Tools)
 
**Das Problem:** Jeder Computer ist wie eine andere Küche!
- Unterschiedliche Python-Versionen
- Unterschiedliche Betriebssysteme (Windows, Mac, Linux)
- Verschiedene installierte Pakete
 
**Die Lösung:** Docker ist wie eine "Fertigküche zum Mitnehmen"!
- Alle Zutaten und Geräte sind schon drin
- Funktioniert überall gleich – egal, wo du bist
- Keine Konflikte mit anderen "Rezepten" oder Projekten
 
> **Merke:** Mit Docker kannst du deine Data-Science-Projekte überall ausführen – ohne Installationsstress!

## 🏗️ Docker Grundbegriffe

### 📦 Container
- Eine "Box" mit allem, was deine App braucht
- Läuft isoliert vom Rest des Systems
- Kann gestartet, gestoppt und gelöscht werden

### 🗂️ Image (Abbild)
- Die "Vorlage" für einen Container
- Wie ein Rezept oder eine Bauanleitung
- Unveränderlich und wiederverwendbar

### 📝 Dockerfile
- Eine Textdatei mit Anweisungen
- Beschreibt, wie ein Image gebaut wird
- Wie eine Schritt-für-Schritt Anleitung

### 🎼 Docker Compose
- Orchestriert mehrere Container
- Wie ein Dirigent für ein Orchester
- Startet alle Services mit einem Befehl

## 🎯 Warum Docker für Data Science?

### ✅ Vorteile

1. **Reproduzierbarkeit** 🔄
   - Deine Analyse läuft überall gleich
   - Keine "Bei mir funktioniert es"-Probleme

2. **Einfache Installation** ⚡
   - Ein Befehl startet alles
   - Keine komplizierte Setup-Prozedur

3. **Isolation** 🏠
   - Verschiedene Projekte stören sich nicht
   - Keine Versionskonflikte

4. **Teamarbeit** 👥
   - Alle haben die gleiche Umgebung
   - Einfaches Teilen von Projekten

5. **Deployment** 🚀
   - Apps einfach in die Cloud bringen
   - Von lokal zu produktiv ohne Änderungen

## 🛠️ Docker Installation

### Windows & Mac
1. Gehe zu [docker.com](https://www.docker.com/products/docker-desktop)
2. Lade Docker Desktop herunter
3. Installiere und starte es
4. Teste mit: `docker --version`

### Linux (Ubuntu/Debian)
```bash
# Docker installieren
curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh

# Docker Compose installieren
sudo apt install docker-compose

# Benutzer zur Docker-Gruppe hinzufügen
sudo usermod -aG docker $USER
```

## 🚀 Unser Docker Setup

In diesem Kurs verwenden wir `docker-compose.yml` für:

### 📊 Jupyter Lab
- Interaktive Notebooks
- Port: 8888
- Passwort: `iu_data_analytics_2025`

### 🌐 Streamlit
- Web-App Development
- Port: 8501
- Für unsere ML-Apps

### 📈 MLflow
- ML-Experiment Tracking
- Port: 5000
- Modell-Verwaltung

## 💻 Docker Kommandos - Cheat Sheet

### Grundlegende Befehle
```bash
# Docker Version prüfen
docker --version

# Alle Container anzeigen
docker ps -a

# Alle Images anzeigen
docker images

# Container stoppen
docker stop <container_name>

# Container löschen
docker rm <container_name>
```

### Docker Compose Befehle
```bash
# Alle Services starten
docker-compose up -d

# Logs anzeigen
docker-compose logs

# Services stoppen
docker-compose down

# Services neu bauen
docker-compose build
```

## 🔧 Troubleshooting

### Problem: "Docker daemon not running"
**Lösung**: Docker Desktop starten

### Problem: "Port already in use"
**Lösung**: 
```bash
# Alle Container stoppen
docker-compose down

# Oder Port in docker-compose.yml ändern
```

### Problem: "Permission denied"
**Lösung** (Linux):
```bash
sudo usermod -aG docker $USER
# Dann neu anmelden
```

### Problem: Container startet nicht
**Lösung**:
```bash
# Logs prüfen
docker-compose logs <service_name>
```

## 🎯 Praktische Übung

### Schritt 1: Docker testen
```bash
# Teste Docker mit einem einfachen Container
docker run hello-world
```

### Schritt 2: Unser Setup starten
```bash
# In das amalea-Verzeichnis wechseln
cd /pfad/zu/amalea

# Alle Services starten
docker-compose up -d
```

### Schritt 3: Services testen
- Jupyter Lab: http://localhost:8888
- Streamlit: http://localhost:8501
- MLflow: http://localhost:5000

### Schritt 4: Container verwalten
```bash
# Status prüfen
docker-compose ps

# Logs anschauen
docker-compose logs jupyter

# Alles stoppen
docker-compose down
```

## 🌟 Docker Best Practices

### 1. Kleine Images verwenden
- Alpine Linux Images (klein und sicher)
- Nur notwendige Pakete installieren

### 2. Volumes für Daten
- Daten außerhalb des Containers speichern
- Überleben Container-Neustarts

### 3. Environment Variables
- Konfiguration flexibel halten
- Geheimnisse sicher verwalten

### 4. .dockerignore verwenden
- Unnötige Dateien ausschließen
- Build-Zeit reduzieren

### 5. Multi-Stage Builds
- Verschiedene Umgebungen (dev, test, prod)
- Kleinere finale Images

## 🎓 Zusammenfassung

**Was du gelernt hast:**
- ✅ Was Docker ist und warum es nützlich ist
- ✅ Grundlegende Docker-Begriffe
- ✅ Installation und Setup
- ✅ Wichtige Kommandos
- ✅ Troubleshooting-Tipps
- ✅ Best Practices

**Nächste Schritte:**
1. Docker installieren und testen
2. Unser docker-compose Setup ausprobieren
3. Mit Jupyter Lab erste Python-Schritte machen
4. Erste Streamlit-App entwickeln

---

**💡 Tipp**: Docker scheint am Anfang kompliziert, aber es macht dein Leben als Data Scientist viel einfacher! Dranbleiben lohnt sich! 🚀