# 🐍 Python Quick-Start – Von 0 auf Data Science in 3 Stunden

## Willkommen zum IU Data Analytics & Big Data Kurs!

**Keine Panik!** 😊 Du hast noch nie Python programmiert? Kein Problem! In diesem Crashkurs lernst du alle Python-Grundlagen, die du für unseren Data Analytics & Big Data Kurs brauchst.

### Was ist Python?
- **Python** ist eine Programmiersprache, die besonders gut für Datenanalyse geeignet ist.
- **Einfach zu lernen:** Python liest sich fast wie Englisch.
- **Sehr beliebt:** Die meistgenutzte Sprache für Data Science und KI.
- **Kostenlos:** Komplett Open Source.

### Was sind Jupyter Notebooks?
- **Jupyter Notebook** ist ein Tool, mit dem du Python-Code schreibst und sofort das Ergebnis siehst.
- **Interaktiv:** Du kannst Code-Schnipsel einzeln ausführen.
- **Perfekt zum Lernen:** Text, Code und Ergebnisse in einem Dokument.

---

## 🎬 Ergänzendes Video: Python-Grundlagen

**📼 Original AMALEA Video (KIT 2021):**
`../Kurs-Videos/amalea-kit2021-w1v1_final (1080p).mp4`

💡 **Tipp:** Schau dir das Video an, um die Python-Grundlagen zu verstehen, bevor du mit den praktischen Übungen startest!

## 🏗️ Teil 1: Python Basics (30 Minuten)

### Variablen – Deine ersten "Datenbehälter"

In [None]:
# Das ist ein Kommentar - wird nicht ausgeführt

# Variablen erstellen (wie Boxen mit Etiketten)
name = "Anna"           # Text (String)
alter = 25              # Ganze Zahl (Integer)  
groesse = 1.68          # Dezimalzahl (Float)
ist_student = True      # Wahr/Falsch (Boolean)

# Ausgeben mit print()
print("Name:", name)
print("Alter:", alter)
print("Größe:", groesse, "m")
print("Student?", ist_student)

**💡 Erklärung:**
- `name = "Anna"` erstellt eine Variable namens "name" mit dem Wert "Anna".
- `print()` zeigt Werte auf dem Bildschirm an.
- Python erkennt automatisch, welcher Datentyp in jeder Variable steht.

In [None]:
# Rechnen mit Variablen
a = 10
b = 3

print("Addition:", a + b)       # 13
print("Subtraktion:", a - b)    # 7
print("Multiplikation:", a * b) # 30
print("Division:", a / b)       # 3.333...
print("Potenz:", a ** b)        # 10³ = 1000

# Text zusammenfügen
vorname = "Max"
nachname = "Mustermann"
vollname = vorname + " " + nachname
print("Vollname:", vollname)

### Listen - Mehrere Werte in einer Variable

In [None]:
# Listen erstellen (wie eine Einkaufsliste)
einkaufsliste = ["Milch", "Brot", "Äpfel", "Käse"]
zahlen = [1, 5, 3, 9, 2]
gemischt = ["Text", 42, True, 3.14]

print("Einkaufsliste:", einkaufsliste)
print("Erstes Element:", einkaufsliste[0])    # Listen starten bei 0!
print("Letztes Element:", einkaufsliste[-1])  # -1 = letztes Element

# Neue Elemente hinzufügen
einkaufsliste.append("Butter")
print("Nach Hinzufügen:", einkaufsliste)

# Länge einer Liste
print("Anzahl Elemente:", len(einkaufsliste))

**💡 Wichtig:** Listen starten bei Index 0, nicht bei 1!
- `liste[0]` = erstes Element
- `liste[1]` = zweites Element
- `liste[-1]` = letztes Element

### Schleifen - Code wiederholen

In [None]:
# For-Schleife: Durch Liste gehen
früchte = ["Apfel", "Banane", "Orange"]

print("Alle Früchte:")
for frucht in früchte:
    print("- " + frucht)

# Zahlen durchgehen
print("\nZahlen 1 bis 5:")
for zahl in range(1, 6):  # range(1,6) = [1,2,3,4,5]
    print(zahl)

**💡 Erklärung:**
- `for frucht in früchte:` geht durch jedes Element der Liste.
- `range(1, 6)` erstellt Zahlen von 1 bis 5 (6 ist ausgeschlossen).
- **Einrückung ist wichtig!** Alles, was eingerückt ist, gehört zur Schleife.

### If-Bedingungen - Entscheidungen treffen

In [None]:
# Einfache Bedingung
alter = 20

if alter >= 18:
    print("Du bist volljährig")
else:
    print("Du bist minderjährig")

# Mehrere Bedingungen
note = 85

if note >= 90:
    print("Sehr gut!")
elif note >= 80:
    print("Gut!")
elif note >= 70:
    print("Befriedigend")
else:
    print("Verbesserung nötig")

**💡 Vergleichsoperatoren:**
- `==` gleich (nicht `=`!)
- `!=` ungleich
- `>` größer als
- `>=` größer oder gleich
- `<` kleiner als
- `<=` kleiner oder gleich

## 🧰 Teil 2: Wichtige Bibliotheken (45 Minuten)

### Was sind Bibliotheken?
**Bibliotheken** (auch "Packages" oder "Module") sind fertige Code-Sammlungen, die andere Programmierer:innen geschrieben haben. Statt alles selbst zu programmieren, nutzt du diese Werkzeuge.

**Analogie:** Wenn Python die Sprache ist, sind Bibliotheken wie Werkzeugkästen für verschiedene Aufgaben.

### Pandas – Der Excel-Ersatz für Python
**Pandas** = **Pan**el **Da**ta **S**ystem (Datenanalyse-Bibliothek)

In [None]:
# Pandas importieren (einmalig pro Notebook)
import pandas as pd  # 'pd' ist die Abkürzung

# DataFrame erstellen (wie eine Excel-Tabelle)
daten = {
    'Name': ['Anna', 'Ben', 'Clara', 'David'],
    'Alter': [25, 30, 35, 28],
    'Stadt': ['Berlin', 'Hamburg', 'München', 'Köln'],
    'Gehalt': [45000, 52000, 48000, 51000]
}

df = pd.DataFrame(daten)  # df = DataFrame
print("Unser DataFrame:")
print(df)

### Data Science Best Practices: Pandas DataFrames (Advanced)

- **Datenimport:** Nutze `pd.read_csv`, `read_parquet` oder `read_sql` für große Datenmengen. Parquet ist oft schneller und speichereffizienter als CSV.
- **Indexierung:** Setze einen sinnvollen Index (`set_index`), um Filter- und Join-Operationen zu beschleunigen.
- **Chained Assignment:** Vermeide verkettete Zuweisungen (`df[df.x > 0].y = 1`), da dies zu schwer auffindbaren Bugs führen kann. Nutze stattdessen `.loc`.
- **Speicheroptimierung:** Prüfe mit `df.info(memory_usage='deep')` und konvertiere z. B. Strings zu `category`, wenn wenige Ausprägungen vorliegen.
- **Vektorisierung:** Schreibe Berechnungen möglichst als Vektoroperationen, nicht in Python-Schleifen – das ist um Größenordnungen schneller.
- **Fehlende Werte:** Nutze `isna()`, `fillna()`, `dropna()` gezielt. Achte auf Seiteneffekte bei Inplace-Operationen.
- **Testing:** Verwende `assert_frame_equal` aus `pandas.testing` für Unit-Tests von DataFrames.
- **Pipelines:** Für reproduzierbare Analysen: Baue Data-Pipelines mit Funktionen oder nutze Libraries wie `sklearn.pipeline` oder `dask`.

In [None]:
# Grundlegende DataFrame-Operationen
print("Erste 2 Zeilen:")
print(df.head(2))

print("\nInfo über den DataFrame:")
print(df.info())

print("\nNur die Spalte 'Name':")
print(df['Name'])

print("\nPersonen älter als 28:")
ältere = df[df['Alter'] > 28]
print(ältere)

### Advanced: Data Cleaning, Feature Engineering & Pipeline-Design

- **Data Cleaning:** Nutze `df.pipe()` für modulare, wiederverwendbare Cleaning-Schritte. Setze gezielt Regex, Mapping und Outlier-Detection ein.
- **Feature Engineering:** Automatisiere Feature-Generierung mit Libraries wie `featuretools` oder nutze `sklearn.compose.ColumnTransformer` für komplexe Pipelines.
- **Pipelines:** Baue End-to-End-Pipelines mit `sklearn.pipeline.Pipeline` oder `dask` für verteilte Verarbeitung. So wird Code wartbar und reproduzierbar.
- **Testing:** Schreibe Unit-Tests für alle Transformationsschritte, z.B. mit `pytest` und `hypothesis`.

**💡 DataFrame = Excel-Tabelle in Python:**
- **Zeilen** = einzelne Datensätze (wie Excel-Zeilen)
- **Spalten** = Eigenschaften (wie Excel-Spalten)
- `df.head()` zeigt die ersten Zeilen.
- `df[spaltenname]` wählt eine Spalte aus.
- `df[bedingung]` filtert Zeilen.

### Matplotlib & Plotly – Diagramme erstellen

In [None]:
import matplotlib.pyplot as plt
import plotly.express as px

# Einfaches Balkendiagramm mit Matplotlib
plt.figure(figsize=(8, 5))  # Größe festlegen
plt.bar(df['Name'], df['Alter'])
plt.title('Alter der Personen')
plt.xlabel('Name')
plt.ylabel('Alter')
plt.show()

### Visualisierung: Advanced Insights & Best Practices

- **Plotly vs. Matplotlib:** Plotly ist ideal für interaktive Dashboards und Web-Apps, Matplotlib für statische Publikationen. Kombiniere beide je nach Use Case.
- **Performance:** Für große Datenmengen: Downsampling oder Aggregation vor dem Plotten. Plotly kann bei mehr als 10.000 Punkten langsam werden.
- **Custom Layouts:** Nutze Subplots, Faceting und eigene Themes für professionelle Visualisierungen.
- **Export:** Plotly-Grafiken lassen sich als HTML, SVG oder PNG exportieren – ideal für Berichte und Präsentationen.
- **Dashboards:** Für komplexe Dashboards empfiehlt sich Dash (Plotly) oder Streamlit. Achte auf State-Management und User Experience.
- **Testing:** Automatisiere Visualisierungs-Tests mit `pytest-mpl` oder Snapshot-Tests für Plotly.

In [None]:
# Interaktives Diagramm mit Plotly
fig = px.bar(df, x='Name', y='Gehalt', 
             title='Gehälter der Personen',
             color='Stadt')
fig.show()

### Advanced: Visual Analytics & Dashboard-Design

- **User-Interaktion:** Integriere Filter, Drilldowns und dynamische Visualisierungen für explorative Analysen (z.B. mit Plotly Dash oder Streamlit).
- **KPI-Visualisierung:** Nutze spezielle Komponenten wie `st.metric` oder Plotly Indicators für Business-Dashboards.
- **Accessibility:** Achte auf Farbschemata (Colorblindness), Responsive Design und Tooltips.
- **Automatisierung:** Generiere Reports automatisiert mit `nbconvert`, `papermill` oder `reporting`-Libraries.

**💡 Unterschied:**
- **Matplotlib** = Statische Bilder (wie gedruckte Grafiken)
- **Plotly** = Interaktive Grafiken (zoomen, Hover-Effekte)
- **Für Web-Apps** verwenden wir hauptsächlich Plotly.

## 🌐 Teil 3: Streamlit – Web-Apps erstellen (60 Minuten)

### Was ist Streamlit?
**Streamlit** ist eine Python-Bibliothek zum Erstellen von Web-Apps **ohne** HTML/CSS/JavaScript.

**Stell dir vor:** Du schreibst normalen Python-Code, und Streamlit macht automatisch eine schöne Website daraus!

In [None]:
# Streamlit installieren (falls noch nicht geschehen)
!pip install streamlit

# Prüfen ob Installation funktioniert hat
import streamlit as st
print("✅ Streamlit erfolgreich installiert!")

---

> ⚠️ **WICHTIG: Streamlit-Code läuft NICHT im Notebook!**
>
> - Kopiere Streamlit-Code immer in eine eigene Datei, z. B. `meine_erste_app.py`.
> - Führe die Datei im Terminal aus:
>   ```bash
>   streamlit run meine_erste_app.py
>   ```
> - Das Notebook zeigt keine Streamlit-Web-App an!
>
> **Warum?** Streamlit startet einen eigenen Webserver und öffnet die App im Browser. Im Notebook funktioniert das nicht.
>
> **Tipp:** Änderungen am Code werden nach dem Speichern automatisch übernommen, solange die App läuft.
---

> ❌ **Häufige Fehlerquelle:**

Viele Studierende versuchen, Streamlit-Code direkt im Notebook auszuführen – das funktioniert NICHT!

> **Typische Fehlermeldungen:**
- `ModuleNotFoundError: No module named 'streamlit'` (obwohl installiert)
- Es erscheint keine Web-App, sondern nur eine Textausgabe im Notebook
- Streamlit-Befehle wie `st.write()` zeigen keine Wirkung

> **Lösung:**
- Speichere den Code immer als `.py`-Datei und starte ihn mit `streamlit run` im Terminal.
- Notebook-Zellen mit Streamlit-Code dienen nur als Vorlage!

> **Troubleshooting:**
- Die App startet nicht? Terminal-Ausgabe prüfen und Fehlermeldungen lesen.
- Browser öffnet sich nicht? Manuell zu `http://localhost:8501` wechseln.
- Änderungen werden nicht übernommen? Datei speichern und Seite neu laden.

### Deine erste Streamlit-App
**Wichtig:** Streamlit-Code muss in einer separaten `.py`-Datei stehen, nicht im Notebook!

In [None]:
# Beispiel: So könnte deine erste Streamlit-App aussehen (als Python-Datei speichern, z.B. meine_erste_app.py)

import streamlit as st
import pandas as pd

# Titel der App
st.title("🎉 Meine erste Streamlit App")
st.write("Hallo Welt! Das ist meine erste Web-App.")

# Eingabefeld für den Namen
name = st.text_input("Wie heißt du?")

if name:
    st.write(f"Hallo {name}! Schön dich kennenzulernen! 👋")

# Einfache Daten
daten = {
    'Obst': ['Apfel', 'Banane', 'Orange'],
    'Anzahl': [10, 5, 8]
}
df = pd.DataFrame(daten)

st.subheader("Meine Daten:")
st.dataframe(df)  # Zeigt Tabelle an

# Einfaches Diagramm
st.bar_chart(df.set_index('Obst'))

### Streamlit für Data Science: Best Practices & Advanced Tipps

- **State Management:** Nutze `st.session_state` für komplexe Interaktionen. Achtung: State ist pro User/Session!
- **Deployment:** Für produktive Deployments: Docker-Container oder Cloud-Angebote wie Streamlit Cloud, Azure, AWS. Achte auf Secrets-Management.
- **Performance:** Große Datenmengen vorab filtern/aggregieren, Caching (`@st.cache_data`) gezielt einsetzen.
- **Testing:** Automatisiere UI-Tests mit `pytest` und `streamlit.testing` (ab v1.28).
- **Custom Components:** Baue eigene UI-Elemente mit Streamlit Components (React, JS).
- **Fehlerquellen:** Viele Probleme entstehen durch das Ausführen von Streamlit-Code im Notebook – immer als `.py`-Datei und mit `streamlit run` starten!

### App ausführen
Um deine Streamlit-App zu starten:

1. **Terminal öffnen** (in VS Code: Terminal → New Terminal)
2. **Befehl eingeben:** `streamlit run meine_erste_app.py`
3. **Browser öffnet sich automatisch** mit deiner App!

**Was passiert:**
- Streamlit startet einen lokalen Webserver
- Deine App läuft unter `http://localhost:8501`
- Jede Änderung am Code wird automatisch aktualisiert

### Streamlit-Komponenten erklärt

In [None]:
# Weitere Streamlit-Beispiele (als Python-Datei speichern, z.B. streamlit_komponenten.py)

import streamlit as st
import pandas as pd
import numpy as np

st.title("🧰 Streamlit Komponenten-Übersicht")

# Text-Elemente
st.header("1. Text-Elemente")
st.subheader("Das ist ein Untertitel")
st.write("Normaler Text mit **fett** und *kursiv*")
st.markdown("### Markdown funktioniert auch!")

# Eingabe-Widgets
st.header("2. Eingabe-Widgets")
zahl = st.slider("Wähle eine Zahl:", 0, 100, 50)
st.write(f"Du hast {zahl} gewählt")

auswahl = st.selectbox("Lieblingsfrucht:", ["Apfel", "Banane", "Orange"])
st.write(f"Du magst {auswahl}")

# Sidebar (seitliche Leiste)
st.sidebar.header("Einstellungen")
farbe = st.sidebar.radio("Wähle Farbe:", ["Rot", "Grün", "Blau"])

# Daten anzeigen
st.header("3. Daten-Anzeige")
beispiel_daten = pd.DataFrame({
    'x': np.random.randn(50),
    'y': np.random.randn(50)
})

st.line_chart(beispiel_daten)

# Spalten-Layout
col1, col2 = st.columns(2)
with col1:
    st.write("Linke Spalte")
with col2:
    st.write("Rechte Spalte")

**💡 Streamlit-Komponenten:**
- `st.title()` = Haupttitel
- `st.header()` = Überschrift
- `st.write()` = Universelle Text- und Datenausgabe
- `st.slider()` = Schieberegler für Zahlen
- `st.selectbox()` = Dropdown-Menü
- `st.sidebar` = Seitenleiste
- `st.columns()` = Spalten-Layout

## 🐳 Teil 4: Docker Grundlagen (45 Minuten)

### Was ist Docker?
**Docker** = Tool um Software in "Containern" zu verpacken

**Analogie:** Stell dir vor, Docker ist wie ein Versandcontainer:
- **Container** = Standardisierte Box mit allem was deine App braucht
- **Funktioniert überall:** Auf deinem Laptop, auf Servern, in der Cloud
- **Isoliert:** Apps stören sich nicht gegenseitig

### Warum Docker für Data Science?
- **Reproduzierbarkeit:** Deine App läuft bei jedem gleich
- **Einfaches Deployment:** Einmal verpackt, überall ausführen
- Keine **"It works on my machine"**-Entschuldigungen
- **Verschiedene Python-Versionen** parallel nutzen

### Docker-Begriffe erklärt

**🐳 Docker-Container:**
- Wie ein virtueller Computer mit deiner App
- Enthält: Python, deine Bibliotheken, deinen Code
- Läuft isoliert vom Hauptsystem

**📋 Dockerfile:**
- Rezept zum Bauen eines Containers
- Textdatei mit Anweisungen
- Wie eine Kochanleitung

**🏪 Docker Image:**
- Fertig gebauter Container (noch nicht gestartet)
- Wie ein Template oder eine Vorlage

**🚢 Docker Hub:**
- Online-Bibliothek für vorgefertigte Images
- Wie der App Store für Container

In [None]:
# Beispiel: Dockerfile für unsere Streamlit-App erstellen

dockerfile_code = '''
# Basis-Image: Python 3.11 auf schlankem Linux
FROM python:3.11-slim

# Arbeitsverzeichnis im Container festlegen
WORKDIR /app

# Abhängigkeiten kopieren und installieren
COPY requirements.txt .
RUN pip install -r requirements.txt

# App-Code kopieren
COPY . .

# Port für Streamlit freigeben
EXPOSE 8501

# Befehl zum Starten der App
CMD ["streamlit", "run", "meine_erste_app.py", "--server.address", "0.0.0.0"]
'''

print(dockerfile_code)

### Docker für Data Science: Advanced Workflow & Best Practices

- **Multi-Stage-Builds:** Reduziere Image-Größe und Angriffsfläche durch Multi-Stage-Builds im Dockerfile.
- **Reproducibility:** Nutze exakte Versionsangaben in `requirements.txt` und dokumentiere Build-Parameter.
- **Security:** Verwende möglichst offizielle, minimalistische Base-Images (z.B. `python:3.11-slim`). Führe keine Container als root aus.
- **Persistenz:** Volumes für Datenhaltung, Secrets nie ins Image einbauen!
- **CI/CD:** Automatisiere Builds und Tests mit GitHub Actions, GitLab CI oder Azure Pipelines.
- **Debugging:** Nutze `docker exec` für interaktives Debugging im laufenden Container.

**💡 Dockerfile erklärt:**
- `FROM python:3.11-slim` = Basis: Python 3.11 (schlank)
- `WORKDIR /app` = Arbeitsordner im Container
- `COPY requirements.txt .` = Kopiere Abhängigkeits-Liste
- `RUN pip install -r requirements.txt` = Installiere Python-Pakete
- `COPY . .` = Kopiere allen Code in Container
- `EXPOSE 8501` = Öffne Port 8501 (Streamlit-Standard)
- `CMD [...]` = Befehl beim Container-Start

In [None]:
# Requirements-Datei für Docker erstellen

requirements_code = '''
streamlit==1.25.0
pandas==2.0.3
plotly==5.15.0
numpy==1.24.3
'''

print(requirements_code)

### Docker-Befehle (wichtigste)

**In der Praxis nutzt du diese Befehle im Terminal:**

```bash
# Container bauen (aus Dockerfile)
docker build -t meine-streamlit-app .

# Container starten
docker run -p 8501:8501 meine-streamlit-app

# Laufende Container anzeigen
docker ps

# Container stoppen
docker stop [container-id]

# Alle Images anzeigen
docker images
```

**💡 Erklärung:**
- `-t meine-streamlit-app` = Tag (Name) für das Image
- `-p 8501:8501` = Port-Weiterleitung (extern:intern)
- `.` = Aktuelles Verzeichnis für Build verwenden

### Docker Compose - Mehrere Container verwalten

**Docker Compose** = Tool um mehrere Container gleichzeitig zu starten

**Beispiel:** Deine App braucht:
- Container 1: Streamlit-App
- Container 2: Datenbank
- Container 3: Machine Learning API

Statt jeden einzeln zu starten → Docker Compose macht alles auf einmal

In [None]:
# Docker Compose Konfiguration

compose_code = '''
version: '3.8'

services:
  # Unsere Streamlit App
  streamlit-app:
    build: .                    # Baue aus lokalem Dockerfile
    ports:
      - "8501:8501"            # Port-Weiterleitung
    volumes:
      - ./data:/app/data       # Datenordner verbinden
    
  # Jupyter für Entwicklung
  jupyter:
    image: jupyter/datascience-notebook
    ports:
      - "8888:8888"
    volumes:
      - ./notebooks:/home/jovyan/work
    environment:
      - JUPYTER_TOKEN=mein-geheimes-token
'''

print(compose_code)

### Advanced: Orchestrierung, Monitoring & Production-Readiness

- **Orchestrierung:** Nutze Kubernetes oder Docker Swarm für skalierbare Multi-Container-Deployments. Automatisiere Healthchecks und Rolling Updates.
- **Monitoring:** Integriere Prometheus, Grafana oder ELK-Stack für Logging und Monitoring von Containern und Services.
- **Production-Readiness:** Implementiere automatisierte Tests, Security-Scans (z.B. Trivy), Secrets-Management (z.B. Vault) und automatisches Rebuild bei neuen Base-Images.
- **Zero Downtime:** Setze Blue/Green- oder Canary-Deployments für unterbrechungsfreie Updates ein.

**Docker Compose Befehle:**
```bash
# Alle Services starten
docker-compose up -d

# Services stoppen
docker-compose down

# Nur bestimmten Service starten
docker-compose up streamlit-app

# Logs anschauen
docker-compose logs
```

**💡 Warum Docker Compose?**
- **Ein Befehl** startet die gesamte Umgebung
- **Konfiguration in Datei** gespeichert
- **Services können miteinander kommunizieren**
- **Perfekt für Entwicklung und Deployment**

## 🎯 Teil 5: Zusammenfassung & Nächste Schritte (20 Minuten)

### Was du heute gelernt hast:

#### 🐍 **Python Grundlagen:**
- **Variablen:** `name = "Anna"`
- **Listen:** `[1, 2, 3]`
- **Schleifen:** `for item in liste:`
- **Bedingungen:** `if alter >= 18:`

#### 📊 **Data Science Libraries:**
- **Pandas:** Excel-Tabellen in Python (`pd.DataFrame`)
- **Matplotlib/Plotly:** Diagramme erstellen
- **Streamlit:** Web-Apps ohne HTML/CSS

#### 🐳 **Docker:**
- **Container:** Verpacke deine App mit allen Abhängigkeiten
- **Dockerfile:** Rezept zum Bauen
- **Docker Compose:** Mehrere Container verwalten

#### 🌐 **Streamlit:**
- **Web-Apps** aus Python-Code
- **Interaktive Widgets:** Slider, Selectboxes
- **Automatisches Update** bei Code-Änderungen

### Nächste Schritte für den Kurs:

#### **Woche 1:** Streamlit-Apps entwickeln
- Datenanalyse-Apps bauen
- Verschiedene Visualisierungen
- Interaktive Filter und Widgets

#### **Woche 2:** Machine Learning integrieren  
- Erste ML-Modelle trainieren
- Vorhersagen in der App machen
- Modell-Performance visualisieren

#### **Woche 3-6:** Fortgeschrittene Features
- Apps online deployen
- Deep Learning einbauen
- Eigene Fallstudie entwickeln

### Dein Endprodukt:
Eine **vollständige ML-Web-App** die du:
- **Live demonstrieren** kannst
- **Online verfügbar** machst
- **Als Fallstudie präsentierst**

## 🏆 Quiz: Teste dein Wissen!

### Frage 1: Python Basics
Was gibt dieser Code aus?
```python
alter = 25
if alter >= 18:
    print("Erwachsen")
else:
    print("Kind")
```

### Frage 2: Pandas
Wie wählst du die Spalte "Name" aus einem DataFrame `df` aus?

### Frage 3: Streamlit
Welcher Befehl startet eine Streamlit-App?

### Frage 4: Docker
Was ist der Unterschied zwischen einem Image und einem Container?

**💡 Antworten findest du in den Code-Beispielen oben!**

## 🔧 Praktische Übung: Deine erste vollständige App

**Aufgabe:** Erstelle eine Streamlit-App die:

1. **Daten einliest** (CSV oder erstellt eigene)
2. **Filter-Optionen** in der Sidebar hat
3. **Verschiedene Visualisierungen** zeigt
4. **Zusammenfassung/Statistiken** anzeigt

### Template zum Starten:

In [None]:
%%writefile uebungs_app.py

import streamlit as st
import pandas as pd
import plotly.express as px

# App-Titel
st.title("📊 Meine Data Analytics & Big Data App")
st.write("Von: [Dein Name hier]")

# Beispieldaten erstellen
daten = {
    'Produkt': ['Laptop', 'Handy', 'Tablet', 'Kopfhörer', 'Maus'],
    'Preis': [800, 600, 400, 100, 25],
    'Kategorie': ['Computer', 'Telefon', 'Computer', 'Audio', 'Computer'],
    'Bewertung': [4.5, 4.2, 4.0, 4.8, 3.9]
}

df = pd.DataFrame(daten)

# Sidebar für Filter
st.sidebar.header("🔍 Filter")
kategorie_filter = st.sidebar.selectbox(
    "Kategorie wählen:",
    ["Alle"] + list(df['Kategorie'].unique())
)

# Daten filtern
if kategorie_filter != "Alle":
    gefilterte_daten = df[df['Kategorie'] == kategorie_filter]
else:
    gefilterte_daten = df

# Hauptbereich
st.subheader("🛍️ Produktdaten")
st.dataframe(gefilterte_daten)

# Visualisierungen
col1, col2 = st.columns(2)

with col1:
    fig1 = px.bar(gefilterte_daten, x='Produkt', y='Preis', 
                  title="Preise nach Produkt")
    st.plotly_chart(fig1, use_container_width=True)

with col2:
    fig2 = px.scatter(gefilterte_daten, x='Preis', y='Bewertung',
                     color='Kategorie', title="Preis vs. Bewertung")
    st.plotly_chart(fig2, use_container_width=True)

# Statistiken
st.subheader("📈 Zusammenfassung")
col1, col2, col3 = st.columns(3)

with col1:
    st.metric("Anzahl Produkte", len(gefilterte_daten))
with col2:
    st.metric("Durchschnittspreis", f"{gefilterte_daten['Preis'].mean():.0f}€")
with col3:
    st.metric("Beste Bewertung", f"{gefilterte_daten['Bewertung'].max()}")

# TODO: Erweitere die App nach deinen Ideen!
st.info("💡 Ideen zum Erweitern: Mehr Filter, andere Diagramme, Daten-Upload...")

## 🎉 Herzlichen Glückwunsch!

Du hast erfolgreich die **Python-Grundlagen für Data Science** gelernt!

**Du kannst jetzt:**
- ✅ Python-Code schreiben und verstehen
- ✅ Mit Pandas Daten analysieren
- ✅ Streamlit-Apps erstellen
- ✅ Docker-Konzepte verstehen
- ✅ Deine erste interaktive Web-App bauen

**Nächste Woche** geht es weiter mit Machine Learning in Streamlit-Apps! 🚀

---

**💡 Tipp:** Nutze diese Datei als Nachschlagewerk – du wirst die Konzepte immer wieder brauchen!