# 🚀 Meine erste Streamlit Data App

## Lernziele dieser Woche
- Erste interaktive Web-App mit Streamlit erstellen
- Daten einlesen und grundlegend verstehen
- Einfache Visualisierungen für Web-Apps
- App lokal ausführen und testen

## Was ist Streamlit?
**Streamlit** ist ein Python-Framework, mit dem du schnell und einfach interaktive Web-Anwendungen für Data Science erstellen kannst - ohne HTML, CSS oder JavaScript zu kennen!

**Warum Streamlit für ML-Apps?**
- ✅ Schnelle Prototypenerstellung
- ✅ Automatisches responsive Design
- ✅ Einfache Integration von ML-Modellen
- ✅ Ideal für Präsentationen und Demos
- ✅ Kostenlose Deployment-Optionen

# 🎯 Woche 1: Von Jupyter zu Streamlit - Erste Schritte

**Willkommen beim modernisierten AMALEA-Kurs! Hier lernst du alles, was du brauchst.**

## 📚 Was du heute lernst

- **Jupyter Notebooks** verstehen und bedienen (aus dem ursprünglichen AMALEA-Kurs)
- **Python Libraries** für Data Science kennenlernen
- **Streamlit** - von Notebooks zu interaktiven Web-Apps
- **Pandas** für Datenanalyse (aus "Pandas retten den Tag")
- **Erste Visualisierungen** mit matplotlib und plotly

---

## 🧠 Wichtige Begriffe aus dem AMALEA-Kurs

Bevor wir mit Streamlit loslegen, hier die wichtigen Grundlagen aus dem ursprünglichen Kurs:

### Was ist ein Jupyter Notebook?

Das hier ist eine **interaktive Umgebung**, in der du direkt Code schreiben und ausführen kannst. Jupyter Notebooks bestehen aus einzelnen **Zellen**:

1. **Text-Zellen (Markdown):** Für formatierten Text, Bilder, Links, Formeln
2. **Code-Zellen:** Hier kommt dein Python-Code rein

### Code-Zellen verstehen

- `In [ ]:` (leer): Zelle wurde noch **nicht ausgeführt**
- `In [*]:` (Sternchen): Zelle wird **gerade ausgeführt**
- `In [1]:` (Zahl): Zelle wurde ausgeführt (Reihenfolge der Ausführung)

**Tastenkürzel:**
- `Strg+Enter` (Windows/Linux) / `Cmd+Enter` (Mac): Zelle ausführen
- `Shift+Enter`: Zelle ausführen und zur nächsten springen

## 📚 Begriffe die du kennen solltest

### Packages (Pakete/Bibliotheken)
**Package** = Sammlung von fertigem Python-Code für bestimmte Aufgaben

**Die wichtigsten für uns:**
- **Streamlit** = Web-Apps erstellen
- **Pandas** = Datenanalyse (wie Excel für Python)
- **Plotly** = Interaktive Diagramme
- **NumPy** = Mathematische Berechnungen
- **Scikit-learn** = Machine Learning

### Installation mit pip
**pip** = Package Installer for Python (das "App Store" für Python-Pakete)

In [None]:
# Installiere die wichtigsten Pakete für diese Woche
!pip install streamlit pandas plotly seaborn numpy

# Überprüfe die Installation
import streamlit as st
import pandas as pd
import plotly.express as px
import seaborn as sns
import numpy as np

print("✅ Alle Pakete erfolgreich installiert!")
print(f"Streamlit Version: {st.__version__}")
print(f"Pandas Version: {pd.__version__}")

# 🎯 AMALEA-Grundlagen: Erste Schritte mit Jupyter und Python
# Diese Zelle kombiniert die wichtigsten Konzepte aus dem ursprünglichen AMALEA-Kurs

print("🚀 Willkommen beim modernisierten AMALEA-Kurs!")
print("=" * 50)

# Beispiel aus "Erste Schritte": Einfache Berechnungen
seconds_in_a_day = 24 * 60 * 60
print(f"Sekunden pro Tag: {seconds_in_a_day:,}")

seconds_in_a_week = 7 * seconds_in_a_day
print(f"Sekunden pro Woche: {seconds_in_a_week:,}")

# Data Science Bibliotheken installieren und importieren
# (Das war im ursprünglichen "Pandas retten den Tag" Notebook)

try:
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    import plotly.express as px
    print("\n✅ Alle wichtigen Data Science Bibliotheken sind verfügbar!")
    print("- pandas: Datenmanipulation und -analyse")
    print("- numpy: Numerische Berechnungen")  
    print("- matplotlib: Basis-Plotting")
    print("- plotly: Interaktive Plots")
    
except ImportError as e:
    print(f"❌ Fehler beim Importieren: {e}")
    print("💡 Installiere die Pakete mit: pip install pandas numpy matplotlib plotly")

# Kleine Demo-Visualisierung (aus dem ursprünglichen AMALEA)
print("\n📊 Demo-Visualisierung aus dem ursprünglichen AMALEA-Kurs:")
ys = 200 + np.random.randn(100)
x = list(range(len(ys)))

plt.figure(figsize=(10, 4))
plt.plot(x, ys, '-', alpha=0.7)
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)
plt.title("Sample Visualization - Wie im ursprünglichen AMALEA")
plt.xlabel("Index")
plt.ylabel("Wert")
plt.grid(True, alpha=0.3)
plt.show()

print("\n🎯 Jetzt geht's weiter mit Streamlit - der modernen Art, Data Science Apps zu bauen!")

## 🎯 Demo 1.1: Deine erste "Hello World" Streamlit App

**Wichtig:** Streamlit-Apps müssen in separaten `.py`-Dateien stehen, nicht im Notebook!

**Warum?** Streamlit startet einen eigenen Webserver und muss die Datei direkt ausführen können.

## 🐼 Pandas-Grundlagen (aus "Pandas retten den Tag")

Bevor wir Streamlit verwenden, müssen wir die **Datenaufbereitung** verstehen - das war ein zentraler Teil des ursprünglichen AMALEA-Kurses.

### Wichtige Begriffe aus dem ursprünglichen Kurs:

| Begriff | Erklärung | Beispiel |
|---------|-----------|----------|
| **Sample** | Eine Zeile in der Tabelle (Datenpunkt, Beobachtung, Instanz) | Ein Kunde, ein Haus, ein Patient |
| **Feature** | Eine Spalte in der Tabelle (Merkmal, Attribut, Variable) | Alter, Wohnfläche, Blutdruck |
| **Label/Target** | Die Zielvariable, die vorhergesagt werden soll | Kaufentscheidung, Hauspreis, Diagnose |

### CSV-Dateien verstehen

**CSV** = **C**omma **S**eparated **V**alues (durch Komma getrennte Werte)

```
Name,Alter,Stadt
Anna,25,Berlin
Max,30,Hamburg
Lisa,28,München
```

### Datenqualität ist entscheidend!

> **"Müll rein, Müll raus"** - Die Qualität deiner Daten hat enormen Einfluss auf dein ML-Modell!

---

## 🌐 Von Jupyter zu Streamlit - Warum der Wechsel?

**Jupyter Notebooks sind toll für:**
- ✅ Datenanalyse und Exploration
- ✅ Prototyping und Experimente
- ✅ Dokumentation von Analysen

**Aber Streamlit ist besser für:**
- 🚀 **Interaktive Web-Apps** erstellen
- 👥 **Apps mit anderen teilen** (ohne Python-Installation)
- 🎛️ **Benutzerfreundliche Interfaces** mit Widgets
- ☁️ **Einfaches Deployment** in die Cloud

**Streamlit** verwandelt deine Python-Skripte in interaktive Web-Apps - ohne HTML, CSS oder JavaScript!

In [None]:
# Erstelle deine erste App-Datei
%%writefile hello_streamlit.py

import streamlit as st
import pandas as pd
import numpy as np
import plotly.express as px

# App-Titel und Beschreibung
st.title("🎯 Meine erste ML-Data App")
st.write("Willkommen zur IU Data Analytics Fallstudie!")

# Sidebar für Eingaben
st.sidebar.header("🔧 Einstellungen")
name = st.sidebar.text_input("Wie heißt du?", "Student")
anzahl_datenpunkte = st.sidebar.slider("Anzahl Datenpunkte", 10, 1000, 100)

# Hauptbereich
st.write(f"Hallo **{name}**! 👋")

# Erstelle Beispiel-Daten
np.random.seed(42)  # Für reproduzierbare Zufallszahlen
data = pd.DataFrame({
    'x': np.random.randn(anzahl_datenpunkte),
    'y': np.random.randn(anzahl_datenpunkte),
    'kategorie': np.random.choice(['A', 'B', 'C'], anzahl_datenpunkte)
})

# Zeige die Daten
st.subheader("📊 Unsere Beispiel-Daten")
st.write(f"Dataset mit {len(data)} Datenpunkten:")
st.dataframe(data.head(10))  # Zeigt nur erste 10 Zeilen

# Einfache Visualisierung
st.subheader("📈 Interaktive Visualisierung")
fig = px.scatter(data, x='x', y='y', color='kategorie', 
                title="Scatter Plot der Beispiel-Daten")
st.plotly_chart(fig, use_container_width=True)

# Einfache Statistiken
st.subheader("📋 Grundlegende Statistiken")
st.write(data.describe())

# Info-Box
st.info("💡 Tipp: Verändere die Einstellungen in der Sidebar und beobachte, wie sich die App aktualisiert!")

# 📊 Pandas-Demo: CSV-Daten einlesen und analysieren
# Basiert auf "Pandas retten den Tag" aus dem ursprünglichen AMALEA-Kurs

print("🐼 Pandas-Grundlagen aus dem ursprünglichen AMALEA-Kurs")
print("=" * 60)

# CSV-Daten simulieren (wie im ursprünglichen Kurs erklärt)
print("1️⃣ CSV-Struktur verstehen:")
csv_content = """Name,Alter,Stadt,Gehalt
Anna,25,Berlin,45000
Max,30,Hamburg,52000
Lisa,28,München,48000
Tom,35,Köln,55000
Sarah,22,Frankfurt,38000"""

print(csv_content)

# DataFrame erstellen (zentral in allen AMALEA-Notebooks)
print("\n2️⃣ CSV in pandas DataFrame konvertieren:")
from io import StringIO
df = pd.read_csv(StringIO(csv_content))
print(df)

# Wichtige pandas-Operationen (aus dem ursprünglichen Kurs)
print("\n3️⃣ Wichtige pandas-Operationen:")
print(f"📏 Anzahl Zeilen und Spalten: {df.shape}")
print(f"📋 Spalten: {list(df.columns)}")
print(f"📊 Erste 3 Zeilen:")
print(df.head(3))

print(f"\n📈 Statistische Zusammenfassung:")
print(df.describe())

# Datentypen prüfen (wichtig für ML!)
print(f"\n🔍 Datentypen (wichtig für Machine Learning):")
print(df.dtypes)

# Features vs. Labels identifizieren (ML-Konzept aus AMALEA)
print(f"\n🎯 Features vs. Labels (ML-Konzepte):")
features = ['Alter', 'Stadt']  # Input-Variablen
target = 'Gehalt'              # Zielvariable
print(f"Features (Input): {features}")
print(f"Target (Output): {target}")

# Einfache Datenanalyse
print(f"\n📊 Einfache Analyse:")
print(f"Durchschnittsalter: {df['Alter'].mean():.1f} Jahre")
print(f"Durchschnittsgehalt: {df['Gehalt'].mean():,.0f} €")
print(f"Städte: {df['Stadt'].unique()}")

print(f"\n✅ Das sind die Pandas-Grundlagen, die du für Streamlit brauchst!")
print(f"🚀 Jetzt erstellen wir daraus eine interaktive Streamlit-App...")

### 🚀 App starten

**So startest du deine Streamlit-App:**

1. **Terminal öffnen** (in VS Code: Terminal → New Terminal)
2. **Ins richtige Verzeichnis navigieren:** `cd pfad/zu/deinem/ordner`
3. **App starten:** `streamlit run hello_streamlit.py`
4. **Browser öffnet sich automatisch** unter `http://localhost:8501`

**Was passiert dabei:**
- **Webserver:** Streamlit startet einen lokalen Webserver
- **Live-Reload:** Änderungen am Code werden automatisch aktualisiert
- **Port 8501:** Standard-Port für Streamlit-Apps

## 🛠️ Streamlit-Komponenten erklärt

### Die wichtigsten Streamlit-Befehle:

In [None]:
# Übersicht über Streamlit-Komponenten (neue Datei erstellen)
%%writefile streamlit_komponenten.py

import streamlit as st
import pandas as pd
import numpy as np
import plotly.express as px

st.title("🧰 Streamlit Komponenten-Guide")

# 1. TEXT-ELEMENTE
st.header("1️⃣ Text-Elemente")
st.subheader("Untertitel")
st.write("Universeller Ausgabe-Befehl")
st.markdown("**Markdown** funktioniert auch!")
st.text("Einfacher Text ohne Formatierung")
st.caption("Kleine Beschriftung")

# 2. EINGABE-WIDGETS
st.header("2️⃣ Eingabe-Widgets")

col1, col2 = st.columns(2)

with col1:
    st.write("**Zahlen-Eingaben:**")
    zahl = st.slider("Schieberegler:", 0, 100, 50)
    nummer = st.number_input("Zahl eingeben:", 0, 1000, 42)
    
with col2:
    st.write("**Text-Eingaben:**")
    text = st.text_input("Textfeld:", "Hallo Welt")
    auswahl = st.selectbox("Dropdown:", ["Option A", "Option B", "Option C"])

# Radio-Buttons und Checkboxes
radio = st.radio("Radio-Buttons:", ["Ja", "Nein", "Vielleicht"])
checkbox = st.checkbox("Checkbox aktiviert?")

# 3. DATEN-ANZEIGE
st.header("3️⃣ Daten anzeigen")

# Beispieldaten erstellen
beispiel_daten = pd.DataFrame({
    'Spalte 1': np.random.randn(20),
    'Spalte 2': np.random.randn(20),
    'Kategorie': np.random.choice(['A', 'B'], 20)
})

# Verschiedene Anzeige-Methoden
st.write("**DataFrame:**")
st.dataframe(beispiel_daten)

st.write("**Statische Tabelle:**")
st.table(beispiel_daten.head())

st.write("**JSON:**")
st.json({'name': 'Anna', 'alter': 25, 'stadt': 'Berlin'})

# 4. DIAGRAMME
st.header("4️⃣ Diagramme")

col1, col2 = st.columns(2)

with col1:
    st.write("**Einfache Diagramme:**")
    st.line_chart(beispiel_daten[['Spalte 1', 'Spalte 2']])
    
with col2:
    st.write("**Plotly-Diagramm:**")
    fig = px.scatter(beispiel_daten, x='Spalte 1', y='Spalte 2', 
                    color='Kategorie')
    st.plotly_chart(fig, use_container_width=True)

# 5. LAYOUT
st.header("5️⃣ Layout-Optionen")

# Sidebar-Beispiele
st.sidebar.header("Sidebar-Bereich")
sidebar_option = st.sidebar.radio("Sidebar-Radio:", ["A", "B", "C"])

# Columns
st.write("**Spalten-Layout:**")
col1, col2, col3 = st.columns(3)
col1.metric("Wert 1", "1234")
col2.metric("Wert 2", "5678")
col3.metric("Wert 3", "91011")

# Tabs
tab1, tab2, tab3 = st.tabs(["Tab 1", "Tab 2", "Tab 3"])
with tab1:
    st.write("Inhalt von Tab 1")
with tab2:
    st.write("Inhalt von Tab 2")
with tab3:
    st.write("Inhalt von Tab 3")

# 6. STATUS-MELDUNGEN
st.header("6️⃣ Status-Meldungen")
st.success("✅ Erfolgsmeldung")
st.info("ℹ️ Informations-Box")
st.warning("⚠️ Warnung")
st.error("❌ Fehlermeldung")

# 7. INTERAKTIVE ELEMENTE
st.header("7️⃣ Interaktive Elemente")

if st.button("Klick mich!"):
    st.balloons()  # Konfetti-Animation
    st.write("Button wurde geklickt! 🎉")

# File Uploader
uploaded_file = st.file_uploader("Datei hochladen:", type=['csv', 'txt'])
if uploaded_file:
    st.success("Datei erfolgreich hochgeladen!")

## 🏆 Lernziel-Check Woche 1

Am Ende dieser Woche solltest du:

- [ ] **Streamlit-Grundlagen verstehen:** Was ist ein Framework, wie funktioniert es?
- [ ] **Eine App lokal ausführen können:** Terminal, streamlit run, Browser
- [ ] **Wichtige Streamlit-Komponenten kennen:** st.write, st.sidebar, st.plotly_chart
- [ ] **Daten in Apps laden und anzeigen:** Pandas, Seaborn-Datasets
- [ ] **Interaktive Filter implementieren:** Selectbox, Slider, Multiselect
- [ ] **Einfache Visualisierungen erstellen:** Plotly Express
- [ ] **Eine eigene Datenanalyse-App entwickelt haben:** Funktionsfähig und vollständig

## 🔮 Ausblick auf Woche 2

Nächste Woche erweitern wir unsere Apps um **Machine Learning**:
- **Erste ML-Modelle** in Streamlit integrieren
- **Benutzer-Eingaben** für Vorhersagen nutzen
- **Modell-Training** in der App visualisieren
- **Interaktive ML-Demos** erstellen

**💡 Tipp:** Die beste Art Python zu lernen ist durch praktisches Experimentieren! 🚀