# üöÄ Deine erste Streamlit Data App
 
**Willkommen im modernisierten AMALEA-Kurs! Hier lernst du alles, was du f√ºr Data Science und moderne Web-Apps brauchst ‚Äì Schritt f√ºr Schritt, praxisnah und mit Spa√ü.**
 
## Lernziele dieser Woche
- Du erstellst deine erste interaktive Web-App mit Streamlit
- Du liest Daten ein und verstehst sie grundlegend
- Du baust einfache Visualisierungen f√ºr Web-Apps
- Du f√ºhrst deine App lokal aus und testest sie selbstst√§ndig
 
> **Warum lohnt sich das?**
> Mit Streamlit kannst du Data-Science-Projekte nicht nur analysieren, sondern auch als App f√ºr andere erlebbar machen ‚Äì ein echter Skill-Booster!
 
## Was ist Streamlit?
**Streamlit** ist ein Python-Framework, mit dem du schnell und einfach interaktive Web-Anwendungen f√ºr Data Science erstellen kannst ‚Äì ohne HTML, CSS oder JavaScript zu kennen!
 
**Warum Streamlit f√ºr ML-Apps?**
- ‚úÖ Schnelle Prototypenerstellung
- ‚úÖ Automatisches responsives Design
- ‚úÖ Einfache Integration von ML-Modellen
- ‚úÖ Ideal f√ºr Pr√§sentationen und Demos
- ‚úÖ Kostenlose Deployment-Optionen
 
# üéØ Woche 1: Von Jupyter zu Streamlit ‚Äì Deine ersten Schritte
 
## üìö Was du heute lernst
- **Jupyter Notebooks** verstehen und bedienen (aus dem urspr√ºnglichen AMALEA-Kurs)
- **Python Libraries** f√ºr Data Science kennenlernen
- **Streamlit** ‚Äì von Notebooks zu interaktiven Web-Apps
- **Pandas** f√ºr Datenanalyse (aus "Pandas retten den Tag")
- **Erste Visualisierungen** mit matplotlib und plotly
 
---
 
## üß† Wichtige Begriffe aus dem AMALEA-Kurs
 
Bevor wir mit Streamlit loslegen, hier die wichtigsten Grundlagen aus dem urspr√ºnglichen Kurs:
 
### Was ist ein Jupyter Notebook?
 
Das hier ist eine **interaktive Umgebung**, in der du direkt Code schreiben und ausf√ºhren kannst. Jupyter Notebooks bestehen aus einzelnen **Zellen**:
 
1. **Text-Zellen (Markdown):** F√ºr formatierten Text, Bilder, Links, Formeln
2. **Code-Zellen:** Hier kommt dein Python-Code rein
 
### Code-Zellen verstehen
 
- `In [ ]:` (leer): Zelle wurde noch **nicht ausgef√ºhrt**
- `In [*]:` (Sternchen): Zelle wird **gerade ausgef√ºhrt**
- `In [1]:` (Zahl): Zelle wurde ausgef√ºhrt (Reihenfolge der Ausf√ºhrung)
 
**Tastenk√ºrzel:**
- `Strg+Enter` (Windows/Linux) / `Cmd+Enter` (Mac): Zelle ausf√ºhren
- `Shift+Enter`: Zelle ausf√ºhren und zur n√§chsten springen

## üìö Begriffe die du kennen solltest

### Packages (Pakete/Bibliotheken)
**Package** = Sammlung von fertigem Python-Code f√ºr bestimmte Aufgaben

**Die wichtigsten f√ºr uns:**
- **Streamlit** = Web-Apps erstellen
- **Pandas** = Datenanalyse (wie Excel f√ºr Python)
- **Plotly** = Interaktive Diagramme
- **NumPy** = Mathematische Berechnungen
- **Scikit-learn** = Machine Learning

### Installation mit pip
**pip** = Package Installer for Python (das "App Store" f√ºr Python-Pakete)

In [1]:
# Installiere die wichtigsten Pakete f√ºr diese Woche
!pip install streamlit==1.52.1 pandas==2.2.3 plotly==5.24.1 seaborn==0.13.2 numpy==1.26.4 scikit-learn==1.6.0

# √úberpr√ºfe die Installation
import streamlit as st
import pandas as pd
import plotly.express as px
import seaborn as sns
import numpy as np

print("‚úÖ Alle Pakete erfolgreich installiert!")
print(f"Streamlit Version: {st.__version__}")
print(f"Pandas Version: {pd.__version__}")

# üéØ AMALEA-Grundlagen: Erste Schritte mit Jupyter und Python
# Diese Zelle kombiniert die wichtigsten Konzepte aus dem urspr√ºnglichen AMALEA-Kurs

print("üöÄ Willkommen beim modernisierten AMALEA-Kurs!")
print("=" * 50)

# Beispiel aus "Erste Schritte": Einfache Berechnungen
seconds_in_a_day = 24 * 60 * 60
print(f"Sekunden pro Tag: {seconds_in_a_day:,}")

seconds_in_a_week = 7 * seconds_in_a_day
print(f"Sekunden pro Woche: {seconds_in_a_week:,}")

# Data Science Bibliotheken installieren und importieren
# (Das war im urspr√ºnglichen "Pandas retten den Tag" Notebook)

try:
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    import plotly.express as px
    print("\n‚úÖ Alle wichtigen Data Science Bibliotheken sind verf√ºgbar!")
    print("- pandas: Datenmanipulation und -analyse")
    print("- numpy: Numerische Berechnungen")  
    print("- matplotlib: Basis-Plotting")
    print("- plotly: Interaktive Plots")
    
except ImportError as e:
    print(f"‚ùå Fehler beim Importieren: {e}")
    print("üí° Installiere die Pakete mit: pip install pandas numpy matplotlib plotly")

# Kleine Demo-Visualisierung (aus dem urspr√ºnglichen AMALEA)
print("\nüìä Demo-Visualisierung aus dem urspr√ºnglichen AMALEA-Kurs:")
ys = 200 + np.random.randn(100)
x = list(range(len(ys)))

plt.figure(figsize=(10, 4))
plt.plot(x, ys, '-', alpha=0.7)
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)
plt.title("Sample Visualization - Wie im urspr√ºnglichen AMALEA")
plt.xlabel("Index")
plt.ylabel("Wert")
plt.grid(True, alpha=0.3)

print("\nüéØ Jetzt geht's weiter mit Streamlit - der modernen Art, Data Science Apps zu bauen!")

‚úÖ Alle Pakete erfolgreich installiert!
Streamlit Version: 1.52.1
Pandas Version: 2.2.3
üöÄ Willkommen beim modernisierten AMALEA-Kurs!
Sekunden pro Tag: 86,400
Sekunden pro Woche: 604,800

‚úÖ Alle wichtigen Data Science Bibliotheken sind verf√ºgbar!
- pandas: Datenmanipulation und -analyse
- numpy: Numerische Berechnungen
- matplotlib: Basis-Plotting
- plotly: Interaktive Plots

üìä Demo-Visualisierung aus dem urspr√ºnglichen AMALEA-Kurs:

üéØ Jetzt geht's weiter mit Streamlit - der modernen Art, Data Science Apps zu bauen!


## üéØ Demo 1.1: Deine erste "Hello World" Streamlit App

**Wichtig:** Streamlit-Apps m√ºssen in separaten `.py`-Dateien stehen, nicht im Notebook!

**Warum?** Streamlit startet einen eigenen Webserver und muss die Datei direkt ausf√ºhren k√∂nnen.

## üêº Pandas-Grundlagen (aus "Pandas retten den Tag")

Bevor wir Streamlit verwenden, m√ºssen wir die **Datenaufbereitung** verstehen - das war ein zentraler Teil des urspr√ºnglichen AMALEA-Kurses.

### Wichtige Begriffe aus dem urspr√ºnglichen Kurs:

| Begriff | Erkl√§rung | Beispiel |
|---------|-----------|----------|
| **Sample** | Eine Zeile in der Tabelle (Datenpunkt, Beobachtung, Instanz) | Ein Kunde, ein Haus, ein Patient |
| **Feature** | Eine Spalte in der Tabelle (Merkmal, Attribut, Variable) | Alter, Wohnfl√§che, Blutdruck |
| **Label/Target** | Die Zielvariable, die vorhergesagt werden soll | Kaufentscheidung, Hauspreis, Diagnose |

### CSV-Dateien verstehen

**CSV** = **C**omma **S**eparated **V**alues (durch Komma getrennte Werte)

```
Name,Alter,Stadt
Anna,25,Berlin
Max,30,Hamburg
Lisa,28,M√ºnchen
```

### Datenqualit√§t ist entscheidend!

> **"M√ºll rein, M√ºll raus"** - Die Qualit√§t deiner Daten hat enormen Einfluss auf dein ML-Modell!

---

## üåê Von Jupyter zu Streamlit - Warum der Wechsel?

**Jupyter Notebooks sind toll f√ºr:**
- ‚úÖ Datenanalyse und Exploration
- ‚úÖ Prototyping und Experimente
- ‚úÖ Dokumentation von Analysen

**Aber Streamlit ist besser f√ºr:**
- üöÄ **Interaktive Web-Apps** erstellen
- üë• **Apps mit anderen teilen** (ohne Python-Installation)
- üéõÔ∏è **Benutzerfreundliche Interfaces** mit Widgets
- ‚òÅÔ∏è **Einfaches Deployment** in die Cloud

**Streamlit** verwandelt deine Python-Skripte in interaktive Web-Apps - ohne HTML, CSS oder JavaScript!

In [2]:
%%writefile hello_streamlit.py
# Erstelle deine erste App-Datei

import streamlit as st
import pandas as pd
import numpy as np
import plotly.express as px

# App-Titel und Beschreibung
st.title("üéØ Meine erste ML-Data App")
st.write("Willkommen zur IU Data Analytics & Big Data Fallstudie!")

# Sidebar f√ºr Eingaben
st.sidebar.header("üîß Einstellungen")
name = st.sidebar.text_input("Wie hei√üt du?", "Student")
anzahl_datenpunkte = st.sidebar.slider("Anzahl Datenpunkte", 10, 1000, 100)

# Hauptbereich
st.write(f"Hallo **{name}**! üëã")

# Erstelle Beispiel-Daten
np.random.seed(42)  # F√ºr reproduzierbare Zufallszahlen
data = pd.DataFrame({
    'x': np.random.randn(anzahl_datenpunkte),
    'y': np.random.randn(anzahl_datenpunkte),
    'kategorie': np.random.choice(['A', 'B', 'C'], anzahl_datenpunkte)
})

# Zeige die Daten
st.subheader("üìä Unsere Beispiel-Daten")
st.write(f"Dataset mit {len(data)} Datenpunkten:")
st.dataframe(data.head(10))  # Zeigt nur erste 10 Zeilen

# Einfache Visualisierung
st.subheader("üìà Interaktive Visualisierung")
fig = px.scatter(data, x='x', y='y', color='kategorie', 
                title="Scatter Plot der Beispiel-Daten")
st.plotly_chart(fig, use_container_width=True)

# Einfache Statistiken
st.subheader("üìã Grundlegende Statistiken")
st.write(data.describe())

# Info-Box
st.info("üí° Tipp: Ver√§ndere die Einstellungen in der Sidebar und beobachte, wie sich die App aktualisiert!")

# üìä Pandas-Demo: Vektorisierung vs. Loops
# Warum wir in Data Science keine For-Schleifen nutzen

print("üêº Pandas Performance Demo")
print("=" * 60)

# CSV-Daten simulieren (wie im urspr√ºnglichen Kurs erkl√§rt)
print("1Ô∏è‚É£ CSV-Struktur verstehen:")
csv_content = """Name,Alter,Stadt,Gehalt
Anna,25,Berlin,45000
Max,30,Hamburg,52000
Lisa,28,M√ºnchen,48000
Tom,35,K√∂ln,55000
Sarah,22,Frankfurt,38000"""

print(csv_content)

# DataFrame erstellen (zentral in allen AMALEA-Notebooks)
print("\n2Ô∏è‚É£ CSV in pandas DataFrame konvertieren:")
from io import StringIO
df = pd.read_csv(StringIO(csv_content))
print(df)

# Vektorisierte Operationen (SQL-Style)
print("\n3Ô∏è‚É£ Vektorisierung (The Fast Way):")
# Statt durch jede Zeile zu loopen, operieren wir auf der ganzen Spalte
df['Gehalt_Netto_Est'] = df['Gehalt'] * 0.6  # Eine Zeile, C-Speed
print(df[['Name', 'Gehalt', 'Gehalt_Netto_Est']])

# Filtering (WHERE Clause)
high_earners = df[df['Gehalt'] > 50000]
print(f"\nüí∞ High Earners (>50k):\n{high_earners['Name'].tolist()}")

print(f"üìè Anzahl Zeilen und Spalten: {df.shape}")

# Datentypen pr√ºfen (wichtig f√ºr ML!)
print(f"\nüîç Datentypen (wichtig f√ºr Machine Learning):")
print(df.dtypes)

# Features vs. Labels identifizieren (ML-Konzept aus AMALEA)
print(f"\nüéØ Features vs. Labels (ML-Konzepte):")
features = ['Alter', 'Stadt']  # Input-Variablen
target = 'Gehalt'              # Zielvariable
print(f"Features (Input): {features}")
print(f"Target (Output): {target}")

# Einfache Datenanalyse
print(f"\nüìä Einfache Analyse:")
print(f"Durchschnittsalter: {df['Alter'].mean():.1f} Jahre")
print(f"Durchschnittsgehalt: {df['Gehalt'].mean():,.0f} ‚Ç¨")
print(f"St√§dte: {df['Stadt'].unique()}")

print(f"\n‚úÖ Das sind die Pandas-Grundlagen, die du f√ºr Streamlit brauchst!")
print(f"üöÄ Jetzt erstellen wir daraus eine interaktive Streamlit-App...")

Overwriting hello_streamlit.py


### üöÄ App starten

**So startest du deine Streamlit-App:**

1. **Terminal √∂ffnen** (in VS Code: Terminal ‚Üí New Terminal)
2. **Ins richtige Verzeichnis navigieren:** `cd pfad/zu/deinem/ordner`
3. **App starten:** `streamlit run hello_streamlit.py`
4. **Browser √∂ffnet sich automatisch** unter `http://localhost:8501`

**Was passiert dabei:**
- **Webserver:** Streamlit startet einen lokalen Webserver
- **Live-Reload:** √Ñnderungen am Code werden automatisch aktualisiert
- **Port 8501:** Standard-Port f√ºr Streamlit-Apps

## üõ†Ô∏è Streamlit-Komponenten erkl√§rt

### Die wichtigsten Streamlit-Befehle:

In [3]:
%%writefile streamlit_komponenten.py
# √úbersicht √ºber Streamlit-Komponenten (neue Datei erstellen)

import streamlit as st
import pandas as pd
import numpy as np
import plotly.express as px

st.title("üß∞ Streamlit Komponenten-Guide")

# 1. TEXT-ELEMENTE
st.header("1Ô∏è‚É£ Text-Elemente")
st.subheader("Untertitel")
st.write("Universeller Ausgabe-Befehl")
st.markdown("**Markdown** funktioniert auch!")
st.text("Einfacher Text ohne Formatierung")
st.caption("Kleine Beschriftung")

# 2. EINGABE-WIDGETS
st.header("2Ô∏è‚É£ Eingabe-Widgets")

col1, col2 = st.columns(2)

with col1:
    st.write("**Zahlen-Eingaben:**")
    zahl = st.slider("Schieberegler:", 0, 100, 50)
    nummer = st.number_input("Zahl eingeben:", 0, 1000, 42)
    
with col2:
    st.write("**Text-Eingaben:**")
    text = st.text_input("Textfeld:", "Hallo Welt")
    auswahl = st.selectbox("Dropdown:", ["Option A", "Option B", "Option C"])

# Radio-Buttons und Checkboxes
radio = st.radio("Radio-Buttons:", ["Ja", "Nein", "Vielleicht"])
checkbox = st.checkbox("Checkbox aktiviert?")

# 3. DATEN-ANZEIGE
st.header("3Ô∏è‚É£ Daten anzeigen")

# Beispieldaten erstellen
beispiel_daten = pd.DataFrame({
    'Spalte 1': np.random.randn(20),
    'Spalte 2': np.random.randn(20),
    'Kategorie': np.random.choice(['A', 'B'], 20)
})

# Verschiedene Anzeige-Methoden
st.write("**DataFrame:**")
st.dataframe(beispiel_daten)

st.write("**Statische Tabelle:**")
st.table(beispiel_daten.head())

st.write("**JSON:**")
st.json({'name': 'Anna', 'alter': 25, 'stadt': 'Berlin'})

# 4. DIAGRAMME
st.header("4Ô∏è‚É£ Diagramme")

col1, col2 = st.columns(2)

with col1:
    st.write("**Einfache Diagramme:**")
    st.line_chart(beispiel_daten[['Spalte 1', 'Spalte 2']])
    
with col2:
    st.write("**Plotly-Diagramm:**")
    fig = px.scatter(beispiel_daten, x='Spalte 1', y='Spalte 2', 
                    color='Kategorie')
    st.plotly_chart(fig, use_container_width=True)

# 5. LAYOUT
st.header("5Ô∏è‚É£ Layout-Optionen")

# Sidebar-Beispiele
st.sidebar.header("Sidebar-Bereich")
sidebar_option = st.sidebar.radio("Sidebar-Radio:", ["A", "B", "C"])

# Columns
st.write("**Spalten-Layout:**")
col1, col2, col3 = st.columns(3)
col1.metric("Wert 1", "1234")
col2.metric("Wert 2", "5678")
col3.metric("Wert 3", "91011")

# Tabs
tab1, tab2, tab3 = st.tabs(["Tab 1", "Tab 2", "Tab 3"])
with tab1:
    st.write("Inhalt von Tab 1")
with tab2:
    st.write("Inhalt von Tab 2")
with tab3:
    st.write("Inhalt von Tab 3")

# 6. STATUS-MELDUNGEN
st.header("6Ô∏è‚É£ Status-Meldungen")
st.success("‚úÖ Erfolgsmeldung")
st.info("‚ÑπÔ∏è Informations-Box")
st.warning("‚ö†Ô∏è Warnung")
st.error("‚ùå Fehlermeldung")

# 7. INTERAKTIVE ELEMENTE
st.header("7Ô∏è‚É£ Interaktive Elemente")

if st.button("Klick mich!"):
    st.balloons()  # Konfetti-Animation
    st.write("Button wurde geklickt! üéâ")

# File Uploader
uploaded_file = st.file_uploader("Datei hochladen:", type=['csv', 'txt'])
if uploaded_file:
    st.success("Datei erfolgreich hochgeladen!")

Overwriting streamlit_komponenten.py


## üèÜ Lernziel-Check Woche 1

Am Ende dieser Woche solltest du:

- [ ] **Streamlit-Grundlagen verstehen:** Was ist ein Framework, wie funktioniert es?
- [ ] **Eine App lokal ausf√ºhren k√∂nnen:** Terminal, streamlit run, Browser
- [ ] **Wichtige Streamlit-Komponenten kennen:** st.write, st.sidebar, st.plotly_chart
- [ ] **Daten in Apps laden und anzeigen:** Pandas, Seaborn-Datasets
- [ ] **Interaktive Filter implementieren:** Selectbox, Slider, Multiselect
- [ ] **Einfache Visualisierungen erstellen:** Plotly Express
- [ ] **Eine eigene Datenanalyse-App entwickelt haben:** Funktionsf√§hig und vollst√§ndig

## üîÆ Ausblick auf Woche 2

N√§chste Woche erweitern wir unsere Apps um **Machine Learning**:
- **Erste ML-Modelle** in Streamlit integrieren
- **Benutzer-Eingaben** f√ºr Vorhersagen nutzen
- **Modell-Training** in der App visualisieren
- **Interaktive ML-Demos** erstellen

**üí° Tipp:** Die beste Art Python zu lernen ist durch praktisches Experimentieren! üöÄ