# Streamlit Vertiefung
# Interaktive Dashboards & ML Integration

## DataPy - WiSe25/26 - Woche 11

### Data Science Praktikum Python

# R√ºckblick Woche 10

## Was wir schon k√∂nnen

- ‚úì Streamlit installieren
- ‚úì Daten laden & anzeigen
- ‚úì Einfache Visualisierungen
- ‚úì Einzelne Widgets (Slider, Selectbox)
- ‚úì Caching f√ºr Performance

## Heute

**√úbergeordnetes Ziel: Professionelle, interaktive Dashboards f√ºr Ihr Projekt erstellen**

# Layout: Sidebar

## Sidebar f√ºr Kontrollelemente
<img src="images\sidebar.png" style="float: right; width: 30%; margin-left: 20px;">


```python
import streamlit as st

# Sidebar
st.sidebar.title('Einstellungen ‚öôÔ∏è')
st.sidebar.write('Hier kommen alle Filter!')

# Filter in Sidebar
age_range = st.sidebar.slider(
    'Alter:',
    20, 80, (30, 70)
)

show_stats = st.sidebar.checkbox(
    'Zeige Statistiken',
    value=True
)

# Main Content
st.title('Heart Disease Dashboard ü´Ä')
st.write(f'Gefiltert: Alter {age_range[0]}-{age_range[1]}')
```

**Vorteil:** √úbersichtliche Trennung von Kontrollen und Content!

# Layout: Columns

## Mehrere Plots nebeneinander

```python
import matplotlib.pyplot as plt

# 2 Spalten erstellen
col1, col2 = st.columns(2)

with col1:
    st.subheader('Altersverteilung')
    fig1, ax1 = plt.subplots()
    ax1.hist(df['age'], bins=20)
    st.pyplot(fig1)

with col2:
    st.subheader('Geschlechterverteilung')
    fig2, ax2 = plt.subplots()
    df['sex'].value_counts().plot(kind='bar', ax=ax2)
    st.pyplot(fig2)

# Auch m√∂glich: 3 Spalten mit unterschiedlichen Breiten
col1, col2, col3 = st.columns([2, 1, 1])
```

# Layout: Tabs
<img src="images\tabs.png" style="float: right; width: 50%; margin-left: 20px;">

## Organisiere Content in Tabs


```python
 # Tabs
    tab1, tab2, tab3 = st.tabs(["üìã √úbersicht", "üîç Datenqualit√§t", "üìä Statistiken"])

    # Tab 1: √úbersicht
    with tab1:
        st.subheader("Dataset √úbersicht")

        col1, col2 = st.columns([2, 1])

        with col1:
            st.markdown("#### Daten-Vorschau")
            n_rows = st.slider("Anzahl Zeilen", 5, 50, 10)
            st.dataframe(df.head(n_rows), use_container_width=True)

        with col2:
            st.markdown("#### Info")
            st.write(f"**Shape:** {df.shape}")
            st.write(f"**Spalten:** {len(df.columns)}")
            st.write(f'**Datentypen:**')
            st.dataframe(pd.DataFrame({
                'Typ': df.dtypes,
                'Count': df.count()
```

**Perfekt f√ºr:** Verschiedene Ansichten des gleichen Datensatzes

# Layout: Expander

## Verstecke Details, zeige sie bei Bedarf

```python
st.title('Dashboard')

# Kurze Zusammenfassung
st.metric('Anzahl Patienten', len(df))
st.metric('Durchschnittsalter', f"{df['age'].mean():.1f} Jahre")

# Details verstecken
with st.expander('üìã Zeige Rohdaten'):
    st.dataframe(df)

with st.expander('üìä Zeige Statistiken'):
    st.write(df.describe())

with st.expander('‚ÑπÔ∏è √úber den Datensatz'):
    st.write('''
    Dieser Datensatz enth√§lt...
    - 297 Patienten
    - 13 Features
    - Quelle: Cleveland Heart Disease Database
    ''')
```

# Interaktive Filter kombinieren

## Mehrere Filter gleichzeitig

```python
st.sidebar.title('Filter ‚öôÔ∏è')

# Filter 1: Alter
age_range = st.sidebar.slider('Alter:', 20, 80, (30, 70))

# Filter 2: Geschlecht
sex_filter = st.sidebar.multiselect(
    'Geschlecht:',
    options=df['sex'].unique(),
    default=df['sex'].unique()
)

# Filter 3: Herzkrankheit
condition_filter = st.sidebar.radio(
    'Zeige:',
    ['Alle', 'Nur Kranke', 'Nur Gesunde']
)

# Daten filtern
filtered_df = df[
    (df['age'] >= age_range[0]) &
    (df['age'] <= age_range[1]) &
    (df['sex'].isin(sex_filter))
]

if condition_filter == 'Nur Kranke':
    filtered_df = filtered_df[filtered_df['condition'] == 1]
elif condition_filter == 'Nur Gesunde':
    filtered_df = filtered_df[filtered_df['condition'] == 0]

st.write(f'üîç Gefiltert: **{len(filtered_df)}** von {len(df)} Patienten')
```

# Dynamische Visualisierungen

## Plots reagieren auf Filter

```python
# Filter (wie vorher)
age_range = st.sidebar.slider('Alter:', 20, 80, (30, 70))
filtered_df = df[(df['age'] >= age_range[0]) & (df['age'] <= age_range[1])]

# Plots mit gefilterten Daten
col1, col2 = st.columns(2)

with col1:
    st.subheader('Cholesterin')
    fig, ax = plt.subplots()
    ax.hist(filtered_df['chol'], bins=20, edgecolor='black')
    ax.set_xlabel('Cholesterin (mg/dl)')
    ax.set_ylabel('H√§ufigkeit')
    st.pyplot(fig)

with col2:
    st.subheader('Blutdruck')
    fig, ax = plt.subplots()
    ax.boxplot(filtered_df['trestbps'])
    ax.set_ylabel('Ruhender Blutdruck (mm Hg)')
    st.pyplot(fig)

# Statistiken aktualisieren sich auch!
st.metric('Durchschnittliches Cholesterin', 
          f"{filtered_df['chol'].mean():.1f} mg/dl")
```

# Interaktive Plotly Charts

## Mehr Interaktivit√§t mit Plotly

```python
import plotly.express as px

# Scatter Plot mit Hover-Informationen
fig = px.scatter(
    df,
    x='age',
    y='chol',
    color='condition',
    hover_data=['trestbps', 'thalach'],
    title='Alter vs. Cholesterin',
    labels={'condition': 'Herzkrankheit'},
    color_continuous_scale='RdYlGn_r'
)

st.plotly_chart(fig, use_container_width=True)

# Interaktive Features:
# - Zoom in/out
# - Pan (verschieben)
# - Hover f√ºr Details
# - Download als PNG
```

**Installation:** `pip install plotly`

# ML Modell in Streamlit

## Schritt 1: Modell laden

```python
import joblib
import streamlit as st

@st.cache_resource  # Modell nur einmal laden!
def load_model():
    return joblib.load('heart_disease_model.pkl')

model = load_model()
st.success('‚úÖ Modell geladen!')
```

## Modell vorher speichern (in Jupyter)

```python
# In Jupyter Notebook
from sklearn.tree import DecisionTreeClassifier
import joblib

model = DecisionTreeClassifier(max_depth=5)
model.fit(X_train, y_train)

# Speichern
joblib.dump(model, 'heart_disease_model.pkl')
```

# ML Modell: User Input

## Schritt 2: Input-Felder f√ºr Vorhersage

```python
st.header('üîÆ Herzkrankheit vorhersagen')
st.write('Gen Sie hier die Patientendaten ein:')

col1, col2, col3 = st.columns(3)

with col1:
    age = st.number_input('Alter', 20, 100, 50)
    sex = st.selectbox('Geschlecht', [0, 1], 
                       format_func=lambda x: 'Weiblich' if x==0 else 'M√§nnlich')
    cp = st.selectbox('Brustschmerz-Typ', [0, 1, 2, 3])

with col2:
    trestbps = st.number_input('Blutdruck (mm Hg)', 80, 200, 120)
    chol = st.number_input('Cholesterin (mg/dl)', 100, 400, 200)
    fbs = st.checkbox('N√ºchternblutzucker > 120 mg/dl')

with col3:
    thalach = st.number_input('Max. Herzfrequenz', 60, 220, 150)
    exang = st.checkbox('Belastungsinduzierte Angina')
    oldpeak = st.number_input('ST-Depression', 0.0, 6.0, 1.0, 0.1)
```

# ML Modell: Vorhersage

## Schritt 3: Vorhersage machen

```python
# Input zusammenstellen
import pandas as pd

if st.button('üîç Vorhersage starten'):
    # Feature-Vektor erstellen
    input_data = pd.DataFrame({
        'age': [age],
        'sex': [sex],
        'cp': [cp],
        'trestbps': [trestbps],
        'chol': [chol],
        'fbs': [int(fbs)],
        'thalach': [thalach],
        'exang': [int(exang)],
        'oldpeak': [oldpeak]
    })
    
    # Vorhersage
    prediction = model.predict(input_data)[0]
    proba = model.predict_proba(input_data)[0]
    
    # Ergebnis anzeigen
    if prediction == 1:
        st.error(f'‚ö†Ô∏è Herzkrankheit erkannt (Wahrscheinlichkeit: {proba[1]:.1%})')
    else:
        st.success(f'‚úÖ Keine Herzkrankheit (Wahrscheinlichkeit: {proba[0]:.1%})')
```

# ML Modell: Visualisierung

## Zeige Wahrscheinlichkeiten

```python
# Nach der Vorhersage
if st.button('Vorhersage starten'):
    prediction = model.predict(input_data)[0]
    proba = model.predict_proba(input_data)[0]
    
    # Wahrscheinlichkeiten als Chart
    st.subheader('Wahrscheinlichkeiten')
    
    col1, col2 = st.columns(2)
    with col1:
        st.metric('Gesund', f'{proba[0]:.1%}')
    with col2:
        st.metric('Krank', f'{proba[1]:.1%}')
    
    # Progress Bar
    st.progress(proba[1])
    
    # Bar Chart
    import pandas as pd
    proba_df = pd.DataFrame({
        'Klasse': ['Gesund', 'Krank'],
        'Wahrscheinlichkeit': proba
    })
    st.bar_chart(proba_df.set_index('Klasse'))
```

# Feature Importance anzeigen

```python
# Wenn Modell Feature Importance hat (z.B. Random Forest)
if hasattr(model, 'feature_importances_'):
    st.subheader('üìä Feature Importance')
    
    # DataFrame erstellen
    feature_names = ['age', 'sex', 'cp', 'trestbps', 'chol', 
                     'fbs', 'thalach', 'exang', 'oldpeak']
    importance_df = pd.DataFrame({
        'Feature': feature_names,
        'Importance': model.feature_importances_
    }).sort_values('Importance', ascending=False)
    
    # Bar Chart
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.barh(importance_df['Feature'], importance_df['Importance'])
    ax.set_xlabel('Importance')
    ax.set_title('Welche Features sind wichtig?')
    st.pyplot(fig)
```

# File Upload

## User k√∂nnen eigene Daten hochladen

```python
st.sidebar.title('Daten laden üìÅ')

# File Uploader
uploaded_file = st.sidebar.file_uploader(
    'CSV-Datei hochladen:',
    type=['csv']
)

if uploaded_file is not None:
    # Datei lesen
    df = pd.read_csv(uploaded_file)
    st.success(f'‚úÖ Datei geladen: {len(df)} Zeilen')
    
    # Zeige Vorschau
    with st.expander('Vorschau'):
        st.dataframe(df.head())
else:
    # Fallback: Standard-Datensatz
    st.info('‚ÑπÔ∏è Verwende Standard-Datensatz')
    df = pd.read_csv('heart_disease_cleaned.csv')

st.write(f'Arbeite mit: **{len(df)} Patienten**')
```

# Session State

## Daten zwischen Reruns speichern

```python
# Problem: Streamlit f√ºhrt Script bei jeder Interaktion neu aus
# L√∂sung: Session State f√ºr persistente Daten

# Initialisieren
if 'counter' not in st.session_state:
    st.session_state.counter = 0

# Verwenden
st.write(f'Counter: {st.session_state.counter}')

if st.button('Erh√∂hen'):
    st.session_state.counter += 1
    st.rerun()  # App neu laden

# Praktisches Beispiel: History speichern
if 'predictions' not in st.session_state:
    st.session_state.predictions = []

if st.button('Vorhersage'):
    prediction = model.predict(input_data)[0]
    st.session_state.predictions.append({
        'timestamp': pd.Timestamp.now(),
        'prediction': prediction
    })

# Zeige History
st.write('Bisherige Vorhersagen:', len(st.session_state.predictions))
```

# Styling & Theming

## Custom CSS

```python
# Custom CSS f√ºr besseres Design
st.markdown("""
<style>
    .main {
        background-color: #f0f2f6;
    }
    .stButton>button {
        background-color: #4CAF50;
        color: white;
        border-radius: 10px;
        font-weight: bold;
    }
    h1 {
        color: #1f77b4;
    }
</style>
""", unsafe_allow_html=True)

# Oder: Farbiges Markdown
st.markdown('# :blue[Heart Disease] :red[Dashboard] ü´Ä')

# Emojis f√ºr visuelle Elemente
st.success('‚úÖ Erfolg!')
st.error('‚ùå Fehler!')
st.warning('‚ö†Ô∏è Warnung!')
st.info('‚ÑπÔ∏è Information')
```

# Performance Tipps

## 5 Tipps f√ºr schnellere Apps

1. **Caching:** Nutze `@st.cache_data` und `@st.cache_resource`
```python
@st.cache_data
def load_data():
    return pd.read_csv('large_file.csv')
```

2. **Lazy Loading:** Lade Daten nur wenn n√∂tig
```python
if st.checkbox('Zeige Details'):
    detailed_data = load_detailed_data()  # Nur bei Bedarf
```

3. **Sampling:** Zeige nur Teil der Daten
```python
st.dataframe(df.sample(1000))  # Nur 1000 Zeilen
```

4. **Plotly statt Matplotlib:** Schneller bei vielen Datenpunkten

5. **Weniger Reruns:** Verwende Forms f√ºr mehrere Inputs

# Forms: Mehrere Inputs gleichzeitig

## Problem: Jeder Input l√∂st Rerun aus

```python
# OHNE Form: 3 Reruns bei 3 Inputs
age = st.number_input('Alter')  # Rerun!
chol = st.number_input('Cholesterin')  # Rerun!
bp = st.number_input('Blutdruck')  # Rerun!
```

## L√∂sung: Form

```python
# MIT Form: Nur 1 Rerun beim Submit
with st.form('patient_form'):
    age = st.number_input('Alter', 20, 100, 50)
    chol = st.number_input('Cholesterin', 100, 400, 200)
    bp = st.number_input('Blutdruck', 80, 200, 120)
    
    submitted = st.form_submit_button('üìä Analysieren')
    
if submitted:
    st.write(f'Alter: {age}, Cholesterin: {chol}, BP: {bp}')
    # Mache Vorhersage etc.
```

# Komplettes Dashboard Beispiel

```python
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px

st.set_page_config(page_title='Heart Disease Dashboard', page_icon='ü´Ä', layout='wide')

@st.cache_data
def load_data():
    return pd.read_csv('heart_disease_cleaned.csv')

df = load_data()

# Sidebar
st.sidebar.title('Filter ‚öôÔ∏è')
age_range = st.sidebar.slider('Alter:', 20, 80, (30, 70))
sex_filter = st.sidebar.multiselect('Geschlecht:', df['sex'].unique(), df['sex'].unique())

filtered_df = df[
    (df['age'] >= age_range[0]) & 
    (df['age'] <= age_range[1]) &
    (df['sex'].isin(sex_filter))
]

# Main
st.title('Heart Disease Dashboard ü´Ä')
st.write(f'Zeige **{len(filtered_df)}** von {len(df)} Patienten')

# Tabs
tab1, tab2, tab3 = st.tabs(['üìä √úbersicht', 'üîç Analysen', 'ü§ñ ML Modell'])

with tab1:
    col1, col2, col3 = st.columns(3)
    col1.metric('Patienten', len(filtered_df))
    col2.metric('√ò Alter', f"{filtered_df['age'].mean():.1f}")
    col3.metric('√ò Cholesterin', f"{filtered_df['chol'].mean():.0f}")
    
    st.dataframe(filtered_df)

with tab2:
    fig = px.scatter(filtered_df, x='age', y='chol', color='condition')
    st.plotly_chart(fig, use_container_width=True)

with tab3:
    st.write('ML Modell kommt hier!')
```

# Deployment: App teilen

## Streamlit Community Cloud (kostenlos!)

**Schritte:**

1. **GitHub Repository erstellen -falls nicht vorhanden**
   - `app.py` (bzw. Ihr komplettes App-Projekt)
   - `requirements.txt` (Dependencies)
   - Daten (falls nicht zu gro√ü, in Ihrem falls die bereinigten Daten)

2. **requirements.txt erstellen**
```
streamlit==1.51.0
pandas==2.0.3
matplotlib==3.7.2
plotly==5.17.0
scikit-learn==1.3.0
```

3. **Auf Streamlit Cloud deployen**
   - Gehe zu: share.streamlit.io
   - Login mit GitHub
   - "New app" ‚Üí Repository ausw√§hlen
   - Deploy!

‚Üí **√ñffentliche URL f√ºr Ihre App!**

# Best Practices

## 10 Tipps f√ºr gute Streamlit Apps

1. ‚úÖ **Clear Title & Description:** User sollen sofort verstehen worum es geht
2. ‚úÖ **Sidebar f√ºr Kontrollen:** Hauptbereich f√ºr Content
3. ‚úÖ **Caching nutzen:** Performance!
4. ‚úÖ **Loading Indicators:** `st.spinner()` f√ºr lange Operationen
5. ‚úÖ **Error Handling:** Try-Except f√ºr robuste Apps
6. ‚úÖ **Responsive Layout:** `use_container_width=True`
7. ‚úÖ **Tooltips:** `help=` Parameter f√ºr Erkl√§rungen
8. ‚úÖ **Expander f√ºr Details:** Verstecke optionale Informationen
9. ‚úÖ **Emojis:** Machen App freundlicher üéâ
10. ‚úÖ **Testing:** Probiere verschiedene Inputs aus!

# Zusammenfassung

## Heute gelernt

‚úÖ **Layout:** Sidebar, Columns, Tabs, Expander  
‚úÖ **Interaktive Filter:** Mehrere Filter kombinieren  
‚úÖ **Dynamische Plots:** Visualisierungen reagieren auf Input  
‚úÖ **ML Integration:** Modelle laden & Vorhersagen machen  
‚úÖ **File Upload:** User k√∂nnen eigene Daten hochladen  
‚úÖ **Session State:** Daten zwischen Reruns speichern  
‚úÖ **Performance:** Caching, Forms, Lazy Loading  
‚úÖ **Deployment:** App mit der Welt teilen  

---

**N√§chste Woche (Woche 12):** Projekt-Finalisierung & Peer-Review

# Aufgaben f√ºr heute

## Live-Testing & Erweiterung

1. **Erweitern Sie Ihre App aus Woche 10 z.B. wie folgt:**
   - F√ºgen Sie Sidebar mit mindestens 3 Filtern hinzu
   - Nutzen Sie Columns f√ºr Layout (mindestens 2 Plots nebeneinander)
   - Erstellen Sie Tabs f√ºr verschiedene Ansichten
   - Binden Sie Ihr ML-Modell ein (Vorhersage-Interface)

2. **Optional aber empfohlen:**
   - File Upload Feature
   - Plotly statt Matplotlib
   - Feature Importance Visualisierung

3. **Live-Testing im Kurs:**
   - Zeigen Sie Ihre App Ihrem Tischnachbarn/ Ihrer Tischnachbarin, um erstes Feedback einzuholen
   - Feedback sammeln
   - Gegenseitig testen

---

# Ressourcen

## üìö Dokumentation
- [Streamlit Docs](https://docs.streamlit.io/)
- [Streamlit Cheat Sheet](https://docs.streamlit.io/library/cheatsheet)
- [Streamlit Gallery](https://streamlit.io/gallery) - Inspiration!

## üéì Tutorials
- [Streamlit Tutorial Series](https://www.youtube.com/c/streamlit)
- [30 Days of Streamlit](https://30days.streamlit.app/)

## üîß Tools
- [Streamlit Components](https://streamlit.io/components) - Erweiterte Widgets
- [Streamlit Community Cloud](https://share.streamlit.io/) - Kostenloses Hosting

## üí° Beispiel-Apps
- Schauen Sie sich die Apps in der Gallery an f√ºr Inspiration!