# 🧠 Woche 4: Neural Networks in Streamlit - AMALEA Deep Learning

**Integration der ursprünglichen AMALEA-Notebooks:**
- "Jetzt geht's in die Tiefe" → Neural Network Grundlagen
- "Wir trainieren nur bergab" → Backpropagation & Optimierung
- "Regression II" → Neural Networks für Regression
- "Classification Softmax" → Neural Networks für Klassifikation

## 📚 Was du heute lernst

- **Künstliche Neuronen** 🧠 - Grundbausteine des Deep Learning
- **Neural Networks** 🕸️ - Mehrere Neuronen vernetzen
- **Backpropagation** ⚡ - Wie Neuronen "lernen"
- **Activation Functions** 📈 - ReLU, Sigmoid, Softmax verstehen
- **Streamlit Neural Network Apps** 🚀 - Interaktive Demos erstellen

---

## 🧠 Neural Network Grundlagen aus dem ursprünglichen AMALEA-Kurs

### Das künstliche Neuron (aus "Jetzt geht's in die Tiefe")

Ein **künstliches Neuron** ist eine mathematische Funktion, inspiriert von biologischen Nervenzellen:

$$f_{neuron}(x) = φ(∑_{n=1}^m x_n · w_n + b)$$

**Komponenten:**
- **Eingaben** (x_n): Numerische Werte (Daten oder andere Neuronen)
- **Gewichte** (w_n): Werden mit Eingaben multipliziert
- **Bias** (b): Konstanter Wert, wird zur Summe addiert
- **Aktivierungsfunktion** (φ): Transformiert die Summe
- **Ausgabe** (y): Aktivierung des Neurons

### Einfachstes Neuron: Lineare Regression

Ohne Aktivierungsfunktion: `f(x) = w * x + b`

Das ist bereits **lineare Regression**! 🤯

### Aktivierungsfunktionen (entscheidend für Deep Learning)

| Funktion | Formel | Verwendung |
|----------|--------|------------|
| **Linear** | f(x) = x | Regression (Ausgabeschicht) |
| **ReLU** | f(x) = max(0, x) | **Meistverwendet** in Hidden Layers |
| **Sigmoid** | f(x) = 1/(1+e^(-x)) | Binäre Klassifikation |
| **Softmax** | f(x_i) = e^(x_i)/Σe^(x_j) | Multi-Class Klassifikation |

### Warum Neural Networks so mächtig sind

> **Universal Approximation Theorem**: Ein ausreichend großes neuronales Netz kann jede kontinuierliche Funktion beliebig genau approximieren!

**Aber**: Mehr Parameter ≠ automatisch bessere Performance (Overfitting!)

In [None]:
# 🧠 Neural Network Demo - Basierend auf ursprünglichen AMALEA-Konzepten
# Integration von "Jetzt geht's in die Tiefe" + "Wir trainieren nur bergab"

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.datasets import make_regression, make_classification
from sklearn.neural_network import MLPRegressor, MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, accuracy_score

print("🧠 Neural Networks - AMALEA Konzepte modernisiert")
print("=" * 60)

# 1️⃣ Einfachstes Neuron implementieren (aus ursprünglichem AMALEA)
print("1️⃣ Einfachstes Neuron: f(x) = w*x + b")

def simple_neuron(x, w, b):
    """
    Implementierung aus dem ursprünglichen AMALEA-Kurs
    Aufgabe 4.1.1: Einfachstes Neuron ohne Aktivierungsfunktion
    """
    return w * x + b

# Demo mit AMALEA-Beispiel (w=-1, b=1)
w, b = -1, 1
x_values = range(10)
y_values = [simple_neuron(x, w, b) for x in x_values]

plt.figure(figsize=(10, 4))
plt.plot(x_values, y_values, 'o-', linewidth=2, markersize=8)
plt.title("Einfachstes Neuron (AMALEA Original: w=-1, b=1)")
plt.xlabel("x (Input)")
plt.ylabel("y (Output)")
plt.grid(True, alpha=0.3)
plt.show()

print(f"Mit w={w}, b={b}: f(5) = {simple_neuron(5, w, b)}")

# 2️⃣ Aktivierungsfunktionen visualisieren (aus AMALEA erweitert)
print(f"\n2️⃣ Aktivierungsfunktionen (zentral für Deep Learning):")

def relu(x):
    return np.maximum(0, x)

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def tanh(x):
    return np.tanh(x)

x = np.linspace(-5, 5, 100)

plt.figure(figsize=(15, 4))

# ReLU
plt.subplot(1, 3, 1)
plt.plot(x, relu(x), 'b-', linewidth=2)
plt.title("ReLU: max(0, x)")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.grid(True, alpha=0.3)

# Sigmoid
plt.subplot(1, 3, 2)
plt.plot(x, sigmoid(x), 'r-', linewidth=2)
plt.title("Sigmoid: 1/(1+e^(-x))")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.grid(True, alpha=0.3)

# Tanh
plt.subplot(1, 3, 3)
plt.plot(x, tanh(x), 'g-', linewidth=2)
plt.title("Tanh: tanh(x)")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 3️⃣ Regression mit Neural Network (aus "Regression II")
print(f"\n3️⃣ Neural Network für Regression (aus AMALEA 'Regression II'):")

# Künstliche Daten erstellen
X_reg, y_reg = make_regression(n_samples=200, n_features=1, noise=10, random_state=42)
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(
    X_reg, y_reg, test_size=0.2, random_state=42
)

# Neural Network für Regression
nn_regressor = MLPRegressor(
    hidden_layer_sizes=(10, 5),  # 2 Hidden Layers
    activation='relu',           # ReLU Aktivierung (AMALEA-Standard)
    solver='adam',              # Adam Optimizer (aus "Wir trainieren nur bergab")
    max_iter=1000,
    random_state=42
)

nn_regressor.fit(X_train_reg, y_train_reg)
y_pred_reg = nn_regressor.predict(X_test_reg)

# Visualisierung
plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.scatter(X_train_reg, y_train_reg, alpha=0.6, label='Training')
plt.scatter(X_test_reg, y_test_reg, alpha=0.6, label='Test', color='orange')
plt.xlabel("X")
plt.ylabel("y")
plt.title("Regressionsdaten")
plt.legend()

plt.subplot(1, 2, 2)
plt.scatter(y_test_reg, y_pred_reg, alpha=0.6)
plt.plot([y_test_reg.min(), y_test_reg.max()], [y_test_reg.min(), y_test_reg.max()], 'r--')
plt.xlabel("Tatsächliche Werte")
plt.ylabel("Vorhergesagte Werte")
plt.title("Vorhersage vs. Realität")

plt.tight_layout()
plt.show()

mse = mean_squared_error(y_test_reg, y_pred_reg)
print(f"Mean Squared Error: {mse:.2f}")

# 4️⃣ Klassifikation mit Neural Network (aus "Classification Softmax")
print(f"\n4️⃣ Neural Network für Klassifikation (aus AMALEA 'Softmax'):")

# Künstliche Klassifikationsdaten
X_clf, y_clf = make_classification(
    n_samples=300, n_features=2, n_redundant=0, 
    n_informative=2, n_clusters_per_class=1, 
    random_state=42
)
X_train_clf, X_test_clf, y_train_clf, y_test_clf = train_test_split(
    X_clf, y_clf, test_size=0.2, random_state=42
)

# Neural Network für Klassifikation
nn_classifier = MLPClassifier(
    hidden_layer_sizes=(10, 5),
    activation='relu',
    solver='adam',
    max_iter=1000,
    random_state=42
)

nn_classifier.fit(X_train_clf, y_train_clf)
y_pred_clf = nn_classifier.predict(X_test_clf)

# Visualisierung
plt.figure(figsize=(10, 4))

plt.subplot(1, 2, 1)
colors = ['red', 'blue']
for i, color in enumerate(colors):
    mask = y_train_clf == i
    plt.scatter(X_train_clf[mask, 0], X_train_clf[mask, 1], 
               c=color, alpha=0.6, label=f'Klasse {i}')
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.title("Klassifikationsdaten")
plt.legend()

plt.subplot(1, 2, 2)
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test_clf, y_pred_clf)
plt.imshow(cm, interpolation='nearest', cmap=plt.cm.Blues)
plt.title("Confusion Matrix")
plt.colorbar()
plt.xlabel("Vorhergesagte Klasse")
plt.ylabel("Tatsächliche Klasse")

# Zahlen in der Matrix anzeigen
for i in range(cm.shape[0]):
    for j in range(cm.shape[1]):
        plt.text(j, i, str(cm[i, j]), ha='center', va='center')

plt.tight_layout()
plt.show()

accuracy = accuracy_score(y_test_clf, y_pred_clf)
print(f"Genauigkeit: {accuracy:.2%}")

print(f"\n✅ Neural Network Grundlagen aus dem AMALEA-Kurs erfolgreich modernisiert!")
print(f"🚀 Jetzt erstellen wir daraus interaktive Streamlit-Apps...")

## 🎮 Interaktive Streamlit-App: Neural Network Playground

Jetzt erstellen wir eine interaktive Streamlit-App, die alle Neural Network Konzepte aus dem ursprünglichen AMALEA-Kurs vereint!

### 📝 Streamlit-App erstellen

Erstelle eine neue Datei `neural_network_playground.py` im Ordner `Woche_4_Deep_Learning/`:

In [None]:
# 🎮 Streamlit Neural Network App erstellen
# Diese App integriert alle AMALEA Neural Network Konzepte interaktiv

# Erstelle diese Datei als neural_network_playground.py

streamlit_app_code = '''
import streamlit as st
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go
from sklearn.datasets import make_regression, make_classification, load_iris
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor, MLPClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, mean_squared_error, confusion_matrix
import seaborn as sns

# 🎯 Streamlit App Configuration
st.set_page_config(
    page_title="🧠 Neural Network Playground - AMALEA 2025",
    page_icon="🧠",
    layout="wide",
    initial_sidebar_state="expanded"
)

# 📊 Title and Introduction
st.title("🧠 Neural Network Playground")
st.markdown("**Interaktive Demo der AMALEA Neural Network Konzepte**")

# Sidebar für Navigation
st.sidebar.title("🎛️ Navigation")
app_mode = st.sidebar.selectbox(
    "Wähle einen Bereich:",
    ["🧠 Einfachstes Neuron", "📈 Aktivierungsfunktionen", "🎯 Regression Demo", 
     "🏷️ Klassifikation Demo", "🎮 Interaktiver Playground"]
)

# ============================================================================
# 🧠 BEREICH 1: Einfachstes Neuron (aus AMALEA "Jetzt geht's in die Tiefe")
# ============================================================================

if app_mode == "🧠 Einfachstes Neuron":
    st.header("🧠 Einfachstes Neuron verstehen")
    st.markdown("**Aus dem ursprünglichen AMALEA-Kurs: 'Jetzt geht's in die Tiefe'**")
    
    # Interaktive Parameter
    col1, col2 = st.columns(2)
    
    with col1:
        st.subheader("🎛️ Neuron-Parameter")
        w = st.slider("Gewicht (w)", -5.0, 5.0, -1.0, 0.1)
        b = st.slider("Bias (b)", -5.0, 5.0, 1.0, 0.1)
        
        # Formel anzeigen
        st.latex(f"f(x) = w \\cdot x + b = {w} \\cdot x + {b}")
        
    with col2:
        st.subheader("📊 Neuron-Verhalten")
        x_values = np.linspace(-10, 10, 100)
        y_values = w * x_values + b
        
        fig = go.Figure()
        fig.add_trace(go.Scatter(x=x_values, y=y_values, mode='lines', name='Neuron Output'))
        fig.update_layout(
            title="Einfachstes Neuron: f(x) = w*x + b",
            xaxis_title="Input (x)",
            yaxis_title="Output f(x)",
            height=400
        )
        st.plotly_chart(fig, use_container_width=True)
    
    # Beispielberechnung
    st.subheader("🧮 Beispiel-Berechnung")
    test_input = st.number_input("Teste Input-Wert:", value=5.0)
    result = w * test_input + b
    st.success(f"f({test_input}) = {w} × {test_input} + {b} = **{result:.2f}**")
    
    # AMALEA-Originale
    st.info("💡 **AMALEA-Original**: Mit w=-1, b=1 ergibt f(5) = -4")

# ============================================================================
# 📈 BEREICH 2: Aktivierungsfunktionen (AMALEA Deep Learning Grundlagen)
# ============================================================================

elif app_mode == "📈 Aktivierungsfunktionen":
    st.header("📈 Aktivierungsfunktionen verstehen")
    st.markdown("**Herzstück des Deep Learning - aus den ursprünglichen AMALEA-Notebooks**")
    
    # Funktionen definieren
    def relu(x):
        return np.maximum(0, x)
    
    def sigmoid(x):
        return 1 / (1 + np.exp(-np.clip(x, -500, 500)))  # Clip für numerische Stabilität
    
    def tanh_func(x):
        return np.tanh(x)
    
    def leaky_relu(x, alpha=0.01):
        return np.where(x > 0, x, alpha * x)
    
    # Interaktive Auswahl
    x = np.linspace(-5, 5, 1000)
    
    col1, col2 = st.columns([1, 2])
    
    with col1:
        st.subheader("🎛️ Funktions-Parameter")
        
        show_relu = st.checkbox("ReLU", value=True)
        show_sigmoid = st.checkbox("Sigmoid", value=True)
        show_tanh = st.checkbox("Tanh", value=True)
        show_leaky = st.checkbox("Leaky ReLU", value=False)
        
        if show_leaky:
            alpha = st.slider("Leaky ReLU α", 0.01, 0.3, 0.01, 0.01)
    
    with col2:
        st.subheader("📊 Aktivierungsfunktionen")
        
        fig = go.Figure()
        
        if show_relu:
            fig.add_trace(go.Scatter(x=x, y=relu(x), mode='lines', name='ReLU: max(0,x)', line=dict(color='blue')))
        if show_sigmoid:
            fig.add_trace(go.Scatter(x=x, y=sigmoid(x), mode='lines', name='Sigmoid: 1/(1+e^(-x))', line=dict(color='red')))
        if show_tanh:
            fig.add_trace(go.Scatter(x=x, y=tanh_func(x), mode='lines', name='Tanh: tanh(x)', line=dict(color='green')))
        if show_leaky:
            fig.add_trace(go.Scatter(x=x, y=leaky_relu(x, alpha), mode='lines', name=f'Leaky ReLU (α={alpha})', line=dict(color='orange')))
        
        fig.update_layout(
            title="Aktivierungsfunktionen im Vergleich",
            xaxis_title="Input (x)",
            yaxis_title="Output f(x)",
            height=500,
            hovermode='x unified'
        )
        st.plotly_chart(fig, use_container_width=True)
    
    # Verwendungszwecke
    st.subheader("🎯 Wann welche Funktion verwenden?")
    
    col1, col2, col3 = st.columns(3)
    
    with col1:
        st.markdown("""
        **🔵 ReLU**
        - ✅ Standard für Hidden Layers
        - ✅ Schnell zu berechnen
        - ❌ "Dying ReLU" Problem
        """)
    
    with col2:
        st.markdown("""
        **🔴 Sigmoid**
        - ✅ Binäre Klassifikation (Output)
        - ✅ Werte zwischen 0 und 1
        - ❌ Vanishing Gradient Problem
        """)
    
    with col3:
        st.markdown("""
        **🟢 Tanh**
        - ✅ Werte zwischen -1 und 1
        - ✅ Zero-centered
        - ❌ Auch Vanishing Gradient
        """)

# ============================================================================
# 🎯 BEREICH 3: Regression Demo (aus AMALEA "Regression II")
# ============================================================================

elif app_mode == "🎯 Regression Demo":
    st.header("🎯 Neural Network Regression")
    st.markdown("**Aus dem ursprünglichen AMALEA-Kurs: 'Regression II - Künstliche Gehirne'**")
    
    # Daten generieren
    col1, col2 = st.columns([1, 2])
    
    with col1:
        st.subheader("🎛️ Daten-Parameter")
        n_samples = st.slider("Anzahl Samples", 50, 500, 200)
        noise_level = st.slider("Noise Level", 0.0, 50.0, 10.0)
        
        st.subheader("🧠 Netzwerk-Parameter")
        hidden_layers = st.selectbox("Hidden Layer", [(10,), (20,), (10, 5), (20, 10)])
        activation = st.selectbox("Aktivierung", ['relu', 'tanh', 'logistic'])
        learning_rate = st.selectbox("Learning Rate", [0.001, 0.01, 0.1])
        
        train_button = st.button("🚀 Trainiere Neural Network!")
    
    with col2:
        if train_button:
            # Daten erstellen
            X, y = make_regression(n_samples=n_samples, n_features=1, noise=noise_level, random_state=42)
            X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
            
            # Skalierung
            scaler_X = StandardScaler()
            scaler_y = StandardScaler()
            X_train_scaled = scaler_X.fit_transform(X_train)
            X_test_scaled = scaler_X.transform(X_test)
            y_train_scaled = scaler_y.fit_transform(y_train.reshape(-1, 1)).ravel()
            
            # Neural Network trainieren
            with st.spinner("Training Neural Network..."):
                nn = MLPRegressor(
                    hidden_layer_sizes=hidden_layers,
                    activation=activation,
                    learning_rate_init=learning_rate,
                    max_iter=1000,
                    random_state=42
                )
                nn.fit(X_train_scaled, y_train_scaled)
                
                # Vorhersagen
                y_pred_scaled = nn.predict(X_test_scaled)
                y_pred = scaler_y.inverse_transform(y_pred_scaled.reshape(-1, 1)).ravel()
            
            # Visualisierung
            fig = go.Figure()
            
            # Trainingsdaten
            fig.add_trace(go.Scatter(
                x=X_train.ravel(), y=y_train, mode='markers', 
                name='Training Data', opacity=0.6, marker=dict(color='blue')
            ))
            
            # Testdaten
            fig.add_trace(go.Scatter(
                x=X_test.ravel(), y=y_test, mode='markers', 
                name='Test Data (True)', marker=dict(color='red')
            ))
            
            # Vorhersagen
            fig.add_trace(go.Scatter(
                x=X_test.ravel(), y=y_pred, mode='markers', 
                name='Predictions', marker=dict(color='green', symbol='x', size=10)
            ))
            
            fig.update_layout(
                title="Neural Network Regression Results",
                xaxis_title="X",
                yaxis_title="y",
                height=500
            )
            st.plotly_chart(fig, use_container_width=True)
            
            # Metriken
            mse = mean_squared_error(y_test, y_pred)
            st.success(f"🎯 Mean Squared Error: **{mse:.2f}**")

# ============================================================================
# 🏷️ BEREICH 4: Klassifikation Demo (aus AMALEA "Classification Softmax")
# ============================================================================

elif app_mode == "🏷️ Klassifikation Demo":
    st.header("🏷️ Neural Network Klassifikation")
    st.markdown("**Aus dem ursprünglichen AMALEA-Kurs: 'Classification Softmax-Eis'**")
    
    # Dataset Auswahl
    dataset_choice = st.selectbox(
        "📊 Dataset wählen:",
        ["Iris (AMALEA-Klassiker)", "Künstliche Daten", "Kreise (Non-linear)"]
    )
    
    col1, col2 = st.columns([1, 2])
    
    with col1:
        st.subheader("🧠 Netzwerk-Konfiguration")
        
        if dataset_choice == "Iris (AMALEA-Klassiker)":
            # Iris Dataset
            iris = load_iris()
            X, y = iris.data, iris.target
            feature_names = iris.feature_names
            target_names = iris.target_names
            
            # Feature Auswahl
            feature_1 = st.selectbox("Feature 1", feature_names, index=0)
            feature_2 = st.selectbox("Feature 2", feature_names, index=1)
            
            X_viz = X[:, [feature_names.index(feature_1), feature_names.index(feature_2)]]
            
        elif dataset_choice == "Künstliche Daten":
            n_samples = st.slider("Anzahl Samples", 100, 1000, 300)
            n_classes = st.slider("Anzahl Klassen", 2, 4, 3)
            X_viz, y = make_classification(
                n_samples=n_samples, n_features=2, n_redundant=0, 
                n_informative=2, n_clusters_per_class=1, n_classes=n_classes,
                random_state=42
            )
            target_names = [f"Klasse {i}" for i in range(n_classes)]
            
        else:  # Kreise
            from sklearn.datasets import make_circles
            n_samples = st.slider("Anzahl Samples", 100, 1000, 300)
            noise = st.slider("Noise", 0.0, 0.3, 0.1)
            X_viz, y = make_circles(n_samples=n_samples, noise=noise, random_state=42)
            target_names = ["Innen", "Außen"]
        
        # Netzwerk Parameter
        hidden_layers = st.selectbox("Hidden Layers", [(10,), (20,), (10, 5), (50, 20)])
        activation = st.selectbox("Aktivierung", ['relu', 'tanh', 'logistic'])
        solver = st.selectbox("Optimizer", ['adam', 'sgd', 'lbfgs'])
        
        train_classification = st.button("🚀 Trainiere Klassifikator!")
    
    with col2:
        if train_classification:
            # Daten aufteilen
            X_train, X_test, y_train, y_test = train_test_split(
                X_viz, y, test_size=0.2, stratify=y, random_state=42
            )
            
            # Skalierung
            scaler = StandardScaler()
            X_train_scaled = scaler.fit_transform(X_train)
            X_test_scaled = scaler.transform(X_test)
            
            # Neural Network trainieren
            with st.spinner("Training Classifier..."):
                nn_clf = MLPClassifier(
                    hidden_layer_sizes=hidden_layers,
                    activation=activation,
                    solver=solver,
                    max_iter=1000,
                    random_state=42
                )
                nn_clf.fit(X_train_scaled, y_train)
                y_pred = nn_clf.predict(X_test_scaled)
            
            # Entscheidungsgrenze visualisieren
            h = 0.02
            x_min, x_max = X_viz[:, 0].min() - 1, X_viz[:, 0].max() + 1
            y_min, y_max = X_viz[:, 1].min() - 1, X_viz[:, 1].max() + 1
            xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                               np.arange(y_min, y_max, h))
            
            mesh_points = np.c_[xx.ravel(), yy.ravel()]
            mesh_points_scaled = scaler.transform(mesh_points)
            Z = nn_clf.predict(mesh_points_scaled)
            Z = Z.reshape(xx.shape)
            
            # Plot erstellen
            fig = go.Figure()
            
            # Entscheidungsgrenze
            fig.add_trace(go.Contour(
                x=np.arange(x_min, x_max, h),
                y=np.arange(y_min, y_max, h),
                z=Z,
                showscale=False,
                opacity=0.3,
                colorscale='Viridis'
            ))
            
            # Datenpunkte
            colors = ['red', 'blue', 'green', 'orange']
            for i, target_name in enumerate(target_names):
                mask = y == i
                fig.add_trace(go.Scatter(
                    x=X_viz[mask, 0], y=X_viz[mask, 1],
                    mode='markers', name=target_name,
                    marker=dict(color=colors[i % len(colors)], size=8)
                ))
            
            fig.update_layout(
                title="Neural Network Classification + Decision Boundary",
                xaxis_title="Feature 1",
                yaxis_title="Feature 2",
                height=500
            )
            st.plotly_chart(fig, use_container_width=True)
            
            # Accuracy
            accuracy = accuracy_score(y_test, y_pred)
            st.success(f"🎯 Test Accuracy: **{accuracy:.2%}**")
            
            # Confusion Matrix
            cm = confusion_matrix(y_test, y_pred)
            fig_cm = px.imshow(cm, text_auto=True, aspect="auto",
                             x=target_names[:len(np.unique(y))], 
                             y=target_names[:len(np.unique(y))],
                             title="Confusion Matrix")
            st.plotly_chart(fig_cm, use_container_width=True)

# ============================================================================
# 🎮 BEREICH 5: Interaktiver Playground
# ============================================================================

else:  # Interaktiver Playground
    st.header("🎮 Neural Network Playground")
    st.markdown("**Experimentiere mit verschiedenen Architekturen!**")
    
    # Zwei-Spalten Layout
    col1, col2 = st.columns([1, 2])
    
    with col1:
        st.subheader("🏗️ Netzwerk-Architektur")
        
        # Layer Konfiguration
        n_layers = st.slider("Anzahl Hidden Layers", 1, 5, 2)
        
        layers = []
        for i in range(n_layers):
            neurons = st.slider(f"Layer {i+1} Neuronen", 1, 100, 10*(i+1))
            layers.append(neurons)
        
        # Aktivierungsfunktion
        activation = st.selectbox("Aktivierungsfunktion", ['relu', 'tanh', 'logistic'])
        
        # Trainings-Parameter
        st.subheader("🎯 Training")
        learning_rate = st.select_slider("Learning Rate", [0.001, 0.01, 0.1, 1.0])
        max_iter = st.slider("Max Iterations", 100, 2000, 500)
        
        # Problem Type
        problem_type = st.radio("Problem Type", ["Regression", "Classification"])
        
        st.info(f"🧠 **Architektur**: {layers}\\n📊 **Aktivierung**: {activation}")
    
    with col2:
        st.subheader("🎯 Live Training")
        
        if st.button("🚀 Starte Training!"):
            if problem_type == "Regression":
                # Regression Problem
                X, y = make_regression(n_samples=300, n_features=1, noise=15, random_state=42)
                X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
                
                scaler_X = StandardScaler()
                scaler_y = StandardScaler()
                X_train_scaled = scaler_X.fit_transform(X_train)
                X_test_scaled = scaler_X.transform(X_test)
                y_train_scaled = scaler_y.fit_transform(y_train.reshape(-1, 1)).ravel()
                
                # Model
                model = MLPRegressor(
                    hidden_layer_sizes=tuple(layers),
                    activation=activation,
                    learning_rate_init=learning_rate,
                    max_iter=max_iter,
                    random_state=42
                )
                
                # Training mit Progress
                progress_bar = st.progress(0)
                status_text = st.empty()
                
                model.fit(X_train_scaled, y_train_scaled)
                progress_bar.progress(100)
                status_text.text("Training completed!")
                
                # Vorhersagen
                y_pred_scaled = model.predict(X_test_scaled)
                y_pred = scaler_y.inverse_transform(y_pred_scaled.reshape(-1, 1)).ravel()
                
                # Plot
                fig = go.Figure()
                fig.add_trace(go.Scatter(x=X_test.ravel(), y=y_test, mode='markers', name='True'))
                fig.add_trace(go.Scatter(x=X_test.ravel(), y=y_pred, mode='markers', name='Predicted'))
                fig.update_layout(title="Regression Results", height=400)
                st.plotly_chart(fig, use_container_width=True)
                
                mse = mean_squared_error(y_test, y_pred)
                st.metric("MSE", f"{mse:.2f}")
                
            else:
                # Classification Problem
                X, y = make_classification(n_samples=300, n_features=2, n_redundant=0, 
                                         n_informative=2, n_clusters_per_class=1, random_state=42)
                X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
                
                scaler = StandardScaler()
                X_train_scaled = scaler.fit_transform(X_train)
                X_test_scaled = scaler.transform(X_test)
                
                # Model
                model = MLPClassifier(
                    hidden_layer_sizes=tuple(layers),
                    activation=activation,
                    learning_rate_init=learning_rate,
                    max_iter=max_iter,
                    random_state=42
                )
                
                # Training
                progress_bar = st.progress(0)
                model.fit(X_train_scaled, y_train)
                progress_bar.progress(100)
                
                y_pred = model.predict(X_test_scaled)
                
                # Plot
                fig = go.Figure()
                colors = ['red', 'blue']
                for i in [0, 1]:
                    mask = y_test == i
                    fig.add_trace(go.Scatter(
                        x=X_test[mask, 0], y=X_test[mask, 1],
                        mode='markers', name=f'Class {i} (True)',
                        marker=dict(color=colors[i])
                    ))
                    
                    mask_pred = y_pred == i
                    fig.add_trace(go.Scatter(
                        x=X_test[mask_pred, 0], y=X_test[mask_pred, 1],
                        mode='markers', name=f'Class {i} (Pred)',
                        marker=dict(color=colors[i], symbol='x', size=10)
                    ))
                
                fig.update_layout(title="Classification Results", height=400)
                st.plotly_chart(fig, use_container_width=True)
                
                accuracy = accuracy_score(y_test, y_pred)
                st.metric("Accuracy", f"{accuracy:.2%}")

# ============================================================================
# Footer
# ============================================================================

st.markdown("---")
st.markdown("**🎓 AMALEA 2025 - Neural Networks modernisiert mit Streamlit**")
st.markdown("Alle ursprünglichen AMALEA-Konzepte interaktiv erlebbar!")
'''

# Speichere die Streamlit-App
with open("neural_network_playground.py", "w", encoding="utf-8") as f:
    f.write(streamlit_app_code)

print("✅ Streamlit App 'neural_network_playground.py' erstellt!")
print("\n🚀 Starte die App mit:")
print("streamlit run neural_network_playground.py")

# Test der wichtigsten Komponenten
print("\n🧪 Teste Neural Network Komponenten:")

# Test 1: Einfachstes Neuron (AMALEA Original)
def simple_neuron(x, w=-1, b=1):
    return w * x + b

test_result = simple_neuron(5)
print(f"✅ Einfachstes Neuron: f(5) = {test_result} (AMALEA-Original: -4)")

# Test 2: Aktivierungsfunktionen
def relu_test(x):
    return max(0, x)

print(f"✅ ReLU(-2) = {relu_test(-2)}, ReLU(3) = {relu_test(3)}")

print("\n🎯 Die Streamlit-App integriert alle AMALEA Neural Network Konzepte:")
print("- Einfachstes Neuron (aus 'Jetzt geht's in die Tiefe')")
print("- Aktivierungsfunktionen (ReLU, Sigmoid, Tanh)")
print("- Regression (aus 'Regression II')")
print("- Klassifikation (aus 'Classification Softmax')")
print("- Interaktiver Playground für Experimente")

## 🎓 Backpropagation & Gradient Descent (aus "Wir trainieren nur bergab")

Ein Neural Network ist nur so gut wie sein Training! Hier verstehen wir die wichtigsten Konzepte aus dem ursprünglichen AMALEA-Kurs "Wir trainieren nur bergab".

### 🏔️ Warum "bergab"?

Das Training eines Neural Networks ist wie das Finden des tiefsten Punkts in einer bergigen Landschaft:

- **🏔️ Berglandschaft** = Loss Function (Fehlerfunktion)
- **📍 Position** = Aktuelle Gewichte des Networks
- **⬇️ Bergab gehen** = Gradient Descent (Gewichte verbessern)
- **🎯 Tal** = Minimum der Loss Function (beste Gewichte)

### 📊 Loss Functions verstehen

| Problem | Loss Function | Formel | Verwendung |
|---------|---------------|--------|------------|
| **Regression** | Mean Squared Error | MSE = 1/n Σ(y - ŷ)² | Kontinuierliche Werte |
| **Binary Classification** | Binary Cross-Entropy | BCE = -1/n Σ[y log(ŷ) + (1-y)log(1-ŷ)] | 2 Klassen |
| **Multi-Class** | Categorical Cross-Entropy | CCE = -1/n Σ Σ y_ij log(ŷ_ij) | Mehrere Klassen |

### ⚡ Gradient Descent Algorithmus

1. **Forward Pass**: Input → Hidden Layers → Output
2. **Loss berechnen**: Vergleiche Output mit Ground Truth
3. **Backward Pass**: Berechne Gradienten (∂Loss/∂Weight)
4. **Weight Update**: w_new = w_old - learning_rate × gradient
5. **Wiederholen** bis Konvergenz

### 🎛️ Hyperparameter aus dem ursprünglichen AMALEA-Kurs

| Parameter | Beschreibung | Typische Werte | Auswirkung |
|-----------|--------------|----------------|------------|
| **Learning Rate** | Schrittgröße beim "Bergabgehen" | 0.001 - 0.1 | Zu groß: Überspringen, Zu klein: Langsam |
| **Batch Size** | Anzahl Samples pro Update | 32, 64, 128 | Größer: Stabilere Gradienten |
| **Epochs** | Vollständige Durchläufe durch Daten | 10 - 1000 | Mehr: Bessere Konvergenz (aber Overfitting!) |
| **Hidden Layers** | Netzwerk-Architektur | 1-5 Layers | Mehr: Komplexere Funktionen |
| **Neurons per Layer** | Kapazität pro Layer | 10-1000 | Mehr: Höhere Kapazität |

In [None]:
# 🏔️ Gradient Descent Visualisierung - AMALEA "Wir trainieren nur bergab"
# Verstehe das "Bergab"-Konzept interaktiv!

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

print("🏔️ Gradient Descent - Das 'Bergab' verstehen")
print("=" * 50)

# 1️⃣ Einfache 1D Loss Function (Parabel)
print("1️⃣ Einfaches Beispiel: Loss = (w - 2)²")

def loss_function_1d(w):
    """Einfache quadratische Loss Function"""
    return (w - 2)**2

def gradient_1d(w):
    """Gradient der Loss Function"""
    return 2 * (w - 2)

# Gradient Descent Simulation
def gradient_descent_1d(start_w, learning_rate, iterations):
    """1D Gradient Descent Simulation"""
    w_history = [start_w]
    loss_history = [loss_function_1d(start_w)]
    
    w = start_w
    for i in range(iterations):
        grad = gradient_1d(w)
        w = w - learning_rate * grad  # Das "Bergab"-Update!
        
        w_history.append(w)
        loss_history.append(loss_function_1d(w))
    
    return w_history, loss_history

# Verschiedene Learning Rates testen
learning_rates = [0.1, 0.3, 0.8]
colors = ['blue', 'green', 'red']

plt.figure(figsize=(15, 5))

# Plot 1: Loss Function
plt.subplot(1, 3, 1)
w_range = np.linspace(-1, 5, 100)
loss_range = [loss_function_1d(w) for w in w_range]
plt.plot(w_range, loss_range, 'k-', linewidth=2, label='Loss Function')
plt.axvline(x=2, color='red', linestyle='--', alpha=0.7, label='Optimum (w=2)')
plt.xlabel('Weight (w)')
plt.ylabel('Loss')
plt.title('Loss Landscape')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 2: Gradient Descent Pfade
plt.subplot(1, 3, 2)
plt.plot(w_range, loss_range, 'k-', linewidth=2, alpha=0.3)

for lr, color in zip(learning_rates, colors):
    w_hist, loss_hist = gradient_descent_1d(start_w=4.5, learning_rate=lr, iterations=10)
    plt.plot(w_hist, loss_hist, 'o-', color=color, label=f'LR={lr}', markersize=4)

plt.xlabel('Weight (w)')
plt.ylabel('Loss')
plt.title('Gradient Descent Pfade')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 3: Konvergenz über Zeit
plt.subplot(1, 3, 3)
for lr, color in zip(learning_rates, colors):
    w_hist, loss_hist = gradient_descent_1d(start_w=4.5, learning_rate=lr, iterations=20)
    plt.plot(loss_hist, color=color, label=f'LR={lr}')

plt.xlabel('Iteration')
plt.ylabel('Loss')
plt.title('Loss über Zeit')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')

plt.tight_layout()
plt.show()

# 2️⃣ Learning Rate Auswirkungen demonstrieren
print(f"\n2️⃣ Learning Rate Auswirkungen (AMALEA-Konzept):")

for lr in learning_rates:
    w_hist, loss_hist = gradient_descent_1d(start_w=4.5, learning_rate=lr, iterations=10)
    final_w = w_hist[-1]
    final_loss = loss_hist[-1]
    print(f"LR={lr}: Finales w={final_w:.3f}, Loss={final_loss:.3f}")

print(f"\n📊 Interpretation:")
print(f"- LR=0.1: Langsam aber stabil")
print(f"- LR=0.3: Gute Balance")
print(f"- LR=0.8: Schnell, aber möglicherweise instabil")

# 3️⃣ 2D Loss Surface (für Multi-Parameter Networks)
print(f"\n3️⃣ 2D Loss Surface (echte Neural Networks haben viele Parameter):")

def loss_function_2d(w1, w2):
    """2D Loss Function (Rosenbrock-ähnlich)"""
    return (1 - w1)**2 + 100 * (w2 - w1**2)**2

# Grid für Visualisierung
w1_range = np.linspace(-2, 2, 50)
w2_range = np.linspace(-1, 3, 50)
W1, W2 = np.meshgrid(w1_range, w2_range)
Z = loss_function_2d(W1, W2)

# 3D Plot
fig = plt.figure(figsize=(12, 4))

# 3D Surface
ax1 = fig.add_subplot(121, projection='3d')
surf = ax1.plot_surface(W1, W2, Z, cmap='viridis', alpha=0.7)
ax1.set_xlabel('Weight 1')
ax1.set_ylabel('Weight 2')
ax1.set_zlabel('Loss')
ax1.set_title('3D Loss Surface')

# Contour Plot
ax2 = fig.add_subplot(122)
contour = ax2.contour(W1, W2, Z, levels=20)
ax2.clabel(contour, inline=True, fontsize=8)
ax2.set_xlabel('Weight 1')
ax2.set_ylabel('Weight 2')
ax2.set_title('Loss Contours')
plt.colorbar(contour)

plt.tight_layout()
plt.show()

# 4️⃣ Optimizers Vergleich (aus ursprünglichem AMALEA erweitert)
print(f"\n4️⃣ Optimizer-Vergleich (moderne Erweiterung der AMALEA-Konzepte):")

optimizers_info = {
    "SGD": {
        "Beschreibung": "Stochastic Gradient Descent",
        "Update": "w = w - lr * gradient",
        "Vorteile": "Einfach, wenig Speicher",
        "Nachteile": "Langsam, kann steckenbleiben"
    },
    "SGD + Momentum": {
        "Beschreibung": "SGD mit Schwung",
        "Update": "v = β*v + lr*grad; w = w - v",
        "Vorteile": "Schneller, überwindet lokale Minima",
        "Nachteile": "Ein zusätzlicher Hyperparameter"
    },
    "Adam": {
        "Beschreibung": "Adaptive Moment Estimation",
        "Update": "Adaptiert lr per Parameter",
        "Vorteile": "Robust, wenig Tuning nötig",
        "Nachteile": "Mehr Speicher, nicht immer optimal"
    }
}

for name, info in optimizers_info.items():
    print(f"\n🚀 {name}:")
    print(f"   📝 {info['Beschreibung']}")
    print(f"   ⚡ Update: {info['Update']}")
    print(f"   ✅ Vorteile: {info['Vorteile']}")
    print(f"   ❌ Nachteile: {info['Nachteile']}")

# 5️⃣ Praktische Tipps aus dem AMALEA-Kurs
print(f"\n5️⃣ Praktische Tipps für das Training (AMALEA-Weisheiten):")

tips = [
    "🎯 Starte mit Learning Rate 0.01 oder 0.001",
    "📊 Plotte die Loss Kurve - sie sollte monoton fallen",
    "⏰ Früh stoppen wenn Validation Loss steigt (Overfitting!)",
    "🔄 Bei Oszillation: Learning Rate reduzieren",
    "⚡ Bei langsamer Konvergenz: Learning Rate erhöhen",
    "🧠 Mehr Hidden Units für komplexere Probleme",
    "⚖️ Regularization (Dropout) gegen Overfitting",
    "📈 Batch Normalization für tiefere Networks"
]

for tip in tips:
    print(f"   {tip}")

print(f"\n✅ Das waren die wichtigsten Konzepte aus 'Wir trainieren nur bergab'!")
print(f"🚀 Jetzt verstehst du, wie Neural Networks wirklich lernen!")

## 🍦 Softmax verstehen (aus "Softmax-Eis für einen one-hot day")

Das **Softmax** ist die wichtigste Aktivierungsfunktion für Multi-Class Klassifikation!

### 🧮 Softmax Mathematik

Für einen Vektor **z** = [z₁, z₂, ..., zₖ]:

$$\text{softmax}(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{k} e^{z_j}}$$

**Eigenschaften:**
- ✅ Ausgabewerte sind **Wahrscheinlichkeiten** (0 ≤ p ≤ 1)
- ✅ **Summe = 1** (alle Wahrscheinlichkeiten zusammen)
- ✅ **Differenzierbar** (wichtig für Backpropagation)

### 🎯 One-Hot Encoding

**Problem**: Computer verstehen keine Kategorien wie "Katze", "Hund", "Vogel"

**Lösung**: One-Hot Encoding

| Tier | One-Hot Vector |
|------|----------------|
| Katze | [1, 0, 0] |
| Hund | [0, 1, 0] |
| Vogel | [0, 0, 1] |

### 🏷️ Multi-Class Klassifikation Pipeline

1. **Input** → Neural Network → **Raw Scores** (Logits)
2. **Logits** → Softmax → **Wahrscheinlichkeiten**
3. **Wahrscheinlichkeiten** → argmax → **Prediction**
4. **Prediction** ↔ **One-Hot Ground Truth** → **Loss**

### 📊 Cross-Entropy Loss verstehen

```
Loss = -log(p_correct_class)
```

- Wenn p_correct = 1.0 → Loss = 0 (perfekt!)
- Wenn p_correct = 0.5 → Loss = 0.69 (okay)
- Wenn p_correct = 0.1 → Loss = 2.30 (schlecht!)

In [None]:
# 🍦 Softmax Demo - Verstehe "Softmax-Eis für einen one-hot day"
# Integration des ursprünglichen AMALEA-Konzepts

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

print("🍦 Softmax verstehen - AMALEA 'one-hot day'")
print("=" * 50)

# 1️⃣ Softmax Funktion implementieren
def softmax(z):
    """
    Softmax Aktivierungsfunktion
    Aus dem ursprünglichen AMALEA-Kurs
    """
    # Numerische Stabilität: subtrahiere max(z)
    z_stable = z - np.max(z)
    exp_z = np.exp(z_stable)
    return exp_z / np.sum(exp_z)

# 2️⃣ Beispiel aus dem ursprünglichen AMALEA-Kurs
print("1️⃣ AMALEA-Beispiel: 3 Klassen (Katze, Hund, Vogel)")

# Raw Scores (Logits) vom Neural Network
logits_examples = [
    [2.0, 1.0, 0.1],    # Eindeutig Katze
    [0.5, 0.6, 0.4],    # Unklare Entscheidung
    [-1.0, 3.0, -0.5],  # Eindeutig Hund
    [0.1, 0.2, 2.5]     # Eindeutig Vogel
]

class_names = ["🐱 Katze", "🐶 Hund", "🐦 Vogel"]

for i, logits in enumerate(logits_examples):
    probs = softmax(np.array(logits))
    predicted_class = np.argmax(probs)
    confidence = probs[predicted_class]
    
    print(f"\n📊 Beispiel {i+1}:")
    print(f"   Logits: {logits}")
    print(f"   Softmax: [{probs[0]:.3f}, {probs[1]:.3f}, {probs[2]:.3f}]")
    print(f"   Summe: {np.sum(probs):.3f} (sollte 1.0 sein!)")
    print(f"   Vorhersage: {class_names[predicted_class]} (Konfidenz: {confidence:.1%})")

# 3️⃣ Softmax Visualisierung
print(f"\n2️⃣ Softmax-Verhalten visualisieren:")

# Verschiedene "Temperaturen" testen
temperatures = [0.5, 1.0, 2.0, 5.0]
base_logits = np.array([2.0, 1.0, 0.1])

plt.figure(figsize=(15, 4))

for i, temp in enumerate(temperatures):
    plt.subplot(1, 4, i+1)
    
    # "Temperatur" anwenden
    scaled_logits = base_logits / temp
    probs = softmax(scaled_logits)
    
    bars = plt.bar(class_names, probs, color=['orange', 'blue', 'green'])
    plt.title(f'Temperatur = {temp}')
    plt.ylabel('Wahrscheinlichkeit')
    plt.ylim(0, 1)
    
    # Werte anzeigen
    for bar, prob in zip(bars, probs):
        plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.01, 
                f'{prob:.2f}', ha='center', va='bottom')

plt.tight_layout()
plt.show()

print(f"🌡️ Temperatur-Effekt:")
print(f"   - Niedrige Temperatur (0.5): Scharfe Entscheidungen")
print(f"   - Hohe Temperatur (5.0): Weiche Entscheidungen")

# 4️⃣ One-Hot Encoding Demo
print(f"\n3️⃣ One-Hot Encoding (essentiell für Training):")

def create_one_hot(class_index, num_classes):
    """One-Hot Vector erstellen"""
    one_hot = np.zeros(num_classes)
    one_hot[class_index] = 1
    return one_hot

# Beispiele
examples = [
    ("🐱 Katze", 0),
    ("🐶 Hund", 1), 
    ("🐦 Vogel", 2)
]

print("One-Hot Encoding Beispiele:")
for name, idx in examples:
    one_hot = create_one_hot(idx, 3)
    print(f"   {name}: {one_hot}")

# 5️⃣ Cross-Entropy Loss berechnen
print(f"\n4️⃣ Cross-Entropy Loss verstehen:")

def cross_entropy_loss(predicted_probs, true_one_hot):
    """Cross-Entropy Loss berechnen"""
    # Numerische Stabilität
    predicted_probs = np.clip(predicted_probs, 1e-15, 1 - 1e-15)
    return -np.sum(true_one_hot * np.log(predicted_probs))

# Beispiele für verschiedene Vorhersagequalitäten
scenarios = [
    ("Perfekte Vorhersage", [0.99, 0.005, 0.005], [1, 0, 0]),
    ("Gute Vorhersage", [0.8, 0.15, 0.05], [1, 0, 0]),
    ("Schlechte Vorhersage", [0.4, 0.4, 0.2], [1, 0, 0]),
    ("Sehr schlechte Vorhersage", [0.1, 0.8, 0.1], [1, 0, 0])
]

print("Cross-Entropy Loss für verschiedene Vorhersagen:")
for name, pred, true in scenarios:
    loss = cross_entropy_loss(np.array(pred), np.array(true))
    print(f"   {name}: Loss = {loss:.3f}")

# 6️⃣ Praktisches Iris-Beispiel mit Softmax
print(f"\n5️⃣ Praktisches Beispiel: Iris-Klassifikation mit Softmax:")

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

# Daten laden
iris = load_iris()
X, y = iris.data, iris.target

# Aufteilen
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Skalieren
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Neural Network mit Softmax
nn = MLPClassifier(
    hidden_layer_sizes=(10, 5),
    activation='relu',
    solver='adam',
    max_iter=1000,
    random_state=42
)

nn.fit(X_train_scaled, y_train)

# Vorhersagen (Wahrscheinlichkeiten!)
y_pred_proba = nn.predict_proba(X_test_scaled)
y_pred = nn.predict(X_test_scaled)

# Erste 5 Beispiele zeigen
print("Erste 5 Testbeispiele:")
print("True Class | Predicted Probabilities | Prediction")
print("-" * 55)

for i in range(5):
    true_class = iris.target_names[y_test[i]]
    pred_class = iris.target_names[y_pred[i]]
    probs = y_pred_proba[i]
    
    print(f"{true_class:10} | [{probs[0]:.3f}, {probs[1]:.3f}, {probs[2]:.3f}] | {pred_class}")

# Gesamtperformance
accuracy = nn.score(X_test_scaled, y_test)
print(f"\n🎯 Test Accuracy: {accuracy:.2%}")

# 7️⃣ Softmax Gradient (für Interessierte)
print(f"\n6️⃣ Bonus: Softmax Gradient (für tieferes Verständnis):")

def softmax_gradient(softmax_output):
    """
    Gradient der Softmax-Funktion
    Wichtig für Backpropagation!
    """
    # Softmax Gradient ist: s_i * (δ_ij - s_j)
    # wobei δ_ij das Kronecker Delta ist
    s = softmax_output.reshape(-1, 1)
    return np.diagflat(s) - np.dot(s, s.T)

# Beispiel
example_softmax = softmax(np.array([2.0, 1.0, 0.1]))
gradient_matrix = softmax_gradient(example_softmax)

print("Softmax Output:", example_softmax)
print("Gradient Matrix (3x3):")
print(gradient_matrix)

print(f"\n✅ Softmax-Konzepte aus dem ursprünglichen AMALEA erfolgreich integriert!")
print(f"🎯 Du verstehst jetzt Multi-Class Klassifikation mit Neural Networks!")

## 🎯 Praktische Übungen - Neural Networks meistern

### 📝 Übung 1: Eigenes Neuron implementieren

**Aufgabe**: Implementiere ein Neuron mit ReLU-Aktivierung für das XOR-Problem.

```python
def my_neuron(x1, x2, w1, w2, bias):
    # Deine Implementierung hier
    pass

# XOR Daten: (0,0)→0, (0,1)→1, (1,0)→1, (1,1)→0
# Teste verschiedene Gewichte!
```

### 📝 Übung 2: Aktivierungsfunktionen vergleichen

**Aufgabe**: Trainiere das gleiche Network mit verschiedenen Aktivierungsfunktionen und vergleiche die Performance.

### 📝 Übung 3: Learning Rate Experiment

**Aufgabe**: Teste Learning Rates von 0.001 bis 1.0 und dokumentiere das Trainingsverhalten.

### 📝 Übung 4: Softmax von Hand

**Aufgabe**: Berechne Softmax für [3.0, 1.0, -1.0] ohne NumPy.

### 🚀 Portfolio-Projekt: Deine erste Neural Network App

**Ziel**: Erstelle eine Streamlit-App für ein selbstgewähltes Klassifikationsproblem.

**Anforderungen**:
1. ✅ Eigener Datensatz (CSV Upload)
2. ✅ Interaktive Hyperparameter-Auswahl
3. ✅ Live-Training mit Progress Bar
4. ✅ Performance-Metriken visualisieren
5. ✅ Vorhersagen für neue Eingaben

**Bewertungskriterien**:
- 📊 **Datenqualität** (20%): Saubere, relevante Daten
- 🧠 **Neural Network** (30%): Angemessene Architektur
- 🎨 **UI/UX** (20%): Benutzerfreundliche Streamlit-App
- 📈 **Evaluation** (20%): Aussagekräftige Metriken
- 📝 **Dokumentation** (10%): Code-Kommentare und README

In [None]:
# 🎯 Übungslösungen - Neural Networks praktisch anwenden

print("🎯 Übungslösungen - AMALEA Neural Networks")
print("=" * 50)

# ✅ Lösung Übung 1: Eigenes Neuron implementieren
print("✅ Lösung Übung 1: XOR-Neuron")

def my_neuron(x1, x2, w1, w2, bias, activation='relu'):
    """
    Eigenes Neuron mit verschiedenen Aktivierungsfunktionen
    """
    # Lineare Kombination
    z = w1 * x1 + w2 * x2 + bias
    
    # Aktivierungsfunktion anwenden
    if activation == 'relu':
        return max(0, z)
    elif activation == 'sigmoid':
        return 1 / (1 + np.exp(-z))
    elif activation == 'tanh':
        return np.tanh(z)
    else:
        return z  # Linear

# XOR-Problem testen (braucht mehrere Neuronen!)
print("XOR-Problem: Ein einzelnes Neuron kann XOR nicht lösen!")
print("(Das ist der Grund, warum wir mehrere Layer brauchen)")

xor_data = [(0, 0, 0), (0, 1, 1), (1, 0, 1), (1, 1, 0)]

for x1, x2, expected in xor_data:
    # Versuche mit verschiedenen Gewichten
    result = my_neuron(x1, x2, w1=1, w2=1, bias=-0.5)
    print(f"Input: ({x1}, {x2}) → Output: {result:.2f}, Expected: {expected}")

print("💡 XOR ist nicht linear separierbar → braucht Hidden Layer!")

# ✅ Lösung Übung 4: Softmax von Hand
print(f"\n✅ Lösung Übung 4: Softmax von Hand berechnen")

def softmax_by_hand(z_list):
    """Softmax Schritt für Schritt berechnen"""
    print(f"Eingabe: {z_list}")
    
    # Schritt 1: Exponential
    exp_values = []
    for z in z_list:
        exp_z = np.exp(z)
        exp_values.append(exp_z)
        print(f"e^{z} = {exp_z:.3f}")
    
    # Schritt 2: Summe
    sum_exp = sum(exp_values)
    print(f"Summe: {sum_exp:.3f}")
    
    # Schritt 3: Normalisierung
    softmax_values = []
    for i, exp_val in enumerate(exp_values):
        softmax_val = exp_val / sum_exp
        softmax_values.append(softmax_val)
        print(f"Softmax[{i}] = {exp_val:.3f} / {sum_exp:.3f} = {softmax_val:.3f}")
    
    print(f"Ergebnis: {softmax_values}")
    print(f"Summe Check: {sum(softmax_values):.3f} (sollte 1.0 sein)")
    return softmax_values

# Beispiel aus Übung 4
softmax_result = softmax_by_hand([3.0, 1.0, -1.0])

# ✅ Bonus: Neural Network Performance Metriken
print(f"\n🏆 Bonus: Wichtige Performance Metriken für Neural Networks")

# Simuliere Klassifikationsergebnisse
np.random.seed(42)
y_true = np.random.randint(0, 3, 100)  # 3 Klassen
y_pred = y_true.copy()
# Füge einige Fehler hinzu
error_indices = np.random.choice(100, 20, replace=False)
y_pred[error_indices] = np.random.randint(0, 3, 20)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.metrics import classification_report, confusion_matrix

# Berechne Metriken
accuracy = accuracy_score(y_true, y_pred)
precision = precision_score(y_true, y_pred, average='weighted')
recall = recall_score(y_true, y_pred, average='weighted')
f1 = f1_score(y_true, y_pred, average='weighted')

print("📊 Classification Metriken:")
print(f"   Accuracy:  {accuracy:.3f}")
print(f"   Precision: {precision:.3f}")
print(f"   Recall:    {recall:.3f}")
print(f"   F1-Score:  {f1:.3f}")

# Confusion Matrix
cm = confusion_matrix(y_true, y_pred)
print(f"\n🎯 Confusion Matrix:")
print(cm)

# ✅ Praktische Tipps für Neural Network Debugging
print(f"\n🔧 Neural Network Debugging Checklist:")

debugging_tips = [
    "🔍 Check Input Data Shape: Stimmen die Dimensionen?",
    "📊 Normalize Features: StandardScaler oder MinMaxScaler",
    "🎯 Balance Classes: Gleiche Anzahl pro Klasse oder Class Weights",
    "📈 Plot Loss Curve: Sollte monoton fallen",
    "⚡ Learning Rate: 0.001-0.1, bei Oszillation reduzieren",
    "🧠 Architecture: Start simple (1-2 Hidden Layers)",
    "⏰ Early Stopping: Validation Loss überwachen",
    "🔄 Regularization: Dropout (0.2-0.5) gegen Overfitting",
    "🎲 Random Seeds: Für reproduzierbare Ergebnisse",
    "💾 Save Models: Beste Checkpoints speichern"
]

for i, tip in enumerate(debugging_tips, 1):
    print(f"{i:2d}. {tip}")

print(f"\n✅ Neural Network Grundlagen aus AMALEA erfolgreich modernisiert!")
print(f"🚀 Du bist bereit für Woche 5: CNNs und Computer Vision!")

# Nächste Schritte Preview
print(f"\n🔮 Vorschau Woche 5:")
print(f"   🖼️  Convolutional Neural Networks (CNNs)")
print(f"   👁️  Computer Vision Grundlagen")
print(f"   🎨  Image Classification mit Streamlit")
print(f"   🔄  Data Augmentation Techniken")
print(f"   📱  Transfer Learning für Praxis-Projekte")

## 🎓 Zusammenfassung: Neural Networks gemeistert!

### 🎯 Was du heute gelernt hast

✅ **Einfachstes Neuron** - Grundbaustein des Deep Learning verstanden  
✅ **Aktivierungsfunktionen** - ReLU, Sigmoid, Tanh richtig einsetzen  
✅ **Neural Network Architektur** - Hidden Layers, Gewichte, Bias  
✅ **Backpropagation** - Wie Networks "lernen" (bergab gehen!)  
✅ **Gradient Descent** - Optimierung verstehen  
✅ **Regression mit Neural Networks** - Kontinuierliche Vorhersagen  
✅ **Klassifikation mit Neural Networks** - Kategorien vorhersagen  
✅ **Softmax & One-Hot** - Multi-Class Klassifikation meistern  
✅ **Cross-Entropy Loss** - Loss Functions verstehen  
✅ **Hyperparameter Tuning** - Learning Rate, Architecture, etc.  
✅ **Streamlit Neural Network Apps** - Interaktive Demos erstellen

### 🔄 AMALEA-Integration erfolgreich abgeschlossen

Alle ursprünglichen AMALEA-Konzepte wurden modernisiert integriert:

| Original AMALEA | Modernisierte Integration |
|----------------|---------------------------|
| 🧠 "Jetzt geht's in die Tiefe" | ✅ Neuron-Grundlagen + Streamlit Demo |
| 🏔️ "Wir trainieren nur bergab" | ✅ Gradient Descent + Optimizer Vergleich |
| 📊 "Regression II" | ✅ Neural Network Regression + Live Demo |
| 🍦 "Classification Softmax" | ✅ Softmax + One-Hot + Interactive Explorer |

### 🚀 Nächste Schritte - Woche 5 Preview

**Woche 5: Convolutional Neural Networks (CNNs)**
- 🖼️ Computer Vision Grundlagen
- 🔍 Convolution, Pooling, Feature Maps
- 👁️ Image Classification mit CNNs
- 🎨 Data Augmentation für bessere Performance
- 📱 Transfer Learning für Praxis-Projekte
- 🤖 Object Detection Grundlagen

### 📚 Weiterführende Ressourcen

**Für tieferes Verständnis:**
- 📖 "Deep Learning" von Ian Goodfellow (Bibel des Deep Learning)
- 🎓 CS231n Stanford Course (Convolutional Networks)
- 🧠 Neural Network Playground (playground.tensorflow.org)
- 📺 3Blue1Brown Neural Networks Serie (YouTube)

**Praktische Tools:**
- 🔧 TensorFlow/Keras für größere Projekte
- ⚡ PyTorch für Forschung
- 🎮 Streamlit für schnelle Prototypen
- 📊 Weights & Biases für Experiment Tracking

### 🏆 Projektideen für dein Portfolio

1. **📈 Stock Price Predictor** - LSTM Neural Network für Zeitreihen
2. **🎵 Music Genre Classifier** - Audio Features + Deep Learning
3. **📝 Sentiment Analysis** - Text Classification mit Neural Networks
4. **🏠 House Price Predictor** - Regression mit Feature Engineering
5. **🎮 Game AI** - Reinforcement Learning Grundlagen

---

## 🎯 Quiz: Neural Networks Check

**Teste dein Wissen:**

1. Was ist die Ausgabe von ReLU(-5)?
2. Warum brauchen wir Hidden Layers für XOR?
3. Was passiert bei zu hoher Learning Rate?
4. Wofür steht "Softmax"?
5. Wie lautet die Formel für ein einfaches Neuron?

**Antworten:**
1. 0 (ReLU = max(0, x))
2. XOR ist nicht linear separierbar
3. Gradient Descent springt über das Minimum
4. "Soft" Maximum - gibt Wahrscheinlichkeiten zurück
5. f(x) = w*x + b (ohne Aktivierung)

---

### 🎉 Glückwunsch!

Du hast Neural Networks von Grund auf verstanden und kannst jetzt:
- ✅ Eigene Neural Networks designen
- ✅ Hyperparameter intelligent wählen
- ✅ Training-Probleme debuggen
- ✅ Interaktive Streamlit-Apps erstellen
- ✅ Performance richtig evaluieren

**Du bist bereit für fortgeschrittene Deep Learning Themen!** 🚀