# 3D-Visualisierung: Lineare Regression vs. Entscheidungsbaum

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/klar74/WS2025_lecture/blob/main/Vorlesung_16/3d_simple_comparison.ipynb)

## Einfaches Beispiel: Wie sehen die Algorithmen den 3D-Raum?

**Lineare Regression:** Glatte Ebene  
**Entscheidungsbaum:** Stufen und Quader

Schauen wir uns das visuell an!

In [None]:
# Einfache Bibliotheken
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor

print("📦 Bibliotheken geladen!")

## Schritt 1: Einfache Daten erstellen

Wir erstellen 50 Punkte mit 2 Features (x, y) und einem Target (z).

In [None]:
# Einfache Daten erstellen
np.random.seed(42)

# 50 Punkte
x = np.random.uniform(-2, 2, 50)
y = np.random.uniform(-2, 2, 50)

# Einfacher linearer Zusammenhang: z = x + y + etwas Rauschen
z = x + y + np.random.normal(0, 0.3, 50)

# Als DataFrame für sklearn
X = np.column_stack([x, y])

print(f"✅ {len(x)} Datenpunkte erstellt")
print(f"📊 Features: x und y")
print(f"🎯 Target: z")

## Schritt 2: Beide Modelle trainieren

In [None]:
# Lineare Regression
lr_model = LinearRegression()
lr_model.fit(X, z)

# Entscheidungsbaum (einfach gehalten)
tree_model = DecisionTreeRegressor(max_depth=3, random_state=42)
tree_model.fit(X, z)

print("🤖 Beide Modelle trainiert!")
print(f"📈 Lineare Regression: z = {lr_model.coef_[0]:.2f}*x + {lr_model.coef_[1]:.2f}*y + {lr_model.intercept_:.2f}")
print(f"🌳 Entscheidungsbaum: {tree_model.get_n_leaves()} Blätter, Tiefe {tree_model.get_depth()}")

## Schritt 3: 3D-Visualisierung

Jetzt schauen wir uns an, wie beide Modelle den 3D-Raum "verstehen"!

In [None]:
# Raster für Vorhersagen erstellen
x_range = np.linspace(-2, 2, 20)
y_range = np.linspace(-2, 2, 20)
X_grid, Y_grid = np.meshgrid(x_range, y_range)

# Vorhersagen für das gesamte Raster
grid_points = np.column_stack([X_grid.ravel(), Y_grid.ravel()])
Z_linear = lr_model.predict(grid_points).reshape(X_grid.shape)
Z_tree = tree_model.predict(grid_points).reshape(X_grid.shape)

print("🌐 Vorhersage-Oberflächen berechnet!")

In [None]:
# 3D-Plot erstellen
fig = plt.figure(figsize=(16, 6))

# Lineare Regression
ax1 = fig.add_subplot(121, projection='3d')
ax1.scatter(x, y, z, color='red', s=20, alpha=0.8, label='Datenpunkte')  # kleinere Punkte
ax1.plot_surface(X_grid, Y_grid, Z_linear, alpha=0.3, color='blue')
ax1.set_xlabel('x')
ax1.set_ylabel('y')
ax1.set_zlabel('z')
ax1.set_title('Lineare Regression\n(Glatte Ebene)', fontweight='bold')
ax1.legend()

# Entscheidungsbaum - mit achsparallelen Grenzen
ax2 = fig.add_subplot(122, projection='3d')
ax2.scatter(x, y, z, color='red', s=20, alpha=0.8, label='Datenpunkte')  # kleinere Punkte

# Für bessere Visualisierung der achsparallelen Grenzen:
# Weniger Interpolation, mehr Rechtecke
x_range_fine = np.linspace(-2, 2, 50)
y_range_fine = np.linspace(-2, 2, 50)
X_grid_fine, Y_grid_fine = np.meshgrid(x_range_fine, y_range_fine)
grid_points_fine = np.column_stack([X_grid_fine.ravel(), Y_grid_fine.ravel()])
Z_tree_fine = tree_model.predict(grid_points_fine).reshape(X_grid_fine.shape)

# Plot mit weniger Glättung für scharfe Kanten
ax2.plot_surface(X_grid_fine, Y_grid_fine, Z_tree_fine, 
                alpha=0.4, color='orange', 
                rcount=50, ccount=50,  # mehr Auflösung
                linewidth=0, antialiased=False)  # scharfe Kanten

ax2.set_xlabel('x')
ax2.set_ylabel('y')
ax2.set_zlabel('z')
ax2.set_title('Entscheidungsbaum\n(Achsparallele Quader)', fontweight='bold')
ax2.legend()

plt.tight_layout()
plt.show()

print("🎨 3D-Visualisierung fertig!")
print("💡 Achsparallele Grenzen des Entscheidungsbaums sind jetzt besser sichtbar!")

## Was sehen wir?

**🔵 Lineare Regression (links):**
- Erzeugt eine **glatte, schräge Ebene**
- Die Ebene geht durch die Punktwolke
- **Formel:** z = 1.00*x + 1.00*y + 0.00 (ungefähr)

**🟡 Entscheidungsbaum (rechts):**
- Erzeugt **flache Plateaus** mit **achsparallelen Grenzen**
- Jedes Rechteck hat einen konstanten z-Wert (Vorhersage)
- **Wichtig:** Grenzen verlaufen parallel zu x- und y-Achsen!
- Der 2D-Raum wird in rechteckige Bereiche aufgeteilt

## Warum achsparallele Grenzen?

Der Entscheidungsbaum teilt mit Regeln wie:
- "Wenn x < 0.5, dann..."
- "Wenn y > -1.2, dann..."

Diese Regeln erzeugen **senkrechte und waagerechte Linien** im 2D-Raum, die sich zu **rechteckigen Bereichen** kombinieren. Jeder Bereich bekommt eine konstante Vorhersage → flache Plateaus!

## Fazit

- **Lineare Daten** → Lineare Regression ist besser (glatte Ebene passt)
- **Stufenförmige Daten** → Entscheidungsbaum ist besser (Stufen passen)

Das ist der Grundunterschied! 🎯

## 🎮 Bonus: Interaktive 3D-Plots

Die gleiche Visualisierung, aber **interaktiv**! Du kannst:
- **Drehen** mit der Maus
- **Zoomen** mit dem Mausrad
- **Verschieben** durch Klicken und Ziehen

In [None]:
# Plotly für interaktive Plots
import plotly.graph_objects as go
from plotly.subplots import make_subplots

print("🚀 Plotly geladen - bereit für interaktive Plots!")

In [None]:
# Funktion für echte 3D-Quader
def create_3d_box(x_min, x_max, y_min, y_max, z_min, z_max, color='orange', opacity=0.3):
    """Erstellt einen vollständigen 3D-Quader mit go.Mesh3d"""
    # 8 Eckpunkte eines Quaders
    vertices = [
        [x_min, y_min, z_min], [x_max, y_min, z_min],  # unten vorne links/rechts
        [x_max, y_max, z_min], [x_min, y_max, z_min],  # unten hinten rechts/links
        [x_min, y_min, z_max], [x_max, y_min, z_max],  # oben vorne links/rechts
        [x_max, y_max, z_max], [x_min, y_max, z_max]   # oben hinten rechts/links
    ]
    
    x_coords = [v[0] for v in vertices]
    y_coords = [v[1] for v in vertices]
    z_coords = [v[2] for v in vertices]
    
    # 12 Dreiecke für die 6 Flächen des Quaders
    triangles = [
        [0,1,2], [0,2,3],  # unten
        [4,7,6], [4,6,5],  # oben
        [0,4,5], [0,5,1],  # vorne
        [2,6,7], [2,7,3],  # hinten
        [0,3,7], [0,7,4],  # links
        [1,5,6], [1,6,2]   # rechts
    ]
    
    i_coords = [t[0] for t in triangles]
    j_coords = [t[1] for t in triangles]
    k_coords = [t[2] for t in triangles]
    
    return go.Mesh3d(
        x=x_coords, y=y_coords, z=z_coords,
        i=i_coords, j=j_coords, k=k_coords,
        color=color, opacity=opacity,
        showscale=False
    )

# Interaktive 3D-Plots erstellen
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=["Lineare Regression", "Entscheidungsbaum mit 3D-Quadern"],
    specs=[[{"type": "scene"}, {"type": "scene"}]]
)

# Datenpunkte (für beide Plots)
scatter_trace = go.Scatter3d(
    x=x, y=y, z=z,
    mode='markers',
    marker=dict(size=4, color='red', opacity=0.9),
    name='Datenpunkte'
)

# Lineare Regression - feineres Grid für glatte Oberfläche
x_range_fine = np.linspace(-2, 2, 30)
y_range_fine = np.linspace(-2, 2, 30)
X_grid_fine, Y_grid_fine = np.meshgrid(x_range_fine, y_range_fine)
grid_points_fine = np.column_stack([X_grid_fine.ravel(), Y_grid_fine.ravel()])
Z_linear_fine = lr_model.predict(grid_points_fine).reshape(X_grid_fine.shape)

linear_surface = go.Surface(
    x=X_grid_fine, y=Y_grid_fine, z=Z_linear_fine,
    colorscale='Blues', opacity=0.5,
    name='Lineare Regression',
    showscale=False
)

# Entscheidungsbaum: Echte 3D-Quader für jeden Blattknoten
# Analysiere die Entscheidungsregeln
from sklearn.tree import _tree

def get_leaf_regions(tree, feature_names=['x', 'y']):
    """Extrahiert die rechteckigen Bereiche jedes Blattknotens"""
    tree_ = tree.tree_
    regions = []
    
    def recurse(node, x_min, x_max, y_min, y_max):
        if tree_.feature[node] != _tree.TREE_UNDEFINED:  # nicht Blatt
            feature = tree_.feature[node]
            threshold = tree_.threshold[node]
            
            if feature == 0:  # x-Feature
                # linker Knoten: x <= threshold
                recurse(tree_.children_left[node], x_min, threshold, y_min, y_max)
                # rechter Knoten: x > threshold  
                recurse(tree_.children_right[node], threshold, x_max, y_min, y_max)
            else:  # y-Feature
                # linker Knoten: y <= threshold
                recurse(tree_.children_left[node], x_min, x_max, y_min, threshold)
                # rechter Knoten: y > threshold
                recurse(tree_.children_right[node], x_min, x_max, threshold, y_max)
        else:  # Blattknoten
            prediction = tree_.value[node][0][0]
            regions.append({
                'x_min': x_min, 'x_max': x_max,
                'y_min': y_min, 'y_max': y_max,
                'prediction': prediction
            })
    
    recurse(0, -2, 2, -2, 2)
    return regions

# Extrahiere die Regionen
regions = get_leaf_regions(tree_model)
print(f"🔍 Entscheidungsbaum hat {len(regions)} rechteckige Bereiche (Quader)")

# Erstelle 3D-Quader für jeden Bereich
tree_boxes = []
colors = ['orange', 'gold', 'coral', 'sandybrown', 'darkorange', 'peachpuff', 'papayawhip', 'moccasin']

for i, region in enumerate(regions):
    # Quader von z=prediction-0.1 bis z=prediction+0.1 für Sichtbarkeit
    z_center = region['prediction']
    box = create_3d_box(
        region['x_min'], region['x_max'],
        region['y_min'], region['y_max'], 
        z_center - 0.05, z_center + 0.05,  # dünne Quader
        color=colors[i % len(colors)],
        opacity=0.6
    )
    tree_boxes.append(box)

# Plots hinzufügen
# Linke Seite: Lineare Regression
fig.add_trace(scatter_trace, row=1, col=1)
fig.add_trace(linear_surface, row=1, col=1)

# Rechte Seite: Entscheidungsbaum mit echten 3D-Quadern
scatter_trace_2 = go.Scatter3d(
    x=x, y=y, z=z,
    mode='markers',
    marker=dict(size=5, color='red', opacity=1.0),
    name='Datenpunkte'
)
fig.add_trace(scatter_trace_2, row=1, col=2)

# Füge alle 3D-Quader hinzu
for i, box in enumerate(tree_boxes):
    box.name = f'Quader {i+1}'
    fig.add_trace(box, row=1, col=2)

# Zusätzlich: Rahmenlinien für bessere Sichtbarkeit der Quader-Grenzen
for i, region in enumerate(regions):
    z_val = region['prediction']
    
    # Rechteckiger Rahmen auf der Höhe der Vorhersage
    frame_x = [region['x_min'], region['x_max'], region['x_max'], region['x_min'], region['x_min']]
    frame_y = [region['y_min'], region['y_min'], region['y_max'], region['y_max'], region['y_min']]
    frame_z = [z_val] * 5
    
    fig.add_trace(go.Scatter3d(
        x=frame_x, y=frame_y, z=frame_z,
        mode='lines',
        line=dict(color='black', width=4),
        showlegend=False,
        name=f'Rahmen {i+1}'
    ), row=1, col=2)

# Layout anpassen
fig.update_layout(
    title="🎮 Interaktive 3D-Visualisierung (Drehen & Zoomen möglich!)",
    scene=dict(
        xaxis_title="x",
        yaxis_title="y",
        zaxis_title="z"
    ),
    scene2=dict(
        xaxis_title="x",
        yaxis_title="y",
        zaxis_title="z"
    ),
    height=600,
    showlegend=False
)

fig.show()

print("🎯 Interaktive 3D-Quader bereit!")
print("💡 Tipp: Klicke und ziehe zum Drehen, Mausrad zum Zoomen!")
print(f"📦 Der Entscheidungsbaum teilt den Raum in {len(regions)} achsparallele Quader!")
print("🔍 Jeder Datenpunkt fällt in genau einen Quader mit konstanter Vorhersage")
print("⚫ Schwarze Rahmen zeigen die exakten Quader-Grenzen")

# Zeige Details der Bereiche
for i, region in enumerate(regions):
    print(f"Quader {i+1}: x∈[{region['x_min']:.2f}, {region['x_max']:.2f}], "
          f"y∈[{region['y_min']:.2f}, {region['y_max']:.2f}] → z={region['prediction']:.2f}")

## 🎯 Perfekt!

Jetzt hast du beide Visualisierungen:
- **Statische Plots** (matplotlib) - für Screenshots und Dokumentation
- **Interaktive Plots** (plotly) - zum Erkunden und Verstehen

**Probiere es aus:**
1. **Klicke und ziehe** um die 3D-Ansicht zu drehen
2. **Mausrad** zum Rein- und Rauszoomen  
3. **Doppelklick** um zur ursprünglichen Ansicht zurückzukehren

So siehst du noch besser, wie die **glatte Ebene** der linearen Regression sich von den **stufigen Plateaus** des Entscheidungsbaums unterscheidet!