<p><font size="6" color='grey'> <b>
Machine Learning
</b></font> </br></p>
<p><font size="5" color='grey'> <b>
XAI Frameworks im Vergleich - Titanic
</b></font> </br></p>

---

**Explainable AI (XAI) Frameworks:**

- üîç **LIME** - Local Interpretable Model-agnostic Explanations
- üéØ **SHAP** - SHapley Additive exPlanations  
- üë∂ **ELI5** - Explain Like I'm 5
- üè¢ **InterpretML** - Microsoft's umfassendes Framework

Dieses Notebook vergleicht alle wichtigen XAI-Frameworks am Titanic-Datensatz.

---

**üìö Wichtige Begriffe f√ºr dieses Notebook:**

| Begriff | Bedeutung |
|---------|----------|
| **Black-Box-Modell** | ML-Modell, dessen Entscheidungslogik nicht direkt einsehbar ist (z.B. Random Forest, neuronale Netze) |
| **Modell-agnostisch** | Die Methode funktioniert bei jedem Modelltyp ‚Äì egal ob Random Forest, XGBoost oder neuronales Netz |
| **Lokal vs. Global** | Lokal = erkl√§rt eine einzelne Vorhersage; Global = erkl√§rt das gesamte Modellverhalten |
| **Feature Importance** | Wie wichtig ist ein Merkmal f√ºr die Vorhersage? |
| **Perturbation** | Gezieltes Ver√§ndern von Eingabewerten, um deren Einfluss zu messen |


# 0  | Install & Import
---

In [None]:
# Install - Verwendet normales pip (funktioniert in allen Umgebungen)
!uv pip install -q shap lime eli5 interpret plotly
!uv pip install -q git+https://github.com/parrt/dtreeviz.git

print("‚úÖ Alle Pakete installiert")

In [None]:
# Import
from pandas import read_excel, DataFrame
import numpy as np

from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OrdinalEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# XAI Frameworks
import shap
import lime
from lime.lime_tabular import LimeTabularExplainer
import eli5
from eli5.sklearn import PermutationImportance
from interpret import show
from interpret.blackbox import ShapKernel

import plotly.express as px
import matplotlib.pyplot as plt
import dtreeviz

In [None]:
# Warnung ausstellen
import warnings
warnings.filterwarnings("ignore")

# Matplotlib-spezifische Warnungen unterdr√ºcken
import logging
logging.getLogger('matplotlib').setLevel(logging.ERROR)

# 1  | Understand
---

<p><font color='black' size="5">
üìí Anwendungsfall
</font></p>

Der legend√§re Titanic ML-Wettbewerb: Vorhersage, welche Passagiere √ºberlebt haben.

**Ziel**: Vergleich verschiedener XAI-Frameworks zur Erkl√§rung der Modellvorhersagen.

**Beispielpersonen:**
- üë∞ **Rose DeWitt Bukater** (Kate Winslet) - 1. Klasse, weiblich, 22 Jahre
- üé® **Jack Dawson** (Leonardo DiCaprio) - 3. Klasse, m√§nnlich, 23 Jahre


In [None]:
df = read_excel(
    "https://raw.githubusercontent.com/ralf-42/ML_Intro/main/02_daten/05_tabellen/titanic.xlsx",
    usecols=["pclass", "survived", "sex", "age", "sibsp", "parch"],
)

data = df.copy()
target = data.pop("survived")

data.head()

#  2 | Prepare
---


<p><font color='black' size="5">üìã Checkliste</font></p>

‚úÖ Train-Test-Split durchf√ºhren</br>
‚úÖ Nicht ben√∂tigte Features l√∂schen</br>
‚úÖ Datentyp ermitteln/√§ndern</br>
‚úÖ Missing Values behandeln</br>
‚úÖ Ausrei√üer behandeln</br>
‚úÖ Kategorischer Features Kodieren</br>
‚úÖ Numerischer Features skalieren</br>
‚úÖ Feature-Engineering (neue Features schaffen)</br>
‚úÖ Dimensionalit√§t reduzieren</br>
‚úÖ Resampling (Over-/Undersampling)</br>
‚úÖ Pipeline erstellen/konfigurieren</br>


<font color='black' size="5">
Datentyp ermitteln
</font>


In [None]:
all_col = data.columns
num_col = data.select_dtypes(include="number").columns
cat_col = data.select_dtypes(exclude="number").columns

<font color='black' size="5">
Train-Test-Set
</font>


In [None]:
data_train, data_test, target_train, target_test = train_test_split(
    data, target, test_size=0.20, stratify=target, random_state=42)

<font color='black' size="5">
Missing Values behandeln
</font>

In [None]:
# Missing Values - numerische Features (z.B. age)
imputer_num = SimpleImputer(strategy="mean")
imputer_num.fit(data_train[num_col])
data_train[num_col] = imputer_num.transform(data_train[num_col])
data_test[num_col] = imputer_num.transform(data_test[num_col])

# Missing Values - kategoriale Features (z.B. sex)
imputer_cat = SimpleImputer(strategy="most_frequent")
imputer_cat.fit(data_train[cat_col])
data_train[cat_col] = imputer_cat.transform(data_train[cat_col])
data_test[cat_col] = imputer_cat.transform(data_test[cat_col])

<font color='black' size="5">
Kodierung
</font>

In [None]:
encoder = OrdinalEncoder()
encoder.fit(data_train[cat_col])
data_train[cat_col] = encoder.transform(data_train[cat_col])
data_test[cat_col] = encoder.transform(data_test[cat_col])

# 3 | Modeling
---

<p><font color='black' size="5">
üèÉ Modellauswahl & Training
</font></p>


In [None]:
# RandomForestClassifier mit optimierten Hyperparametern (ohne Pipeline!)
# Reduziert Overfitting durch:
# - Mehr B√§ume (n_estimators=200)
# - Weniger tiefe B√§ume (max_depth=5)
# - Gr√∂√üere Mindestanzahl pro Blatt (min_samples_leaf=5)
# - Gr√∂√üere Mindestanzahl f√ºr Split (min_samples_split=10)

model = RandomForestClassifier(
    n_estimators=200,        # Mehr B√§ume f√ºr stabilere Vorhersagen
    max_depth=5,             # Weniger tief = weniger Overfitting
    min_samples_split=10,    # Mind. 10 Samples f√ºr Split
    min_samples_leaf=5,      # Mind. 5 Samples pro Blatt
    max_features='sqrt',     # Nur Wurzel der Features pro Split
    random_state=42
)

model.fit(data_train, target_train)

# 4 | Evaluate
---

<p><font color='black' size="5">
üéØ Accuracy
</font></p>


In [None]:
target_train_pred = model.predict(data_train)
target_test_pred = model.predict(data_test)

acc_train = accuracy_score(target_train, target_train_pred) * 100
acc_test = accuracy_score(target_test, target_test_pred) * 100

print(f"Train Accuracy: {acc_train:5.2f}%")
print(f"Test Accuracy:  {acc_test:5.2f}%")

<p><font color='black' size="5">
üìù Testpersonen: Rose & Jack
</font></p>

In [None]:
# Rose DeWitt Bukater (Kate Winslet) - Original-Werte (keine Skalierung!)
rose = DataFrame(
    {"age": [22], "sex": [0], "sibsp": [0], "parch": [1], "pclass": [1]},  # sex=1 (female)
    index=["Rose"],
)

# Jack Dawson (Leonardo DiCaprio) - Original-Werte (keine Skalierung!)
jack = DataFrame(
    {"age": [23], "sex": [1], "sibsp": [0], "parch": [0], "pclass": [3]},  # sex=0 (male)
    index=["Jack"],
)

rose_pred = model.predict_proba(rose)[0][1] * 100
jack_pred = model.predict_proba(jack)[0][1] * 100

print(f"üë∞ Rose √úberlebenschance: {rose_pred:.2f}%")
print(f"   (22 Jahre, weiblich, 1. Klasse)")
print(f"üé® Jack √úberlebenschance: {jack_pred:.2f}%")
print(f"   (23 Jahre, m√§nnlich, 3. Klasse)")

<p><font color='black' size="5">
üå≥ Entscheidungsbaum Visualisierung
</font></p>

**Hinweis**: RandomForest besteht aus 200 B√§umen. Hier wird nur der ersten Baum als Beispiel visualisiert.


In [None]:
# Extrahiere den ersten Baum aus dem RandomForest
single_tree = model.estimators_[1]

# Erstelle dtreeviz Visualisierung f√ºr diesen einzelnen Baum
viz_model = dtreeviz.model(
    single_tree,
    X_train=data_train,
    y_train=target_train,
    target_name="survived",
    class_names=["not survived", "survived"],
    feature_names=list(data_train.columns),
)

print(f"‚úÖ Visualisierung f√ºr Baum 1 von {model.n_estimators} erstellt")

In [None]:
# Visualisierung f√ºr diesen einzelnen Baum
viz_model.view(scale=1.0, fontname="Monospace")

In [None]:
# Local Explanation f√ºr Rose - total
one = rose.iloc[0].values
viz_model.view(x=one, scale=1.0, fontname="Monospace")

In [None]:
# local Explanation - single
viz_model.view(x=one, scale=1.2, show_just_path=True, fontname="Monospace")

# 5 | Deploy
---

# A | XAI mit LIME üîç
---

**LIME** = Local Interpretable Model-agnostic Explanations

**Was macht LIME?**

LIME erkl√§rt **einzelne Vorhersagen**, indem es ein einfaches, verst√§ndliches Modell lokal um den zu erkl√§renden Datenpunkt herum trainiert.

**Wie funktioniert LIME?**

1. **Perturbation**: LIME erzeugt viele leicht ver√§nderte Versionen des Datenpunkts (z.B. Alter ¬±5 Jahre, andere Klasse)
2. **Vorhersagen sammeln**: Das Black-Box-Modell bewertet alle perturbierten Samples
3. **Gewichtung**: Samples, die dem Original √§hnlicher sind, bekommen mehr Gewicht
4. **Lokales Modell**: Ein einfaches lineares Modell wird auf diese gewichteten Samples trainiert
5. **Interpretation**: Die Koeffizienten des linearen Modells zeigen den Einfluss jedes Features

**Warum "lokal"**?

LIME erkl√§rt nicht das gesamte Modell, sondern nur die **unmittelbare Umgebung** eines Datenpunkts. Die Erkl√§rung f√ºr Rose kann v√∂llig anders aussehen als die f√ºr Jack.

**Vorteile**
- ‚úÖ Funktioniert mit **jedem** Modell (modell-agnostisch)
- ‚úÖ Sehr **intuitiv** zu verstehen
- ‚úÖ **Schnell** f√ºr einzelne Vorhersagen


In [None]:
# LIME Explainer mit vorverarbeiteten Daten erstellen
lime_explainer = LimeTabularExplainer(
    data_train.values,
    feature_names=data_train.columns.tolist(),
    class_names=['Not Survived', 'Survived'],
    categorical_features=[data_train.columns.get_loc('sex'), data_train.columns.get_loc('pclass')],
    mode='classification'
)

print("‚úÖ LIME Explainer erstellt")
print("   Features:", data_train.columns.tolist())

<p><font color='black' size="5">
üë∞ Rose mit LIME erkl√§ren
</font></p>


In [None]:
# Rose mit LIME erkl√§ren
rose_lime_exp = lime_explainer.explain_instance(
    rose.iloc[0].values,
    model.predict_proba,
    num_features=5
)
rose_lime_exp.show_in_notebook(show_table=True)

<p><font color='black' size="5">
üé® Jack mit LIME erkl√§ren
</font></p>

In [None]:
# Jack mit LIME erkl√§ren
jack_lime_exp = lime_explainer.explain_instance(
    jack.iloc[0].values,
    model.predict_proba,
    num_features=5
)

jack_lime_exp.show_in_notebook(show_table=True)

<p><font color='blue' size="4">
üí° LIME Interpretation
</font></p>

**Balkendiagramm:**
- **Orange Balken**: Erh√∂hen die √úberlebenschance (Klasse "Survived")
- **Blaue Balken**: Verringern die √úberlebenschance (Klasse "Not Survived")
- **Werte**: Wie stark beeinflusst das Feature die Vorhersage

**PrScore (Prediction Score) Tabelle:**
- Zeigt die Vorhersage-Wahrscheinlichkeit f√ºr **beide Klassen**
- **Not Survived**: Wahrscheinlichkeit f√ºr Tod (h√∂her bei Jack)
- **Survived**: Wahrscheinlichkeit f√ºr √úberleben (h√∂her bei Rose)
- Beide Werte zusammen ergeben immer 100%

**Beispiel:**
- Rose: Not Survived ‚âà 38%, **Survived ‚âà 62%**
- Jack: **Not Survived ‚âà 93%**, Survived ‚âà 7%

‚ö†Ô∏è **Wichtig**: Der PrScore f√ºr "Not Survived" ist bei Jack h√∂her - das bedeutet er hat eine h√∂here Todeswahrscheinlichkeit, nicht eine h√∂here √úberlebenschance!

**Erkenntnisse:**
- Rose: `sex=0` (female) und `pclass=1` erh√∂hen massiv die √úberlebenschance
- Jack: `sex=1` (male) und `pclass=3` verringern massiv die √úberlebenschance


# B | XAI mit SHAP üéØ
---

**SHAP** = SHapley Additive exPlanations

**Was macht SHAP?**

SHAP berechnet den **Beitrag jedes Features** zur Vorhersage, basierend auf einem mathematisch fundierten Konzept aus der Spieltheorie.

**Die Spieltheorie-Idee (vereinfacht**)

Stellen Sie sich ein Team von Spielern vor, das gemeinsam einen Preis gewinnt. Wie verteilt man den Gewinn **fair**? Die Shapley-Werte l√∂sen genau dieses Problem.

**√úbertragen auf ML:**
- **Spieler** = Features (Alter, Geschlecht, Klasse, ...)
- **Gewinn** = Vorhersage des Modells
- **Frage**: Wie viel tr√§gt jedes Feature zur Vorhersage bei?

**Wie funktioniert SHAP**?

1. Betrachte **alle m√∂glichen Kombinationen** von Features
2. Berechne f√ºr jede Kombination: Was √§ndert sich, wenn ich Feature X hinzuf√ºge?
3. Der **Durchschnitt** √ºber alle Kombinationen = SHAP-Wert des Features

**Interpretation der SHAP-Werte**

| SHAP-Wert | Bedeutung |
|-----------|----------|
| **Positiv (+)** | Feature erh√∂ht die Vorhersage (hier: √úberlebenschance) |
| **Negativ (-)** | Feature senkt die Vorhersage |
| **Nahe 0** | Feature hat wenig Einfluss auf diese Vorhersage |

**Vorteile gegen√ºber LIME**
- ‚úÖ **Theoretisch fundiert** ‚Äì mathematisch beweisbar fair
- ‚úÖ Funktioniert **lokal und global**
- ‚úÖ Die Summe aller SHAP-Werte ergibt die Vorhersage


<p><font color='black' size="5">
‚öôÔ∏è SHAP Explainer erstellen
</font></p>

In [None]:
# SHAP TreeExplainer (optimal f√ºr RandomForest - sehr schnell!)
shap_explainer = shap.TreeExplainer(model)

print("‚úÖ SHAP TreeExplainer erstellt (optimiert f√ºr RandomForest)")

<p><font color='black' size="5">
üë∞ Rose mit SHAP erkl√§ren (Waterfall Plot)
</font></p>


In [None]:
rose_shap = shap_explainer(rose)

# Waterfall Plot f√ºr Klasse "Survived" (Index 1)
shap.plots.waterfall(rose_shap[0, :, 1])

<p><font color='black' size="5">
üé® Jack mit SHAP erkl√§ren (Waterfall Plot)
</font></p>

In [None]:
jack_shap = shap_explainer(jack)

# Waterfall Plot f√ºr Klasse "Survived" (Index 1)
shap.plots.waterfall(jack_shap[0, :, 1])

<p><font color='blue' size="4">
üí° SHAP Interpretation
</font></p>

**Waterfall Plot:**
- Zeigt, wie sich die Vorhersage vom Durchschnittswert (E[f(x)]) zum finalen Wert aufbaut
- Jeder Pfeil = Beitrag eines Features
- Rot = erh√∂ht die √úberlebenschance, Blau = verringert sie

# C | XAI mit ELI5 üë∂
---

**ELI5** = Explain Like I'm 5 (Erkl√§re es mir wie einem 5-J√§hrigen)

**Was macht ELI5?**

ELI5 ist das **einfachste** XAI-Framework. Es fokussiert sich auf **Permutation Importance** ‚Äì eine intuitive Methode zur Messung der Feature-Wichtigkeit.

**Was ist Permutation Importance?**

Die Grundidee ist simpel: **Wenn ein Feature wichtig ist, wird das Modell schlechter, wenn wir es "kaputt machen".**

**So funktioniert es:**
1. Miss die Modell-Accuracy auf den Testdaten
2. Mische die Werte eines Features zuf√§llig durch ("permutieren")
3. Miss erneut die Accuracy
4. **Differenz** = Wichtigkeit des Features

**Beispiel:**
- Original-Accuracy: 85%
- Accuracy nach Durchmischen von "Geschlecht": 65%
- ‚Üí Importance(Geschlecht) = 85% - 65% = **20%** (sehr wichtig!)

**Warum "Like I'm 5"?**

- Minimaler Code (oft nur 3 Zeilen)
- Keine komplexe Mathematik
- Ergebnis ist sofort verst√§ndlich: "Feature X ist am wichtigsten"

**Einschr√§nkungen**
- ‚ö†Ô∏è Zeigt nur **wie wichtig**, nicht **warum** oder **in welche Richtung**
- ‚ö†Ô∏è Prim√§r f√ºr **globale** Erkl√§rungen (nicht f√ºr einzelne Vorhersagen)


<p><font color='black' size="5">
‚öôÔ∏è Permutation Importance
</font></p>

In [None]:
# Permutation Importance berechnen
perm = PermutationImportance(model, random_state=42).fit(data_test, target_test)

In [None]:
# Feature Importance anzeigen
eli5.show_weights(perm, feature_names=data.columns.tolist())

<p><font color='black' size="5">
üë∞ Rose mit ELI5 erkl√§ren
</font></p>


In [None]:
# Einzelne Vorhersage erkl√§ren
eli5.show_prediction(
    model,
    rose.iloc[0],
    feature_names=rose.columns.tolist(),
    show_feature_values=True,
)

<p><font color='black' size="5">
üé® Jack mit ELI5 erkl√§ren
</font></p>


In [None]:
# Einzelne Vorhersage erkl√§ren
eli5.show_prediction(
    model,
    jack.iloc[0],
    feature_names=jack.columns.tolist(),
    show_feature_values=True,
    targets=[1]  # 1 = √úberleben
)

<p><font color='blue' size="4">
üí° ELI5 Interpretation
</font></p>



**Permutation Importance:**
- Misst, wie stark die Modell-Accuracy sinkt, wenn ein Feature zuf√§llig permutiert wird
- ¬± Werte = Unsicherheit der Messung

**Vorhersage-Erkl√§rung:**
- Zeigt Feature-Werte und ihre Beitr√§ge zur Vorhersage
- Sehr einfach zu verstehen!



# D | XAI mit InterpretML üè¢
---

**InterpretML** = Microsoft's umfassendes Open-Source-Framework f√ºr XAI

**Was macht InterpretML?**

InterpretML ist das **professionellste** der hier vorgestellten Frameworks. Es kombiniert verschiedene XAI-Methoden unter einer einheitlichen Oberfl√§che und bietet **interaktive Dashboards**.

**Kernfunktionen**

| Funktion | Beschreibung |
|----------|-------------|
| **ShapKernel** | SHAP-Erkl√§rungen f√ºr beliebige Black-Box-Modelle |
| **Interaktive Dashboards** | Web-basierte Visualisierungen zum Erkunden |
| **Unified API** | Gleiche Schnittstelle f√ºr verschiedene Erkl√§rungsmethoden |
| **EBM** | Eigenes interpretierbares Modell (Explainable Boosting Machine) |

**Wann InterpretML verwenden**?

- ‚úÖ Wenn Sie **interaktive Exploration** brauchen
- ‚úÖ F√ºr **professionelle Pr√§sentationen** und Berichte
- ‚úÖ Wenn Sie **verschiedene XAI-Methoden** vergleichen wollen

**Einschr√§nkungen**
- ‚ö†Ô∏è Mehr Setup-Aufwand als LIME oder ELI5
- ‚ö†Ô∏è Kann f√ºr einfache Aufgaben "√ºberdimensioniert" sein


<p><font color='black' size="5">
‚öôÔ∏è InterpretML mit SHAP
</font></p>


In [None]:
# SHAP-basierter Explainer in InterpretML
interpret_explainer = ShapKernel(
    model.predict_proba,
    data_train.sample(n=100, random_state=42)
)

print("‚úÖ InterpretML Explainer erstellt")

<p><font color='black' size="5">
üë∞üé® Rose & Jack mit InterpretML
</font></p>

**Was macht `explain_local`?**
- Erkl√§rt **lokale** Vorhersagen f√ºr einzelne Instanzen (hier: Rose & Jack)
- Verwendet SHAP-Werte im Hintergrund
- Zeigt Feature-Beitr√§ge f√ºr jede Person einzeln
- Erm√∂glicht interaktiven Vergleich zwischen Instanzen


In [None]:
# Beide Personen kombinieren
rose_jack = DataFrame([rose.iloc[0], jack.iloc[0]], index=["Rose", "Jack"])
rose_jack_target = [1, 0]  # Rose √ºberlebt, Jack nicht

In [None]:
# Lokale Erkl√§rungen erstellen mit Namen
# explain_local liefert:
# - Feature-Beitr√§ge f√ºr jede einzelne Instanz
# - Interaktive Visualisierung zum Vergleichen
# - Basiert auf SHAP-Werten
interpret_local = interpret_explainer.explain_local(
    rose_jack,
    rose_jack_target,
    name="Rose & Jack Erkl√§rungen"  # Name f√ºr die Erkl√§rung
)

# Die Namen werden aus dem DataFrame-Index √ºbernommen
print("‚úÖ Lokale Erkl√§rungen f√ºr Rose & Jack erstellt")
print("   - Zeigt Feature-Beitr√§ge f√ºr jede Person")
print("   - Interaktiv vergleichbar im Dashboard")
print("   - Namen: Rose (Index 0), Jack (Index 1)")

**‚ö†Ô∏è Wichtiger Hinweis zur Auswahl:**       
Im Dropdown "Select Component to Graph" bedeuten:
- **0** = Rose (1. Klasse, weiblich, 22 Jahre)
- **1** = Jack (3. Klasse, m√§nnlich, 23 Jahre)

In [None]:
# ‚ö†Ô∏è WICHTIG: InterpretML ben√∂tigt JavaScript!
# Falls Fehler "JavaScript-Dateien konnten nicht geladen werden":
#
# 1. Chrome: chrome://settings/content/cookies
#    ‚Üí "Drittanbieter-Cookies zulassen" aktivieren
# 2. Firefox: about:preferences#privacy
#    ‚Üí Verbesserter Schutz: "Standard" statt "Streng"
# 3. Seite neu laden (Strg+R / Cmd+R)
#
# Alternative: Verwenden Sie SHAP (Cells oben) - √§hnliche Ergebnisse!

# Interaktives Dashboard anzeigen
show(interpret_local)

# E | Globale Analysen üåç
---

**Lokal vs. Global ‚Äì Was ist der Unterschied?**

Bisher haben wir **einzelne Vorhersagen** erkl√§rt (lokal). Jetzt schauen wir uns das **gesamte Modellverhalten** an (global).

| Scope | Frage | Beispiel |
|-------|-------|----------|
| **Lokal** | Warum wurde *diese* Vorhersage gemacht? | Warum √ºberlebt Rose mit 92%? |
| **Global** | Wie verh√§lt sich das Modell *insgesamt*? | Welches Feature ist generell am wichtigsten? |



**Globale Methoden in diesem Notebook**

- **SHAP Summary Plot**: Zeigt die Verteilung der SHAP-Werte √ºber alle Datenpunkte
- **SHAP Dependence Plot**: Zeigt, wie ein Feature die Vorhersage √ºber alle Datenpunkte beeinflusst
- **RandomForest Feature Importance**: Eingebaute Wichtigkeit basierend auf Entscheidungsb√§umen


<p><font color='black' size="5">
üéØ SHAP Dependence Plot
</font></p>

**Konzept**: Zeigt, wie die Werte eines Features die Vorhersage beeinflussen.


In [None]:
# SHAP Dependence Plot f√ºr das wichtigste Feature (sex)
# Zeigt: Wie beeinflusst sex die √úberlebenschance?

# Berechne SHAP Werte f√ºr das gesamte Testset
test_sample = data_test
shap_values_test = shap_explainer(test_sample)

shap.dependence_plot(
    "sex",
    shap_values_test[:, :, 1].values,  # SHAP-Werte f√ºr "Survived"
    test_sample,
    interaction_index="pclass"  # Farbe zeigt Interaktion mit pclass
)

print("üí° Interpretation:")
print("   - X-Achse: Feature-Wert (0=male, 1=female)")
print("   - Y-Achse: SHAP-Wert (Einfluss auf √úberlebenschance)")
print("   - Farbe: Interaktion mit pclass (Passagierklasse)")

<p><font color='black' size="5">
üå≤ RandomForest Feature Importance
</font></p>

**Konzept**: Zeigt, wie oft und wie stark jedes Feature zur Entscheidungsfindung beitr√§gt.


In [None]:
# Feature Importance aus RandomForest extrahieren
feature_importance = DataFrame({
    'Feature': data_train.columns,
    'Importance': model.feature_importances_
}).sort_values('Importance', ascending=False)

# Visualisierung
fig = px.bar(
    feature_importance,
    x='Importance',
    y='Feature',
    orientation='h',
    title='RandomForest Feature Importance (Global)',
    labels={'Importance': 'Wichtigkeit', 'Feature': 'Feature'},
    color='Importance',
    color_continuous_scale='viridis'
)
fig.update_layout(height=400)
fig.show()

print("\nüìä Feature Importance Ranking:")
for idx, row in feature_importance.iterrows():
    print(f"  {row['Feature']:10s}: {row['Importance']:.4f}")

# F | Ceteris Paribus Analysen üåç
---

**Ceteris Paribus** = "unter sonst gleichen Bedingungen" (lateinisch)

**Was ist eine Ceteris Paribus Analyse?**

Eine Ceteris Paribus Analyse beantwortet die Frage: **"Was passiert mit der Vorhersage, wenn ich NUR ein Feature √§ndere?"**

Alle anderen Features bleiben dabei konstant ‚Äì daher der Name.

**Beispiel**

F√ºr Jack (m√§nnlich, 23 Jahre, 3. Klasse) fragen wir:
- Was w√§re, wenn Jack in der **1. Klasse** gewesen w√§re? (alle anderen Werte bleiben gleich)
- Was w√§re, wenn Jack **50 Jahre** alt gewesen w√§re?

**Warum ist das n√ºtzlich?**

- üéØ Zeigt den **isolierten Einfluss** einzelner Features
- üìä Erm√∂glicht **"Was-w√§re-wenn"**-Szenarien
- üí° Hilft zu verstehen, **wie das Modell "denkt"**

**Unterschied zu anderen XAI-Methoden**

| Methode | Frage |
|---------|-------|
| **SHAP/LIME** | Welche Features haben diese Vorhersage beeinflusst? |
| **Ceteris Paribus** | Wie √§ndert sich die Vorhersage, wenn ich ein Feature variiere? |

**Erkenntnisse:**
1. **Alter**: J√ºngere Personen hatten tendenziell h√∂here √úberlebenschancen ("Women and children first")
2. **Passagierklasse**: 1. Klasse hatte deutlich h√∂here √úberlebenschancen
3. **Geschlecht dominiert**: Selbst Jack in 1. Klasse h√§tte schlechtere Chancen als Rose in 3. Klasse!


<p><font color='black' size="5">
üé® Individual Ceteris Paribus: Jack
</font></p>

**Was w√§re wenn**: Jack in verschiedenen Passagierklassen gereist w√§re?

In [None]:
# Ceteris Paribus f√ºr Jack: Was passiert in verschiedenen Klassen?
jack_cp = jack.copy()

pclass_original = [1, 2, 3]
jack_predictions = []

for pclass in pclass_original:
    jack_cp['pclass'] = pclass
    pred = model.predict_proba(jack_cp)[0][1] * 100
    jack_predictions.append(pred)

# Visualisierung
fig = px.bar(
    x=['1. Klasse', '2. Klasse', '3. Klasse (Jack)'],
    y=jack_predictions,
    labels={'x': 'Passagierklasse', 'y': '√úberlebenschance (%)'},
    title='Ceteris Paribus: Jack - Einfluss der Passagierklasse',
    color=jack_predictions,
    color_continuous_scale='RdYlGn'
)
fig.show()

print("üí° Interpretation:")
print(f"   Jack in 1. Klasse: {jack_predictions[0]:.2f}%")
print(f"   Jack in 2. Klasse: {jack_predictions[1]:.2f}%")
print(f"   Jack in 3. Klasse: {jack_predictions[2]:.2f}% (aktuell)")
print("\n   ‚ö†Ô∏è Selbst in 1. Klasse w√ºrde Jack's m√§nnliches Geschlecht seine Chancen stark begrenzen!")

<p><font color='black' size="5">
üë∞ Individual Ceteris Paribus: Rose
</font></p>

**Was w√§re wenn**:  Was passiert, wenn wir ihr Alter variieren??

In [None]:
# Ceteris Paribus f√ºr Rose: Was passiert, wenn wir ihr Alter variieren?
# Alle anderen Features bleiben konstant

age_range = range(0, 80,1)  # Skalierte Werte (StandardScaler)
rose_cp = rose.copy()

predictions = []
for age_val in age_range:
    rose_cp['age'] = age_val
    pred = model.predict_proba(rose_cp)[0][1] * 100
    predictions.append(pred)

# Visualisierung
fig = px.line(
    x=age_range,
    y=predictions,
    labels={'x': 'Alter', 'y': '√úberlebenschance (%)'},
    title='Ceteris Paribus: Rose - Einfluss des Alters'
)
fig.add_vline(x=rose.iloc[0]['age'], line_dash="dash", line_color="red",
              annotation_text="Rose aktuell")
fig.show()

print(f"üí° Rose's aktuelles Alter (skaliert): {rose.iloc[0]['age']:.2f}")
print(f"   Aktuelle √úberlebenschance: {rose_pred:.2f}%")
print(f"   Interpretation: Je j√ºnger Rose, desto h√∂her ihre √úberlebenschance")

# G | Zusammenfassung üî¨
---

| Framework | üéØ St√§rken | ‚ö†Ô∏è Schw√§chen | üë®‚Äçüéì Einsteigerfreundlichkeit |
|-----------|-----------|-------------|---------------------------|
| **LIME** | - Sehr intuitives Konzept<br>- Gute visuelle Darstellung<br>- Schnell f√ºr lokale Erkl√§rungen | - Nur lokale Erkl√§rungen<br>- Kann instabil sein | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **SHAP** | - Theoretisch fundiert<br>- Beste Visualisierungen<br>- Lokal & global | - Kann langsam sein<br>- Komplexeres Konzept | ‚≠ê‚≠ê‚≠ê‚≠ê |
| **ELI5** | - Extrem einfach<br>- Minimaler Code<br>- Schnell | - Weniger Visualisierungen<br>- Weniger Features | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **InterpretML** | - Interaktive Dashboards<br>- Umfassend<br>- Professionell | - Komplexer Setup<br>- Overhead f√ºr einfache Aufgaben | ‚≠ê‚≠ê‚≠ê |
| **RF Importance** | - Extrem schnell<br>- In sklearn integriert<br>- Sehr einfach | - Nur Feature Importance<br>- Keine Richtung des Einflusses | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |



**üîó Weiterf√ºhrende Ressourcen**

**LIME:**
- Dokumentation: https://github.com/marcotcr/lime
- Paper: "Why Should I Trust You?" (Ribeiro et al., 2016)

**SHAP:**
- Dokumentation: https://shap.readthedocs.io/
- Paper: "A Unified Approach to Interpreting Model Predictions" (Lundberg & Lee, 2017)

**ELI5:**
- Dokumentation: https://eli5.readthedocs.io/

**InterpretML:**
- Dokumentation: https://interpret.ml/
- Microsoft Research: https://www.microsoft.com/en-us/research/project/interpretml/
"""