# Übung zu Kapitel 8.6 - Erklärbare KI

*Eine Übung zum Buch "[Basiswissen KI-Testen - Qualität von und mit KI-basierten Systemen](https://dpunkt.de/produkt/basiswissen-ki-testen/)", ISBN 978-3-86490-947-4*

In dieser Übung sehen wir uns das Qualitätsmerkmal der *Erklärbarkeit* einer KI-Komponente an. Dabei wirst du auch selbst zwei Algorithmen, die bei der Erklärbarkeit von KI häufig verwendet werden (LIME und SHAP), anwenden. Die Grundlagen zur *Transparenz*, *Interpretierbarkeit* und *Erklärbarkeit* findest du in Abschnitt 8.6 des Buches.

[<img src="https://numpy.org/doc/stable/_static/numpylogo.svg" alt="Numpy" width="80" height="24">](https://numpy.org/doc/stable/reference/index.html#reference)
&emsp; [<img src="https://pandas.pydata.org/docs/_static/pandas.svg" alt="pandas" width="80" height="24">](https://pandas.pydata.org/docs/reference/index.html)
&emsp; [<img src="https://scikit-learn.org/stable/_static/scikit-learn-logo-small.png" alt="Scikit-learn" width="80" height="24">](https://scikit-learn.org/stable/modules/classes.html)
&emsp; [<img src="https://matplotlib.org/_static/logo_light.svg" alt="Matplotlib" width="100" height="24">](https://matplotlib.org/)


Diese Übung setzt sich aus folgenden Aufgaben zusammen:

**Aufgabe 1:**
Importiere das in der praktischen Übung 4.2.1 erstellte Modell eines Entscheidungsbaums, um die Schwertlilien-Art anhand verschiedener Merkmale vorherzusagen. Visualisiere das Ergebnis mit Methoden aus der sklearn-Bibliothek.

**Aufgabe 2:**
Auch wenn ein Entscheidungsbaum ein von sich aus erklärbares Modell ist, wollen wir die Erklärmethode LIME beispielhaft daran zeigen. Wende auf unser Modell die Erklärmethode LIME an, um die Ausgaben des Modells für einzelne Beispiele zu erläutern (https://github.com/marcotcr/lime).

**Zusatzaufgabe:**
Verwende den SHAP-Ansatz, um das Modell zu erklären (https://shap.readthedocs.io/en/latest). Wie unterscheidet sich der SHAP-Ansatz vom LIME-Ansatz?



## Aufgabe 1
Importiere das in der praktischen Übung 4.2.1 erstellte Modell eines Entscheidungsbaums, um die Schwertlilien-Art anhand verschiedener Merkmale vorherzusagen. Visualisiere das Ergebnis mit Methoden aus der sklearn-Bibliothek.

**Schritt 1:** importiere zuerst das Modell, das du in [Übung 4.2](../Kap04.2_Datensätze_aufteilen/Übung_Datensätze_aufteilen.ipynb) erstellt und abgespeichert hast.

In [None]:
import joblib as jl     # wir benötigen die joblib um das Modell zu laden

model = jl.load(...)    # gib hier den Pfad zur *pkl*-Datei an, die du in Übung 4.2 abgespeichert hast.
                        # hast du die Übung nicht bis zum Ende gemacht, kannst du das im Verzeichnis data vorbereitete Modell nehmen
model

In [None]:
# Um die Lösung anzuzeigen, bitte diese Zelle zweimal ausführen
%load Lösungen/Lösung01.py

Das oben geladene Modell ist ein [DecisionTreeClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier) Objekt. Über den Link kannst du in der scikit-learn Library mehr darüber nachlesen.

**Schritt 2:** Wir schauen uns an, was das Modell selbst an *"Erklärungen"* zu bieten hat:
* Mit `.feature_names_in_` können wir uns ansehen, welche Features (Merkmale) für den Entscheidungsbaum beim Trainieren ausgewählt wurden.
* Mit `.feature_importances_` können wir ansehen, wie wichtig diese Features für die Unterscheidung der Ergebnisklassen sind.

In [None]:
import pandas as pd     # wir stellen den Output mit Hilfe der Pythonbibliothek pandas dar

# Daten in ein Pandas DataFrame umwandeln
data = {'Feature Names':       model.feature_names_in_, 
        'Feature Importances': model.feature_importances_}
pd.DataFrame(data)

In dem Modellbeispiel siehst du, dass die Features (Merkmale) in dem Modell unterschiedliche Wichtigkeit bei der Klassifizierung haben.

**Schritt 3:** Um noch mehr Informationen sichtbar und die Details des Entscheidungsbaums deutlich zu machen, kannst du über das scikit-learn Objekt *tree* und dessen Methode [plot_tree()](https://scikit-learn.org/stable/modules/generated/sklearn.tree.plot_tree.html#sklearn.tree.plot_tree) den Entscheidungsbaum selbst visualisieren:

In [None]:
from   sklearn           import tree    # wir verwenden die Klasse tree aus der sklearn-Bibliothek 
import matplotlib.pyplot as     plt     # wir benötigen matplotlib für grafische Darstellungen

plt.figure(figsize=(10,8))
vis = tree.plot_tree(model, feature_names = model.feature_names_in_, class_names = ["0","1","2"], fontsize = 8, filled = True, rounded=True)

Schau dir den Entscheidungsbaum und die in den Knoten eingetragenen Werte genauer an (ggf. auch in der Dokumentation zur plot_tree()-Methode). Dazu ein paar **Fragen**:
1. Welche Information beinhaltet die erste Zeile der Knoten? Was ist der Unterschied zwischen den Knoten?
1. Was bedeutet der Eintrag `class = x`?
1. Was bedeuten z.B. `samples = 91` und `values = [0, 47, 44]`?
1. Was bedeutet die Farbe des Knoten?

*Hinweis:* Der *Gini*-Index oder die *Gini*-Unreinheit misst den Grad der Ausgewogenheit eines Datensatzes. Die *Gini*-Unreinheit, eine Zahl zwischen 0 und 0.5, dient bei der Erstellung von Entscheidungsbäumen dazu, die Wahrscheinlichkeit anzugeben, dass neue zufällige Daten falsch klassifiziert werden.

**Lösung:** Die *Antworten* zu den Fragen findest du in der nächsten Zelle (auf die `...` klicken).

1. Knoten an denen eine *Entscheidung* getroffen wird, haben in der ersten Zeile das Merkmal mit einer Bedingung stehen (z.B. `petallength <= 2.6`). Trifft die Bedingung zu, wird der linke Zweig gewählt, andernfalls der rechte. Die Knoten, die keine Bedingung in der ersten Zeile angeben, sind die Blätter, die die Schwertlilien-Arten widerspiegeln. 
1. Der Eintrag `class = x`, dass diese Klasse x - während der Entscheidungsbaum (bei der Inferenz) durchlaufen wird, ausgehend von dem bis dahin durchlaufenden Entscheidungsbaum - gerade am wahrscheinlichsten ist.
1. Der Eintrag `samples = 91` in einem Knoten bedeutet, dass für 91 Trainingsdaten dieser Knoten durchlaufen wurde. Die Werte `values = [0, 47, 44]` geben dabei an, zu welchen Klassen (0, 1, 2) diese Samples gehören (kein Sample der Klasse 0, 47 Samples der Klasse 1 und 44 Samples der Klasse 2).
1. Die *Farbe* des Knotens gibt an, *welche* Klasse am wahrscheinlichsten ist (Klassen: 0=orange, 1=grün, 2=lila). Die *Farbsättigung* zeigt, wie *wahrscheinlich* diese Klasse schon ist.

## Aufgabe 2
Auch wenn ein Entscheidungsbaum ein von sich aus erklärbares Modell ist, wollen wir die Erklärmethode LIME beispielhaft daran zeigen. Wende auf unser Modell die Erklärmethode LIME an, um die Ausgaben des Modells für einzelne Beispiele zu erläutern (https://github.com/marcotcr/lime)!

Achtung: Du musst Aufgabe 1 zuvor bearbeitet haben.

**Schritt 1:** Der LIME-Algorithmus verwendet konkrete Daten, um eine Erklärung für beispielsweise ein konkretes Klassifikationsergebnis zu geben. Daher laden wir wieder den Iris-Datensatz aus der Übung 4.1:

In [None]:
import pandas as pd
iris = pd.read_csv(...) # Lade die iris-Daten aus der vorangegangenen Übung 4.1
iris                    # und zeige die Daten an

In [None]:
# Um die Lösung anzuzeigen, bitte diese Zelle zweimal ausführen
%load Lösungen/Lösung02.py

**Schritt 2:** Wir müssen nun wieder die Iris-Daten in Eingabe- `X` und Ausgabedaten `y` sowie Trainings- `..._train` und Testdaten `..._test` aufteilen.

In [None]:
from sklearn.model_selection import train_test_split   # importiere diese Methode aus der scikit-learn bibliothek

# Aufteilen in Eingaben (X) und Ausgaben (y)
X = iris.drop(columns='class')     # Entfernt aus dem DataFrame die Spalte mit dem Namen 'class' (den Output)
y = iris.filter(items=['class'])   # Filtert nur die Spalte 'class' heraus (also entfernt alle anderen) 

# Aufteilen in Trainings-, Validierungs- und Testdaten
X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.1, random_state=4 )

Stimmen die Merkmale des Iris-Datensatzes mit denen aus dem geladenen Modell überein? Schau dir die Spaltenüberschriften aus dem vorhergehenden Schritt an und vergleiche sie mit den 'Features' des Modells aus Aufgabe 1.

Machen wir einen Test:

In [None]:
# Prüfe, ob die Feature-Namen des Modells mit den Spalten (=Merkmalen) der Eingabedaten X übereinstimmen
# hier sollte die Ausgabe: "[ True True True True ]" erscheinen.
print(model.feature_names_in_ == X.columns)

Schauen wir uns an, welche Daten wir nun als **Trainingsdaten** haben und wie diese über die zwei Merkmale mit den größten Wichtigkeit im Modell, nämlich *petallength* und *petalwidth*, aufgeteilt sind. Dafür übergeben wir die Trainingsdaten dem *LIME Explainer* und zeichnen diese mit einem *Scatterplot*.

In [None]:
ax = iris.loc[X_train.index].plot.scatter('petallength', 'petalwidth', c='class', label= 0,  colormap='viridis')

Du siehst, dass die drei Klassen (0 bis 2) der Schwertlilienarten als farbige Punke dargestellt sind. Die Klassen 1 und 2 überlappen sich leicht.

**Schritt 3:** Wir erstellen aus den Trainingsdaten einen *LIME Explainer*. Die Trainingsdaten braucht dieser, um zu erahnen um welche numerischen Bereiche die Merkmale jeweils variieren.

In [None]:
from lime import lime_tabular
import numpy as np

explainer = lime_tabular.LimeTabularExplainer(
    training_data = np.array(X_train),
    feature_names = ['sepallength', 'sepalwidth', 'petallength', 'petalwidth'],
    class_names   = y_train['class'].unique(),
    mode          = 'classification'
)

**Schritt 4:** Mit Hilfe dieses *Explainers* können wir nun eine konkrete Eingabe dem Modell (Mit Hilfe von dessen `predict_proba`-Methode) übergeben. Die neue Eingabe entnehmen wir aus den Testdaten `X_test`.

Nehmen wir als erstes Beispiel den Datenpunkt mit dem Index 130:

In [None]:
idx = 130
np.random.seed(0)
exp = explainer.explain_instance(
    data_row     = X_test.loc[idx], 
    predict_fn   = model.predict_proba,
    num_features = 2,
    top_labels   = 1
)
exp.show_in_notebook(show_table=True);
print("Die tatsächliche Schwertlilienart ist: ", y_test.loc[idx])
# Hinweis: Es kann sein, dass du hier eine Fehlermeldung siehst "UserWarning: X does not have valid feature names...", die du aber ignorieren darfst ;)

Wir sehen, dass der Datenpunkt mit dem Index 130 zur Schwertlilienart Nummer 2 gehört. Die Grafik (links) zeigt, dass die Vorhersagegenauigkeit für genau diese Klasse bei 1.00 liegt. Die mittlere Grafik zeigt, dass die beiden Merkmale *petellength* und *petalwidth* den größten Einfluss **für** eine Entscheidung (grün) zur Ausgabe 2 hatten. Das zeigt auch nochmal der die rechte Grafik, die die beiden wichtigsten Features und ihre Werte, die für die Ausgabe 2 gesprochen haben, auflistet.

Die mittlere Grafik (oben), die die positiven und negativen Faktoren für die Ausgabe 2 darstellt, können wir auch separat wie folgt ausgeben:

In [None]:
fig = exp.as_pyplot_figure(2)

**Schritt 5:** Schaue dir die Testdaten in einem *Scatterplot* an und suche den obigen Datenpunkt (Index=130).

In [None]:
# Wir erzeugen wieder ein Scatterplot - nun mit den Testdaten X_test
ax = iris.loc[X_test.index].plot.scatter('petallength', 'petalwidth', c='class', colormap='viridis')
# ... und schreiben die Index-Nummer der Datenpunkte dazu...
for i,txt in enumerate(X_test.index):
    ax.annotate(txt,(X_test.iloc[i]['petallength'],X_test.iloc[i]['petalwidth']))

Such dir nun einen anderen Punkt heraus, der näher an der Grenze zwischen der Klasse 1 und 2 liegt und analysiere ihn dann wie oben. Setze diesen unten im Code ein und prüfe die Erklärung. Lass dir diesmal *alle vier* Features (`num_features`) und *alle* Ausgabe-Labels (`top_labels`) anzeigen.

In [None]:
idx = ...
exp = explainer.explain_instance(
    data_row     = X_test.loc[idx], 
    predict_fn   = model.predict_proba,
    num_features = ...,
    top_labels   = ...
)
exp.show_in_notebook(show_table=True);
print("Die vorhergesagte Schwertlilienart ist: ", model.predict(X_test.loc[[idx]])[0])
print("Die tatsächliche  Schwertlilienart ist: ", y_test.loc[idx][0])

fig = exp.as_pyplot_figure(...)

In [None]:
# Um die Lösung anzuzeigen, bitte diese Zelle zweimal ausführen
%load Lösungen/Lösung03.py

**Frage:** Welche Features haben den größten Einfluss darauf gehabt, dass der von dir ausgewählte Datenpunkt der richtigen Klasse zugeordnet wurde?

**Lösungen:**
* Beim Datenpunkt **133**: Er gehört zur Klasse 2 und wird auch vom Modell so erkannt.
  Obwohl die *petallength* am stärksten für Klasse 1 spricht, spricht die *sepalwidth* dagegen. Für Klasse 2 sprechen - wenn auch von ihren absoluten Werten kleiner - *sepalwidth* und *petallength*. Dies sieht man, wenn man `exp.as_pyplot_figure(2)` betrachtet.

* Beim Datenpunkt  **83**: Er gehört zur Klasse 1, wird aber vom Modell als Klasse 2 vorhergesagt. Warum ist das so?

  Beim Betrachten von `exp.as_pyplot_figure(2)`: Für die Klasse 2 sprechen die Werte *sepalwidth und petallength* (grün). Allerdings sprechen die beiden anderen Features *sepallength und petalwidth* auch merklich gegen die Klasse 2 (rot).
  
  Beim Betrachten von `exp.as_pyplot_figure(1)`: Für die (falsche) Klasse 1 spricht hier mit großem Anteil insbesondere die *petallength*. *sepalwidth* und *petalwidth* sprechen zwar gegen Klasse 1, doch das Modell gewichtet diese deutlich geringer, so dass sie letztlich die Entscheidung für Klasse 1 nicht beeinflusst haben.
  
* Beim Datenpunkt  **78**: Er gehört zur Klasse 1 und wird auch vom Modell so erkannt.
  Betrachtet man die Einflüsse, die für und gegen Klasse 1 bzw. 2 sprechen, erkennt man, dass je zwei Merkmale für bzw. gegen Klasse 2 sprechen. Bei Klasse 1 ist daszwar ähnlich, doch überwiegt hier der Einfluss der *petallength*.
  
* Beim Datenpunkt  **63**: Die Situation ist sehr ähnlich zum Datenpunkt 78. Die absoluten Einflussfaktoren aus den Eingabegrößen sprechen ebenso für Klasse 1.

## Optionale Zusatzaufgabe
Als Ergänzung zum oben gezeigten LIME-Ansatz schauen wir uns einen anderen Algorithmus an, der auf den sogenannten *Shapley-Values* basiert.

### *Hinweis:* 
Die aktuelle Version von Shap für Python wird nur bis zur Version 3.11 unterstützt. Wenn du diese Aufgabe bearbeiten möchtest, musst du zuerst deine Python-Version überprüfen und gegebenenfalls eine ältere Python-Version installieren (oder eine andere Umgebung mit Python 3.11 nutzen).

**Vorbereitung:** Bevor du *shap* verwenden kannst, muss *shap* installiert werden. Öffne dazu die Eingabeaufforderung/Terminal (z.B. im Jupyter Notebook über File -> New -> Terminal) und installiere *shap* mit `'pip install shap'`. Danach musst du den Python-Kernel neu starten (JupyterLab-Menü: Kernel --> Restart Kernel ...) und die obigen Code-Teile erneut ausführen.

### Aufgabe
Verwende den SHAP-Ansatz, um das Modell zu erklären (https://shap.readthedocs.io/en/latest). Wie unterscheidet sich der SHAP-Ansatz vom LIME-Ansatz?

Wir gehen dabei in drei Schritten vor: Auch hier müssen wir im Code erstmal einen *Explainer* erzeugen. Den wenden wir dann explizit auf Testdaten an, und visualisieren die erhaltenen Ergebnisse.

**Schritt 1:** Einen *SHAP-Explainer* erzeugen. Schau dir in der Dokumentation dazu den Teil [Example of loading a custom tree model into SHAP](https://shap.readthedocs.io/en/latest/example_notebooks/tabular_examples/tree_based_models/Example%20of%20loading%20a%20custom%20tree%20model%20into%20SHAP.html) an. Dort ist Python Code eines Jupyter Notebooks gezeigt, bei dem ab Code-Zelle "\[6\]" das Modell des Entscheidungsbaums für den *Explainer* verwendet wird. Auch wir verwenden den [TreeExplainer](https://shap.readthedocs.io/en/latest/generated/shap.TreeExplainer.html):

In [None]:
import shap    # wir importieren die 'shap' bibliothek
# shap.initjs()   # und initialisieren diese     ... nicht notwendig?
shap_explainer = shap.TreeExplainer(model)

# Hinweis: Du bekommst evtl. eine Meldung "IProgress not found. Please update jupyter an ipywidgets..." - diese darfst du ignorieren ;).

**Schritt 2:** Mit Hilfe des `shap_explainer` lassen wir uns nun die *SHAP-Values* zu den Testdaten berechnen:

In [None]:
shap_values = shap_explainer.shap_values(X_test)

**Schritt 3:** Diese können wir zusammen in einem Diagramm über die vier Merkmale darstellen:

In [None]:
figure = plt.figure()
shap.summary_plot(shap_values, X_test)

**Zwei Fragen dazu:**
* Was bedeutet der *SHAP-Value*?
* Was ist hier dargestellt?</br>

Schaue dir dafür das Diagramm, dessen Achsenbeschriftungen und die Legende genau an.
Eine guten Einstieg (in englisch) findest du in der Dokumentation der *shap*-Bibliothek im Einführungsabschnitt [Explaining a linear regression model](https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html#Explaining-a-linear-regression-model).

Die **Shapley-Werte** stellen - einfach ausgedrückt - den Einflussfaktor jeweils *eines* einzelnen Merkmals für *einen* bestimmten Datenpunkt auf *eine* bestimmte Ausgabe (das Klassifikationsergebnis) dar. Diese Werte können *positiv* sein und unterstützen dabei das Klassifikationsergebnis, oder *negativ* und wirken so dem Klassifikationsergebnis entgegen.

Sowohl *positive* wie auch *negative* Shapley-Werte haben also Einfluss auf die Ausgabe - dies **hängt jedoch von der prognostizierten Klasse** ab. In unserem Fall, dem obigen Balkendiagramm, sehen wir, dass das Merkmal *sepallength* **keinen** Einfluss auf die Klassifikation hat - wir könnten daher dieses Merkmal aus unseren Features entfernen.</br>
Das Merkmal *petallength* hingegen hat **sehr großen** Einfluss auf alle drei möglichen Klassifikationsausgaben - zu fast ähnlich großen Anteilen. Der Einfluss pro Ausgabeklasse - also die Länge des jeweiligen Balkens einer Farbe - errechnet sich aus dem **Mittelwert aller Absolutbeträge der *Shapley-Werte***. Es ist also egal ob ein Merkmal "für" oder "gegen" eine Ausgabe ist.

Für das Merkmal *petalwidth* siehst du übrigens, dass dieses nur zur Bestimmung der Klassen 1 und 2 beiträgt (positiv oder negativ ist hier nicht sichtbar), nicht jedoch zur Klasse 0.

***Anmerkung an die Autoren: Sollen wir das auch noch beschreiben? Wir müssten hier recht ausholen.. ich würde den Teil lieber erstmal weglassen. Können wir ja später immer noch "hinterherschieben"***