# Coalition-Finding Algorithmus

Dieses Notebook demonstriert die Nutzung des Algorithmus `subset_finding`, um Koalitionen von Features mit dem höchsten bzw. niedrigsten aggregierten Interaktionswert zu identifizieren.

Als Grundlage dienen Interaktionswerte, die auf einem erklärbaren Modell basieren und mit Hilfe von Indizes wie `k-SII`, `STII` oder `FSII` berechnet wurden.

Der zugrundeliegende Algorithmus basiert auf einer heuristischen Beam Search, die durch gezielte Vorauswahl vielversprechender Teilkoalitionen eine effiziente Suche in großen Feature-Räumen ermöglicht.





## Vorbereitung: Imports

Wir beginnen mit dem Import aller benötigten Module für Modellierung, Datenaufbereitung und den Koalitionsfindungs-Algorithmus.



In [2]:
# general imports
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from shapiq import load_bike_sharing
from shapiq.explainer import Explainer
from shapiq import Explainer
# sklearn imports
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.neighbors import KNeighborsRegressor

## Datensatz und Regressionsmodell

In diesem Beispiel verwenden wir den `bike_sharing`-Datensatz, der stündliche Fahrradverleihzahlen und zugehörige Kontextinformationen wie Temperatur, Luftfeuchtigkeit oder Uhrzeit enthält.

Wir trainieren ein Regressionsmodell, das die Ausleihzahl vorhersagt. Standardmäßig verwenden wir hier einen Random Forest Regressor – andere Alternativen wären z. B. `LinearRegression`, `KNeighborsRegressor` oder `DecisionTreeRegressor`.

Anschließend berechnen wir Interaktionswerte mithilfe des `k-SII`-Index.
Diese Werte dienen als Grundlage für die nachfolgende Koalitionsanalyse.


In [3]:
# Daten laden (Tuple entpacken)
X, y = load_bike_sharing()
print(type(X))
print(type(y))
print(X )
print(y)
# Zielvariable als float
y = y.astype(float)

# One-Hot-Encoding für kategorische/string-Spalten in Features
X = pd.get_dummies(X, drop_first=True)

# Train-Test-Split
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Modell trainieren
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Shapiq Explainer initialisieren
explainer = Explainer(
    model = model.predict,
    data = X_train.to_numpy(),    # <-- numpy array statt DataFrame
    index = "k-SII",
    max_order = 2
)


# Erklärung für ersten Trainingspunkt
x0 = X_train.iloc[0]
explanation = explainer.explain(x0.to_numpy(), budget=10)

print(explanation)

<class 'pandas.core.frame.DataFrame'>
<class 'pandas.core.series.Series'>
           hour    temp  feel_temp  humidity  windspeed  year     month  \
0     -1.000000 -0.8125  -0.683918  0.600000  -1.300268  -1.0 -1.000000   
1     -0.916667 -0.8750  -0.736714  0.566667  -1.300268  -1.0 -1.000000   
2     -0.833333 -0.8750  -0.736714  0.566667  -1.300268  -1.0 -1.000000   
3     -0.750000 -0.8125  -0.683918  0.400000  -1.300268  -1.0 -1.000000   
4     -0.666667 -0.8125  -0.683918  0.400000  -1.300268  -1.0 -1.000000   
...         ...     ...        ...       ...        ...   ...       ...   
17374  0.583333 -0.7500  -0.789163 -0.100000  -0.199732   0.0  0.833333   
17375  0.666667 -0.7500  -0.789163 -0.100000  -0.199732   0.0  0.833333   
17376  0.750000 -0.7500  -0.789163 -0.100000  -0.199732   0.0  0.833333   
17377  0.833333 -0.7500  -0.736714 -0.233333  -0.400134   0.0  0.833333   
17378  0.916667 -0.7500  -0.736714  0.066667  -0.400134   0.0  0.833333   

       holiday  weekday  



InteractionValues(
    index=k-SII, max_order=2, min_order=0, estimated=True, estimation_budget=10,
    n_players=12, baseline_value=190.86463629737608,
    Top 10 interactions:
        (): 190.86463629737608
        (0,): -4.574300022630151
        (10,): -12.985351338320923
        (5,): -12.985351338320928
        (2,): -12.98535133832093
        (1,): -12.985351338320932
        (3,): -12.985351338320937
        (7,): -18.626236297376074
        (11,): -20.06053629737609
        (6,): -27.28403629737602
)




## Interaktionswerte berechnen

Um sinnvolle Koalitionen identifizieren zu können, benötigen wir sogenannte Interaktionswerte.
Diese quantifizieren den Beitrag einzelner oder kombinierter Features zur Vorhersage eines Modells.

Wir verwenden dazu den `Explainer` aus der `shapiq`-Bibliothek mit dem Index `k-SII` (Shapley Interaction Index).
Dabei legen wir die maximale Interaktionsordnung (`max_order`) auf 3 fest – d. h. es werden Einzel-, Paar- und Dreifachinteraktionen berücksichtigt.

Die Erklärung erfolgt für einen einzelnen Datenpunkt aus dem Trainingsdatensatz.


In [None]:
from shapiq import Explainer

explainer = Explainer(
    model=model.predict,
    data=X_train.to_numpy(),
    index="k-SII",
    max_order=3,
)

# Wir erklären den ersten Datenpunkt aus dem Trainingsset
x0 = X_train.to_numpy()[0]
interaction_values = explainer.explain(x0, budget=16)
interaction_values

## Koalitionsfindung mit Beam Search (Theorie)

Der Algorithmus `subset_finding` nutzt eine heuristische Beam Search zur effizienten Koalitionssuche.

Ziel ist es, unter allen möglichen Koalitionen der Größe $l$ diejenigen zu finden, die den höchsten oder niedrigsten Gesamtbeitrag zur Vorhersage eines Modells leisten – gemessen an den sogenannten Interaktionswerten.


### Wie wird eine Koalition bewertet?

Jede Koalition $S$ besteht aus einer Teilmenge von Features, z. B. $S = \{A, B\}$.
Zur Bewertung wird der gesamte Einfluss dieser Feature-Kombination auf das Modell aggregiert:

$$
\hat{\nu}_e(S) = e_0 + \sum_{i \in S} e_{\{i\}} + \sum_{\substack{i,j \in S \\ i < j}} e_{\{i,j\}} + \sum_{\substack{T \subseteq S \\ |T| > 2}} e_T
$$

Dabei gilt:
- $e_0$: Basiswert ohne Features (leere Koalition)
- $e_{\{i\}}$: Beitrag des einzelnen Features $i$
- $e_{\{i,j\}}$: Beitrag des Zusammenspiels von zwei Features
- $e_T$: höherwertige Interaktionen (drei oder mehr)

Je höher der Wert $\hat{\nu}_e(S)$, desto stärker der Einfluss der Koalition auf die Vorhersage (positiv oder negativ).

### Beispiel

Gegeben sei eine Feature-Menge $N = \{A, B, C\}$ mit folgenden Interaktionen:

- $e_{\{A\}} = 1.0$, $e_{\{B\}} = -0.5$, $e_{\{A,B\}} = 0.3$
- $e_{\{C,B\}} = -0.2$, $e_{\{C\}} = -0.1$, $e_{\{A,C\}} = 0.2$, $e_{\{A,B,C\}} = 0.6$, $e_0 = 0.0$

Dann ergibt sich für die Koalition $S = \{A, B\}$:

$$
\hat{\nu}_e(\{A,B\}) = 0.0 + 1.0 - 0.5 + 0.3 = 0.8
$$

### Wie findet der Algorithmus solche Koalitionen effizient?

Statt alle möglichen Kombinationen zu prüfen, was bei vielen Features sehr aufwändig wäre, geht der Algorithmus schrittweise vor:

- Zuerst werden alle einzelnen Features als Startpunkte betrachtet
- In mehreren Runden werden die vielversprechendsten Kandidaten um je ein weiteres Feature erweitert
- In jeder Runde bleiben nur die bestbewerteten Kombinationen erhalten, alle anderen werden verworfen

Der Algorithmus besteht dabei aus zwei klar getrennten Phasen:

1. **Approximationsphase**:
   In dieser Phase erfolgt die Bewertung der Koalitionen heuristisch.
   Höherwertige Interaktionen werden vorab anteilig auf die Einzelspieler verteilt.
   So kann der Algorithmus Koalitionen effizient vergleichen, ohne die vollständige Formel auszuwerten.

2. **Genauigkeitsphase**:
   Sobald die Anzahl der Kandidaten unter eine festgelegte Schwelle sinkt (die sogenannte Threshold-Beam-Breite),
   wird die Bewertung auf Basis der exakten Bewertungsfunktion durchgeführt – also unter Berücksichtigung aller vorhandenen Hyperkanten.

Auf diese Weise lassen sich Koalitionen mit extremen Interaktionswerten effizient und präzise identifizieren.



## Koalitionsfindung mit Beam Search (Praxis)

Wir wenden nun den Algorithmus `subset_finding` auf die berechneten Interaktionswerte an.
Gesucht wird eine Koalition fester Größe (hier: $l = 3$) mit maximalem bzw. minimalem aggregierten Interaktionswert gemäß der zuvor erklärten Bewertungsfunktion.


In [40]:
# Import des Koalitionsfindungs-Algorithmus
from shapiq_student.subset_finding import subset_finding

# Suche nach Koalitionen der Größe 3
beam_result = subset_finding(interaction_values=interaction_values, max_size=3)
beam_result

InteractionValues(
    index=k-SII, max_order=3, min_order=3, estimated=True, estimation_budget=None,
    n_players=12, baseline_value=191.13187499999998
)

## Analyse der gefundenen Koalitionen

Die Funktion `subset_finding` liefert zwei Koalitionen:

- `s_max`: Die Koalition der Größe `l`, die den höchsten aggregierten Interaktionswert erzielt
- `s_min`: Die Koalition mit dem niedrigsten Wert

Zusätzlich gibt sie auch die zugehörigen aggregierten Interaktionswerte `v_max` und `v_min` zurück.

Im Folgenden untersuchen wir die Koalitionen genauer – sowohl in numerischer Form (Index) als auch lesbar mit Spaltennamen.


In [43]:
# Rohausgabe
print("Koalition mit höchstem, aggregierten Interaktionswert (Index):", beam_result.s_max)
print("Koalition mit niedrigstem, aggregierten Interaktionswert (Index):", beam_result.s_min)
print("Interaktionswert der Koalition mit höchstem, aggregierten Interaktionswert:", beam_result.v_max)
print("Interaktionswert der Koalition mit niedrigstem, aggregierten Interaktionswert:", beam_result.v_min)

# Lesbare Darstellung mithilfe der Spaltennamen
columns = X_train.columns


def readable(S: set[int]) -> set[str]:
    return {columns[i] for i in S}


print("Koalition mit höchstem, aggregierten Interaktionswert (Namen):", readable(beam_result.s_max))
print("Koalition mit niedrigstem, aggregierten Interaktionswert (Namen):", readable(beam_result.s_min))

Koalition mit höchstem, aggregierten Interaktionswert (Index): {8, 9, 5}
Koalition mit niedrigstem, aggregierten Interaktionswert (Index): {0, 1, 2}
Interaktionswert der Koalition mit höchstem, aggregierten Interaktionswert: 195.56869930600533
Interaktionswert der Koalition mit niedrigstem, aggregierten Interaktionswert: 42.10465199174142
Koalition mit höchstem, aggregierten Interaktionswert (Namen): {'weekday', 'workingday', 'year'}
Koalition mit niedrigstem, aggregierten Interaktionswert (Namen): {'feel_temp', 'temp', 'hour'}


## Fazit

Der heuristische Beam Search Algorithmus ermöglicht eine effiziente Identifikation von Koalitionen mit hohem oder niedrigem Einfluss auf eine Modellvorhersage – selbst bei großen Feature-Mengen.

Durch die Kombination aus Approximations- und Genauigkeitsphase werden vielversprechende Koalitionen gezielt ausgewählt und präzise bewertet.
So lässt sich eine starke Reduktion des Suchraums erzielen, ohne auf gute Lösungen verzichten zu müssen.

Der Algorithmus lässt sich flexibel auf Interaktionen höherer Ordnung anwenden und stellt eine leistungsfähige Erweiterung
zur Analyse modellbasierter Erklärungen dar.
