## Preliminaries

* Funktionen $f,g,h,\dots$ mit zugehörigen Variablenmengen $F,G,H,\dots$
* Anzahl der 1-Einträge: $|f|, |g|,\dots$
* Analog gilt für einfache coalition games: $|v| = |\{ S : v(S) = 1 \}|$.
* Kofaktoren: für $f = x \lor y \lor z$ ist $f[x/0] = y \lor z$ und $f[x/1] = 1$
* Hintereinanderschreiben von Vektoren: $x/0;y/1$ ist der Vektor $\mathbf{u} : x \mapsto 0, y \mapsto 1$
* Für eine Menge an Variablen $S$ ist $B(S)$ die Menge der Vektoren $\mathbf{u}$ mit $\text{var}(\mathbf{u}) = S$.
* Für eine Menge an Variablen $S$ und eine Funktion $f$ mit $S \subseteq F$ definiert $f^S$ die Funktion, die die Variablen in $S$ komplementiert und sich sonst wie $f$ verhält: $f^S(\mathbf{u}) = f(\mathbf{u} \oplus 1_S)$.
* Für eine Umbenennung $\pi : G \rightarrow F$ (bijektive Funktion) definiert $g = \pi(f)$ die Funktion $\pi(f)(\mathbf{u}) = f(\pi(\mathbf{u}))$ mit $\pi(\mathbf{u})(x) = \mathbf{u}(\pi(x))$ für $x\in G$.

## Weitere Importance-Values aus der Literatur

**Birnbaum-Importance**

Definiert für monotone boolsche Funktionen: $ \gamma_x(f) = \frac{1}{2^{n-1}} \sum_{\mathbf{u} \in B(F) : \mathbf{u}(x) = 0} f(\mathbf{u} \oplus 1_x) - f(\mathbf{u}) $. Das ist im Prinzip (bis auf einen Faktor von 2) der gleiche Wert wie die "Influence", und es gilt auch $\gamma_x(f) = \text{Bz}_x(\tau_f)$.

**Hammer-Mapping**

Von Hammer, Kogan, Rothblum wird folgendes Maß für die "Wichtigkeit" einer Menge an Variablen definiert. Sei $\rho$ eine konvexe Funktion mit den Eigenschaften $\rho(0) = \rho(1) = 1$ und $\rho(1/2) = 0$. Beispiele sind 
$$
\begin{aligned}
  \rho(x) &= 4(x-0.5)^2, \\
  \rho(x) &= 2 | x-0.5| \quad \text{oder} \\ 
  \rho(x) &= 1 + x \log_2 x + (1-x) \log_2 (1-x)
\end{aligned}
$$

<img src="pics/hammer_convex.png"></img>

Weiterhin wird der folgende Wert definiert:
$$
  E_f(S) = \frac{1}{2^{|S|}} \sum_{\alpha \in B(S)} \rho\left( \frac{|f[\alpha]|}{ 2^{|F|-|S|} } \right)
$$

* Wenn $f[\alpha]$ "sehr konstant" ist, d.h. entweder viele 1en oder 0en enthält, ist $|f[\alpha]|$ entweder sehr klein oder sehr groß. 
* Indem durch $2^{|F|-|S|}$ geteilt wird, wird der Wert auf das Intervall $[0,1]$ normiert. (Es gibt $|F|$ Variablen in $f$, und nachdem $|S|$ Stück zugewiesen worden sind, bleiben $|F|-|S|$ in $f[\alpha]$. D.h. $2^{|F|-|S|}$ ist die Anzahl der möglichen Belegungen von $f[\alpha]$.)
* Damit gilt $0 \leq |f[\alpha]|/2^{|F|-|S|} \leq 1$ und der Wert geht gegen $1$ oder $0$ wenn $f[\alpha]$ "sehr konstant" ist. Wenn $f[\alpha]$ zu gleichen Teilen aus 0en und 1en besteht, ist der Wert $1/2$.
* Zusammen mit den Eigenschaften von $\rho$ ist also ...$\rho(|f[\alpha]|/2^{|F|-|S|})$ hoch, wenn $f[\alpha]$ "sehr konstant" ist, und niedrig, wenn $f[\alpha]$ annährend aus gleich vielen 0en/1en besteht.

Der Wert $E_f(S)$ kann also als *durchschnittliche Konstanz* der möglichen Kofaktoren über $S$ verstanden werden. Beispiele sind für $f = (x \oplus y) \lor z$:

$$ 
\begin{aligned}
  E_f(\{ x, z\}) &= \frac{1}{4}\left( \rho(\frac{|f[x/0;z/0]|}{2}) + \rho(\frac{|f[x/0;z/1]|}{2}) +  \rho(\frac{|f[x/1;z/0]|}{2}) + \rho(\frac{|f[x/1;z/1]|}{2}) \right) = \frac{1}{4}(\rho(\frac{1}{2}) + \rho(1) + \rho(\frac{1}{2}) + \rho(1) ) = \frac{1}{2}. \\
  E_f(\{ z \}) &= \frac{1}{2} \left( \rho(\frac{|f[z/0]|}{4}) + \rho(\frac{|f[z/1]|}{4} ) \right) = \frac{1}{2} \left( \rho(\frac{1}{2}) + \rho(1) \right) = \frac{1}{2}.
\end{aligned}
$$

...die Autoren präsentieren hier im Prinzip ein Coalition Game Mapping, das auch monoton ist. (D.h. $E_f(S \cup T) \geq E_f(S)$ für alle $S,T$. Das kann mit Hilfe der Konvexität von $\rho$ gezeigt werden.) Ein möglicher Wichtigkeitswert, der auf diesem Mapping basiert, ist bspw. also

$$ 
  \text{Bz}_x(E_f) = \frac{1}{2^{|F|-1}} \sum_{S \subseteq F: x \not\in S} E_f(S \cup \{ x \}) - E_f(S).
$$

für $f = (x \oplus y) \lor z$ ergeben sich bspw. für $\rho(x) = 4(x-0.5)^2$ die Werte $0.1875$ für $x$ und $y$ und $0.3125$ für $z$. 

In [8]:
import sys; sys.path.append("..")
import cgm
import binfunc

f = binfunc.from_lambda(lambda x,y,z: (x^y)|z)

print(cgm.banzhaf(cgm.quadratic_hammer, "y", f))
print(cgm.banzhaf(cgm.quadratic_hammer, "x", f))
print(cgm.banzhaf(cgm.quadratic_hammer, "z", f))

0.1875
0.1875
0.3125


## Untersuchungen

Alle Importance-Values zu untersuchen wäre zu viel. Deswegen will ich mich auf die folgenden Fokussieren:

* Blame mit generalisierter Responsibility und uniformer Verteilung
  * Statt $\rho(x) = 1/(x+1)$ als "Gewichtung" würde nichts dagegen sprechen, $\rho$ auch linear oder in der Form $\rho(x) = a 2^{-x} + b$ o.ä. sein zu lassen.
  * Die folgenden Eigenschaften reichen für die meisten Beweise: $\rho(0) = 1$, $\rho(|F|) = 0$, $\rho$ streng monoton fallend.
* Bz/Sym/* (Eigenschaften für Dom/Rec können zusammen abgearbeitet werden)
* Bz/ASym/* 
* Bz/QuadHammer (hat ein paar nette Eigenschaften)

(Mit dem Banzhaf-Wert lässt sich besser rechnen und die Wichtigkeitsreihenfolge der Variablen unterscheidet sich vom Shapley-Wert erst ab 6 (!) Variablen.)

### Berechnungsvorschriften

Wir suchen nach Berechnungsvorschriften für die o.g. Werte der Funktionen, die sich in $f = h \land g$ (oder $f = h \lor g$) zerlegen lassen. Falls sich $h$ und $g$ Variablen teilen, scheint es keine guten Berechnungsmöglichkeiten zu geben. Deswegen betrachten wir nur Fälle, für die $H \cap G = \emptyset$ gilt. Dann haben wir bspw. für $x \in H$:

$$
\begin{aligned}
  &\text{Bz/ASym/*:}\quad &\text{Bz}_x(v_{h \land g}) &= \left( \frac{|v_g|}{2^{|G|}} \right) \text{Bz}_x(v_h) \quad\text{für}\quad v \in \{ \omega, \nu \} \\
  &\text{Bz/Sym/*:}\quad &\text{Bz}_x(\tilde v_{h \land g}) &= \frac{| v_g \land v_{\neg g}|}{2^{|G|}} \text{Bz}_x(v_h) + \frac{| v_g \land \neg v_{\neg g}|}{2^{|G|}} \text{Bz}_x(\tilde v_h) \quad \text{für}\quad v \in \{ \omega, \nu \} \\
  &\text{Bz/QuadHammer:}\quad &\text{Bz}_x(E_{h \land g}) &= \left( \frac{1}{2^{|G|}} \sum_{T \subseteq G} \frac{1}{2^{|T|}} \sum_{\beta \in B(T)} \left( \frac{|g[\beta]|}{2^{|G|-|T|}} \right)^2 \right) \text{Bz}_x(E_h)
\end{aligned}
$$

(Für den Blame-Wert scheint es keine "schöne" Zerlegung zu geben.)

### Äquivalenz von boolschen Funktionen

Man kann Funktionen $f,g$ als äquivalent definieren, wenn es eine Umbenennung $\pi : F \rightarrow G$ und ein $S \subseteq G$ mit $f = \pi(g^S)$ gibt. Bspw. sind $x \land \neg z$ und $x \land y$ in dieser Hinsicht äquivalent, aber auch $x \oplus y$ und $z \leftrightarrow v$. $f = 1$ und $f = 0$ sind nicht äquivalent. Diese Äquivalenz von Funktionen wurde schon von (Slepian, 1953: On the Number of Symmetry Types of Boolean Functions of n Variables) untersucht.

### Monotone Erweiterungen

Sei $h$ eine Funktion; wir nennen $f$ eine Monotone Erweiterung (ME) von $h$, wenn einer der folgenden Punkte gilt:
* $f = h$ oder
* $f = f' \lor g$ oder $f = f' \land g$ für eine Funktion $g$ mit $G \cap F' = \emptyset$ und eine ME $f'$ von $h$.

Beispiele: $(x \land y) \lor z$ ist eine ME von $x$ und von $z$ und von $x \land y$.

### Forderungen

Für ein Importance-Value will ich mich jetzt auf folgende Postulate reduzieren... Die ersten beiden sollen auf jeden Fall erfüllt sein:

1. (Invarianz bzgl. Umbenennung) Ist $h$ eine Funktion und $\pi : H \rightarrow G$ eine Umbenennung, dann gilt $\gamma_x(h) = \gamma_{\pi(x)}(\pi(h))$.
2. (Invarianz bzgl. Komplementierung von Variablen) Ist $h$ eine Funktion und $S \subseteq H$ eine Menge an Variablen, dann gilt $\gamma_x(h) = \gamma_x(h^S)$.

Das dritte erlaubt die Unterscheidung von "Satisfiability-Biased" und "Symmetric" Importance-Values:

3. (Invarianz bzgl. Komplementierung von Funktionen) Ist $h$ eine Funktion, dann gilt $\gamma_x(h) = \gamma_x(\neg h)$.

Und die letzten beiden Postulate erlauben u.U. eine Schlussfolgerung der Wichtigkeitsreihenfolge:

4. (Ranking-Invarianz bzgl. ME) Sei $h$ eine Funktion mit $x \in H$. Wenn $\gamma_x(h) \geq \gamma_y(h)$, dann $\gamma_x(f) \geq \gamma_y(f)$ für jede ME $f$ von $h$.
5. (Ranking-Invarianz bzgl. ME von Modulen) Seien $h, g$ eine Funktionen mit $x\in H$ und $h = \pi(g^S)$ für eine Umbennenung $\pi : H \rightarrow G$ und $S \subseteq G$. Ist $f$ eine ME von $g$ sodass $F \cap H = \emptyset$, dann gilt $\gamma_x(h \circ f) \geq \gamma_{\pi(x)}(h \circ f)$ für $\circ \in \{ \land, \lor \}$.

---

Beispiel für die letzte Forderung:

- $h = x \land z_0$ 
- $g = y \land \neg z_1$ ist $h = \pi(g^S)$ mit $S = \{ z_1 \}$ und $\pi : x \mapsto y, z_0 \mapsto z_1$.
- $f = y \land \neg z_1 \land z_2 \land z_3$ ist ME von $g$ mit $F \cap H = \emptyset$.
- $h \lor f = (x \land z_0) \lor (y \land z_1 \land z_2 \land z_3)$.
- Also: $\gamma_x(h \lor f) \geq \gamma_y(h \lor f)$.

Bspw. impliziert das aber auch $\gamma_x(f) = \gamma_y(f)$ wenn $f = x \land y \land z_0 \land z_1 \land \dots$ gilt. 

Ich habe die folgenden Teilergebnisse:

| Postulat | Blame | Bz/ASym/\* | Bz/Sym/\* | Bz/QuadHammer |
|--|--|--|--|--|
| Invarianz bzgl. Komplementierung von Funktionen | &#10003; | x | &#10003; | &#10003; |
| Ranking-Invarianz bzgl. ME | x | &#10003; | x | &#10003; |
| Ranking-Invarianz bzgl. ME von Modulen | (vorsichtiges) &#10003; | ? | ? | ? |

## Todo

- Letztes Ranking-Postulat für restliche Importance-Values überprüfen
- Anfangen zu schreiben...
