# Shapley
---

Shapley Vector - a method of a "fair" gain distribution between team members, introduced in the mid 20th century in the research of cooperative games (games theory). The principle was later adopted in Machine Learning for determining individual feature contributions

### Problem setting
Есть набор игроков ${1, 2 … N}$, из которого собирается команда. Команда коллективно выполняет определенную работу, за которую получает выигрыш. Задача - построить стратегию "честного" распределения выигрыша. Различные определения честности предлагаются в теории игр, но в целом - кто больше принес пользы, тот и получает больше

В примитивных играх игроки дейтвуют независимо. Например, каждый игрок зарабатывает медали на соревнованиях - кто больше заработал, тот и получил большую премию. В таких играх все более или менее просто

В кооперативных играх игроки должны сотрудничать, например, игрок X может подстраховывать игрока Y и т.п. Цель: максимизировать <u>общую</u> прибыль

$S$ - коалиция (команда) игроков<br>
$v(S)$ - характеристическая функция, какой выигрыш получает команда S

В этой теории $v(S)$ не зависит от порядка игроков, только от набора (игроки работают одновременно)

Player contribution (aka marginal contribution) is quite intuitive, it is "gain with player" - "gain without player"

<img src="img/formula1.png" width=150>


### Main idea:
since player contribution depends on the team and we want to get a "fair" evaluation of it, it's better to average the contribution over ALL possible teamings. There are $n!$ possible teamings, so

<img src="img/formula2.png" width=250>

In order to compute, it is convenient to list all team combinations that include player X through player permutations. That is, for each permutation we find the position of player X and assign the team be all preceeding (to the left) players

The table illustrates this kind of iteration over all combinations for 3 player coalitions. First, we list all permutations. Then compute the marginal contribution <br>The second column contains all contributions for player "1"
<img src="img/formula3.png" width=350>

Shapley Vector = the set of all Shapley Values<br>
$\varphi = \{\varphi_1, \varphi_2 ... \varphi_N \}$

In most scenarios the gain does not depend on the order of players => we can simplify this formula by grouping teams that differ only by its order

The number of permutations inside the coalition of players $S$ equals $|S|!$<br>
The number of permutations of other players that we exclude equals $(N-S-1)!$<br>
Thus we can rewrite:

<img src="img/formula4.png" width=300>



And if we take $1/n$ out of the braces, we can also rewrite it using combination notation

<img src="img/unnamed (1).png" width=310>


# Properties


### 1) Effectiveness

Распределеник по Шепли - эффективно<br>В теории кооперативных игр эффективность распределения = ничего не остается нераспределенного

__Доказательство__<br>
Представляем все возможные коалиции в виде таблицы N! перестановок. Каждому элементу соответсвует его вклад в коалицию, что слева. Нам надо просуммировать вклады каждой переменной, уседнить и сложить их. Поменяем порядок суммирования - по строкам все всегда суммируется в v(N), так как мы суммируем дельты и, получается, порядок не важен. Тогда средняя строка будет как раз v(N) - это и есть сумма вкладов.

### Superadditivity
Если функция выгрыша v супераддитивна (в коалицию вступать выгодно), то вклад будет больше вклада игрока, если бы он играл один




A way to fairly evaluate contribution of each player to a team result

In simple game models you can evaluate them individually (game is a sum of player results)
In most real world scenarios players act differently depending on team cooperation strategy

{1,2 … N} players
S = coalition (set of players)
characteristic function v(S) = performance of a coalition S
It does not depend on the order of players

Important assumptions about player contribution:


- they are not additive
contribution depends on what already has been done


- they depend on other players
with strong team members new player brings less

Marginal contribution of player i to coalition S = additional revenue brought by the player i when he cooperates with team S


### Synergy

Informaly, synergy = when effect of a coalition is bigger than sum of the individual effects<br> (i.e. value function is convex over coalitions)

Formally, synergy = "uplift" of the effect after joining player's efforts<br> It is calculated using set algebra. Example for 2 players:<br>

$W_{X+Y} = V_{X+Y} - V_X - V_Y$<br><br>


Or for multilevel inclusions<br>

$W_{X+Y} = V_{X+Y} - (V_{x} - V_{X1} - V_{x2}) - (V_{Y} - V_{y1} - V_{y2})$


Or for arbitrary level
<img src="img/formula5.png" width=200>

Synergy takes place when there is some sort of coordination between players in a team - it can boost or reduce the overall performance<br>This means synegry can be negative


Shapley = sum of all synergies



__Synergy Example__<br>
Team consists of a manager and a set of workers<br> $\{o, w_1 … w_N\}$ 

Without manager team is useless<br>
$v(w_1) = … = v(w_N) = 0$

Without workers manager is useless<br>
$v(o) = 0$

But together they provide result:<br>
$v(o, w_1 w_N) = (N-1) p$

Synergy of a {manager+worker} cooperation is positive and equals to<br>
$w(o, w_1) = -v(0) -v(w_1) + v(o, w_1)$

Shapley Value = sum of synergies per member in all coalitions

How Shapley is computed
1.compare results with and without player
2.average over all subsets of player combinations





# Attribtuion

В Маркетинге задача атрибуции конверсий = оценить, что и в какой пропорции повлияло на решение о конверсии. Обычно сравнивается влияние различных каналов коммуникации или их типов.

Игроки = каналы коммуникации
Коалиция = микс каналов, задействованых в коммуникации с клиентом
Выигрыш = кол-во конверсий или CTR

Задача: честно распределить конверсии между каналами. Правильная оценка позволит сделать вывод о полезности каналов


Feature Importance



# SHAP
---

SHAP = Python library for Prediction interpretation

It repeats the Shapley approach: 
- coaition = set of features 
- return = prediction deviation from $E[f]$

As Shapley method decomposes the return into sum of player contributions, it can also decompose the predicted value for each observation

<img src="img/formula.png" width=300>

We need approximate solution => train regression on a set of features. Resulting coefficients will be approximate Shapley values. This approach is called __KernelSHAP__

## Visualization

__Force plot__ = we start from $E[f]$ at the bottom and gradually add up new features showing how each of them affects the prediction<br> When all features are added we come up to the actual prediction 
<img src="img/shap1.png" width=500>

__Beeswarm__ = for each feature (vertical axis) plot its contributions for all data points in a dataset (horizontal axis). Color denotes feature value
<img src="img/shap2.png" width=500>

Среднее значение вклада от признака f по всему датасету = значимость признака
<img src="img/shap3.png" width=400>


По оси X - шкала предсказания, посередине - вывод модели, синее занижает предсказание, красное завышает
<img src="img/shap4.png" width=750>





# Usage Example
---

In [3]:
import shap
import sklearn
import numpy as np

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

# Load data
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    iris.data, iris.target, random_state=42
)

# Train a model
model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)


ModuleNotFoundError: No module named 'numba.core'

In [10]:
!pip install numba

