# Clase 20 - Interpretabilidad II üßê

- MDS7202: Laboratorio de Programaci√≥n Cient√≠fica para Ciencia de Datos


![1.png](attachment:5453cf7e-dc40-489d-9a9b-7fea73057883.png)

## Objetivos

- Comprender modelos agnosticos que permiten obtener explicaciones locales.
- Ver potenciales aplicaciones de Shap.

## Dataset

Para esta clase ocuparemos el dataset `credit_risk.csv`, el cual contiene una muestra de datos bancarios de diferentes personas. De esta forma, el problema se puede dividir en 2 partes:

- Entrenar un modelo que prediga la si un cliente ser√° o no pagador.
- A partir del modelo entrenado, obtener insights para explicar su funcionamiento.

Para esta clase nos enfocaremos en la parte de **interpretabilidad**.

In [None]:
import pandas as pd

path = "../../recursos/2023-01/25_interpretacion_II/credit_risk.csv"
df = pd.read_csv(path, index_col=0)
df.head()

## Modelos Agnosticos Locales

Los m√©todos locales de interpretabilidad en machine learning (ML) se centran en explicar las predicciones de un modelo para un √∫nico punto de datos o un peque√±o subconjunto de puntos de datos. Esto contrasta con los m√©todos globales, que intentan explicar las predicciones del modelo para todo el conjunto de datos.

![image.png](attachment:75495b6a-5753-4261-9b7c-1148ee0ec99c.png)

Los m√©todos locales suelen utilizarse cuando es importante entender por qu√© un modelo ha hecho una predicci√≥n concreta para un punto de datos espec√≠fico. Por ejemplo, un m√©dico podr√≠a querer entender por qu√© a un paciente se le diagnostic√≥ una enfermedad concreta, o un analista financiero podr√≠a querer entender por qu√© el precio de una acci√≥n subi√≥ o baj√≥.

**Es importante** tener en cuenta que estos m√©todos son s√≥lo **aproximaciones** a las verdaderas razones de las predicciones de un modelo. Adem√°s, los m√©todos locales pueden ser **costosos desde el punto de vista computacional** y es posible que no puedan explicar las predicciones de todos los modelos.

### Tipos de m√©todos locales

**Modelos sustitutos locales**: Estos m√©todos crean un modelo simple e interpretable que se aproxima a las predicciones de un modelo complejo para un √∫nico punto de datos. Esto puede hacerse encontrando un modelo lineal que se aproxime a las predicciones del modelo de caja negra para el punto de datos.

**Importancia local de las caracter√≠sticas**: Estos m√©todos calculan la importancia de cada caracter√≠stica en el modelo para un √∫nico punto de datos. Esto puede hacerse midiendo cu√°nto cambia la predicci√≥n cuando se modifica la caracter√≠stica.

## Scoped Rules (Anchors)

![image.png](attachment:a514669d-a45d-4417-a8c2-3d7e8b5825fa.png)

Las reglas de alcance, tambi√©n conocidas como **anchors** (anclas en espa√±ol), son un tipo de m√©todo de interpretabilidad local que explica las predicciones de un modelo para un √∫nico punto de datos. Los anclajes se crean encontrando **reglas de decisi√≥n** que "anclen" suficientemente la predicci√≥n. Una regla ancla una predicci√≥n si los cambios en los valores de otras caracter√≠sticas no afectan a la predicci√≥n.

### ¬øComo funciona?

Los anclajes se crean mediante un algoritmo de reinforcement-learning multi-armed bandit. Los pasos son:

- El algoritmo empieza generando aleatoriamente un gran n√∫mero de reglas. 
- A continuaci√≥n, el algoritmo eval√∫a cada regla prediciendo la etiqueta del punto de datos utilizando el modelo y la regla. 
- El algoritmo se queda con las reglas que tienen la mayor precisi√≥n de predicci√≥n.

Finalmente, el algoritmo repite el proceso, pero esta vez s√≥lo tiene en cuenta las reglas que se mantuvieron en la ronda anterior. El algoritmo sigue repitiendo este proceso hasta que encuentra un conjunto de reglas que anclan suficientemente la predicci√≥n.

![image.png](attachment:71b9a0b6-10a5-4c48-9415-7b054d42d3f9.png)

### Ejemplo

| Feature           | Valor  |
|-------------------|--------|
| Sexo              | M      |
| dinero_depositado | 30M    |
| Raza              | Asian  |
| ...               | ...    |
| Target            | Fraude |

*IF SEXO = M AND Raza = Asian AND dinero_depositado >= 20M THEN PREDICT Target = Fraude WITH PRECISION 97% AND COVERAGE 15%*

### ¬øCoverage y Precision?

**El Coverage** (o cobertura) en las Anchors se refiere a la proporci√≥n de puntos de datos de un conjunto de datos que se explican por un anchor. El coverage de una anchor es importante porque indica hasta qu√© punto el anchor puede explicar las predicciones del modelo para otros puntos de datos.

Una anchor de alta cobertura tiene m√°s probabilidades de ser √∫til para comprender las predicciones del modelo. **Un anchor de baja cobertura puede ser menos √∫til porque puede que s√≥lo explique las predicciones del modelo para un peque√±o n√∫mero de puntos de datos**.

La cobertura de un ancla puede calcularse dividiendo el n√∫mero de puntos de datos que explica la anchor, por el n√∫mero total de puntos de datos del conjunto de datos. Por ejemplo, si una anchor explica 100 puntos de datos en un conjunto de datos de 1000 puntos de datos, la cobertura del ancla es del 10%.

**La cobertura de un anclaje puede verse afectada por varios factores**, como el tama√±o del conjunto de datos, la complejidad del modelo y el n√∫mero de reglas del anclaje. En general, los conjuntos de datos m√°s grandes, los modelos m√°s sencillos y un menor n√∫mero de reglas dar√°n lugar a anclas de mayor cobertura.

![image.png](attachment:3c8ab4db-7926-4321-802b-bb8d3f3502ce.png)

La **precisi√≥n** de una anchor es la fracci√≥n de puntos de datos que la anchor explica correctamente. **Una anchor con alta precisi√≥n tiene m√°s probabilidades de ser exacta y √∫til para comprender las predicciones del modelo**.

La precisi√≥n puede calcularse dividiendo el n√∫mero de puntos de datos explicados correctamente por la anchor entre el n√∫mero total de puntos de datos explicados por el anclaje. Por ejemplo, si una anchor explica correctamente 10 puntos de datos de los 100 que explica, la precisi√≥n del anchor es del 10%.

### Consideraciones

**Si el conjunto de entrenamiento est√° desbalanceado, el espacio de perturbaci√≥n tambi√©n lo est√°**. Esta condici√≥n afecta a la b√∫squeda de reglas y a la precisi√≥n que podr√≠an tener los resultados.

### Ventajas
- Facil de interpretar.
- Funciona cuando las predicciones del modelo no son lineales o son complejas en la vecindad de una instancia.
- Es altamente eficiente y puede ser paralelizado el proceso de busqueda de interpretabilidad. (en el papel)

### Desventajas
- Aveces necesita un ajuste de sus par√°metros para entregar buenos resultados.
- Muchos escenarios requieren una discretizaci√≥n, ya que de lo contrario los resultados son demasiado espec√≠ficos, tienen poca cobertura y no contribuyen a la comprensi√≥n del modelo.
- Tiene muchas llamadas al modelo de ML entrenado.
- La cobertura no esta bien definida en algunos dominios (especificamente en imagenes).

### Ejemplo en Python

In [None]:
# pip install alibi

In [None]:
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from alibi.explainers import AnchorTabular
from alibi.datasets import fetch_adult

import xgboost as xgb
from imblearn.under_sampling import RandomUnderSampler

In [None]:
# recordemos como se ven los datos
df.head()

In [None]:
# separar datos 
X = df[df.columns[0:10]] #.drop(columns=['user', 'target_value', 'year', 'month'])
y = df['target_value']

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.33, random_state=42, stratify=y)

In [None]:
# entrenar modelo
clf = xgb.XGBClassifier()
clf.fit(X_train, y_train)

In [None]:
# generar predicciones
preds = clf.predict(X_test)
print(classification_report(preds, y_test))

Implementemos ahora `Anchors` para interpretar el modelo entrenado:

In [None]:
predict_fn = lambda x: clf.predict(x) # creamos funci√≥n de predicci√≥n
explainer = AnchorTabular(predict_fn, clf.feature_names_in_, seed=1) # instanciamos Anchor usando funci√≥n creada
explainer.fit(X_train.to_numpy()) # sobre los datos

In [None]:
idx = 5 # √≠ndice obs a predecir
obs = np.array(X_test.iloc[idx], ndmin = 2) # array de la obs

explanation = explainer.explain(obs, threshold=0.95) # generar anchor
print('Prediction: ', explainer.predictor(X_test.to_numpy()[idx].reshape(1, -1))[0]) # obtener prediccion del modelo 
print('Anchor: %s' % (' AND '.join(explanation.anchor))) # obtener regla 
print('Precision: %.2f' % explanation.precision) # obtener precision
print('Coverage: %.2f' % explanation.coverage) # obtener cobertura

In [None]:
idx = 13 # √≠ndice obs a predecir
obs = np.array(X_test.iloc[idx], ndmin = 2) # array de la obs

explanation = explainer.explain(obs, threshold=0.95) # generar anchor
print('Prediction: ', explainer.predictor(X_test.to_numpy()[idx].reshape(1, -1))[0]) # obtener prediccion del modelo 
print('Anchor: %s' % (' AND '.join(explanation.anchor))) # obtener regla 
print('Precision: %.2f' % explanation.precision) # obtener precision
print('Coverage: %.2f' % explanation.coverage) # obtener cobertura

## Shap

![](https://shap.readthedocs.io/en/latest/_images/shap_header.png)

Propuesto en 2017 por Lundberg y Lee, est√© es uno de los m√©todos m√°s utilizados actualmente en la industr√≠a (reemplazo directo de LIME).



El m√©todo de las explicaciones aditivas de Shapley (SHAP) es un enfoque te√≥rico de juegos para explicar el resultado de un modelo de aprendizaje autom√°tico. Funciona considerando todas las posibles coaliciones de caracter√≠sticas y asignando a cada caracter√≠stica un valor de Shapley, que mide la **contribuci√≥n** de esa caracter√≠stica al resultado del modelo.

¬øComo medimos la contribuci√≥n de una caracter√≠stica?

### Contribuci√≥n sobre Valor Base

Uno de los valores relevantes a la hora de calcular la contribuci√≥n de cada feature es el **valor base**. El valor base es el valor esperado de la salida de un modelo de aprendizaje autom√°tico si no tuviera informaci√≥n sobre las caracter√≠sticas. Se calcula promediando las predicciones del modelo en un gran conjunto de datos de ejemplos. El valor base se utiliza como **punto de referencia** para comprender c√≥mo contribuyen las caracter√≠sticas de un ejemplo concreto a la predicci√≥n del modelo para ese ejemplo.

**Ejemplo**: consideremos un modelo que predice el precio de una casa. El valor base de este modelo ser√≠a el precio medio de todas las casas del conjunto de datos. Si el modelo predice que una casa en particular vale 300.000 d√≥lares, los valores SHAP mostrar√≠an c√≥mo contribuye cada caracter√≠stica de esa casa a la diferencia entre la predicci√≥n del modelo y el valor base.

**El valor base es importante para entender los valores SHAP porque proporciona un contexto para interpretar los valores**. Sin el valor base, ser√≠a dif√≠cil saber si un valor SHAP es positivo o negativo. Por ejemplo, un valor SHAP positivo podr√≠a significar que la caracter√≠stica aumenta la predicci√≥n del modelo, o podr√≠a significar que la caracter√≠stica disminuye la predicci√≥n del modelo en una cantidad menor que el valor base.

El valor base tambi√©n es importante para comprender c√≥mo interact√∫an las caracter√≠sticas entre s√≠. Por ejemplo, consideremos un modelo que predice el riesgo de que un paciente desarrolle c√°ncer. El valor base de este modelo ser√≠a el riesgo medio de todos los pacientes del conjunto de datos. Si el modelo predice que un paciente concreto tiene un riesgo del 10%, los valores SHAP mostrar√≠an c√≥mo contribuye cada caracter√≠stica de ese paciente a la diferencia entre la predicci√≥n del modelo y el valor base.

Considerando lo anterior, los valores de shap pueden ser representados bajo la siguiente expresi√≥n:

$$\hat f(z) = \phi_0 + \sum_{j=1}^M \phi_j z'_j$$

donde $\phi_0$ puede ser interpretado como $E(\hat f(z))$.

### C√°lculo de valores SHAP

Conceptualmente, los valores SHAP se calculan re entrenando el modelo en todos los subconjuntos posibles de caracter√≠sticas $S \subseteq F$, donde $F$ es el conjunto total de caracter√≠sticas (todos los atributos disponibles).

De esta manera, la idea entrenar un modelo con $f_{S \cup i}$ con la caracter√≠stica $i$ y otro modelo $f_S$ sin esta caracter√≠stica.

Con ambas salidas, es posible calcular la contribuci√≥n de la feature $i$ como la resta entre ambos valores. Esto se repite para todos los subconjuntos posibles $S \subseteq F$ y luego se obtiene una agregaci√≥n ponderada de la contribuci√≥n.

La siguiente expresi√≥n resume lo expuesto:

$$\phi_i=\sum_{S \subseteq F \backslash\{i\}} \frac{|S|!(|F|-|S|-1)!}{|F|!}\left[f_{S \cup\{i\}}\left(x_{S \cup\{i\}}\right)-f_S\left(x_S\right)\right]$$

Pueden encontrar los detalles para calcular los shapley values en el siguiente [paper](https://proceedings.neurips.cc/paper_files/paper/2017/hash/8a20a8621978632d76c43dfd28b67767-Abstract.html).

### Propiedades

Dentro de las propiedades que posee shap podemos encontrar 4:

- **Eficiencia**: La suma de los valores SHAP de todas las caracter√≠sticas debe ser igual a la diferencia entre la predicci√≥n del modelo y el valor base (generalmente el promedio de las predicciones)

- **Precisi√≥n local**: los valores SHAP son localmente precisos, lo que significa que son precisos para una predicci√≥n concreta. Esto contrasta con las medidas de importancia de caracter√≠sticas globales, como la importancia de permutaci√≥n, que son precisas para todo el conjunto de datos.

$$\hat{f}(x)=g(x¬¥)=\phi_0 + \sum_{j=1}^M \phi_j x'_j$$

![image.png](attachment:a18aca1f-9384-47a2-b8dc-fe321efd0c1b.png)

- **Missigness**: Los valores SHAP son capaces de explicar las predicciones de los modelos incluso cuando faltan caracter√≠sticas. Esto se debe a que los valores SHAP se calculan utilizando una representaci√≥n lineal de las caracter√≠sticas, lo que les permite tener en cuenta los valores que faltan.

$$x_j'=0 \rightarrow \phi_j=0$$

- **Consistencia**: La propiedad de coherencia dice que si un modelo cambia de modo que la contribuci√≥n marginal del valor de una caracter√≠stica aumenta o se mantiene igual (independientemente de otras caracter√≠sticas), el valor de Shapley tambi√©n aumenta o se mantiene igual.

En otras palabras:

$$\phi_j(\hat{f¬¥}, x) \geq \phi_j(\hat{f}, x)$$

Si dos modelos $f$ y $f'$ cumple:
$$\hat{f¬¥}_x(z¬¥) - \hat{f¬¥}_x(z_j¬¥) \geq \hat{f}_x(z¬¥) - \hat{f}_x(z_j¬¥)$$

        ‚ùì Pregunta: ¬øUn ejemplo de esto?


<img src="https://gastronomiaycia.republica.com/wp-content/uploads/2021/05/truco_pinzasensalada_tarta2.jpg" width="250">

### Ventajas

- SHAP tiene una s√≥lida base te√≥rica en la teor√≠a de juegos. 
- M√©todo es agn√≥stico al modelo de predicci√≥n
- La predicci√≥n se distribuye equitativamente entre los valores de las caracter√≠sticas. 
- Obtenemos explicaciones contrastivas que comparan la predicci√≥n con la predicci√≥n media.
- SHAP dispone de una aplicaci√≥n r√°pida para modelos basados en √°rboles.
- Su "r√°pida aplicaci√≥n" permite generar explicaciones globales de los modelos.

### Desventajas

- El SHAP kernel tiende a ser lento cuando se tienen muchos datos.
- KernelSHAP ignora la dependencia de las caracter√≠sticas.
- TreeSHAP puede producir atribuciones de caracter√≠sticas poco intuitivas.

### Ejemplo en Python

In [None]:
# pip install shap
import shap

In [None]:
X = df.drop(columns=['user', 'target_value', 'year', 'month'])
y = df['target_value']

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.33, random_state=42, stratify=y)

In [None]:
# Head del conjunto de entrenamiento
X_train.head(5)

In [None]:
# Dimensiones del dataframe
X_train.shape

In [None]:
clf = xgb.XGBClassifier()
clf.fit(X_train, y_train)

In [None]:
preds = clf.predict(X_test)
print(classification_report(preds, y_test))

Comencemos probando la interpretabilidad del modelo construido con los m√©todos que vienen por default:

In [None]:
import xgboost as xgb
import matplotlib.pyplot as plt

# weight: numbero de veces que una feature es usada para dividir la data
xgb.plot_importance(clf, max_num_features=20)
plt.title("Feature Importance con importance_type='weight'")
plt.show()

        ‚ùìPregunta: ¬øQu√© sucede con las importancias?

La importancia de XGBoost (y en general en modelos que utilizan √°rboles) se calcula en funci√≥n del **n√∫mero de veces que se utiliza una caracter√≠stica** para dividir un nodo en un √°rbol de decisi√≥n. Puede ser una medida √∫til de la importancia de una caracter√≠stica para la precisi√≥n global del modelo. Sin embargo, puede **inducir a error** en el caso de caracter√≠sticas con muchos valores posibles, ya que estas caracter√≠sticas pueden utilizarse con m√°s frecuencia simplemente porque **hay m√°s oportunidades de dividirlas**.

        ‚ùìPregunta: ¬øC√≥mo se utiliza shap para calcular la importancia?

Primero comenzamos eligiendo el `explainer`, este debe ser coherente con el problema que estamos resolviendo, para este caso como estamos usando boosting, usamos √°rboles.

Pueden encontrar todos los explainers habilitados por la librer√≠a `shap` en el siguiente [link](https://shap.readthedocs.io/en/latest/api.html#explainers).

In [None]:
explainer = shap.TreeExplainer(clf)
shap_values = explainer(X)

¬øQu√© incluye `shap_values`? - Con el explainer calcularemos los shap para cada uno de las instancias del modelo. 

In [None]:
shap_values


En especifico, si revisamos `shap_values.values`, podemos ver que esta posee la siguiente dimensi√≥n:

In [None]:
# Vemos el valor de la instancia x_1
shap_values.values[1,:].shape

Tendremos un valor para cada una de las features con las que fue entrenado el modelo.

In [None]:
shap_values.values[1,:]

Los valores negativos se√±alan aportes negativos para detectar el target de inter√©s que en este caso es la morosidad de los clientes a tres meses. Por otro lado, los positivos se√±alan variables que entregan un aporte positivo a la detecci√≥n de la label 1 (morosidad a 3 meses).

Veamos ahora los valores base:

In [None]:
shap_values.base_values

In [None]:
shap_values.base_values.shape

> **Pregunta**: ¬øPor qu√© estos valores no pertenecen al intervalo (0, 1)? 

In [None]:
# transformar logits a probabilidad
np.exp(shap_values.base_values) / (1 + np.exp(shap_values.base_values))

Para ver los aportes de las diferentes variables utilizando shap se realiza lo siguiente:

In [None]:
idx = 1

shap.initjs()
shap.force_plot(explainer.expected_value, 
                shap_values.values[idx,:], 
                X.iloc[idx,:],
                link="logit")

Notar que `link="logit"` se encargar√° de entregar una probabilidad en la salida. Por otro lado, de esta forma es mucho m√°s simple visualizar los aportes de cada una de las variables para tomar la decisi√≥n en el output.

Veamos un segundo ejemplo:

In [None]:
idx = 2

shap.initjs()
shap.force_plot(explainer.expected_value, 
                shap_values.values[idx,:], 
                X.iloc[idx,:],
                link="logit")

Una forma m√°s intuitiva de generar este tipo de gr√°ficos es de la siguiente forma:

In [None]:
idx=2
shap.plots.waterfall(shap_values[idx,:], 
                     max_display=14)

In [None]:
idx=23
shap.plots.waterfall(shap_values[idx,:], 
                     max_display=14)

Otra forma de hacer esto es con un batch de datos, para esto realizamos lo siguiente:

In [None]:
explainer.expected_value

In [None]:
batch_size = 10
shap.force_plot(explainer.expected_value, shap_values.values[:batch_size,:], X.iloc[:batch_size,:], link='logit')

Otra forma de hacer esto es realizando un mapa de calor...

In [None]:
shap.plots.heatmap(shap_values[:batch_size])

¬øQue pasa si quiero obtener la interpretabilidad global?

In [None]:
shap.summary_plot(shap_values, X, plot_type="bar")

In [None]:
# Otra forma der ver el plot anterior es la siguiente
shap.summary_plot(shap_values, X)

¬øQu√© pasa si necesitamos obtener las variables m√°s importantes en orden?

In [None]:
# obtenemos los shap values
shap_values_abs = np.mean(np.abs(shap_values.values), axis=0)

# Obtenemos los nombres ordenados de mayor a menor
feature_importance_names = X_train.columns[shap_values_abs.argsort()[::-1]]

In [None]:
# Revisamos las features
feature_importance_names[:20]

Por otra parte, uno de los gr√°ficos m√°s interesantes es plotear la relaci√≥n de los shap v/s las features entrantes del modelo:

In [None]:
for name in feature_importance_names[:4]:
    shap.plots.scatter(shap_values[:,name])

La librer√≠a de `shap` nos habilita una opci√≥n para colorear los puntos usando la feature con mayor interacci√≥n a la feature del plot: 

In [None]:
for name in feature_importance_names[:4]:
    shap.plots.scatter(shap_values[:,name],
                       color = shap_values)

Tenemos un problema con estos gr√°ficos:

- Los valores extremos que presentan impiden visualizar el comportamiento de valores superiores a cero. 
- Adem√°s, tendr√≠amos graficos mas interpretables si pudi√©semos elegir la variable para colorear

Resolvamos lo anterior:

In [None]:
color = clf.predict(X) # predicci√≥n para todo el conjunto de datos

for name in feature_importance_names[:3]:
    #shap.dependence_plot(name, shap_values.values, X)
    shap.plots.scatter(shap_values[:,name], 
                       color=color, # color por etiqueta predicha
                       xmin=0) # se agrega valor minimo = 0 para tener una mejor visualizaci√≥n

### PDP (¬ødenuevo?)

Punto interesante... Shap puede calcular las PDP de las variables üòÉ, o sea... es un reemplazante directo de gran parte de los m√©todos que vimos:

In [None]:
X100 = shap.utils.sample(X, 100)

sample_ind = 20
shap.partial_dependence_plot(
    'balance_avg_3m_avg_trunc', clf.predict, X100, model_expected_value=True,
    feature_expected_value=True, ice=True,
    shap_values=shap_values[sample_ind:sample_ind+1,:],
)