# Explicabilidad

Como vimos durante los ejercicios con distintos modelos de datos, algunos de ellos muestran una estructura interpretable donde podemos entender la base sobre la que ciertas decisiones han sido tomadas. 

En otros casos, esta comprensión no es tan sencilla, de forma que los modelos que no facilitan tanto la interpretabilidad son consideradas **cajas negras**. Dentro de esta categorización los modelos basados en árboles de decision son los llamados **cajas blancas** aunque el empleo de técnicas de ensembling puede hacer que se reduzca significativamente nuestra capacidad de comprensión.

## Relevancia

Nuestros modelos se fijarán en distinta características del conjunto de datos, pero ¿en cuales? Es una pregunta muy relevante y existen multitud de casos donde no habernos hecho esta pregunta a supuesto un problema.

Tenemos casos donde el impacto de un modelo no auditado a tenido impactos penales: https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing

Casos donde el impacto puede aumentar sesgos existentes en la sociedad

![sesgos](../assets/images/sesgo.png)

O casos donde podemos exponer a riesgos a los usuarios de nuestras aplicaciones o que sean sujetos de malas prácticas.

* https://ieeexplore.ieee.org/document/8601309
* https://arxiv.org/abs/1712.09665


## Interpretar

Esencialmente lo que queremos entender ante una decisión tomada por un modelo es en base a qué criterios ha sido esa decisión tomada. Ya que aunque estadísticamente tenga sentido, podría resultar que debido a sesgos de los datos nuestra decisión no sea justa o ética.

### Frameworks

Algunos frameworks populares en este dominio son:

* Shap (https://shap.readthedocs.io/en/latest/index.html)
* InterpretML (https://interpret.ml/)
* Fairlearn (https://fairlearn.org/)

#### Valores Shapley

Los valores Shapley (SHAP) se basan en la teoría de juegos, específicamente en el concepto de valores de Shapley, desarrollado por Lloyd S. Shapley en 1953. Esta teoría se utiliza para asignar un valor de importancia a cada característica (o “jugador”) en un modelo, midiendo su contribución a la predicción global.

![shap](https://christophm.github.io/interpretable-ml-book/images/shapley-instance-intervention.jpg)

* **Coaliciones y agregación** SHAP crea coaliciones de características (conjuntos de jugadores sin repetición) y calcula la contribución de cada característica a la predicción mediante la agregación de valores Shapley. Esto permite evaluar la influencia individual de cada característica en la predicción, considerando su interacción con otras características.

* **Linealidad y aditividad** Los valores SHAP se representan como un método de atribución de características aditiva y lineal. Esto significa que la contribución de cada característica se puede sumar para obtener la contribución total a la predicción. Esta propiedad lineal y aditiva facilita la interpretación de los resultados y la visualización de las explicaciones.

* **Unidad atómica** Los valores SHAP se consideran la “unidad atómica” de las interpretaciones globales. Esto significa que los valores SHAP son la base para las explicaciones locales y globales, permitiendo una comprensión coherente y objetiva de cómo cada característica influye en la predicción.

* **Transferible a modelos no lineales**
Aunque la teoría de juegos se basa en suposiciones lineales, los valores SHAP se pueden aplicar a modelos no lineales, como modelos de árboles o redes neuronales, mediante aproximaciones y optimizaciones. Esto permite extender la explicabilidad a un amplio rango de modelos de machine learning.

Incluso podemos usar estos valores para entender qué partes de una imagen influyeron en la decisión de una [red neuronal convolucional](https://shap.readthedocs.io/en/latest/example_notebooks/image_examples/image_classification/Explain%20ResNet50%20using%20the%20Partition%20explainer.html#Visualizing-SHAP-values-output).

Es importante porque esto nos ayuda a entender las decisiones de nuestro modelo. Dado un modelo que muestre las siguientes métricas

![perrolobo](../assets/images/perrolobo.png)

qué decís que diría ante un nuevo caso como este?

![corgi](../assets/images/corgi.png)

La respuesta la tenéis aquí: https://arxiv.org/pdf/1602.04938 

Tenéis mucho más detalle en la siguiente página: https://christophm.github.io/interpretable-ml-book