![](images/DataDay-logo.png)
<br>

## Interpretabilidad en modelos de aprendizaje de máquina

+ M.Sc. Liliana Millán, liliana@datank.ai
+ Twitter: @silil3


[https://sg.com.mx/dataday](https://sg.com.mx/dataday) \#DataDayMx


## Agenda

+ Interpretabilidad
+ Interpretabilidad en ML
+ LIME
+ Casos de uso
+ Ejemplo
+ Otros métodos

### Interpretabilidad

+ Interpretabilidad: El grado en el que un **humano** puede entender la causa de una decisión.
+ Nos permite identificar y evitar tener sesgo, injusticia, inequidad en los modelos que generamos.

**Ejemplos:** 

+ COMPAS (US): Predecir si alguien reincidirá en cometer un delito.
+ PredPol (US): Predecir cuándo y en dónde habrá un crimen. El algoritmo aprende de reportes de policias, no necesariamente crímenes cometidos.
+ *Facial Recognition* (IBM, Microsoft, Megvii): Reconocimiento para hombres blancos 99%, mujeres afroamericanas 35% ...
+ Búsqueda de imágenes en Google para CEO: Solo muestra a mujeres 11%.
+ *Facebook automatic translation:* Arresto de un palestino por traducción incorrecta de "buenos días" en hebreo a "atácalos".

### Algo más personal

... 19S

Tener interpretabilidad en el modelo nos brinda más confianza en que lo estamos haciendo correctamente -además de las métricas de desempeño-.



### Interpretabilidad en ML

+ GDPR: *"Right to explanation"* (Mayo 2018).
+ Aplicable a modelos de aprendizaje supervisado.
+ El chisme: es ilegal ocupar *Deep Learning* en Europa.
+ Preferimos ocupar Regresión lineal, logística, árboles porque nos permiten entender por qué se están tomando esas decisiones.
+ *Why should I trust you?* (2016).

### LIME

*Local Interpertable Model-Agnostic Explanation*

**Objetivo:** Tener explicaciones que un humano pueda comprender de cualquier modelo (supervisado) a través de un modelo local más simple.

**Suposición:** Un modelo complejo es lineal en una escala local.

+ *Model Agnostic:* Tratamos al modelo "complejo" utilizado como una caja negra a la que metemos observaciones y nos entrega predicciones.
+ *Interpretable:* Que la explicación pueda ser entendida por un humano.
+ *Local:* Un modelo simple es lo suficientemente bueno/igual de bueno localmente que uno complejo globalmente ([Why should I trust you?](https://arxiv.org/pdf/1602.04938.pdf))

### LIME 

![](images/lime.png)
<br>
Fuente: [Why should I trust you?](https://arxiv.org/pdf/1602.04938.pdf)

### ¿Cómo funciona?

    
Ingeniería inversa: Modificamos las entradas, las pasamos por la "caja negra", observamos los resultados.

![](images/frog_lime.png)
<br>
Fuente: [Local Interpretable Model-Agnostic Explanations (LIME): An Introduction](https://www.oreilly.com/learning/introduction-to-local-interpretable-model-agnostic-explanations-lime)

### ¿Cómo funciona?

![](images/huskie_lime.png)
<br>
[Why should I trust you?](https://arxiv.org/pdf/1602.04938.pdf)

### ¿Cómo funciona?

![](images/lime_explanation.png)

### ¿Cómo funciona?

+ Vecindad
+ Similitud
+ Selección de variables

### Beneficios

+ Identificar si podemos confiar en las predicciones de un modelo como científico de datos.
+ Generar confianza al usuario sobre las predicciones que genera un modelo.
+ Brindar información para identificar si hay sesgo/inequidad/injusticia en nuestro modelo.
+ LIME se puede ocupar en R y Python :).

### Desventajas

+ Definir la vecindad adecuada para generar el modelo lineal.
+ Para junio 2018 solo era posible ocupar regresión lineal (ridge) como modelo simple.

### Casos de Uso

+ Validación de desempeño entre diferentes modelos.
+ Interpretabilidad en modelos complejos: SVM, RF, Redes Neuronales: Clásicas, Profundas, Convolucionales, Recurrentes, etc.
+ Brindarle una explicación al usuario/afectado final.
+ El algoritmo de aprendizaje tiene que ser supervisado.
+ Los datos pueden ser tabulares, imágenes o texto.

### Ejemplo 

Una microfinanciera necesita un modelo de machine learning que le permita establecer el nivel óptimo de crédito que cada uno de sus clientes debe tener:

+ Minimizando el riesgo de caer en mora.
+ Maximizando la oportunidad de ocupar la mayoría de su crédito.

El modelo puede emitir 1 de 3 posibles recomendaciones: **aumentar**, **disminuir** o dejar su nivel de crédito **igual**.

### Ejemplo 

+ Opción aumentar: sin problema para el cliente.
+ Opción dejar igual: sin problema para el cliente.
+ Opción disminuir: altamente probable que el cliente **exiga** una explicación.

In [3]:
explainer_rf = lime_tabular.LimeTabularExplainer(
    training_data=train_data_selected.values, #el set de entrenamiento con el que se entreno el rf
    mode="classification",
    feature_names=feature_names, #nombre de las variables, en el orden que se envian
    class_names=class_names,#el nombre de las etiquetas de clasificación
    kernel_width=0.75) #el tamaño de la ventana para generar datos (mientras más pequeño más cercano a los valores reales)
                                                
#single prediction
sp = explainer_rf.explain_instance(test_obs_1, modelo_lco.predict_proba, num_features=10)
#sp.show_in_notebook(show_table=True, show_all=False)

![](images/explanation_1.png)

In [5]:
sp_2 = explainer_rf.explain_instance(test_obs_2, modelo_lco.predict_proba, num_features=10)
#sp_2.show_in_notebook(show_table=True, show_all=False)

![](images/explanation_2.png)

### Ejemplo 

+ LIME nos permite tener interpretabilidad por observación
+ Tenemos alrededor de 5k observaciones a aplicar un modelo local
+ Se necesita hacer un *pipeline* para correr esos modelos en paralelo

![](images/user_explanation.png)

### Otros métodos para interpretar

+ [*Partial Dependence Plot* (PDP)](https://christophm.github.io/interpretable-ml-book/agnostic.html). Efecto marginal de una o dos variables en la predicción.
+ [*Shapley Values*](https://christophm.github.io/interpretable-ml-book/agnostic.html). *Cooperative Game Theory*. Asignar una recompensa a un jugador dependiendo de su contribución.
+ [*Accumulated Local Effects* (ALE)](https://christophm.github.io/interpretable-ml-book/agnostic.html). Cómo las variables influyen la predicción en promedio.

### Algunos consejos 

+ Trata cada modelo que desarrollas como una afectación de vida o muerte a un humano directamente.
+ Identifica si estas agregando sesgo, inequidad, injusticia con interpretabilidad.
+ Siempre que tengas un modelo de aprendizaje supervisado ocupa interpretabilidad en tu proceso de desarrollo.
+ Siempre que tengas un modelo de aprendizaje supervisado genera interpretabilidad para el usuario final.


### ¿Preguntas?

+ M.Sc. Liliana Millán, liliana@datank.ai
+ Twitter: @silil3


### Referencias

+ [LIME](https://github.com/marcotcr/lime)
+ [Why should I trust you?](https://arxiv.org/pdf/1602.04938.pdf)
+ [Interpretable Machine Learning](https://christophm.github.io/interpretable-ml-book)