### Model Interpretability

> - Explian why machine learning interpretability is important
> - Differentiate between self-interpretable and non-self-interpratable types of models. 

### Importance of model interpretability

![image.png](attachment:image.png)

### Understanding machine learning models 

![image-2.png](attachment:image-2.png)

### Model interpretability 

![image-3.png](attachment:image-3.png)

---

### Examples of self-interpretable and non-self-interpretable models

> - List typical models with different interpretabilities
> - Describe the two main types of model interpretation methods.

### Self-interpretable: Linear models

![image-4.png](attachment:image-4.png)

### Self-interpretable: Tree models 

![image-5.png](attachment:image-5.png)

### Self-interpretable: K-nearest neighbor

![image-6.png](attachment:image-6.png)

---

### non-self-interpratable: ensamble models

![image-7.png](attachment:image-7.png)

### Model interpretation methods 

![image-8.png](attachment:image-8.png)

---
Los modelos autointerpretativos son aquellos que son fáciles de entender y explicar, como los modelos lineales, los modelos de árbol y el modelo de vecinos más cercanos. Estos modelos tienen una estructura simple y se basan en reglas lógicas que podemos entender fácilmente.

Por ejemplo, si queremos predecir el precio de una casa, podemos usar un modelo lineal que tenga en cuenta características como el número de habitaciones y la clasificación de la escuela asociada. Estas características tienen una relación directa con el precio de la casa, por lo que podemos entender cómo el modelo llega a su predicción.

Por otro lado, los modelos no autointerpretativos son más complejos y difíciles de entender. Estos modelos, como el bosque aleatorio, las máquinas de vectores de soporte no lineales y las redes neuronales profundas, están compuestos por múltiples componentes y su proceso de toma de decisiones es más opaco.

En resumen, los modelos autointerpretativos son más fáciles de entender porque se basan en reglas lógicas simples, mientras que los modelos no autointerpretativos son más complejos y requieren más esfuerzo para explicar y comprender.

---

### Model - Agnostic Explanations 

> - Describe what model-agnostic explanation methods are
> - Identify the main features of a model by applying permutation feature importance
> - Indentify how specific features outcomes using a partial dependency plot

### Model-agnostic explanations 

![image-9.png](attachment:image-9.png)

### Predicting if employees are looking for a new job

![image-10.png](attachment:image-10.png)

### Feature importance

- Measure the importance of features
    1. Simplify your model by only including important features
    2. Interpret how predictions were made
- Permutation feature importnace
- Impurity-based feature importance 
- Shapley additive explanations (shap) values

### Permutation feature importance 

- Measure the increases of prediction error by permuting / shuffling a feature

![image-11.png](attachment:image-11.png)

![image-12.png](attachment:image-12.png)

### Permutation feature importance example 

![image-13.png](attachment:image-13.png)

### Partial dependency plot PDP

- shows the relationship (marginal effects) of interested features on the preditiction outcome 

![image-14.png](attachment:image-14.png)

![image-15.png](attachment:image-15.png)

### PDP of feature 'experience'

![image-16.png](attachment:image-16.png)

### Recap
- You can use model-agnostic explanation methods to understand different models, regardless of their structures
- You can use Permutation Feature Importance to calculate and rank feature importance
- You can illustrate the relationship between an interested feature and model outcome using a partial dependency plot (PDP)
---
Estos métodos nos permiten entender diferentes modelos de aprendizaje automático, sin importar su estructura.

Imagina que hemos construido un modelo de clasificación complejo para predecir si un empleado está buscando un nuevo trabajo. Este modelo utiliza diferentes características de los perfiles de los empleados, como el índice de desarrollo de la ciudad, el tamaño y tipo de la empresa, la educación y la experiencia, entre otros.

Una forma común de explicar un modelo de aprendizaje automático es identificando las características más importantes. Esto nos ayuda a simplificar el modelo y a entender cómo toma decisiones. Para medir la importancia de una característica, podemos usar el método de importancia de características por permutación.

Este método consiste en mezclar los valores de una característica y observar cómo afecta a las predicciones del modelo. Si una característica es importante, al mezclar sus valores se generarán errores de predicción más grandes. Podemos calcular la importancia de cada característica y visualizarla en gráficos de barras o diagramas de caja.

Además, podemos usar el gráfico de dependencia parcial para entender la relación entre una característica y el resultado del modelo. Este gráfico muestra cómo cambia el resultado del modelo cuando modificamos una característica específica, manteniendo las demás características constantes.

En resumen, los métodos de explicación agnósticos al modelo nos permiten entender diferentes modelos de aprendizaje automático y sus características más importantes. Podemos usar la importancia de características por permutación para medir la importancia de cada característica y el gráfico de dependencia parcial para visualizar la relación entre una característica y el resultado del modelo.

---

### Surrogate Models 

> - Explain  the term global surrogate model
> - Explain the steps involved in building global surrogate models
> - Describe how LIMEs make predictions given specific variable instances 

### Surrogate models 

![image-17.png](attachment:image-17.png)

### Global surrogate models 

![image-18.png](attachment:image-18.png)

### Local Surrogate 
- Global surrogate models may not always work
    - Large inconsistency between surrogate models and black-blox models
    - Multiple data instance groups or clusters in the dataset

- Explain specific interested data instances locally
- A local surrogate model is built on one or a few instances. 

### Local Interpretable Model-Agnostic Explanations (LIME)

![image-19.png](attachment:image-19.png)

### A line Example 

![image-20.png](attachment:image-20.png)

### Recap

- A surrogate model is a way of explaining complex black-box models using simpler models
- The general steps to build global surrogate models are straighforward
- You can build local surrogate models using the LIME algorithm

---

Imagina que tienes un modelo de aprendizaje automático muy complejo que es difícil de entender. Este modelo se conoce como un modelo de caja negra, porque no sabemos cómo se relacionan las entradas con las salidas. Ahora, para poder entender este modelo, podemos construir un modelo más simple que se aproxime a él. A este modelo más simple se le llama modelo sustituto.

El proceso para construir un modelo sustituto global es el siguiente: primero seleccionamos un conjunto de datos de entrada y usamos el modelo de caja negra para hacer predicciones con esos datos. Luego, utilizamos esos datos y las predicciones para entrenar un modelo sustituto más simple, como un modelo lineal o un modelo de árbol. Este modelo sustituto nos dará sus propias predicciones. Si las predicciones del modelo sustituto son similares a las del modelo de caja negra, podemos interpretar el modelo sustituto en lugar del modelo original.

Por otro lado, también podemos construir un modelo sustituto local utilizando solo uno o unos pocos ejemplos de datos. Esto nos permite entender cómo el modelo de caja negra hace predicciones en casos específicos. Para construir este modelo sustituto local, generamos un conjunto de datos artificiales basado en el ejemplo seleccionado y luego lo utilizamos para entrenar un modelo sustituto. Al analizar este modelo sustituto local, podemos explicar cómo el modelo de caja negra hace predicciones en ese ejemplo en particular.

---