[![Abrir en Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ManuelEspejo/Machine-Learning-Bases/blob/main/notebooks/03_Aprendizaje-Por-Refuerzo.ipynb) 👈🏻​ **Pulsar para abrir en Colab​**

# ¿Cómo usar estos notebooks?

Si este es el primer notebook que abres en este repositorio, te recomiendo que antes leas el [Manual de uso de estos notebooks](https://github.com/ManuelEspejo/Machine-Learning-Bases/blob/main/docs/manual-notebooks.md) que he creado para que te familiarices con el proyecto y las distintas rutas que puedes seguir, luego puedes volver aquí y continuar.

En este notebook, vamos a profundizar en la **interpretabilidad de los modelos de IA**.

Por otra parte, si aún no has revisado el notebook "[00_Empieza-aquí.ipynb](https://github.com/ManuelEspejo/Machine-Learning-Bases/blob/main/notebooks/00_Empieza-aquí.ipynb)", te sugiero que le eches un vistazo primero para conocer los conceptos básicos. Pero si ya tienes una idea clara de los conceptos básicos y quieres pasar a la práctica, ¡estás en el lugar correcto!

# 04. Interpretabilidad de los Modelos

Cuando entrenamos modelos de Machine Learning, uno de los mayores desafíos no es solo que el modelo funcione bien, sino entender **cómo** y **por qué** toma sus decisiones. Este es el corazón de la interpretabilidad: poder responder a preguntas como *"¿por qué este modelo rechazó mi préstamo?"* o *"¿por qué dice que este tumor es maligno?"*.

## ¿Por qué es importante?

La interpretabilidad de los modelos no es solo un tema técnico, es una cuestión de confianza, responsabilidad y toma de decisiones éticas. Aquí te dejo tres razones principales por las que es crucial:

1. **Confianza en el modelo:** Si no entiendes cómo funciona un modelo, ¿cómo puedes confiar en él? Esto es especialmente importante en áreas críticas como la salud, las finanzas y la justicia, donde las decisiones tienen un impacto directo en la vida de las personas.

2. **Cumplimiento de normativas:** Cada vez más regulaciones exigen que los modelos de IA sean explicables, como el [GDPR en Europa](https://gdpr-info.eu/), que establece el "derecho a explicación" para decisiones automatizadas.

> **Recursos:** Si quieres saber más sobre el GDPR, te recomiendo explorar este [GPT personalizado](https://chatgpt.com/g/g-JvCAAqPCj-gdpr-expert), está muy bien construido.

3. **Impacto social y ético:** Un modelo opaco puede amplificar sesgos y tomar decisiones injustas. Por ejemplo, si un modelo de contratación favorece a un grupo sobre otro sin una justificación clara, estaríamos perpetuando desigualdades.

En resumen, la interpretabilidad no es solo un *"nice to have"*, es una necesidad fundamental en cualquier aplicación de IA que impacte el mundo real.


## ¿Qué vamos a ver?

En este notebook, nos sumergiremos en el fascinante mundo de la interpretabilidad y exploraremos cómo podemos explicar y justificar las decisiones de dos tipos de modelos muy diferentes: un **árbol de decisión** y una **red neuronal**.

Al final de este notebook, habrás aprendido:

- **Qué es la interpretabilidad y por qué importa**, con ejemplos del mundo real.  
- **Cómo entrenar y visualizar un árbol de decisión,** uno de los modelos más intuitivos.  
- **Cómo trabajar con redes neuronales y explorar su interpretabilidad,** utilizando herramientas como SHAP.  
- **La comparación entre ambos enfoques,** destacando los pros y los contras de cada uno.

La meta no es solo entender qué modelo funciona mejor, sino también aprender a tomar decisiones informadas sobre cuándo priorizar la interpretabilidad frente a la precisión.

**¿Listo para desentrañar las decisiones de tus modelos y convertirte en un maestro de la interpretabilidad?**

**¡Vamos allá! 🚀**

# Índice de Contenidos

```
1. Fundamentos de la Interpretabilidad
   1.1. Componentes clave de la interpretabilidad  
       1.1.1. Comprensibilidad  
       1.1.2. Trazabilidad  
       1.1.3. Generalización y robustez  
   1.2. Dimensiones de la interpretabilidad  
       1.2.1. Modelos intrínsecamente interpretables  
       1.2.2. Interpretabilidad post-hoc  
   1.3. Tradeoff: Interpretabilidad vs. Complejidad  
2. Árboles de decisión: Explorando un modelo interpretable (Ejercicio práctico)
   2.1. Carga y exploración del dataset (Breast Cancer Wisconsin)
   2.2. Entrenamiento del árbol de decisión
      2.2.1. Configuración y ajuste de hyperparámetros
      2.2.2. Visualización y análisis del árbol
   2.3. Análisis de la importancia de features
      2.3.1. Identificando las reglas clave
      2.3.2. Interpretación de decisiones específicas
3. Redes neuronales: Desentrañando la "caja negra" (Ejercicio práctico)
   3.1. Construcción y entrenamiento de una red neuronal simple
   3.2. Métodos para interpretar redes neuronales
      3.2.1. Uso de SHAP para analizar la importancia de features
      3.2.2. Visualización de resultados y comparación con el árbol de decisión
4. Comparativa entre modelos: Árboles de decisión vs. Redes neuronales
   4.1. Precisión vs. Interpretabilidad
   4.2. Ventajas y limitaciones de cada enfoque
5. Conclusión
   5.1. Reflexión sobre el tradeoff entre interpretabilidad y precisión
   5.2. El futuro de la interpretabilidad en modelos avanzados
```

In [None]:
import os
import sys

# Configuraciones
# Detectar si estamos en Colab
in_colab = 'google.colab' in str(get_ipython())

if in_colab:
    # Descargar el archivo visualizations.py desde el repositorio de GitHub
    !mkdir -p /content/utils # Creamos una carpeta utils para que coincida con la estructura del repositorio
    !wget -O utils/visualizations.py "https://raw.githubusercontent.com/ManuelEspejo/Machine-Learning-Bases/main/utils/visualizations.py"
    data_dir = '/content/data' # Ruta de los datos
else:
    # Agregar el directorio raíz al path de Python (Para ejecutar en local)
    notebook_dir = os.path.dirname(os.path.abspath('__file__'))
    project_dir = os.path.dirname(notebook_dir)
    sys.path.append(project_dir)
    data_dir = '../data/raw'

In [None]:
# Importar las librerías necesarias


# 1. Fundamentos de la Interpretabilidad

La interpretabilidad no es solo un tema técnico; es lo que conecta a las personas con los modelos. Es como tener un traductor entre el mundo de las matemáticas y el mundo real. Aquí exploraremos los pilares que hacen que un modelo sea interpretable y, lo más importante, entendible.

## 1.1. Componentes clave de la interpretabilidad

### 1.1.1. Comprensibilidad

La facilidad con la que un humano puede entender el funcionamiento interno de un modelo. Por ejemplo, un árbol de decisión es claro porque sigue una lógica "si esto, entonces aquello".

### 1.1.2. Trazabilidad

La capacidad de descomponer una predicción en sus partes para entender qué factores influyeron más. Es como seguir las huellas en la escena de un crímen para reconstruir lo que sucedió.

Por ejemplo, en un modelo médico que predice si un tumor es maligno, queremos saber: ¿Fue el tamaño del tumor? ¿Su forma? ¿La edad del paciente? ¿Todas las características?

Sin trazabilidad, usamos modelos ciegamente. No podemos aceptar un diagnóstico médico sin saber en qué se basó. Aplicar un modelo así puede sonar extremo, pero es la realidad en muchos sistemas de IA actuales, se usan modelos que no sabemos cómo funcionan mucho más frecuentemente de lo que podrías imaginar.

### 1.1.3. Generalización y robustez

Una buena interpretabilidad no solo implica entender un modelo, sino también confiar en que su lógica se mantiene consistente ante nuevas situaciones.

El mundo no es estático, por lo que no queremos un modelo que sólo de buenos resultados en lo que ya ha visto, sino que sea capaz de aplicar su lógica a nuevas situaciones de manera efectiva y sin errores o fallos críticos.

Un modelo robusto debe ser consistente: Si sus decisiones se vuelven erráticas cuando los datos cambian ligeramente, la interpretabilidad pierde su valor.

En definitiva, queremos un modelo que sea capaz de salir de su "zona de confort" y adaptarse a lo que le venga.

## 1.2. Dimensiones de la interpretabilidad

### 1.2.1. Modelo intrínsecamente interpretables

Algunos modelos, como los árboles de decisión y las regresiones lineales, son interpretables por diseño. Su estructura lógica y directa hace que puedas explicarlos como si estuvieras contando una historia.

Te pongo un ejemplo: "Si el paciente tiene más de 50 años y su presión arterial es alta, hay un 80% de probabilidades de que tenga riesgo cardiovascular." Como ves, dos factores que influyen directamente en la variable a predecir.

El problema es que estos modelos a menudo no capturan toda la complejidad de los datos. Son buenos para hacerse una idea de la situación, pero pueden pasar por alto cosas importantes.

### 1.2.2. Interpretabilidad post-hoc

Aquí entran en juego herramientas como `SHAP` o `LIME`. Estas nos sirven para inspeccionar modelos más complejos y entender qué está pasando dentro. Por ejemplo, SHAP te dirá cuánto influyó cada feature en una predicción específica.

Esto sería como tener un panel de control para una máquina compleja. No entiendes todo el sistema, pero las herramientas te permiten ver qué está fallando o funcionando bien.


## 1.3. Tradeoff: Interpretabilidad vs. Complejidad

La vida es un constante balance entre simplicidad y detalle, y lo mismo ocurre con los modelos de Machine Learning. A menudo, enfrentamos el dilema de elegir entre un modelo simple y entendible o uno complejo y más potente y preciso.

Y, como habrás imaginado, no hay una respuesta o una regla que podamos aplicar a todos los casos: dependerá de la situación.

La clave está en decidir qué es más importante según el contexto. En medicina o justicia, probablemente prefieras un modelo más interpretable, incluso si pierdes algo de precisión. En cambio, en aplicaciones como recomendaciones de películas, podrías priorizar la precisión, porque no pasa nada si el modelo falla, de hecho, incluso puede ser divertido y enseñarte cosas que no sabías que te gustaban.

En definitiva, la interpretabilidad no es una meta en sí misma, sino un medio para llegar a decisiones más informadas y conscientes.

# 2. Árboles de decisión: Explorando un modelo interpretable (Ejercicio práctico)