[![Abrir en Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ManuelEspejo/Machine-Learning-Bases/blob/main/notebooks/03_Aprendizaje-Por-Refuerzo.ipynb) üëàüèª‚Äã **Pulsar para abrir en Colab‚Äã**

# ¬øC√≥mo usar estos notebooks?

Si este es el primer notebook que abres en este repositorio, te recomiendo que antes leas el [Manual de uso de estos notebooks](https://github.com/ManuelEspejo/Machine-Learning-Bases/blob/main/docs/manual-notebooks.md) que he creado para que te familiarices con el proyecto y las distintas rutas que puedes seguir, luego puedes volver aqu√≠ y continuar.

En este notebook, vamos a profundizar en la **interpretabilidad de los modelos de IA**.

Por otra parte, si a√∫n no has revisado el notebook "[00_Empieza-aqu√≠.ipynb](https://github.com/ManuelEspejo/Machine-Learning-Bases/blob/main/notebooks/00_Empieza-aqu√≠.ipynb)", te sugiero que le eches un vistazo primero para conocer los conceptos b√°sicos. Pero si ya tienes una idea clara de los conceptos b√°sicos y quieres pasar a la pr√°ctica, ¬°est√°s en el lugar correcto!

# 04. Interpretabilidad de los Modelos

Cuando entrenamos modelos de Machine Learning, uno de los mayores desaf√≠os no es solo que el modelo funcione bien, sino entender **c√≥mo** y **por qu√©** toma sus decisiones. Este es el coraz√≥n de la interpretabilidad: poder responder a preguntas como *"¬øpor qu√© este modelo rechaz√≥ mi pr√©stamo?"* o *"¬øpor qu√© dice que este tumor es maligno?"*.

## ¬øPor qu√© es importante?

La interpretabilidad de los modelos no es solo un tema t√©cnico, es una cuesti√≥n de confianza, responsabilidad y toma de decisiones √©ticas. Aqu√≠ te dejo tres razones principales por las que es crucial:

1. **Confianza en el modelo:** Si no entiendes c√≥mo funciona un modelo, ¬øc√≥mo puedes confiar en √©l? Esto es especialmente importante en √°reas cr√≠ticas como la salud, las finanzas y la justicia, donde las decisiones tienen un impacto directo en la vida de las personas.

2. **Cumplimiento de normativas:** Cada vez m√°s regulaciones exigen que los modelos de IA sean explicables, como el [GDPR en Europa](https://gdpr-info.eu/), que establece el "derecho a explicaci√≥n" para decisiones automatizadas.

> **Recursos:** Si quieres saber m√°s sobre el GDPR, te recomiendo explorar este [GPT personalizado](https://chatgpt.com/g/g-JvCAAqPCj-gdpr-expert), est√° muy bien construido.

3. **Impacto social y √©tico:** Un modelo opaco puede amplificar sesgos y tomar decisiones injustas. Por ejemplo, si un modelo de contrataci√≥n favorece a un grupo sobre otro sin una justificaci√≥n clara, estar√≠amos perpetuando desigualdades.

En resumen, la interpretabilidad no es solo un *"nice to have"*, es una necesidad fundamental en cualquier aplicaci√≥n de IA que impacte el mundo real.


## ¬øQu√© vamos a ver?

En este notebook, nos sumergiremos en el fascinante mundo de la interpretabilidad y exploraremos c√≥mo podemos explicar y justificar las decisiones de dos tipos de modelos muy diferentes: un **√°rbol de decisi√≥n** y una **red neuronal**.

Al final de este notebook, habr√°s aprendido:

- **Qu√© es la interpretabilidad y por qu√© importa**, con ejemplos del mundo real.  
- **C√≥mo entrenar y visualizar un √°rbol de decisi√≥n,** uno de los modelos m√°s intuitivos.  
- **C√≥mo trabajar con redes neuronales y explorar su interpretabilidad,** utilizando herramientas como SHAP.  
- **La comparaci√≥n entre ambos enfoques,** destacando los pros y los contras de cada uno.

La meta no es solo entender qu√© modelo funciona mejor, sino tambi√©n aprender a tomar decisiones informadas sobre cu√°ndo priorizar la interpretabilidad frente a la precisi√≥n.

**¬øListo para desentra√±ar las decisiones de tus modelos y convertirte en un maestro de la interpretabilidad?**

**¬°Vamos all√°! üöÄ**

# √çndice de Contenidos

```
1. Fundamentos de la Interpretabilidad
   1.1. Componentes clave de la interpretabilidad  
       1.1.1. Comprensibilidad  
       1.1.2. Trazabilidad  
       1.1.3. Generalizaci√≥n y robustez  
   1.2. Dimensiones de la interpretabilidad  
       1.2.1. Modelos intr√≠nsecamente interpretables  
       1.2.2. Interpretabilidad post-hoc  
   1.3. Tradeoff: Interpretabilidad vs. Complejidad  
2. √Årboles de decisi√≥n: Explorando un modelo interpretable (Ejercicio pr√°ctico)
   2.1. Carga y exploraci√≥n del dataset (Breast Cancer Wisconsin)
   2.2. Entrenamiento del √°rbol de decisi√≥n
      2.2.1. Configuraci√≥n y ajuste de hyperpar√°metros
      2.2.2. Visualizaci√≥n y an√°lisis del √°rbol
   2.3. An√°lisis de la importancia de features
      2.3.1. Identificando las reglas clave
      2.3.2. Interpretaci√≥n de decisiones espec√≠ficas
3. Redes neuronales: Desentra√±ando la "caja negra" (Ejercicio pr√°ctico)
   3.1. Construcci√≥n y entrenamiento de una red neuronal simple
   3.2. M√©todos para interpretar redes neuronales
      3.2.1. Uso de SHAP para analizar la importancia de features
      3.2.2. Visualizaci√≥n de resultados y comparaci√≥n con el √°rbol de decisi√≥n
4. Comparativa entre modelos: √Årboles de decisi√≥n vs. Redes neuronales
   4.1. Precisi√≥n vs. Interpretabilidad
   4.2. Ventajas y limitaciones de cada enfoque
5. Conclusi√≥n
   5.1. Reflexi√≥n sobre el tradeoff entre interpretabilidad y precisi√≥n
   5.2. El futuro de la interpretabilidad en modelos avanzados
```

In [2]:
import os
import sys

# Configuraciones
# Detectar si estamos en Colab
in_colab = 'google.colab' in str(get_ipython())

if in_colab:
    # Descargar el archivo visualizations.py desde el repositorio de GitHub
    !mkdir -p /content/utils # Creamos una carpeta utils para que coincida con la estructura del repositorio
    !wget -O utils/visualizations.py "https://raw.githubusercontent.com/ManuelEspejo/Machine-Learning-Bases/main/utils/visualizations.py"
    data_dir = '/content/data' # Ruta de los datos
else:
    # Agregar el directorio ra√≠z al path de Python (Para ejecutar en local)
    notebook_dir = os.path.dirname(os.path.abspath('__file__'))
    project_dir = os.path.dirname(notebook_dir)
    sys.path.append(project_dir)
    data_dir = '../data/raw'

In [3]:
# Importar las librer√≠as necesarias
import pandas as pd
from sklearn.datasets import load_breast_cancer

# 1. Fundamentos de la Interpretabilidad

La interpretabilidad no es solo un tema t√©cnico; es lo que conecta a las personas con los modelos. Es como tener un traductor entre el mundo de las matem√°ticas y el mundo real. Aqu√≠ exploraremos los pilares que hacen que un modelo sea interpretable y, lo m√°s importante, entendible.

## 1.1. Componentes clave de la interpretabilidad

### 1.1.1. Comprensibilidad

La facilidad con la que un humano puede entender el funcionamiento interno de un modelo. Por ejemplo, un √°rbol de decisi√≥n es claro porque sigue una l√≥gica "si esto, entonces aquello".

### 1.1.2. Trazabilidad

La capacidad de descomponer una predicci√≥n en sus partes para entender qu√© factores influyeron m√°s. Es como seguir las huellas en la escena de un cr√≠men para reconstruir lo que sucedi√≥.

Por ejemplo, en un modelo m√©dico que predice si un tumor es maligno, queremos saber: ¬øFue el tama√±o del tumor? ¬øSu forma? ¬øLa edad del paciente? ¬øTodas las caracter√≠sticas?

Sin trazabilidad, usamos modelos ciegamente. No podemos aceptar un diagn√≥stico m√©dico sin saber en qu√© se bas√≥. Aplicar un modelo as√≠ puede sonar extremo, pero es la realidad en muchos sistemas de IA actuales, se usan modelos que no sabemos c√≥mo funcionan mucho m√°s frecuentemente de lo que podr√≠as imaginar.

### 1.1.3. Generalizaci√≥n y robustez

Una buena interpretabilidad no solo implica entender un modelo, sino tambi√©n confiar en que su l√≥gica se mantiene consistente ante nuevas situaciones.

El mundo no es est√°tico, por lo que no queremos un modelo que s√≥lo de buenos resultados en lo que ya ha visto, sino que sea capaz de aplicar su l√≥gica a nuevas situaciones de manera efectiva y sin errores o fallos cr√≠ticos.

Un modelo robusto debe ser consistente: Si sus decisiones se vuelven err√°ticas cuando los datos cambian ligeramente, la interpretabilidad pierde su valor.

En definitiva, queremos un modelo que sea capaz de salir de su "zona de confort" y adaptarse a lo que le venga.

## 1.2. Dimensiones de la interpretabilidad

### 1.2.1. Modelo intr√≠nsecamente interpretables

Algunos modelos, como los √°rboles de decisi√≥n y las regresiones lineales, son interpretables por dise√±o. Su estructura l√≥gica y directa hace que puedas explicarlos como si estuvieras contando una historia.

Te pongo un ejemplo: "Si el paciente tiene m√°s de 50 a√±os y su presi√≥n arterial es alta, hay un 80% de probabilidades de que tenga riesgo cardiovascular." Como ves, dos factores que influyen directamente en la variable a predecir.

El problema es que estos modelos a menudo no capturan toda la complejidad de los datos. Son buenos para hacerse una idea de la situaci√≥n, pero pueden pasar por alto cosas importantes.

### 1.2.2. Interpretabilidad post-hoc

Aqu√≠ entran en juego herramientas como `SHAP` o `LIME`. Estas nos sirven para inspeccionar modelos m√°s complejos y entender qu√© est√° pasando dentro. Por ejemplo, SHAP te dir√° cu√°nto influy√≥ cada feature en una predicci√≥n espec√≠fica.

Esto ser√≠a como tener un panel de control para una m√°quina compleja. No entiendes todo el sistema, pero las herramientas te permiten ver qu√© est√° fallando o funcionando bien.


## 1.3. Tradeoff: Interpretabilidad vs. Complejidad

La vida es un constante balance entre simplicidad y detalle, y lo mismo ocurre con los modelos de Machine Learning. A menudo, enfrentamos el dilema de elegir entre un modelo simple y entendible o uno complejo y m√°s potente y preciso.

Y, como habr√°s imaginado, no hay una respuesta o una regla que podamos aplicar a todos los casos: depender√° de la situaci√≥n.

La clave est√° en decidir qu√© es m√°s importante seg√∫n el contexto. En medicina o justicia, probablemente prefieras un modelo m√°s interpretable, incluso si pierdes algo de precisi√≥n. En cambio, en aplicaciones como recomendaciones de pel√≠culas, podr√≠as priorizar la precisi√≥n, porque no pasa nada si el modelo falla, de hecho, incluso puede ser divertido y ense√±arte cosas que no sab√≠as que te gustaban.

En definitiva, la interpretabilidad no es una meta en s√≠ misma, sino un medio para llegar a decisiones m√°s informadas y conscientes.

# 2. √Årboles de decisi√≥n: Explorando un modelo interpretable (Ejercicio pr√°ctico)

Los √°rboles de decisi√≥n son un excelente punto de partida para entender la interpretabilidad en Machine Learning. Son simples, visuales y f√°ciles de explicar: como un diagrama de flujo que gu√≠a cada decisi√≥n bas√°ndose en reglas claras. Si quieres explicar c√≥mo tu modelo lleg√≥ a una conclusi√≥n, un √°rbol de decisi√≥n te lo muestra de forma directa.

Estos √°rboles nos permiten:
1. Seguir cada decisi√≥n paso a paso.
2. Justificar las decisiones de manera clara y sencilla.
3. Son una base ideal para comparar con otros modelos m√°s complejos, como las redes neuronales.

## 2.1. Carga y exploraci√≥n del dataset (Breast Cancer Wisconsin)

Para comenzar, trabajaremos con el [Breast Cancer Wisconsin Dataset](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html), un conjunto de datos cl√°sico en Machine Learning. Este dataset incluye mediciones m√©dicas de tumores y clasifica si son malignos o benignos.

> **Nota:** Este dataset est√° disponible en la librer√≠a `scikit-learn`, una de las m√°s populares para Machine Learning en Python. Adem√°s de este, hay muchos otros m√°s disponibles en [`sklearn.datasets`](https://scikit-learn.org/stable/api/sklearn.datasets.html).

Primero, cargaremos y exploraremos los datos:


In [5]:
# Cargar el dataset
data = load_breast_cancer()
df = pd.DataFrame(data.data, columns=data.feature_names)

# A√±adir la columna objetivo (maligno o benigno)
df['target'] = data.target

# Ver las primeras filas del dataset
df.head()

Unnamed: 0,mean radius,mean texture,mean perimeter,mean area,mean smoothness,mean compactness,mean concavity,mean concave points,mean symmetry,mean fractal dimension,radius error,texture error,perimeter error,area error,smoothness error,compactness error,concavity error,concave points error,symmetry error,fractal dimension error,worst radius,worst texture,worst perimeter,worst area,worst smoothness,worst compactness,worst concavity,worst concave points,worst symmetry,worst fractal dimension,target
0,17.99,10.38,122.8,1001.0,0.1184,0.2776,0.3001,0.1471,0.2419,0.07871,1.095,0.9053,8.589,153.4,0.006399,0.04904,0.05373,0.01587,0.03003,0.006193,25.38,17.33,184.6,2019.0,0.1622,0.6656,0.7119,0.2654,0.4601,0.1189,0
1,20.57,17.77,132.9,1326.0,0.08474,0.07864,0.0869,0.07017,0.1812,0.05667,0.5435,0.7339,3.398,74.08,0.005225,0.01308,0.0186,0.0134,0.01389,0.003532,24.99,23.41,158.8,1956.0,0.1238,0.1866,0.2416,0.186,0.275,0.08902,0
2,19.69,21.25,130.0,1203.0,0.1096,0.1599,0.1974,0.1279,0.2069,0.05999,0.7456,0.7869,4.585,94.03,0.00615,0.04006,0.03832,0.02058,0.0225,0.004571,23.57,25.53,152.5,1709.0,0.1444,0.4245,0.4504,0.243,0.3613,0.08758,0
3,11.42,20.38,77.58,386.1,0.1425,0.2839,0.2414,0.1052,0.2597,0.09744,0.4956,1.156,3.445,27.23,0.00911,0.07458,0.05661,0.01867,0.05963,0.009208,14.91,26.5,98.87,567.7,0.2098,0.8663,0.6869,0.2575,0.6638,0.173,0
4,20.29,14.34,135.1,1297.0,0.1003,0.1328,0.198,0.1043,0.1809,0.05883,0.7572,0.7813,5.438,94.44,0.01149,0.02461,0.05688,0.01885,0.01756,0.005115,22.54,16.67,152.2,1575.0,0.1374,0.205,0.4,0.1625,0.2364,0.07678,0


Como podemos apreciar, este dataset contiene los siguientes datos:

- **features (Caracter√≠sticas):** Contiene 30 caracter√≠sticas num√©ricas que describen diferentes aspectos de los tumores, como el tama√±o, la forma y la textura. Estas caracter√≠sticas se dividen en tres categor√≠as principales:
  - *Promedios de medici√≥n*, como `mean radius` y `mean texture`.
  - *Errores est√°ndar*, como `radius error` y `texture error`.
  - *Peores valores registrados*, como `worst radius` y `worst texture`.

Esta organizaci√≥n permite capturar tanto una descripci√≥n general del tumor como sus posibles irregularidades. Por ejemplo, un error alto en `concavity error` podr√≠a indicar bordes irregulares, una se√±al de malignidad.

- **target (Objetivo):** La columna objetivo indica si el tumor es maligno (`0`) o benigno (`1`).


Ahora, vamos a explorar r√°pidamente las caracter√≠sticas principales del dataset.

In [11]:
print(f"Cantidad de instancias: {df.shape[0]}")
print(f"Cantidad de features: {df.shape[1] - 1}")  # Restamos 1 porque 'target' no es feature
print("*"*100, "\n")
print(f"Conteo de las clases:\n{df['target'].value_counts()}") # Conteo de las clases
print("*"*100, "\n")
print(f"Datos faltantes:\n{df.isnull().sum()}")
print("*"*100, "\n")
print(f"Resumen estad√≠stico:\n{df.describe()}") # Resumen estad√≠stico

Cantidad de instancias: 569
Cantidad de features: 30
**************************************************************************************************** 

Conteo de las clases:
target
1    357
0    212
Name: count, dtype: int64
**************************************************************************************************** 

Datos faltantes:
mean radius                0
mean texture               0
mean perimeter             0
mean area                  0
mean smoothness            0
mean compactness           0
mean concavity             0
mean concave points        0
mean symmetry              0
mean fractal dimension     0
radius error               0
texture error              0
perimeter error            0
area error                 0
smoothness error           0
compactness error          0
concavity error            0
concave points error       0
symmetry error             0
fractal dimension error    0
worst radius               0
worst texture              0
worst perimet

Algunas cosas interesantes que podemos ver a simple vista:
- **Equilibrio de clases**: Hay m√°s casos benignos que malignos, pero el desequilibrio no es extremo. Esto es bueno porque significa que el modelo no tendr√° un sesgo inicial fuerte hacia una clase.
- **Tama√±os de los tumores**: El mean radius var√≠a entre ~6.98 y ~28.1. Esto sugiere que tenemos una gran variedad de tama√±os de tumores.
- **Smoothness**: `mean smoothness` tiene un rango mucho m√°s estrecho, lo que indica que los tumores tienden a ser consistentes en esta caracter√≠stica.
- **Valores extremos**: Las columnas `worst radius`, `worst texture` y `worst area` tienen valores m√°s altos que sus contrapartes promedio, lo cual es l√≥gico, ya que capturan los casos m√°s extremos.
- **Datos faltantes**: No tenemos datos faltantes. Esto est√° genial. Tener un dataset limpio desde el principio facilita el an√°lisis y la modelizaci√≥n. Esto no siempre ocurre en el mundo real, as√≠ que estamos en un buen punto de partida.

> **Reflexi√≥n:** Los valores promedio y "peores" nos dan un contexto interesante. Por ejemplo, un tumor con un `worst radius` significativamente mayor que su `mean radius` podr√≠a ser una se√±al de crecimiento irregular.


# Recursos


**Datasets**

- [Datasets disponibles en scikit-learn](https://scikit-learn.org/stable/api/sklearn.datasets.html)
- [Breast Cancer Wisconsin Dataset](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html)

**Otros recursos**

- [GDPR](https://gdpr-info.eu/)
- [GPT personalizado sobre GDPR](https://chatgpt.com/g/g-JvCAAqPCj-gdpr-expert)