<a href="https://colab.research.google.com/github/Alberto-97sc/mmshap_medclip/blob/others-clips-version/notebooks/02_rclip_classification_demo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# RClip + SHAP: Clasificaci√≥n M√©dica con Balance Multimodal

Este notebook demuestra:
- **Clasificaci√≥n de im√°genes m√©dicas** usando RClip
- **An√°lisis de explicabilidad** con SHAP
- **Medici√≥n del balance multimodal** (TScore/IScore)
- **Visualizaci√≥n de mapas de calor** para parches de imagen y tokens de texto

Dataset: **ROCO** (Radiology Objects in COntext)


## üöÄ Configuraci√≥n inicial


In [None]:
# Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')


In [None]:
# Configuraci√≥n del repositorio
REPO_URL = "https://github.com/Alberto-97sc/mmshap_medclip.git"
LOCAL_DIR = "/content/mmshap_medclip"
BRANCH = "others-clips-version"  # Rama con RClip

%cd /content
import os, shutil, subprocess, sys

if not os.path.isdir(f"{LOCAL_DIR}/.git"):
    # No est√° clonado a√∫n
    !git clone $REPO_URL $LOCAL_DIR
else:
    # Ya existe: actualiza a la √∫ltima versi√≥n del remoto
    %cd $LOCAL_DIR
    !git fetch origin
    !git checkout $BRANCH
    !git reset --hard origin/$BRANCH

%cd $LOCAL_DIR
!git rev-parse --short HEAD


In [None]:
# Instalar el paquete en modo editable
%pip install -e /content/mmshap_medclip

# Dependencias adicionales si son necesarias
%pip install matplotlib seaborn pillow


## üìä Carga de datos y modelo


In [None]:
# Configuraci√≥n para RClip + clasificaci√≥n
CFG_PATH = "/content/mmshap_medclip/configs/roco_classification_rclip.yaml"

from mmshap_medclip.io_utils import load_config
from mmshap_medclip.devices import get_device
from mmshap_medclip.registry import build_dataset, build_model

# Cargar configuraci√≥n
cfg = load_config(CFG_PATH)
device = get_device()
print(f"üñ•Ô∏è Dispositivo: {device}")

# Cargar dataset ROCO
print("üìÅ Cargando dataset ROCO...")
dataset = build_dataset(cfg["dataset"])
print(f"‚úÖ Dataset cargado: {len(dataset)} muestras")

# Cargar modelo RClip
print("ü§ñ Cargando modelo RClip...")
model = build_model(cfg["model"], device=device)
print("‚úÖ Modelo RClip cargado")


In [None]:
# Definir clases para clasificaci√≥n m√©dica
class_names = [
    "Chest X-Ray",
    "Brain MRI", 
    "Abdominal CT Scan",
    "Ultrasound",
    "OPG",  # Orthopantomogram
    "Mammography",
    "Bone X-Ray",
    "Cardiac MRI",
    "Pulmonary CT",
    "Spinal MRI"
]

print(f"üè∑Ô∏è Clases definidas: {len(class_names)}")
for i, clase in enumerate(class_names):
    print(f"  {i+1}. {clase}")


## üîç Ejemplo 1: Clasificaci√≥n simple (sin SHAP)


In [None]:
from mmshap_medclip.tasks.classification import run_classification_one
import matplotlib.pyplot as plt

# Seleccionar una muestra del dataset
muestra_idx = 266  # Cambiar por cualquier √≠ndice v√°lido
sample = dataset[muestra_idx]
image = sample['image']
caption = sample['text']

print(f"üìã Muestra {muestra_idx}:")
print(f"Caption original: {caption[:100]}...")

# Mostrar la imagen
plt.figure(figsize=(8, 6))
plt.imshow(image)
plt.title(f"Muestra {muestra_idx} - ROCO Dataset")
plt.axis('off')
plt.show()


In [None]:
# Clasificaci√≥n r√°pida sin SHAP
print("‚ö° Ejecutando clasificaci√≥n r√°pida (sin SHAP)...")
res_simple = run_classification_one(
    model, image, class_names, device, 
    explain=False  # Sin explicabilidad para mayor velocidad
)

print(f"\nüéØ Resultados de clasificaci√≥n:")
print(f"Clase predicha: {res_simple['predicted_class']}")
print(f"Confianza: {res_simple['probabilities'].max():.2%}")

print(f"\nüìä Todas las probabilidades:")
for clase, prob in zip(class_names, res_simple['probabilities']):
    bar = "‚ñà" * int(prob * 20)  # Barra visual
    print(f"  {clase:<20}: {prob:.2%} {bar}")


## üß† Ejemplo 2: Clasificaci√≥n con SHAP y Balance Multimodal


In [None]:
print("üî¨ Ejecutando clasificaci√≥n con SHAP (esto puede tomar varios minutos)...")
res_shap = run_classification_one(
    model, image, class_names, device, 
    explain=True,  # Con explicabilidad SHAP
    plot=True      # Generar mapas de calor
)

print(f"\nüéØ Resultados con SHAP:")
print(f"Clase predicha: {res_shap['predicted_class']}")
print(f"Confianza: {res_shap['probabilities'].max():.2%}")

print(f"\n‚öñÔ∏è Balance Multimodal:")
print(f"TScore (Text Score): {res_shap['tscore']:.2%}")
print(f"IScore (Image Score): {res_shap['iscore']:.2%}")

# Interpretaci√≥n del balance
if res_shap['tscore'] > 0.6:
    balance_msg = "üî§ Modelo se enfoca m√°s en el TEXTO"
elif res_shap['iscore'] > 0.6:
    balance_msg = "üñºÔ∏è Modelo se enfoca m√°s en la IMAGEN"
else:
    balance_msg = "‚öñÔ∏è Balance equilibrado entre texto e imagen"
    
print(f"Interpretaci√≥n: {balance_msg}")


In [None]:
# Mostrar mapa de calor si est√° disponible
if 'fig' in res_shap:
    print("üó∫Ô∏è Mapa de calor con importancia de parches y tokens:")
    display(res_shap['fig'])
else:
    print("‚ö†Ô∏è No se gener√≥ mapa de calor")


## üéâ Conclusiones

Este notebook ha demostrado:

1. **‚úÖ Clasificaci√≥n m√©dica**: RClip puede clasificar im√°genes m√©dicas en m√∫ltiples categor√≠as
2. **‚úÖ Explicabilidad con SHAP**: Podemos entender qu√© partes de la imagen y texto son importantes
3. **‚úÖ Balance multimodal**: Medimos si el modelo se enfoca m√°s en texto o imagen
4. **‚úÖ Visualizaci√≥n**: Mapas de calor muestran la importancia espacial y textual

### Pr√≥ximos pasos:
- Evaluar en m√°s muestras del dataset
- Comparar con otros modelos CLIP
- An√°lisis de casos espec√≠ficos por tipo de imagen m√©dica
- Optimizaci√≥n de hiperpar√°metros para mejor balance multimodal
