# Proyecto: Detección de Melanoma con ResNet50

Este notebook contiene el flujo completo del proyecto, incluyendo:

1. Exploración del dataset HAM10000  
2. Preprocesamiento de imágenes (CLAHE)  
3. Entrenamiento del modelo original  
4. Entrenamiento del modelo con imágenes preprocesadas  
5. Comparación entre modelos  
6. Pruebas con imágenes externas  
7. Conclusiones finales

## 1. Importación de librerías principales

In [None]:
import os
import numpy as np
import pandas as pd
from PIL import Image
import matplotlib.pyplot as plt
import seaborn as sns

import torch
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms, models

print("PyTorch:", torch.__version__)

## 2. Cargar metadata y revisar distribución de clases

In [None]:
df = pd.read_csv("data/labels_final.csv")
df.head()

In [None]:
sns.countplot(x=df["label"])
plt.title("Distribución de clases (0 = benigno, 1 = melanoma)")
plt.show()

df["label"].value_counts()

## 3. Visualización de algunas imágenes originales del dataset

In [None]:
sample_ids = df["image_id"].sample(6).tolist()

plt.figure(figsize=(12,8))
for i, img_id in enumerate(sample_ids):
    img = Image.open(f"data/images/{img_id}.jpg")
    plt.subplot(2,3,i+1)
    plt.imshow(img)
    plt.title(img_id)
    plt.axis("off")
plt.show()

In [None]:
## 4. Comparación entre imagen original y preprocesada (CLAHE)

In [None]:
img_id = df["image_id"].sample(1).iloc[0]

original = Image.open(f"data/images/{img_id}.jpg")
processed = Image.open(f"data/images_preprocessed/{img_id}.jpg")

plt.figure(figsize=(10,5))

plt.subplot(1,2,1)
plt.imshow(original)
plt.title("Original")
plt.axis("off")

plt.subplot(1,2,2)
plt.imshow(processed)
plt.title("Preprocesada (CLAHE)")
plt.axis("off")

plt.show()

## 5. Entrenamiento del modelo original (sin preprocesamiento)
Ejecutamos el script `train_resnet.py` que entrena el modelo base con ResNet50.

In [None]:
!python scripts/train_resnet.py

## 6. Entrenamiento usando imágenes preprocesadas

In [None]:
!python scripts/train_resnet_advanced.py

## 7. Comparación del rendimiento entre modelos

In [None]:
!python scripts/evaluate_models.py

In [None]:
df_metrics = pd.read_csv("results/metrics/model_metrics_comparison.csv")
df_metrics

## 8. Matrices de confusión del modelo original vs modelo preprocesado

In [None]:
from IPython.display import Image as ShowImage

ShowImage(filename="results/metrics/confusion_matrix_old.png")
ShowImage(filename="results/metrics/confusion_matrix_new.png")

## 9. Prueba con una imagen externa (modelo viejo vs modelo nuevo)

In [None]:
!python scripts/compare_single_image.py foto1