# Ejemplo de entrenamiento de una red neuronal simple en PyTorch utilizando el dataset MNIST de Hugging Face

En este ejemplo, entrenaremos una red neuronal sencilla para clasificar imágenes de dígitos escritos a mano utilizando el dataset `mnist` de Hugging Face. Seguiremos los pasos fundamentales: descarga y exploración del dataset, preprocesamiento, definición del modelo, entrenamiento, validación y generación de predicciones.

## 1. Importar librerías necesarias

Importamos PyTorch, matplotlib y las funciones de datasets de Hugging Face.

In [2]:
import torch
from torch import nn
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt
from datasets import load_dataset

ModuleNotFoundError: No module named 'datasets'

## 2. Descargar y explorar un dataset diferente de Hugging Face

Utilizaremos el dataset `mnist`, que contiene imágenes de dígitos escritos a mano (0-9). Descarguemos el dataset y exploremos su estructura.

In [None]:
# Descargar el dataset MNIST desde Hugging Face
dataset = load_dataset("mnist")

# Mostrar las llaves y tamaños de los splits
print(dataset)

# Visualizar algunas imágenes de ejemplo
fig, axs = plt.subplots(1, 5, figsize=(12, 3))
for i in range(5):
    img = dataset["train"][i]["image"]
    label = dataset["train"][i]["label"]
    axs[i].imshow(img, cmap="gray")
    axs[i].set_title(f"Etiqueta: {label}")
    axs[i].axis("off")
plt.show()

## 3. Preprocesar los datos

Convertimos las imágenes a tensores, normalizamos los valores de píxeles y dividimos el dataset en entrenamiento, validación y prueba. Implementaremos una clase Dataset personalizada para adaptar el formato de Hugging Face a PyTorch.

In [None]:
from torchvision import transforms

# Transformación: convertir a tensor y normalizar
transform = transforms.Compose([
    transforms.ToTensor(),  # Convierte PIL Image a tensor [0,1]
    transforms.Normalize((0.5,), (0.5,))  # Normaliza a [-1,1]
])

# Clase Dataset personalizada
class MNISTDataset(Dataset):
    def __init__(self, hf_dataset, transform=None):
        self.dataset = hf_dataset
        self.transform = transform

    def __len__(self):
        return len(self.dataset)

    def __getitem__(self, idx):
        img = self.dataset[idx]["image"]
        label = self.dataset[idx]["label"]
        if self.transform:
            img = self.transform(img)
        return img, label

# Crear los datasets
train_dataset = MNISTDataset(dataset["train"], transform=transform)
test_dataset = MNISTDataset(dataset["test"], transform=transform)

# Dividir train en train y validación (80/20)
train_size = int(0.8 * len(train_dataset))
val_size = len(train_dataset) - train_size
train_dataset, val_dataset = torch.utils.data.random_split(train_dataset, [train_size, val_size])

print(f"Tamaño train: {len(train_dataset)}, validación: {len(val_dataset)}, test: {len(test_dataset)}")

## 4. Definir el modelo de red neuronal

Definimos una red neuronal simple con una capa oculta y activación ReLU.

In [None]:
class RedSimple(nn.Module):
    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()
        self.red = nn.Sequential(
            nn.Linear(28*28, 128),
            nn.ReLU(),
            nn.Linear(128, 10)
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.red(x)
        return logits

# Instanciar el modelo y mover a GPU si está disponible
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
modelo = RedSimple().to(device)
print(modelo)

## 5. Preparar DataLoaders para entrenamiento y validación

Creamos los DataLoaders para los sets de entrenamiento, validación y prueba.

In [None]:
BATCH_SIZE = 128

train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False)

## 6. Entrenar y validar el modelo

Implementamos los bucles de entrenamiento y validación, mostrando la pérdida y la exactitud por época.

In [None]:
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(modelo.parameters(), lr=0.001)

def train_loop(dataloader, model, loss_fn, optimizer):
    model.train()
    total_loss, correct, total = 0, 0, 0
    for X, y in dataloader:
        X, y = X.to(device), y.to(device)
        optimizer.zero_grad()
        logits = model(X)
        loss = loss_fn(logits, y)
        loss.backward()
        optimizer.step()
        total_loss += loss.item() * X.size(0)
        preds = logits.argmax(1)
        correct += (preds == y).sum().item()
        total += X.size(0)
    avg_loss = total_loss / total
    accuracy = correct / total
    return avg_loss, accuracy

def val_loop(dataloader, model, loss_fn):
    model.eval()
    total_loss, correct, total = 0, 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            logits = model(X)
            loss = loss_fn(logits, y)
            total_loss += loss.item() * X.size(0)
            preds = logits.argmax(1)
            correct += (preds == y).sum().item()
            total += X.size(0)
    avg_loss = total_loss / total
    accuracy = correct / total
    return avg_loss, accuracy

EPOCHS = 5
for epoch in range(EPOCHS):
    train_loss, train_acc = train_loop(train_loader, modelo, loss_fn, optimizer)
    val_loss, val_acc = val_loop(val_loader, modelo, loss_fn)
    print(f"Época {epoch+1}/{EPOCHS}")
    print(f"  Entrenamiento -> Pérdida: {train_loss:.4f}, Exactitud: {train_acc*100:.2f}%")
    print(f"  Validación    -> Pérdida: {val_loss:.4f}, Exactitud: {val_acc*100:.2f}%\n")

## 7. Realizar predicciones con el modelo entrenado

Tomamos una muestra del set de prueba, generamos una predicción y visualizamos la imagen junto con la categoría predicha.

In [None]:
# Tomar una muestra del set de prueba
ejemplo_img, ejemplo_lbl = test_dataset[0]
ejemplo_img_gpu = ejemplo_img.unsqueeze(0).to(device)  # Añadir dimensión batch

# Generar predicción
modelo.eval()
with torch.no_grad():
    logits = modelo(ejemplo_img_gpu)
    pred = logits.argmax(1).item()

plt.imshow(ejemplo_img.squeeze().cpu(), cmap="gray")
plt.title(f"Predicción: {pred} (Etiqueta real: {ejemplo_lbl})")
plt.axis("off")
plt.show()