# üß† Ejemplo de uso de Red Neuronal para reconocer im√°genes

En este cuaderno implementaremos una **red neuronal simple con PyTorch** para **reconocer d√≠gitos escritos a mano (0 y 1)** del conjunto **MNIST**.  

El objetivo es comprender paso a paso c√≥mo:
- Se **preparan los datos** (transformaciones, lotes y etiquetas),
- Se **define un modelo neuronal** (capas, funci√≥n de activaci√≥n y salida),
- Se **entrena y eval√∫a** mediante una funci√≥n de p√©rdida y optimizador.

üí° Este ejemplo aplica los conceptos te√≥ricos de **regresi√≥n log√≠stica**, **funci√≥n sigmoide** y **gradiente ascendente**, extendi√©ndolos al caso de una **red neuronal multicapa** que aprende a clasificar im√°genes.


### üì¶ Importamos librer√≠as necesarias

In [None]:
import torch                         # Manejo de tensores y operaciones con GPU
import torch.nn as nn                # M√≥dulo para definir redes neuronales
import torch.optim as optim          # M√©todos de optimizaci√≥n (SGD, Adam, etc.)
from torchvision import datasets, transforms  # Conjuntos de datos y transformaciones
from torch.utils.data import DataLoader       # Carga de datos por lotes (batch)
import matplotlib.pyplot as plt      # Para graficar im√°genes y resultados

### üß© Inicializaci√≥n de datos de entrenamiento y prueba

In [None]:
# ---------------------------------------------------------------
# Inicializaci√≥n de los datos (entrenamiento y prueba)
# ---------------------------------------------------------------

# transforms.ToTensor()
# Convierte im√°genes en tensores de PyTorch.
# Escala los p√≠xeles de 0‚Äì255 a 0.0‚Äì1.0 y cambia el formato a (canales, alto, ancho).
transformacion = transforms.ToTensor()

# datasets.MNIST()
# Carga o descarga el conjunto de datos MNIST (d√≠gitos 0‚Äì9).
# Devuelve pares (imagen, etiqueta).
# Argumentos:
#   root="./data"          ‚Üí Carpeta donde se guardan los datos.
#   train=True/False       ‚Üí Define si son datos de entrenamiento o prueba.
#   download=True          ‚Üí Descarga autom√°tica si no existen.
#   transform=transformacion ‚Üí Aplica la conversi√≥n a tensor.
datos_entrenamiento = datasets.MNIST(
    root="./data", train=True, download=True, transform=transformacion
)

datos_prueba = datasets.MNIST(
    root="./data", train=False, download=True, transform=transformacion
)

# Cada elemento del dataset es una tupla (imagen_tensor, etiqueta)
# Ejemplo: imagen 28x28 y etiqueta num√©rica entre 0 y 9.


### üî¢ M√°scara de datos para filtrar solo los d√≠gitos 0 y 1

In [None]:


# ---------------------------------------------------------------
# Filtrar el dataset para quedarnos solo con los d√≠gitos 0 y 1
# ---------------------------------------------------------------

# Creamos una "m√°scara" booleana para cada conjunto:
#   True  ‚Üí si la etiqueta es 0 o 1
#   False ‚Üí si la etiqueta es otro n√∫mero (2‚Äì9)
# Esto nos permite seleccionar solo los ejemplos que pertenecen a las clases deseadas.
mascara_entrenamiento = (datos_entrenamiento.targets == 0) | (datos_entrenamiento.targets == 1)
mascara_prueba = (datos_prueba.targets == 0) | (datos_prueba.targets == 1)

# Usamos las m√°scaras para filtrar los datos e √≠ndices correspondientes:
#   - .data almacena las im√°genes (matrices 28x28)
#   - .targets contiene las etiquetas (n√∫mero representado)
datos_entrenamiento.data = datos_entrenamiento.data[mascara_entrenamiento]
datos_entrenamiento.targets = datos_entrenamiento.targets[mascara_entrenamiento]

datos_prueba.data = datos_prueba.data[mascara_prueba]
datos_prueba.targets = datos_prueba.targets[mascara_prueba]

# Ahora ambos conjuntos contienen solo im√°genes de los d√≠gitos 0 y 1,
# lo que convierte el problema en una clasificaci√≥n binaria.



### üßÆ Definimos caracter√≠sticas X y etiquetas Y (sin aplanar)

In [None]:
# ---------------------------------------------------------------
# Convertimos los datos a tipo flotante para poder operar con PyTorch
# ---------------------------------------------------------------

# .data contiene las im√°genes (matrices 28x28)
# .float() convierte los valores enteros (0‚Äì255) a decimales (0.0‚Äì255.0)
X_entrenamiento = datos_entrenamiento.data.float()

# .targets contiene las etiquetas (0 o 1)
# .float() las convierte a tipo flotante, √∫til para operaciones num√©ricas posteriores
Y_entrenamiento = datos_entrenamiento.targets.float()

# .reshape((n,1)) cambia la forma del tensor a una columna
# Esto permite que Y tenga dimensi√≥n [n,1] en lugar de [n], como exige PyTorch
Y_entrenamiento = Y_entrenamiento.reshape((Y_entrenamiento.shape[0], 1))

print("Ejemplo de etiqueta:", Y_entrenamiento[0])

# ---------------------------------------------------------------
# Repetimos el mismo proceso para el conjunto de prueba
# ---------------------------------------------------------------

X_prueba = datos_prueba.data.float()
Y_prueba = datos_prueba.targets.float()
Y_prueba = Y_prueba.reshape((Y_prueba.shape[0], 1))


### üß† Definimos modelo, funci√≥n de p√©rdida y optimizador

In [None]:
# ---------------------------------------------------------------
# Modelo: red totalmente conectada para clasificar 0 vs 1
# ---------------------------------------------------------------

modelo = nn.Sequential(
    nn.Flatten(),           # Convierte imagen 1x28x28 ‚Üí vector 784
    nn.Linear(28*28, 512),  # Capa oculta: 784 ‚Üí 512
    nn.Sigmoid(),           # Activaci√≥n (no linealidad)
    nn.Linear(512, 1),      # Capa de salida: 512 ‚Üí 1 (probabilidad de clase 1)
    nn.Sigmoid()            # Mapea salida a [0,1] para clasificaci√≥n binaria
)

# ---------------------------------------------------------------
# Funci√≥n de p√©rdida y optimizador
# ---------------------------------------------------------------

fn_perdida = nn.BCELoss()                     # Binary Cross-Entropy para etiquetas {0,1}
optimizador = torch.optim.SGD(                 # Descenso por gradiente (SGD)
    modelo.parameters(), lr=0.001              # lr: tasa de aprendizaje
)

# Nota: alternativamente se puede usar nn.BCEWithLogitsLoss()
# y quitar la √∫ltima Sigmoid() para mayor estabilidad num√©rica.


### ‚öôÔ∏è Entrenamiento del modelo

In [None]:
# ---------------------------------------------------------------
# Bucle de entrenamiento: el modelo aprende ajustando sus pesos
# ---------------------------------------------------------------

total_iteraciones = 30  # N√∫mero de veces que veremos todos los datos (√©pocas)

for i in range(total_iteraciones):

    # Forward pass: calculamos las predicciones de la red
    y_pred = modelo(X_entrenamiento)

    # C√°lculo de la p√©rdida: mide qu√© tan lejos est√°n las predicciones de las etiquetas reales
    perdida = fn_perdida(y_pred, Y_entrenamiento)

    # Reinicia los gradientes acumulados del paso anterior
    optimizador.zero_grad()

    # Backpropagation: calcula los gradientes ‚àÇL/‚àÇw para cada peso del modelo
    perdida.backward()

    # Actualiza los pesos seg√∫n el gradiente y la tasa de aprendizaje
    optimizador.step()

    # Muestra el progreso y el valor actual de la p√©rdida
    print(f"Iteraci√≥n {i+1}/{total_iteraciones}, P√©rdida: {perdida.item():.4f}")


### üßæ Evaluaci√≥n del modelo en datos de prueba

In [None]:
# ---------------------------------------------------------------
# Evaluaci√≥n del modelo: medimos qu√© tan bien aprendi√≥
# ---------------------------------------------------------------

modelo.eval()  # Cambia el modelo a modo de evaluaci√≥n (desactiva dropout, batchnorm, etc.)

# torch.no_grad() desactiva el c√°lculo de gradientes para ahorrar memoria y acelerar la inferencia.
with torch.no_grad():
    # Calculamos las salidas (predicciones continuas entre 0 y 1)
    salida = modelo(X_prueba)

    # Convertimos las probabilidades en etiquetas binarias:
    #   > 0.5 ‚Üí clase 1,  ‚â§ 0.5 ‚Üí clase 0
    predicciones = (salida > 0.5).float()

    # Comparamos predicciones con etiquetas verdaderas
    # .sum() cuenta cu√°ntas predicciones son correctas
    # .item() convierte el resultado tensorial a n√∫mero normal (Python float)
    correctas = (predicciones == Y_prueba).sum().item()

    # .size(0) devuelve el total de muestras evaluadas
    total = Y_prueba.size(0)

# Calculamos el porcentaje de aciertos
print(f"Precisi√≥n en prueba: {100 * correctas / total:.2f}%")


### üß© Pruebas individuales del modelo

In [None]:
# ---------------------------------------------------------------
# Prueba individual: verificamos la predicci√≥n para una sola imagen
# ---------------------------------------------------------------

# Seleccionamos una imagen del conjunto de prueba
indice = 1
imagen = X_prueba[indice]      # Tensor de la imagen seleccionada
etiqueta = Y_prueba[indice]    # Etiqueta real (0 o 1)

# ---------------------------------------------------------------
# Visualizamos la imagen en escala de grises
# ---------------------------------------------------------------
plt.imshow(imagen.reshape(28, 28), cmap='gray')    # Convertimos a 28x28 para mostrar
plt.title(f"Etiqueta real: {int(etiqueta)}")       # Mostramos la clase verdadera
plt.show()

# ---------------------------------------------------------------
# Evaluamos el modelo con esa imagen
# ---------------------------------------------------------------
modelo.eval()  # Modo evaluaci√≥n (sin actualizaci√≥n de pesos)

with torch.no_grad():  # Sin c√°lculo de gradientes (ahorra memoria)
    entrada = imagen.reshape(1, 28, 28)    # Redimensionamos para simular un lote (batch=1)
    salida = modelo(entrada)               # Forward pass ‚Üí salida del modelo
    prediccion = (salida > 0.5).float()    # Clasificaci√≥n: 1 si probabilidad > 0.5, de lo contrario 0

# Mostramos el resultado del modelo
print(f"Predicci√≥n del modelo: {int(prediccion.item())}")
