<a href="https://colab.research.google.com/github/ashborn8/EjercicioMulticapa/blob/main/Ejercicio2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# 1. Importar las bibliotecas necesarias
import torch  # Funciones básicas para computación numérica
import torch.nn as nn  # Clases y funciones para redes neuronales
import torch.optim as optim  # Algoritmos de optimización
from torch.utils.data import DataLoader  # Carga datos en lotes
from torchvision import datasets, transforms  # Herramientas para datasets de imágenes

In [2]:
# 2. Definir los hiperparámetros
input_size = 784  # Tamaño de entrada (784 píxeles de la imagen)
hidden_size = 128  # Número de neuronas en la capa oculta
output_size = 10   # Número de clases (0-9)
batch_size = 64    # Tamaño del lote para el entrenamiento
learning_rate = 0.001  # Tasa de aprendizaje
num_epochs = 5     # Número de épocas de entrenamiento

In [3]:
# 3. Descargar y cargar el dataset MNIST
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))]) # Transformaciones para las imágenes: convertir a tensor y normalizar
train_dataset = datasets.MNIST(root='./data', train=True, transform=transform, download=True)  # Dataset de entrenamiento
test_dataset = datasets.MNIST(root='./data', train=False, transform=transform)  # Dataset de prueba
train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)  # DataLoader para entrenamiento (mezcla los datos)
test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)  # DataLoader para prueba (no mezcla los datos)


Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz to ./data/MNIST/raw/train-images-idx3-ubyte.gz


100%|██████████| 9912422/9912422 [00:00<00:00, 35055583.12it/s]


Extracting ./data/MNIST/raw/train-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz to ./data/MNIST/raw/train-labels-idx1-ubyte.gz


100%|██████████| 28881/28881 [00:00<00:00, 1088283.01it/s]


Extracting ./data/MNIST/raw/train-labels-idx1-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw/t10k-images-idx3-ubyte.gz


100%|██████████| 1648877/1648877 [00:00<00:00, 8206503.60it/s]


Extracting ./data/MNIST/raw/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz


100%|██████████| 4542/4542 [00:00<00:00, 5892523.59it/s]

Extracting ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw






In [4]:
# 4. Definir el modelo de red neuronal
class NeuralNet(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(NeuralNet, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)  # Capa completamente conectada 1
        self.relu = nn.ReLU() # Función de activación ReLU
        self.fc2 = nn.Linear(hidden_size, output_size)  # Capa completamente conectada 2 (salida)

    def forward(self, x):
        x = x.view(-1, input_size)  # Aplana la imagen a un vector
        x = self.fc1(x)             # Pasa por la primera capa
        x = self.relu(x)            # Aplica ReLU
        x = self.fc2(x)             # Pasa por la capa de salida
        return x

model = NeuralNet(input_size, hidden_size, output_size) # Crea una instancia del modelo

In [5]:
# 5. Definir la función de pérdida y el optimizador
criterion = nn.CrossEntropyLoss()  # Función de pérdida para clasificación multiclase
optimizer = optim.Adam(model.parameters(), lr=learning_rate)  # Optimizador Adam

In [6]:
# 6. Entrenar el modelo
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # Forward pass
        outputs = model(images)  # Pasa las imágenes por el modelo
        loss = criterion(outputs, labels)  # Calcula la pérdida

        # Backward pass y optimización
        optimizer.zero_grad()  # Reinicia los gradientes
        loss.backward()        # Calcula los gradientes
        optimizer.step()       # Actualiza los pesos del modelo

        if (i + 1) % 100 == 0:
            print(f'Época [{epoch+1}/{num_epochs}], Lote [{i+1}/{len(train_loader)}], Pérdida: {loss.item():.4f}') # Imprime la pérdida cada 100 lotes


Época [1/5], Lote [100/938], Pérdida: 0.3786
Época [1/5], Lote [200/938], Pérdida: 0.4125
Época [1/5], Lote [300/938], Pérdida: 0.3356
Época [1/5], Lote [400/938], Pérdida: 0.3359
Época [1/5], Lote [500/938], Pérdida: 0.1618
Época [1/5], Lote [600/938], Pérdida: 0.5256
Época [1/5], Lote [700/938], Pérdida: 0.2918
Época [1/5], Lote [800/938], Pérdida: 0.2642
Época [1/5], Lote [900/938], Pérdida: 0.2479
Época [2/5], Lote [100/938], Pérdida: 0.1451
Época [2/5], Lote [200/938], Pérdida: 0.0753
Época [2/5], Lote [300/938], Pérdida: 0.2495
Época [2/5], Lote [400/938], Pérdida: 0.2076
Época [2/5], Lote [500/938], Pérdida: 0.0631
Época [2/5], Lote [600/938], Pérdida: 0.2761
Época [2/5], Lote [700/938], Pérdida: 0.2347
Época [2/5], Lote [800/938], Pérdida: 0.1440
Época [2/5], Lote [900/938], Pérdida: 0.1249
Época [3/5], Lote [100/938], Pérdida: 0.2402
Época [3/5], Lote [200/938], Pérdida: 0.1942
Época [3/5], Lote [300/938], Pérdida: 0.2052
Época [3/5], Lote [400/938], Pérdida: 0.1832
Época [3/5

In [7]:
# 7. Evaluar el modelo
model.eval()  # Pone el modelo en modo de evaluación (desactiva capas como Dropout)
with torch.no_grad():  # Desactiva el cálculo de gradientes (ahorra memoria y acelera la evaluación)
    correct = 0  # Inicializa el contador de predicciones correctas
    total = 0    # Inicializa el contador total de predicciones
    for images, labels in test_loader:  # Itera sobre los datos de prueba
        outputs = model(images)  # Obtiene las predicciones del modelo
        _, predicted = torch.max(outputs.data, 1)  # Obtiene la clase predicha (la de mayor probabilidad)
        total += labels.size(0)  # Incrementa el contador total con el número de imágenes en el lote
        correct += (predicted == labels).sum().item()  # Incrementa el contador de correctas si la predicción coincide con la etiqueta real

    print(f'Precisión en el conjunto de prueba: {100 * correct / total}%')  # Imprime la precisión del modelo

Precisión en el conjunto de prueba: 96.64%
