## Arquitectura de LeNet-5

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# Definir la arquitectura de LeNet-5
class LeNet5(nn.Module):
    def __init__(self):
        super(LeNet5, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, kernel_size=5)
        self.relu1 = nn.ReLU()
        self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(6, 16, kernel_size=5)
        self.relu2 = nn.ReLU()
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.fc1 = nn.Linear(16 * 4 * 4, 120)
        self.relu3 = nn.ReLU()
        self.fc2 = nn.Linear(120, 84)
        self.relu4 = nn.ReLU()
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool1(self.relu1(self.conv1(x)))
        x = self.pool2(self.relu2(self.conv2(x)))
        x = x.view(-1, 16 * 4 * 4)
        x = self.relu3(self.fc1(x))
        x = self.relu4(self.fc2(x))
        x = self.fc3(x)
        return x

# Cargar el conjunto de datos MNIST y aplicar transformaciones
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

# Definir la red y el optimizador
net = LeNet5()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)

# Entrenamiento de la red
for epoch in range(10):  # Número de épocas
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data

        optimizer.zero_grad()

        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if i % 100 == 99:  # Imprimir cada 100 mini lotes
            print(f'Época {epoch + 1}, Lote {i + 1}, Pérdida: {running_loss / 100:.3f}')
            running_loss = 0.0

print('Entrenamiento terminado')

# Evaluación en el conjunto de prueba
correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        inputs, labels = data
        outputs = net(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Exactitud en el conjunto de prueba: {100 * correct / total}%')


Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./data\MNIST\raw\train-images-idx3-ubyte.gz


100%|██████████| 9912422/9912422 [00:01<00:00, 9252687.46it/s] 


Extracting ./data\MNIST\raw\train-images-idx3-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./data\MNIST\raw\train-labels-idx1-ubyte.gz


100%|██████████| 28881/28881 [00:00<00:00, 27512081.27it/s]


Extracting ./data\MNIST\raw\train-labels-idx1-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./data\MNIST\raw\t10k-images-idx3-ubyte.gz


100%|██████████| 1648877/1648877 [00:00<00:00, 3875623.59it/s]


Extracting ./data\MNIST\raw\t10k-images-idx3-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./data\MNIST\raw\t10k-labels-idx1-ubyte.gz


100%|██████████| 4542/4542 [00:00<?, ?it/s]


Extracting ./data\MNIST\raw\t10k-labels-idx1-ubyte.gz to ./data\MNIST\raw

Época 1, Lote 100, Pérdida: 2.271
Época 1, Lote 200, Pérdida: 0.945
Época 1, Lote 300, Pérdida: 0.289
Época 1, Lote 400, Pérdida: 0.176
Época 1, Lote 500, Pérdida: 0.152
Época 1, Lote 600, Pérdida: 0.140
Época 1, Lote 700, Pérdida: 0.126
Época 1, Lote 800, Pérdida: 0.111
Época 1, Lote 900, Pérdida: 0.091
Época 2, Lote 100, Pérdida: 0.082
Época 2, Lote 200, Pérdida: 0.071
Época 2, Lote 300, Pérdida: 0.073
Época 2, Lote 400, Pérdida: 0.072
Época 2, Lote 500, Pérdida: 0.079
Época 2, Lote 600, Pérdida: 0.055
Época 2, Lote 700, Pérdida: 0.061
Época 2, Lote 800, Pérdida: 0.070
Época 2, Lote 900, Pérdida: 0.053
Época 3, Lote 100, Pérdida: 0.045
Época 3, Lote 200, Pérdida: 0.044
Época 3, Lote 300, Pérdida: 0.050
Época 3, Lote 400, Pérdida: 0.041
Época 3, Lote 500, Pérdida: 0.058
Época 3, Lote 600, Pérdida: 0.052
Época 3, Lote 700, Pérdida: 0.045
Época 3, Lote 800, Pérdida: 0.043
Época 3, Lote 900, Pérdida: 0.044
Época 4

## Arquitectura de AlexNet

In [11]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# Definir la arquitectura de AlexNet para CIFAR-10
class AlexNetCIFAR(nn.Module):
    def __init__(self, num_classes=10):
        super(AlexNetCIFAR, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(64, 192, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(192, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
        )
        self.avgpool = nn.AdaptiveAvgPool2d((6, 6))
        self.classifier = nn.Sequential(
            nn.Dropout(),
            nn.Linear(256 * 6 * 6, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, num_classes),
        )

    def forward(self, x):
        x = self.features(x)
        x = self.avgpool(x)
        x = x.view(x.size(0), -1)
        x = self.classifier(x)
        return x

# Cargar el conjunto de datos CIFAR-10 y aplicar transformaciones
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomCrop(32, padding=4),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

# Definir la red y el optimizador
net = AlexNetCIFAR(num_classes=10)
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9, weight_decay=1e-4)

# Entrenamiento de la red
for epoch in range(10):  # Número de épocas
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data

        optimizer.zero_grad()

        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if i % 100 == 99:  # Imprimir cada 100 mini lotes
            print(f'Época {epoch + 1}, Lote {i + 1}, Pérdida: {running_loss / 100:.3f}')
            running_loss = 0.0

print('Entrenamiento terminado')

# Evaluación en el conjunto de prueba
correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        inputs, labels = data
        outputs = net(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Exactitud en el conjunto de prueba: {100 * correct / total}%')

Files already downloaded and verified
Files already downloaded and verified
Época 1, Lote 100, Pérdida: 2.303
Época 1, Lote 200, Pérdida: 2.302
Época 1, Lote 300, Pérdida: 2.299
Época 1, Lote 400, Pérdida: 2.173
Época 1, Lote 500, Pérdida: 2.034
Época 1, Lote 600, Pérdida: 1.937
Época 1, Lote 700, Pérdida: 1.867
Época 2, Lote 100, Pérdida: 1.749
Época 2, Lote 200, Pérdida: 1.733
Época 2, Lote 300, Pérdida: 1.670
Época 2, Lote 400, Pérdida: 1.628
Época 2, Lote 500, Pérdida: 1.575
Época 2, Lote 600, Pérdida: 1.575
Época 2, Lote 700, Pérdida: 1.538
Época 3, Lote 100, Pérdida: 1.462
Época 3, Lote 200, Pérdida: 1.427
Época 3, Lote 300, Pérdida: 1.400
Época 3, Lote 400, Pérdida: 1.350
Época 3, Lote 500, Pérdida: 1.348
Época 3, Lote 600, Pérdida: 1.318
Época 3, Lote 700, Pérdida: 1.283
Época 4, Lote 100, Pérdida: 1.194
Época 4, Lote 200, Pérdida: 1.217
Época 4, Lote 300, Pérdida: 1.139
Época 4, Lote 400, Pérdida: 1.118
Época 4, Lote 500, Pérdida: 1.102
Época 4, Lote 600, Pérdida: 1.119
Época 