# Primera red neuronal con Pytorch

La idea es desarrollar una red neuronal que pueda clasificar números basado en el dataset MNIST

In [2]:
# Comencemos importando las librerias.

import torch # librería de pytorch
import torch.nn as nn # contiene módulos para neural networks.
import torch.optim as optim # optimización para entrenar modelos.
import torchvision # contiene datasets y utilidades para visión por computadora.
import torchvision.transforms as transforms # permite aplicar transformaciones a los datos.
import matplotlib.pyplot as plt # para crear imágenes

## Preprocesamiento de datos


In [5]:
transform = transforms.Compose([
    transforms.ToTensor(), # Aqui vamos a tomar las imágenes y lo pasaremos a tensores, una característica de .ToTensor es que ya nos normaliza por 255, es decir cada valor lo divide entre 255
    transforms.Normalize((0.5,), (0.5,)) # Luego que pasamos a tensores, que tenemos valores entre o y 1, cuando normalizamos decimos que el primer valor es el promedio, es decir 0.5 y con una desviación estandar de 0.5 es decir, es decir [-1,1]
])

## Carga de datos

In [None]:

trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform) 
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True) # DataLoader: Organiza los datos en lotes de 64 imágenes y los baraja para mejorar el entrenamiento

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False )



100.0%
100.0%
100.0%
100.0%


## Red neuronal

In [13]:
class NeuralNetwork(nn.Module): # decimos que nuetsra clase NeuralNetwork hereda de nn.Module
    def __init__(self):
        super(NeuralNetwork, self).__init__() # inicializamos la clase padre
        self.fc1 = nn.Linear(784, 128) # primera capa 748 de datos de entrada y salen 128 
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear (64, 10) # capa de salida 10 clases
        self.relu = nn.ReLU() # función de activación
        self.softmax = nn.LogSoftmax(dim=1) # Genera la probabilidad de cada clase

    def forward(self, x):
        x = x.view(-1, 28*28) # aplanar la imagen 28x28 a un vector de 784
        x = self.relu (self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.softmax(self.fc3(x))
        return x

## Función de pérdida y optimización

In [14]:
model = NeuralNetwork() # inicilizamos el modelo 

criterion = nn.CrossEntropyLoss() # función de pérdida usada en clasificación multicase
optimizer = optim.Adam(model.parameters(), lr=0.001) # Algoritmo de optimización que ajusta los pesos, lr es el learning-rate que controla los pasos en el descenso del gradiente.

## Entrenamiento

In [15]:
epochs = 5
for epoch in range(epochs):
    running_loss = 0
    for images, labels in trainloader:
        optimizer.zero_grad() # reiniciar gradientes
        output = model(images)
        loss = criterion(output,labels) # cálcular pérdida
        loss.backward()
        optimizer.step() # actualizar pesos 
        running_loss += loss.item()
    print(f"for epoch {epoch+1}, Loss: {running_loss/len(trainloader)}")  
                                    

for epoch 1, Loss: 0.39417982474763763
for epoch 2, Loss: 0.19143896014975714
for epoch 3, Loss: 0.13771817340318965
for epoch 4, Loss: 0.11249124705354606
for epoch 5, Loss: 0.09651337888365838
