# CONSTRUIR UNA RED NEURONAL

Las *redes neuronales* utilizan capas/módulos para realizar operaciones con datos. `torch.nn` provee todo los bloques que se necesitan para construir una *red neuronal*. Todos los modulos de **PyTorch** son subclases de `nn.Module`. Un *red neuronal* es un módulo formado por otro módulos (o capas). Esta arquitectura anidada permite crear arquitecturas complejas en forma simple.

In [1]:
import os
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

Es preferible utilizar el GPU para entrenar un modelo. El siguiente comando confirma si existe un GPU disponible y si no utiliza el CPU.

In [2]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'
print('Using {} device'.format(device))

Using cpu device


## Definir la clase

Se denfine *una red* neuronal declarando una subclase de `nn.module` e inicializando las capas de la *red neuronal* con el método `__init__`. Todas las subclases de `nn.Module` implementan las operaciones en los datos de entrada en el metodo `forward`.

In [9]:
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10),
            nn.ReLU()
        )
        
    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

Creamos un instancia de `NeuralNetwork`, la movemos a `device`, e imprimimos su extructura.

In [10]:
model = NeuralNetwork().to(device)
print(model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
    (5): ReLU()
  )
)


Para utilizar `model`, le pasamos los datos de entrada. Esto ejecuta la función `forward` del modelo, junto con otras operaciones de fondo. No hay que llamar al método `model.foward()` en forma directa!

Al ejecutar `model` retorna un tensor de 10 dimensiones con los valores predichos para cada clase. Obtenemos las probabilidades de cada predicción pasandolas por una instancia de `nn.softmax`.

In [12]:
X = torch.rand(1, 28, 28, device=device)
logits = model(X)
pred_probab = nn.Softmax(dim=1)(logits)
y_pred = pred_probab.argmax(1)
print(f"Predicted class: {y_pred}")

Predicted class: tensor([9])


## Las capas del modelo

Vamos a desarmar las capas del modelo FashionMNIST. Para ilustrarlo vamos a utilizar un minibatch de 3 imagenes de tamaño 28x28 y ver que sucede cuando pasa por la red.

In [13]:
input_image = torch.rand(3, 28, 28)
print(input_image.size())

torch.Size([3, 28, 28])


### nn.Flatten

Inicializamos la capa `nn.Flatten` para convertir cada imagen de 2D 28x28 a un array continuo de 784 pixeles.