In [1]:
import torch
from torch import nn
import matplotlib.pyplot as plt
import numpy as np

In [2]:
# Load tensors
train_data = torch.load('temp/data/train_data.pt')
test_data = torch.load('temp/data/test_data.pt')

### Construir un modelo

- *Todos nuestros modelos en PyTorch van a heredar sus funcionalidades de la clase `nn.Module`. Esta es la clase base que nos aporta todas las funcionalidades necesarias para construir y entrenar una red neuronal.*
- *Algunas de las funcionalidades que heredamos son:*
    - *La capacidad de hacer un seguimiento de todos los parámetros del modelo que fueron definidos como atributos (esto quiere decir que se definieron usando la clase `nn.Parameter`<sup>1</sup>).*
        - *Entonces, si definimos un atributo utilizando la clase `nn.Parameter`, PyTorch va a automáticamente registrar ese atributo y lo va a tener en cuenta al momento de computar los gradientes o al mover el modelo de un dipositivo a otro (e.g., de CPU a GPU).*
        - *Podemos acceder a estos parámetros utilizando el método `parameters()` o `state_dict()` (recomendado).*
    - *La posibilidad de crear arquitecturas complejas, al poder definir módulos dentro de otros.*

<sup>1</sup> *`nn.Parameter` define una clase especial de tensores que se registran de manera automática cuando se definen dentro de una instancia de `nn.Module`. Muchas veces, cuando definamos las capas ocultas de nuestras redes neuronales, vamos a utilizar clases pre-definidas como `nn.Linear` o `nn.Conv2D`, las cuales definen estos atributos por nosotros, lo que no vamos a tener que llamar a la función `nn.Parameter` explicitamente.*

In [None]:
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.weight = nn.Parameter(torch.randn(1, dtype=torch.float32))
        self.bias = nn.Parameter(torch.randn(1, dtype=torch.float32))
    
    def forward(self, X: torch.Tensor) -> torch.Tensor:
        return self.weight * X + self.bias

- *Notar que al principio de la función `__init__` de la clase (se conoce como constructor) agregamos la línea `super().__init__()`. Esta línea es muy importante ya que inicializa la clase padre. Si no la incluímos, nuestra clase no va a poder heredar las funcionalidades básicas de la clase `nn.Module`.*
- *Siempre que estemos creando una clase a partir de la clase `nn.Module`, vamos a tener que implementar el método `forward()`. Este método es muy importante porque define el grafo computacional de nuestro modelo (i.e., como fluye la información a lo largo de la red neuronal) que utilizamos para calcular los gradientes.*

In [None]:
# Create a random seed
torch.manual_seed(42)

# Create a model instance
model_0 = LinearRegressionModel()

# Check the model's parameters
# We can either use the `.parameters()` method or the `state_dict()` method
model_0.state_dict()  # returns a dictionary of the model's parameters

OrderedDict([('weight', tensor([0.3367])), ('bias', tensor([0.1288]))])