In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import time

In [2]:
# Creamos una clase del modelo
class MLP(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(MLP, self).__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.fc2 = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

In [3]:
# Instanciamos el modelo
model = MLP(
    input_dim=10, # Neuronas de entrada
    hidden_dim=32, # Neuronas en la capa oculta
    output_dim=1 # Neuronas de salida
    )

In [4]:
# Definimos pérdida y optimmizador
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

In [5]:
#  Ejemplo de datos ficticios
x = torch.randn(2000000, 10) # 2000000 muestras 10 features
y = torch.randn(2000000, 1) # 2000000 muestras 1 feature

In [6]:
start_time = time.time()
# Forward + Backward
model.train()
optimizer.zero_grad()
output = model(x)
loss = criterion(output, y)
loss.backward()
optimizer.step()
end_time = time.time()
elapsed = end_time - start_time

print("Pérdida:", loss.item())
print(f"Tiempo de entrenamiento: {elapsed:.6f} segundos")

Pérdida: 1.0693960189819336
Tiempo de entrenamiento: 0.262280 segundos


## Si podemos usar GPU

In [7]:
# Seleccionamos el dispositivo: GPU si está disponible, sino CPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Usando dispositivo: {device}")

Usando dispositivo: cpu


In [None]:
# Definimos la clase del modelo MLP
class MLP(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(MLP, self).__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.fc2 = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

In [None]:
# Instanciamos el modelo
model = MLP(
    input_dim=10, # Neuronas de entrada
    hidden_dim=32, # Neuronas en la capa oculta
    output_dim=1 # Neuronas de salida
    ).to(device) # Movemos el modelo al dispositivo seleccionado

In [None]:
# Definimos pérdida y optimmizador
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

In [None]:
torch.cuda.empty_cache() # Limpiamos la caché de la GPU
#  Generamos datos ficticios y los movemos al mismo dispositivo
x = torch.randn(2000000, 10).to(device) # 2000000 muestras 10 features
y = torch.randn(2000000, 1).to(device) # 2000000 muestras 1 feature
torch.cuda.synchronize() # Sincronizamos la GPU antes de medir el tiempo

In [None]:
start_time = time.time()

# Entrenamiento
model.train()
optimizer.zero_grad() # Limpiamos los gradientes
output = model(x) # Forward pass
loss = criterion(output, y) # Calculamos la pérdida
loss.backward() # Backward pass
optimizer.step() # Actualizamos los pesos
end_time = time.time()
elapsed_time = end_time - start_time

print(f"Perdida: {loss.item()}")
print(f"Tiempo de entrenamiento: {elapsed_time} segundos")