In [11]:
import torch
import torch.nn as nn
import torch.optim as optim

# Definindo um modelo simples
model = nn.Linear(10, 1)

# Definindo o otimizador SGD com weight_decay
optimizer = optim.SGD(model.parameters(), lr=0.01, weight_decay=0.001)

# Função de perda
criterion = nn.MSELoss()

# Exemplo de dado de entrada e saída
input_data = torch.randn(10)  # Entrada de 10 features
print(f"Entrada: {input_data}", flush=True)  # Adiciona o print logo após popular o input_data
target = torch.randn(1)       # Saída esperada

# Forward pass
print("\n=== Forward Pass ===", flush=True)
output = model(input_data)
print(f"Saída gerada (output): {output}", flush=True)

# Cálculo da perda
loss = criterion(output, target)
print(f"Valor da perda (loss): {loss.item()}", flush=True)

# Backward pass - calculando os gradientes
print("\n=== Backward Pass ===", flush=True)
loss.backward()

# Exibindo gradientes antes da otimização
for name, param in model.named_parameters():
    if param.requires_grad:
        print(f"Gradiente de {name}: {param.grad}", flush=True)

# Exibindo os pesos antes da otimização
print("\n=== Pesos Antes da Atualização ===", flush=True)
for name, param in model.named_parameters():
    if param.requires_grad:
        print(f"Pesos de {name} antes da atualização: {param.data}", flush=True)

# Otimização - atualização dos pesos
print("\n=== Atualizando Pesos ===", flush=True)
optimizer.step()

# Exibindo os pesos após a otimização
print("\n=== Pesos Depois da Atualização ===", flush=True)
for name, param in model.named_parameters():
    if param.requires_grad:
        print(f"Pesos de {name} após a atualização: {param.data}", flush=True)


Entrada: tensor([ 0.0395,  0.3992, -1.1142,  0.2570, -0.8831, -0.9944, -0.4334, -0.1837,
        -0.2658, -0.1813])

=== Forward Pass ===
Saída gerada (output): tensor([-0.5268], grad_fn=<ViewBackward0>)
Valor da perda (loss): 2.6495301723480225

=== Backward Pass ===
Gradiente de weight: tensor([[-0.1286, -1.2995,  3.6273, -0.8368,  2.8749,  3.2372,  1.4111,  0.5982,
          0.8652,  0.5901]])
Gradiente de bias: tensor([-3.2555])

=== Pesos Antes da Atualização ===
Pesos de weight antes da atualização: tensor([[-0.0424,  0.2785,  0.1723,  0.0018, -0.0133,  0.2747,  0.1443, -0.1388,
         -0.1877, -0.0931]])
Pesos de bias antes da atualização: tensor([-0.2130])

=== Atualizando Pesos ===

=== Pesos Depois da Atualização ===
Pesos de weight após a atualização: tensor([[-0.0411,  0.2915,  0.1361,  0.0102, -0.0420,  0.2423,  0.1302, -0.1448,
         -0.1963, -0.0990]])
Pesos de bias após a atualização: tensor([-0.1804])


In [4]:
model.parameters

<bound method Module.parameters of Linear(in_features=10, out_features=1, bias=True)>

In [3]:
print(target)

tensor([1.0800])
