In [3]:
import math
import torch
import numpy as np

# Função Sigmoid: (1 / 1 + e^(-x)):
def sigmoid(x):
    return 1 / (1 + math.exp(-x))

# Função ReLU: 0 se x < 0, x se x > 0.
class ReLU(torch.nn.Module):
    def __init__(self):
        super().__init__()

    def forward(self, x):
        return torch.max(torch.zeros_like(x), x)

    
# Erro quadrático médio (Mean Squared Error):
def mse_loss(y_true, y_pred):
    return np.mean((y_true - y_pred) ** 2)

# Perda de entropia cruzada (Cross Entropy Loss):
def cross_entropy_loss(y_true, y_pred):
    epsilon = 1e-15
    y_pred = np.clip(y_pred, epsilon, 1. - epsilon)  # Evitar divisão por zero
    return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))


In [5]:
import torch
import torch.nn as nn
from torch.optim import SGD
import matplotlib.pyplot as plt
%matplotlib inline

# Criando o conjunto de dados

x = [[1, 2], [3, 4], [5, 6], [7, 8]]
y = [[3], [7], [11], [15]]

X = torch.tensor(x).float()
Y = torch.tensor(y).float()

# Verificando o dispositivo (CPU ou GPU)
device = 'cuda' if torch.cuda.is_available() else 'cpu'
X = X.to(device)
Y = Y.to(device)

# Arquitetura do modelo

class MyNeuralNet(nn.Module):
    def __init__(self):
        # Quando chamamos o método super().__init__(), garantimos que estamos herdando
        super().__init__()
        self.layer1 = nn.Linear(2, 8)  # Uma camada linear
        self.activation = nn.ReLU()   # Função de ativação
        self.layer2 = nn.Linear(8, 1) # Segunda camada linear

    # Quando passamos algo pelo modelo, ele chama a função forward
    def forward(self, x):
        x = self.layer1(x)
        x = self.activation(x)
        x = self.layer2(x)
        return x

# Criando uma instância do modelo
model = MyNeuralNet()

# Função de perda
loss_func = nn.MSELoss()  # Erro quadrático médio (Mean Squared Error)

# Otimizador
opt = SGD(model.parameters(), lr=0.001)

# Loop de treinamento
losses = []
for _ in range(50):  # 50 épocas
    opt.zero_grad()  # Zerando os gradientes antes de cada época
    loss_value = loss_func(model(X), Y)
    
    # Os gradientes da função de perda com respeito aos parâmetros treináveis
    # são calculados e armazenados no atributo grad dos tensores correspondentes
    loss_value.backward()

    # opt.step() atualiza os pesos e os vieses da rede neural usando
    # os gradientes calculados e o algoritmo de otimização escolhido
    opt.step()
    losses.append(loss_value.detach().numpy())


In [7]:
# Loss Plot
plt.plot(losses)
plt.title('Loss variation x epochs')
plt.xlabel('epochs')
plt.ylabel('loss value')

Text(0, 0.5, 'loss value')