# Treinando uma rede neural com pytorch

# Introdução

O processo de treinamento de uma rede neural costuma envolver a otimização iterativa dos pesos até que a função de custo se estabilize ou até um número máximo de épocas seja alcançado. No entanto, treinar por muitas épocas pode levar a **overfitting**—quando o modelo começa a ajustar-se demais aos ruídos dos dados de treinamento e perde capacidade de generalização nos exemplos novos. Uma estratégia simples e eficaz para contornar esse problema é a **Parada Antecipada (Early Stopping)**, que interrompe o treino tão logo a performance em um conjunto de validação deixe de melhorar.

Neste notebook implementamos o Early Stopping em uma rede neural feita no Pytorch, aproveitando o mecanismo de `torch.nn` e `torch.optim`.  

Em ambos os casos, monitoramos a **loss** no conjunto de validação a cada época, salvamos o melhor estado de parâmetros e interrompemos o treino quando não houver melhora após um número fixo de épocas (patience). Ao final, comparamos as curvas de treinamento e validação, exibimos o ponto de parada e avaliamos o impacto do Early Stopping na capacidade de generalização do modelo.  


In [16]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler


In [94]:
class MLP(nn.Module):
    def __init__(self, num_dados_entrada, neuronios_c1, neuronios_c2, num_targets):
        super().__init__()
        
        self.camadas = nn.Sequential(
            nn.Linear(num_dados_entrada, neuronios_c1),
            nn.Sigmoid(),
            nn.Linear(neuronios_c1, neuronios_c2),
            nn.Sigmoid(),
            nn.Linear(neuronios_c2, num_targets),
        )
        
    def forward(self, x):
        x = self.camadas(x)
        return x

In [95]:
import pandas as pd

df = pd.read_csv("C:/Users/marco24038/OneDrive - ILUM ESCOLA DE CIÊNCIA/Redes Neurais e Algoritmos Genéticos/Medicaldataset.csv")
df

Unnamed: 0,Age,Gender,Heart rate,Systolic blood pressure,Diastolic blood pressure,Blood sugar,CK-MB,Troponin,Result
0,64,1,66,160,83,160.0,1.80,0.012,negative
1,21,1,94,98,46,296.0,6.75,1.060,positive
2,55,1,64,160,77,270.0,1.99,0.003,negative
3,64,1,70,120,55,270.0,13.87,0.122,positive
4,55,1,64,112,65,300.0,1.08,0.003,negative
...,...,...,...,...,...,...,...,...,...
1314,44,1,94,122,67,204.0,1.63,0.006,negative
1315,66,1,84,125,55,149.0,1.33,0.172,positive
1316,45,1,85,168,104,96.0,1.24,4.250,positive
1317,54,1,58,117,68,443.0,5.80,0.359,positive


In [96]:
X = df.drop(columns=["Blood sugar", "Result", "Gender"])
y = df["Blood sugar"].values.reshape(-1, 1)

X_temp, X_test, y_temp, y_test = train_test_split(X, y, test_size=0.1, random_state=42)
X_train, X_val, y_train, y_val = train_test_split(X_temp, y_temp, test_size=0.1, random_state=42)

In [97]:
scaler_X = StandardScaler()
scaler_y = StandardScaler()

X_train = scaler_X.fit_transform(X_train)
X_val = scaler_X.transform(X_val)
X_test = scaler_X.transform(X_test)

y_train = scaler_y.fit_transform(y_train)
y_val = scaler_y.transform(y_val)
y_test = scaler_y.transform(y_test)
y_test

array([[-4.29050602e-02],
       [-7.37248828e-01],
       [-4.92186322e-01],
       [-1.92665481e-01],
       [-6.41946742e-01],
       [ 1.88542862e-01],
       [-6.41946742e-01],
       [-6.41946742e-01],
       [-7.78092579e-01],
       [-8.87009248e-01],
       [ 3.74194920e+00],
       [-5.19415489e-01],
       [ 8.69272046e-01],
       [ 1.07349080e+00],
       [-5.19415489e-01],
       [-4.92186322e-01],
       [-5.60259240e-01],
       [-6.28332158e-01],
       [ 5.36208466e+00],
       [ 2.56615781e-01],
       [-4.10498820e-01],
       [-5.33030073e-01],
       [ 3.33351169e+00],
       [ 6.78667875e-01],
       [-6.41946742e-01],
       [-1.38207146e-01],
       [-7.50863412e-01],
       [-5.87488407e-01],
       [-6.41946742e-01],
       [-7.50863412e-01],
       [-6.14717575e-01],
       [-5.19415489e-01],
       [-6.82790493e-01],
       [-4.10498820e-01],
       [-2.06130916e-03],
       [ 3.79147034e-01],
       [-4.37727987e-01],
       [-6.96405077e-01],
       [-7.2

In [98]:

X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
X_val_tensor = torch.tensor(X_val, dtype=torch.float32)
X_test_tensor = torch.tensor(X_test, dtype=torch.float32)

y_train_tensor = torch.tensor(y_train, dtype=torch.float32)
y_val_tensor = torch.tensor(y_val, dtype=torch.float32)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32)


In [119]:
NUM_DADOS_DE_ENTRADA = X_train.shape[1] 
NUM_DADOS_DE_SAIDA = 1  
NEURONIOS_C1 = 5  
NEURONIOS_C2 = 3  

minha_mlp = MLP(
    NUM_DADOS_DE_ENTRADA, NEURONIOS_C1, NEURONIOS_C2, NUM_DADOS_DE_SAIDA
)

In [120]:
TAXA_DE_APRENDIZADO = 0.001
otimizador = optim.SGD(minha_mlp.parameters(), lr=TAXA_DE_APRENDIZADO)


fn_perda = nn.MSELoss()

In [121]:
NUM_EPOCAS = 1000
paciencia = 10
min_delta = 0.001
melhor_loss = float("inf")
contador_paciencia = 0

minha_mlp.train()

for epoca in range(NUM_EPOCAS):
    y_pred = minha_mlp(X_train_tensor)

    otimizador.zero_grad()

    loss = fn_perda(y_pred, y_train_tensor)
    
    y_pred_val = minha_mlp(X_val_tensor)
    loss_val = fn_perda(y_pred_val, y_val_tensor)

    loss.backward()

    otimizador.step()
    
    print(f"Época {epoca}: perda treino = {loss.item():.4f}, perda validação = {loss_val.item():.4f}")

    # === EARLY STOPPING COM BASE NA VALIDAÇÃO ===
    if loss_val.item() < melhor_loss - min_delta:
        melhor_loss = loss_val.item()
        contador_paciencia = 0
    else:
        contador_paciencia += 1
        if contador_paciencia >= paciencia:
            print(f"Parada antecipada na época {epoca} com perda da validação = {loss_val.item():.4f}")
            break

Época 0: perda treino = 1.7112, perda validação = 1.6829
Época 1: perda treino = 1.7060, perda validação = 1.6784
Época 2: perda treino = 1.7009, perda validação = 1.6738
Época 3: perda treino = 1.6958, perda validação = 1.6693
Época 4: perda treino = 1.6908, perda validação = 1.6648
Época 5: perda treino = 1.6858, perda validação = 1.6604
Época 6: perda treino = 1.6808, perda validação = 1.6560
Época 7: perda treino = 1.6759, perda validação = 1.6516
Época 8: perda treino = 1.6710, perda validação = 1.6472
Época 9: perda treino = 1.6661, perda validação = 1.6429
Época 10: perda treino = 1.6613, perda validação = 1.6387
Época 11: perda treino = 1.6565, perda validação = 1.6344
Época 12: perda treino = 1.6517, perda validação = 1.6302
Época 13: perda treino = 1.6470, perda validação = 1.6261
Época 14: perda treino = 1.6423, perda validação = 1.6219
Época 15: perda treino = 1.6376, perda validação = 1.6178
Época 16: perda treino = 1.6330, perda validação = 1.6137
Época 17: perda treino =

Época 184: perda treino = 1.1880, perda validação = 1.2367
Época 185: perda treino = 1.1867, perda validação = 1.2357
Época 186: perda treino = 1.1853, perda validação = 1.2346
Época 187: perda treino = 1.1840, perda validação = 1.2336
Época 188: perda treino = 1.1827, perda validação = 1.2326
Época 189: perda treino = 1.1813, perda validação = 1.2315
Época 190: perda treino = 1.1800, perda validação = 1.2305
Época 191: perda treino = 1.1788, perda validação = 1.2295
Época 192: perda treino = 1.1775, perda validação = 1.2285
Época 193: perda treino = 1.1762, perda validação = 1.2275
Época 194: perda treino = 1.1749, perda validação = 1.2265
Época 195: perda treino = 1.1737, perda validação = 1.2256
Época 196: perda treino = 1.1724, perda validação = 1.2246
Época 197: perda treino = 1.1712, perda validação = 1.2236
Época 198: perda treino = 1.1700, perda validação = 1.2227
Época 199: perda treino = 1.1687, perda validação = 1.2218
Época 200: perda treino = 1.1675, perda validação = 1.22

Época 375: perda treino = 1.0473, perda validação = 1.1366
Época 376: perda treino = 1.0470, perda validação = 1.1364
Época 377: perda treino = 1.0466, perda validação = 1.1362
Época 378: perda treino = 1.0463, perda validação = 1.1360
Época 379: perda treino = 1.0460, perda validação = 1.1358
Época 380: perda treino = 1.0456, perda validação = 1.1356
Época 381: perda treino = 1.0453, perda validação = 1.1354
Época 382: perda treino = 1.0450, perda validação = 1.1352
Época 383: perda treino = 1.0446, perda validação = 1.1351
Época 384: perda treino = 1.0443, perda validação = 1.1349
Época 385: perda treino = 1.0440, perda validação = 1.1347
Época 386: perda treino = 1.0437, perda validação = 1.1345
Época 387: perda treino = 1.0434, perda validação = 1.1344
Época 388: perda treino = 1.0431, perda validação = 1.1342
Época 389: perda treino = 1.0427, perda validação = 1.1340
Época 390: perda treino = 1.0424, perda validação = 1.1338
Época 391: perda treino = 1.0421, perda validação = 1.13

In [123]:
minha_mlp.eval()

MLP(
  (camadas): Sequential(
    (0): Linear(in_features=6, out_features=5, bias=True)
    (1): Sigmoid()
    (2): Linear(in_features=5, out_features=3, bias=True)
    (3): Sigmoid()
    (4): Linear(in_features=3, out_features=1, bias=True)
  )
)

In [124]:

with torch.no_grad():
    y_pred = minha_mlp(X_test_tensor)

In [125]:
y_pred

tensor([[-0.1629],
        [-0.1460],
        [-0.1595],
        [-0.1598],
        [-0.1485],
        [-0.1815],
        [-0.1772],
        [-0.1615],
        [-0.1543],
        [-0.1720],
        [-0.1610],
        [-0.1515],
        [-0.1798],
        [-0.1572],
        [-0.1605],
        [-0.1547],
        [-0.1667],
        [-0.1662],
        [-0.1736],
        [-0.1600],
        [-0.1727],
        [-0.1787],
        [-0.1743],
        [-0.1646],
        [-0.1693],
        [-0.1440],
        [-0.1721],
        [-0.1708],
        [-0.1690],
        [-0.1518],
        [-0.1443],
        [-0.1709],
        [-0.1653],
        [-0.1817],
        [-0.1598],
        [-0.1673],
        [-0.1645],
        [-0.1630],
        [-0.1472],
        [-0.1419],
        [-0.1709],
        [-0.1559],
        [-0.1522],
        [-0.1660],
        [-0.1716],
        [-0.1634],
        [-0.1313],
        [-0.1813],
        [-0.1575],
        [-0.1507],
        [-0.1550],
        [-0.1696],
        [-0.

In [126]:
RMSE = mean_squared_error(y_test, y_pred, squared=False)
print(RMSE)

1.14631081489808


- [medium](https://cyborgcodes.medium.com/what-is-early-stopping-in-deep-learning-eeb1e710a3cf)