#  Momentum（モーメンタム
前回の更新の方向（勾配）を考慮して、更新方向に慣性を持たせる  
更新方向に一貫性が生まれ、局所解にとらわれにくくなる

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np

# シード固定
torch.manual_seed(42)
np.random.seed(42)

# サンプルデータ生成： y = 2*x + 1 にノイズ
X = np.linspace(-1, 1, 100).reshape(-1, 1)
y = 2 * X + 1 + np.random.normal(0, 0.1, X.shape)

# NumPyからTensorに変換
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.float32)

# シンプルな線形モデル：入力1次元、出力1次元
def create_model():
    return nn.Linear(1, 1)

# 訓練ループ（エポック数は固定：100エポック）
def train_model(model, optimizer, epochs=100):
    criterion = nn.MSELoss()
    for epoch in range(epochs):
        model.train()
        optimizer.zero_grad()
        preds = model(X_tensor)
        loss = criterion(preds, y_tensor)
        loss.backward()
        optimizer.step()
    return loss.item()


In [3]:
model_momentum = create_model()
# Momentum付きSGD: momentum=0.9 を設定
optimizer_momentum = optim.SGD(model_momentum.parameters(), lr=0.1, momentum=0.9)
loss_momentum = train_model(model_momentum, optimizer_momentum)
print("SGD with Momentum Loss:", loss_momentum)


SGD with Momentum Loss: 0.00815557036548853
