# Adagrad
各パラメータごとに適応的な学習率を割り当てる手法  
パラメータの更新頻度に応じて学習率が自動調整されるため、希少な特徴量にも対応するが、学習率がどんどん小さくなる傾向がある

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np

# シード固定
torch.manual_seed(42)
np.random.seed(42)

# サンプルデータ生成： y = 2*x + 1 にノイズ
X = np.linspace(-1, 1, 100).reshape(-1, 1)
y = 2 * X + 1 + np.random.normal(0, 0.1, X.shape)

# NumPyからTensorに変換
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.float32)

# シンプルな線形モデル：入力1次元、出力1次元
def create_model():
    return nn.Linear(1, 1)

# 訓練ループ（エポック数は固定：100エポック）
def train_model(model, optimizer, epochs=100):
    criterion = nn.MSELoss()
    for epoch in range(epochs):
        model.train()
        optimizer.zero_grad()
        preds = model(X_tensor)
        loss = criterion(preds, y_tensor)
        loss.backward()
        optimizer.step()
    return loss.item()


In [4]:
model_adagrad = create_model()
# Adagrad: 各パラメータごとに学習率を適応的に更新
optimizer_adagrad = optim.Adagrad(model_adagrad.parameters(), lr=0.1)
loss_adagrad = train_model(model_adagrad, optimizer_adagrad)
print("Adagrad Loss:", loss_adagrad)


Adagrad Loss: 0.011433648876845837
