# RMSProp
Adagradの欠点（学習率が小さくなりすぎる）を補うため、最近の勾配の二乗平均を指数移動平均で管理する  
学習率が一定の範囲内で安定し、反復が進むにつれて適切に更新される

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np

# シード固定
torch.manual_seed(42)
np.random.seed(42)

# サンプルデータ生成： y = 2*x + 1 にノイズ
X = np.linspace(-1, 1, 100).reshape(-1, 1)
y = 2 * X + 1 + np.random.normal(0, 0.1, X.shape)

# NumPyからTensorに変換
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.float32)

# シンプルな線形モデル：入力1次元、出力1次元
def create_model():
    return nn.Linear(1, 1)

# 訓練ループ（エポック数は固定：100エポック）
def train_model(model, optimizer, epochs=100):
    criterion = nn.MSELoss()
    for epoch in range(epochs):
        model.train()
        optimizer.zero_grad()
        preds = model(X_tensor)
        loss = criterion(preds, y_tensor)
        loss.backward()
        optimizer.step()
    return loss.item()


In [3]:
model_rmsprop = create_model()
# RMSProp: 勾配の二乗平均を指数移動平均で管理し、学習率を安定化
optimizer_rmsprop = optim.RMSprop(model_rmsprop.parameters(), lr=0.01)
loss_rmsprop = train_model(model_rmsprop, optimizer_rmsprop)
print("RMSProp Loss:", loss_rmsprop)


RMSProp Loss: 0.009307713247835636
