**动量算法Momentum**
$$s_t=βs_{t−1}+(1−β)g_t$$
**参数更新公式**
$$w_t=w_{t−1}−ηs_t$$

In [None]:
import torch

"""
动量算法Momentum

St = β* St-1 + (1 - β)* gt

St: 本次指数移动加权平均的结果
β：动量因子，一般取0.9
St-1：上一次指数移动加权平均的结果
gt：当前梯度
"""


def dm01():
    # 1 初始化权重参数
    w = torch.tensor([1.0], requires_grad=True, dtype=torch.float32)
    loss = (w**2 / 2).sum()
    # 2.momentum默认为0，即不使用动量算法
    optimizer = torch.optim.SGD([w], lr= 0.01, momentum=0.9)
    # 3 第1次更新 计算梯度，并对参数进行更新
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    print("第1次: 梯度w.grad: %f, 更新后的权重:%f" % (w.grad.numpy(), w.detach().numpy()))
    # 4 第2次更新 计算梯度，并对参数进行更新
    # 使用更新后的参数机选输出结果
    loss = (w**2 / 2).sum()
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    print("第2次: 梯度w.grad: %f, 更新后的权重:%f" % (w.grad.numpy(), w.detach().numpy()))




第1次: 梯度w.grad: 1.000000, 更新后的权重:0.990000
第2次: 梯度w.grad: 0.990000, 更新后的权重:0.971100


AdaGrad

公式：
$$
\mathbf{s}_t \leftarrow \mathbf{s}_{t-1} + \mathbf{g}_t^2, \\
\mathbf{x}_t \leftarrow \mathbf{x}_{t-1} - \frac{\eta}{\sqrt{\mathbf{s}_t + \epsilon}} \odot \mathbf{g}_t.
$$


In [5]:
"""
AdaGrad
公式：
   累计平方梯度：
    St = St-1 + Gt * Gt

   权重参数更新：
   Wt = Wt-1 - η * Gt / sqrt(St + ε)
        η：学习率
        ε: 小常数：1e-10，防止除0错误
"""
def dm02():
    # 1 初始化权重参数
    w = torch.tensor([1.0], requires_grad=True, dtype=torch.float32)
    loss = (w**2 / 2).sum()
    # 2 实例化优化方法：adagrad优化方法
    optimizer = torch.optim.Adagrad([w], lr=0.01)
    # 3 第1次更新 计算梯度，并对参数进行更新
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    print(
        "第1次: 梯度w.grad: %f, 更新后的权重:%f" % (w.grad.numpy(), w.detach().numpy())
    )
    # 4 第2次更新 计算梯度，并对参数进行更新
    # 使用更新后的参数机选输出结果
    loss = (w**2 / 2).sum()
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    print(
        "第2次: 梯度w.grad: %f, 更新后的权重:%f" % (w.grad.numpy(), w.detach().numpy())
    )

In [6]:
if __name__ == "__main__":
    # dm01()
    dm02()

第1次: 梯度w.grad: 1.000000, 更新后的权重:0.990000
第2次: 梯度w.grad: 0.990000, 更新后的权重:0.982965
