In [1]:
import numpy as np

# 6.1 パラメータの効率的な更新，最適化
- optimizerを実装して，重みパラメータと勾配を渡して更新する
- optimizerを変えるだけで，異なる最適化アルゴリズムを使える

### Momentum
$$
\boldsymbol{v} \leftarrow \alpha \boldsymbol{v} - \eta \frac{\partial L}{\partial W}
\\ \\
W \leftarrow W + \boldsymbol{v}
$$
- $W$: 更新する重みパラメータ
- $\eta$: 学習率．インスタンス変数として
- $\boldsymbol{v}$: 速度にあたる変数．
- $\alpha$: 減速させる役割をもつ定数．(0.9などを使う)

In [2]:
class Momentum:
    def __init__(self, lr=0.01, momentum=0.9):
        # 初期化．速度の初期値はNone
        self.lr = lr
        self.momentum = momentum
        self.v = None
        
    def update(self, params, grads):
        # 初回更新時，vにparamsと同じ形状のデータをディクショナリとして持たせる
        if self.v is None:
            self.v = {}
            for key, val in params.items():
                self.v[key] = np.zeros_like(val)
                
        # paramsとvを更新する
        for key in params.keys():
            # 前回のvはmomentum分だけ減速，現在のparamsを元にした勾配で速度を更新
            self.v[key] = self.momentum * self.v[key] - self.lr * grads[key]
            # 更新後の速度でparamsを更新
            params[key] += self.v[key]