In [None]:
class SGD:
    """確率的勾配降下法（Stochastic Gradient Descent）

    注意：「確率的」とは、ミニバッチの選び方がランダムだからなのだが、
    ここでの実装にそれは含まれないので単に勾配降下法と呼んだほうが適切かもしれない。
    """

    lr : float
    """学習率"""

    def __init__(self, lr=0.01):
        self.lr = lr

    def update(self, params : dict[str, float], grads : dict[str, float]):
        """パラメータの更新

        Args:
        * params : 重みパラメータが格納されている辞書
        * grads : 勾配が格納されている辞書
        """
        for key in params.keys():
            params[key] -= self.lr * grads[key]

In [None]:
import numpy as np

class Momentum:
    def __init__(self, lr=0.01, momentum=0.9):
        self.lr = lr
        self.momentum = momentum
        self.v = None

    def update(self, params : dict[str, float], grads : dict[str, float]):
        if self.v is None:
            self.v = {}
            for key, val in params.items():
                self.v[key] = np.zeros_like(val)

        for key in params.keys():
            self.v[key] = self.momentum * self.v[key] - self.lr * grads[key]
            params[key] += self.v[key]
