In [None]:
import numpy as np

## 勾配法
$x_{0} = x_{0} - \eta{\frac{\sigma{f}}{\sigma{x_{0}}}}$\
$x_{1} = x_{1} - \eta{\frac{\sigma{f}}{\sigma{x_{1}}}}$\
$\eta$は更新量を表す。これはニューラルネットワークで学習率と呼ばれる。\
一回の学習でどれだけ学習すべきか、どれだけパラメーターを更新するかを決めるのが学習率である。

In [None]:
def numerical_gradient(f, x):
    h = 1e-4 # 0.0001
    grad = np.zeros_like(x) # xと同じ形状の配列を生成
    
    for idx in range(x.size):
        tmp_val = x[idx]
        # f(x+h)の計算
        x[idx] = tmp_val + h
        fxh1 = f(x)
        
        # f(x-h)の計算
        x[idx] = tmp_val - h
        fxh2 = f(x)
        
        grad[idx] = (fxh1 - fxh2) / (2*h)
        x[idx] = tmp_val
    
    return grad
    
    
def gradient_descent(f, init_x, lr=0.01, step_num=100):
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f, x)
        x -= lr * grad
        
    return x