# 경사하강법(gradient descent) 구현

최솟값을 찾기 위한 방법이므로 하강법이라고 정의함

In [1]:
import numpy as np
import matplotlib.pylab as plt

In [2]:
def function_2(x):
    if x.ndim == 1:
        return np.sum(x**2)
    else:
        return np.sum(x**2, axis=0) # x0^2 + x1^2

$f(x_0,x_1)=x_0^2+x_1^2$

In [3]:
def numerical_gradient_single_point(f, x, verbose=False): 
    h = 1e-4
    grad = np.zeros_like(x)
    if verbose:
        print('x.size={}'.format(x.size)) # (x0, x1) 을 입력으로 받음 --> 2
       
    for idx in range(x.size): #축별로 계산
        v_keep = x[idx]
        
        # f(x+h) 계산
        x[idx] = float(v_keep) + h #n차원 입력 중 해당 차원으로만 h를 더하고
        fxh1 = f(x)
        if verbose:
            print(x, '-->', fxh1)
        
        # f(x-h) 계산
        x[idx] = float(v_keep) - h #n차원 입력 중 해당 차원으로만 h를 빼서
        fxh2 = f(x)
        if verbose:
            print(x, '-->', fxh2)
        
        grad[idx] = (fxh1 - fxh2) / (2*h) #n차원 방향의 차분을 구함 !
        x[idx] = v_keep # 값 복원
        
        if verbose:
            print('grad[{}]={}'.format(idx, grad[idx]))
            print()
    return grad

In [4]:
def numerical_gradient(f, X):
    if X.ndim == 1:
        return numerical_gradient_single_point(f, X)
    else:
        grad = np.zeros_like(X)
        
        for idx, x in enumerate(X):
            grad[idx] = numerical_gradient_single_point(f, x)
        
        return grad

In [5]:
def gradient_descent(f, init_x, lr =0.1, step_num= 100, verbose = False):
    x = init_x
    
    for i in range(step_num):
        grad = numerical_gradient(f, x)
        if verbose: 
            print(x, grad)
        x -= lr * grad
        
    return x #나의 최종 위치(변화된 위치)

$x_0 = x_0 - η \frac {∂f} {∂x_0}$ <br>
$x_1 = x_1 - η \frac {∂f} {∂x_1}$

In [6]:
init_x = np.array([-3.0, 4.0])

In [7]:
x_final = gradient_descent(function_2, init_x = init_x, lr = 0.1)

In [8]:
x_final

array([-6.11110793e-10,  8.14814391e-10])

Expected output when lr =0.1, step_num= 100, init_x = np.array([-3.0, 4.0]):<br>
&emsp;&emsp; array([-6.11110793e-10,  8.14814391e-10])

* TODO I: lr = 10.0 으로, lr = 0.0001 등으로 변경하여 결과를 뽑아보고 논의해봅시다.
* TODO II: 3차원 공간에서의 좌표 궤적을 그려주세요 (lr = 0.001, 0.01, 0.1, 1.0, 10.0 등등)