In [20]:
# 실수 벡터를 입력하면 실수 하나를 출력해 주는 함수 
# v에 속해 있는 항목들의 제곱합을 계산한다.
def sum_of_squares(v):
    return sum(v_i ** 2 for v_i in v)

print sum_of_squares([1,2,5,5])

55


In [21]:
# Gradient
# f 가 단변수 함수인 경우, 점 x에서의 미분값은 x가 아주 조금 변했을 때 f(x)의 변화량을 의미한다. x의 변화량을 다음 식에서는 h로 표기.
# 아주 조금 변한다는 것을 반영하기 위해 h를 0에 점근하게 했다.
# 이때 미분값은 함수 변화율(difference quotient)의 극한값이다.
def difference_quotient(f, x, h):
    return (f(x + h) - f(x)) / h

# square 함수의 도함수(derivative)를 구하자.
def square(x):
    return x * x

def derivative_of_square(x):
    return 2 * x

derivative_estimate = lambda x: difference_quotient(square, x, h=0.00001)

print derivative_of_square(2)
print derivative_estimate(2)

4
4.00001000003


In [None]:
import matplotlib.pyplot as plt

# 두 계산식에 따른 결과값이 거의 비슷함을 보여 주기 위한 그래프
x = range(-10, 10)

plt.title("Actual Derivatives vs. Estimate")
plt.plot(x, map(derivative_of_square, x), 'rx', label='Actual')
plt.plot(x, map(derivative_estimate, x), 'b+', label='Estimate')
plt.legend(loc=9)
plt.show()

In [22]:
# 편도함수 변화량 계산
# 함수 f의 i번째 편도함수가 v에서 가지는 값
def partial_difference_quotient(f, v, i, h):
    w = [v_j + (h if j == i else 0)
         for j, v_j in enumerate(v)]
    
    return (f(w) - f(v)) / h

def estimate_gradient(f, v, h=0.00001):
    return [partial_difference_quotient(f, v, i, h)
            for i, _ in enumerate(v)]

In [48]:
import random
import math

# 벡터 뺄셈
def vector_subtract(v, w):
    return [v_i - w_i
            for v_i, w_i in zip(v,w)]

def magnitude(v):
    return math.sqrt(sum_of_squares(v))

def distance(v, w):
    return magnitude(vector_subtract(v, w))

def step(v, direction, step_size):
    return [v_i + step_size * direction_i
            for v_i, direction_i in zip(v, direction)]

def sum_of_squares_gradient(v):
    return [2 * v_i for v_i in v]

v = [random.randint(-10, 10) for i in range(3)]

tolerance = 0.0000001

while True:
    gradient = sum_of_squares_gradient(v)
    next_v = step(v, gradient, -0.01)
    if distance(next_v, v) < tolerance:
        break
    v = next_v
    
print v

[4.0442487262054e-06, 0.0, -2.8887490901467167e-06]


In [50]:
# 적절한 이동 거리 정하기
step_sizes = [100, 10, 1, 0.1, 0.01, 0.001, 0.0001, 0.00001]

def safe(f):
    def safe_f(*args, **kwargs):
        try:
            return f(*args, **kwargs)
        except:
            return float('inf')
    return safe_f

In [None]:
# 목적 함수를 최소화시키는 theta를 경사 하강법을 사용해서 찾아준다.
def minimize_batch(target_fn, gradient_fn, theta_0, tolerance=0.000001):
    step_sizes = [100, 10, 1, 0.1, 0.01, 0.001, 0.0001, 0.00001]
    
    theta = theta_0
    