##### 수치미분 최종 버전 - numerical derivative

In [1]:
import numpy as np

def numerical_derivative(f, x):
    delta_x = 1e-4
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

##### [예제 5] 1변수 함수 f(x) = x^2, f'(3.0)

In [4]:
import numpy as np

def numerical_derivative(f, x):  # 수치미분 debug version
    delta_x = 1e-4
    grad = np.zeros_like(x)
    print("debug 1. initial input variable =", x)
    print("debug 2. initial grad =", grad)
    print("========================================")
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        print("debug 3. idx =", idx, ", x[idx] =", x[idx])
        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        print("debug 4. grad[idx] =", grad[idx])
        print("debug 5. grad =", grad)
        print("========================================")
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 입력변수 1개인 함수 f(x) = x**2
def func1(W):
    x = W[0]
    
    return x**2

# lambda function 정의
f = lambda W : func1(W)

W = np.array([3.0])

# x = 3.0 에서의 편미분 값
ret = numerical_derivative(f, W)

print('type(ret) =', type(ret), ', ret_val =', ret)

debug 1. initial input variable = [3.]
debug 2. initial grad = [0.]
debug 3. idx = (0,) , x[idx] = 3.0
debug 4. grad[idx] = 6.000000000012662
debug 5. grad = [6.]
type(ret) = <class 'numpy.ndarray'> , ret_val = [6.]


##### [예제 6] 2변수 함수 f(x, y) = 2x + 3xy + y^3, f'(1.0, 2.0)

In [6]:
import numpy as np

def numerical_derivative(f, x):  # 수치미분 debug version
    delta_x = 1e-4
    grad = np.zeros_like(x)
    print("debug 1. initial input variable =", x)
    print("debug 2. initial grad =", grad)
    print("========================================")
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        print("debug 3. idx =", idx, ", x[idx] =", x[idx])
        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        print("debug 4. grad[idx] =", grad[idx])
        print("debug 5. grad =", grad)
        print("========================================")
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 입력변수 2개인 함수 f(x, y) = 2x + 3xy + y^3
def func2(W):
    x = W[0]
    y = W[1]
    
    return (2*x + 3*x*y + np.power(y, 3))

# lambda function 정의
f = lambda W : func2(W)

# (x, y) = (1.0, 2.0) 에서의 편미분 값
W = np.array([1.0, 2.0])

numerical_derivative(f, W)

debug 1. initial input variable = [1. 2.]
debug 2. initial grad = [0. 0.]
debug 3. idx = (0,) , x[idx] = 1.0
debug 4. grad[idx] = 7.999999999990237
debug 5. grad = [8. 0.]
debug 3. idx = (1,) , x[idx] = 2.0
debug 4. grad[idx] = 15.000000010019221
debug 5. grad = [ 8.         15.00000001]


array([ 8.        , 15.00000001])

##### [예제 7] 다음과 같은 행렬을 입력으로 받는 4변수 함수 f(w, x, y, z) 에서 각 변수에 대해 수치미분을 이용하여 미분 값을 구하는 코드를 구현하시오
(w x; y z;) = (1.0 2.0; 3.0 4.0;)  
f(w, x, y, z) = wx + xyz + 3w + zy^2

In [8]:
import numpy as np

def numerical_derivative(f, x):  # 수치미분 debug version
    delta_x = 1e-4
    grad = np.zeros_like(x)
    print("debug 1. initial input variable =", x)
    print("debug 2. initial grad =", grad)
    print("========================================")
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        print("debug 3. idx =", idx, ", x[idx] =", x[idx])
        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        print("debug 4. grad[idx] =", grad[idx])
        print("debug 5. grad =", grad)
        print("========================================")
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 입력변수 4개인 함수 f(w, x, y, z) = wx + xyz + 3w + zy^2
def func3(W):
    w = W[0,0]
    x = W[0,1]
    y = W[1,0]
    z = W[1,1]
    
    return (w*x + x*y*z + 3*w + z*np.power(y, 2))

# lambda function 정의
f = lambda W : func3(W)

# (x, y) = (1.0, 2.0) 에서의 편미분 값
W = np.array([[1.0, 2.0], [3.0, 4.0]])

numerical_derivative(f, W)

debug 1. initial input variable = [[1. 2.]
 [3. 4.]]
debug 2. initial grad = [[0. 0.]
 [0. 0.]]
debug 3. idx = (0, 0) , x[idx] = 1.0
debug 4. grad[idx] = 5.000000000023874
debug 5. grad = [[5. 0.]
 [0. 0.]]
debug 3. idx = (0, 1) , x[idx] = 2.0
debug 4. grad[idx] = 13.00000000000523
debug 5. grad = [[ 5. 13.]
 [ 0.  0.]]
debug 3. idx = (1, 0) , x[idx] = 3.0
debug 4. grad[idx] = 32.00000000006753
debug 5. grad = [[ 5. 13.]
 [32.  0.]]
debug 3. idx = (1, 1) , x[idx] = 4.0
debug 4. grad[idx] = 15.000000000000568
debug 5. grad = [[ 5. 13.]
 [32. 15.]]


array([[ 5., 13.],
       [32., 15.]])

##### [예제 8] 1변수 함수 f(x) = x^2 에서 미분하고자 하는 입력값을 정수 3으로 주는 경우의 미분값과 실수 3.0으로 주는 경우 미분값이 다른 이유를 설명하시오
즉, f'(3)과 f'(3.0)을 계산하는 수치미분 코드를 구현하고 각 결과값이 나온 이유를 설명하시오

In [14]:
import numpy as np

def numerical_derivative(f, x):  # 수치미분 debug version
    delta_x = 1e-4
    grad = np.zeros_like(x)
    print("debug 1. initial input variable =", x)
    print("debug 2. initial grad =", grad)
    print("========================================")
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        print("debug 3. idx =", idx, ", x[idx] =", x[idx])
        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        print("debug 4. grad[idx] =", grad[idx])
        print("debug 5. grad =", grad)
        print("========================================")
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 입력변수 1개인 함수 f(x) = x**2
def func1(W):
    x = W[0]
    
    return x**2

# lambda function 정의
f = lambda W : func1(W)

W1 = np.array([3.0])
W2 = np.array([3])

print("x = 3.0 ->", numerical_derivative(f, W1), ", x = 3 ->", numerical_derivative(f, W2))

debug 1. initial input variable = [3.]
debug 2. initial grad = [0.]
debug 3. idx = (0,) , x[idx] = 3.0
debug 4. grad[idx] = 6.000000000012662
debug 5. grad = [6.]
debug 1. initial input variable = [3]
debug 2. initial grad = [0]
debug 3. idx = (0,) , x[idx] = 3
debug 4. grad[idx] = 25000
debug 5. grad = [25000]
x = 3.0 -> [6.] , x = 3 -> [25000]
