수치미분 코드구현

시스템이란
input, output, process의 세가지 combination
미분의 이유
정해놓은 출력값을 찾기 위해 미세한 변수를 대입해 값을 찾는다
실생활에 굉장히 많이 쓰인다(전파, 일기예보).

다변수 함수를 코드로 하기위해선 (행렬의 독립성 이용)
데이터를 모두 행렬도 변경
다중변수 또한 행렬로 변경(독립변수) 행렬의 각각의 원소를 미분하는것

데이터를 통째로 받는게 편하기 때문에 함수를 하나하나 짜지 않는다

In [1]:
import numpy as np

In [2]:
def numerical_derivative(f, x):               
    # 함수의 인자로 넘파이가 넘어오면 변하기 쉬움 그렇기 때문에 temp에 원본을 저장
    delta_x = 1e-4    # lim 함수
    grad = np.zeros_like(x)   # 입력이랑 동일할때 0으로 초기화 시킴 공간세팅
    
    it = np.nditer(x, flags = ['multi_index'], op_flags = ['readwrite'])
    # 포인터의 역할, flags 끝나는 지점과 시작지점을 정해주는 값
    while not it.finished:       # 행렬의 원소가 있는 동안
        # 미분의 계산
        idx = it.multi_index     # 
        
        tmp_val = x[idx]      # 원본 보존(1번째 원소값), 다중변수를 미분할때 독립적으로 하나하나 하기위해 원본을 저장한다
        # 하나를 바꾸고 나머지는 상수로 두고, 하나가 끝나면 그 바꾼 넘파이를 상수로 두고 다음 변수를 미분한다
        x[idx] = float(tmp_val) + delta_x  # 변수 더하기
        fx1 = f(x)        # f(x + delta_x)
        
        x[idx] = tmp_val - delta_x   # 변수 빼기
        fx2 = f(x)        # f(x - delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)   # 미분값
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

In [3]:
# 예시

def func(W):
    
    x = W[0, 0]
    y = W[0, 1]
    
    return 2*x + 3*x*y + y**3

f = lambda W : func(W)

x = np.array([[1.0, 2.0]])

def numerical_derivative(f, x):               
    # 함수의 인자로 넘파이가 넘어오면 변하기 쉬움 그렇기 때문에 temp에 원본을 저장
    delta_x = 1e-4    # lim 함수
    grad = np.zeros_like(x)   # 입력이랑 동일할때 0으로 초기화 시킴
    
    it = np.nditer(x, flags = ['multi_index'], op_flags = ['readwrite'])
    
    while not it.finished:       # 행렬의 원소가 있는 동안
        # 미분의 계산
        idx = it.multi_index     # 
        
        tmp_val = x[idx]      # 원본 보존(1번째 원소값)
         
        x[idx] = float(tmp_val) + delta_x  # 변수 더하기
        fx1 = f(x)        # f(x + delta_x)
        
        x[idx] = tmp_val - delta_x   # 변수 빼기
        fx2 = f(x)        # f(x - delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)   # 미분값
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

ret1 = numerical_derivative(f, x)
print(ret1)

[[ 8.         15.00000001]]


In [4]:
# 예시 2

def func(W):
    
    w = W[0, 0]
    x = W[0, 1]
    y = W[1, 0]
    z = W[1, 1]
    
    
    return w*x + w*y*z + 3*w + (z*y)**2

f = lambda W : func(W)

x = np.array([[1.0, 2.0], [3.0, 4.0]])

print('debug 1.', 'initial input variable = ', x)


def numerical_derivative(f, x):               
    # 함수의 인자로 넘파이가 넘어오면 변하기 쉬움 그렇기 때문에 temp에 원본을 저장
    delta_x = 1e-4    # lim 함수
    grad = np.zeros_like(x)   # 입력이랑 동일할때 0으로 초기화 시킴
    print('debug 2.', 'initial grad =', grad)
    
    it = np.nditer(x, flags = ['multi_index'], op_flags = ['readwrite'])
    
    while not it.finished:       # 행렬의 원소가 있는 동안
        # 미분의 계산
        idx = it.multi_index     
        
        tmp_val = x[idx]      # 원본 보존(1번째 원소값)
        print('debug 3.', 'idx =', idx, ',', 'x[idx] =', tmp_val)
        x[idx] = float(tmp_val) + delta_x  # 변수 더하기
        fx1 = f(x)        # f(x + delta_x)
        
        x[idx] = tmp_val - delta_x   # 변수 빼기
        fx2 = f(x)        # f(x - delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)   # 미분값
        print('debug 4. grad[idx] = ', grad[idx])
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad
        
        
ret3 = numerical_derivative(f, x)
print(ret3)

debug 1. initial input variable =  [[1. 2.]
 [3. 4.]]
debug 2. initial grad = [[0. 0.]
 [0. 0.]]
debug 3. idx = (0, 0) , x[idx] = 1.0
debug 4. grad[idx] =  16.999999999995907
debug 3. idx = (0, 1) , x[idx] = 2.0
debug 4. grad[idx] =  1.0000000000331966
debug 3. idx = (1, 0) , x[idx] = 3.0
debug 4. grad[idx] =  100.00000000019327
debug 3. idx = (1, 1) , x[idx] = 4.0
debug 4. grad[idx] =  75.0000000000739
[[ 17.   1.]
 [100.  75.]]
