# 1,2,3차원 배열의 경사하강법
- 전방차분 대신 오차를 줄이기 위해 중앙차분 방식을 주로 사용
- 가중치 매개변수에 대한 손실함수의 변화량을 구해야하고, 변화량을 구하기 위해 미분
- 1,2,3차원 배열을 모두 포용할 수 있는 경사하강법 코드 구현

In [104]:
import numpy as np
def numerical_gradient_1d(f, x): # f는 미분할 함수, x는 입력값 1차원 배열
    h = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    for i in range(x.size): # 배열 내의 변수 하나에 초점을 맞추고, 다른 변수 고정
        obj_val = x[i]
        x[i] = obj_val + h
        fxh1 = f(x) # f(x+h)
        
        x[i] = obj_val - h 
        fxh2 = f(x) # f(x-h)
        grad[i] = (fxh1 - fxh2) / (h*2) # 중앙 차분 방식으로 수치미분 구현
        
        x[i] = obj_val # 값 복원
        
    return grad # 수치 미분된 배열 결과

In [105]:
def function2(x):
    return x[0]**2+x[1]**2

numerical_gradient_1d(function2,np.array([3.0,4.0]))

array([6., 8.])

In [None]:
def numerical_gradient_2d(f, x): # f는 미분할 함수, x는 입력값 1차원 or 2차원 배열
    h = 1e-4 # 0.0001
    grad = np.zeros_like(x) 
    
    if x.ndim == 1: # x가 1차원 배열인 경우
        return numerical_gradient_1d(f, x)
    else: # x가 2차원 배열인 경우
        for idx, x in enumerate(x): # enumerate를 이용하면 2차원 배열의 행이 하나씩 입력됨
            grad[idx] = numerical_gradient_1d(f, x)
    return grad
    
    
    for i in range(x.size): # 배열 내의 변수 하나에 초점을 맞추고, 다른 변수 고정
        obj_val = x[i]
        x[i] = obj_val + h
        fxh1 = f(x) # f(x+h)
        
        x[i] = obj_val - h 
        fxh2 = f(x) # f(x-h)
        grad[i] = (fxh1 - fxh2) / (h*2) # 중앙 차분 방식으로 수치미분 구현
        
        x[i] = obj_val # 값 복원
        
    return grad # 수치 미분된 배열 결과

### 넘파이의 iterator를 이해하기
- 배열 내의 모든 원소를 탐색해 index를 찾으면서 수치 미분 구하기
- it.multi_index로 현재 탐색중인 원소의 index 반환
- it.iternext()로 다음 원소로 넘어가기

In [None]:
A = np.array([[[10, 20, 30, 40],
		[50, 60, 70, 80]],
              [[1, 2, 3, 4],
              [5, 6, 7, 8]]])
              
 pritn(A.shape)
 >>> (2,2,4)
 
 it = np.nditer(A, flags=['multi_index'], op_flags=['readwrite'])
 
while not it.finished:
    idx = it.multi_index # 현재 탐색하고 있는 index
    print("현재 접근한 원소 => ", A[idx])
    print("원소의 index",idx)
    it.iternext() # 다음 index로 넘어가기

In [146]:
def numerical_gradient(f,x):
    h = 1e-4
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=["multi_index"],op_flags=["readwrite"])
    
    while not it.finished:
        idx = it.multi_index
        obj_val = x[idx]
        x[idx] = float(obj_val) + h
        fxh1 = f(x) # f(x+h)
        
        x[idx] = float(obj_val) - h
        fxh2 = f(x) # f(x-h)
        
        x[idx] = float(obj_val) # 값 초기화
        grad[idx] = (fxh1 - fxh2) / (2*h)
        it.iternext() # False 반복문 종료
    return grad