[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/shhommychon/DeZero-Koki/blob/master/from_scratch_3/step04.ipynb)

# 제1고지 미분 자동 계산

## 1단계 상자로서의 변수

In [1]:
class Variable:
    def __init__(self, data):
        self.data = data

## 2단계 변수를 낳는 함수

In [2]:
class Function:
    """

    * Function 클래스는 기반 클래스로서, 모든 함수에 공통되는 기능을 구현합니다.
    * 구체적인 함수는 Function 클래스를 상속한 클래스에서 구현합니다.
    """
    def __call__(self, input):
        x = input.data  # 데이터를 꺼낸다.
        y = self.forward(x)  # 구체적인 계산은 forward 메서드에서 한다.
        output = Variable(y)  # Variable 형태로 되돌린다.
        return output

    def forward(self, x):
        raise NotImplementedError()

In [3]:
class Square(Function):
    def forward(self, x):
        return x ** 2

## 3단계 함수 연결

In [4]:
import numpy as np

class Exp(Function):
    def forward(self, x):
        return np.exp(x)

## 4단계 수치 미분

### 4.1 미분이란

### 4.2 수치 미분 구현

- 컴퓨터는 극한을 취급할 수 없어 매우 작은 차이를 의미하는 값을 이용하여 함수의 변화량을 구하며, 이를 수치 미분(numerical differentiation)이라고 한다.
- 근사 오차를 줄이는 방법으로는 중앙차분(centered difference)이 있다.
  - 전진차분(forward difference)보다 중앙차분이 실제 미분값에 더 가깝다. \(증명: T. Young, M. J. Mohlenkamp. "[Introduction to Numerical Methods and Matlab Programming for Engineers - Lecture 27: Numerical Differentiation](http://www.ohiouniversityfaculty.com/youngt/IntNumMeth/lecture27.pdf)"\)

In [5]:
def numerical_diff(f, x, eps=1e-4):
    """

      param:
        f (Function): 미분의 대상이 되는 함수
        x (Variable): 미분을 계산하는 변수
        eps (float): 작은 값
    """
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    y0 = f(x0)
    y1 = f(x1)
    return (y1.data - y0.data) / (2 * eps)

In [6]:
f = Square()
x = Variable(np.array(2.0))
dy = numerical_diff(f, x)
print(dy)

4.000000000004


### 4.3 합성 함수의 미분

In [7]:
def f(x):
    A = Square()
    B = Exp()
    C = Square()
    return C(B(A(x)))

x = Variable(np.array(0.5))
dy = numerical_diff(f, x)
print(dy)

3.2974426293330694


### 4.4 수치 미분의 문제점

- 자릿수 누락에 따라 발생하는 오차가 포함되기 쉽다.
- 계산량이 많다.

&nbsp;

- 실제 딥러닝에서는 역전파를 사용하고, 역전파를 정확하게 구현했는지 확인하는 기울기 확인(gradient checking) 단계에서 수치 미분 결과를 사용한다.