# CH1. 미분 자동 계산

# Step1 변수

In [1]:
class Variable:
    def __init__(self, data):
        self.data = data

In [3]:
import numpy as np

data = np.array(1.0) # ndarray 인스턴스 생성
x = Variable(data) # Variable 클래스의 인스턴스를 x라는 이름으로 생성
print(x.data)

x.data = np.array(2.0) # 클래스의 속성 변경
print(x.data)

1.0
2.0


#### 다차원 배열 (텐서) 보충설명

In [7]:
x = np.array(1)
print(x.ndim) # numpy의 ndarray인스턴스에는 ndim이라는 인스턴스 변수가 있다

x = np.array([1,2,3])
print(x.ndim)

x = np.array([[1,2,3],
              [4,5,6]])
print(x.ndim)

0
1
2


# Step2 함수

* Funcion 클래스는 Variable 인스턴스를 입력받아 Variable 인스턴스를 출력한다
* Variable 인스턴스의 실제 데이터는 인스턴스 변수인 data에 있다.

In [10]:
class Function:
    def __call__(self, input): # input 파라미터에는 Variable 자료형이 전달될 것임
        x = input.data # 전달받은 데이터를 Function의 인스턴스 변수에 저장
        y = x**2 # 함수가 수행하는 연산
        output = Variable(y) # 결과값을 Variable 형태로 되돌림
        return output

In [11]:
x = Variable(np.array(10))
f = Function()
y = f(x)

print(type(y))
print(y.data)

<class '__main__.Variable'>
100


* Function 클래스는 기반 클래스로서, 모든 함수에 공통되는 기능만 구현한다.
* 구체적인 함수는 Function 클래스를 상속한 클래스에서 구현한다.

In [12]:
class Function:
    # 받은 Variable에서 데이터 추출, 계산결과를 Variable에 포장하는 부분
    def __call__(self, input): 
        x = input.data
        y = self.forward(x) 
        output = Variable(y)
        return output
    
    # 구체적인 계산을 수행하는 부분
    # 그 계산은 이 클래스를 상속할 하위 클래스에서 구현
    def forward(self, x):
        raise NotImplementedError()

#### 클래스 상속

In [13]:
class Square(Function):
    def forward(self, x):
        return x**2

In [14]:
X = Variable(np.array(10))
f = Square()
y = f(x)

print(type(y))
print(y.data)

<class '__main__.Variable'>
100


# Step3 함수 연결

In [15]:
class Exp(Function):
    def forward(self, x):
        return np.exp(x)

In [16]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)
print(y.data)

1.648721270700128


# Step4 수치 미분

In [17]:
# 중앙차분을 이용한 수치미분 구현
def numerical_diff(f, x, eps = 1e-4):
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    y0 = f(x0)
    y1 = f(x1)
    return (y1.data - y0.data) / (2 * eps)

In [18]:
f = Square()
x = Variable(np.array(2.0))
dy = numerical_diff(f,x)
print(dy)

4.000000000004


#### 합성함수의 미분

In [19]:
def f(x):
    A = Square()
    B = Exp()
    C = Square()
    return C(B(A(x)))

x = Variable(np.array(0.5))
dy = numerical_diff(f,x)
print(dy)

3.2974426293330694


#### 수치미분의 문제점
- 비슷한 값들의 차분 연산시 자릿수 누락이 발생하여 오차가 포함되기 쉬움
- 계산량이 많음
  
대안 : 역전파 알고리즘

# Step6 수동 역전파
###  
 chain rule 

In [20]:
# 역전파를 사용할 수 있도록 Variable 클래스 수정
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None

In [21]:
# 역전파를 사용할 수 있도록 Funcion 클래스 수정
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        self.input = input # 역전파 시 사용하기 위해 입력변수를 보관한다.
        return output
    
    def forward(self, x):
        raise NotImplementedError()
    
    def backward(self, gy):
        raise NotImplementedError()

In [63]:
# Square 함수 클래스 수정
class Square(Function):
    def forward(self, x):
        y = x**2
        return y
    
    def backward(self, gy): # gy는 출력쪽에서부터 전해지고있는 미분값을 전달하는 역할
        x = self.input.data
        gx = 2*x*gy
        return gx

In [64]:
# Exp 함수 클래스 수정
class Exp(Function):
    def forward(self, x):
        y = np.exp(x)
        return y
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx

In [27]:
# (e^(x^2))^2 의 순전파 
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

In [30]:
# 순전파의 역순으로 각 함수에 대해 backward 메서드를 호출하면
# 각 변수에 대한 미분값이 구해짐
y.grad = np.array(1.0) # 역전파 기울기 초기값 dy/dy = 1
b.grad = C.backward(y.grad)
a.grad = B.backward(b.grad)
x.grad = A.backward(a.grad)
print(x.grad)

3.297442541400256


# Step7 역전파 자동화

In [59]:
# 변수 클래스 수정
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None # 함수와 변수를 연결 
        
    def set_creator(self, func): 
        self.creator = func

In [60]:
# 함수 클래스 수정
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self) # 출력변수에 창조자 설정 (연결을 동적으로 만드는 기법의 핵심)
        # 함수의 intput값과 output값을 모두 저장
        self.input = input
        self.output = output 
        return output
    
    def forward(self, x):
        raise NotImplementedError()
    
    def backward(self, gy):
        raise NotImplementedError()

In [65]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

In [67]:
# assert 문은 조건을 충족하는지 여부를 확인하여 True가 아니면 예외를 발생시킴
assert y.creator == C
assert y.creator.input == b
assert y.creator.input.creator == B
assert y.creator.input.creator.input == a
assert y.creator.input.creator.input.creator == A
assert y.creator.input.creator.input.creator.input == x

# note 클래스를 상속받아 생성된 클래스는
# 상속대상 클래스가 변경된 뒤에는 다시 정의해줘야됨

In [68]:
## x -> [A] -> a -> [B] -> b -> [C] -> y
y.grad = np.array(1.0)

# y에서 b까지의 역전파
C = y.creator # 1.함수를 가져온다.
b = C.input # 2.함수의 입력을 가져온다.
b.grad = C.backward(y.grad) # 3.함수의 backward 메서드를 호출한다.

# b에서 a로의 역전파
B = b.creator 
a = B.input
a.grad = B.backward(b.grad)

# a에서 최초입력 x로의 역전파
A = a.creator 
x = A.input
x.grad = A.backward(a.grad)

print(x.grad)

3.297442541400256


In [69]:
# 변수 클래스 수정(2)
# 변수에서 하나 앞의 변수로 거슬러 올라가는 반복 로직
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None # 함수와 변수를 연결 
        
    def set_creator(self, func): 
        self.creator = func
    
    def backward(self):
        f = self.creator # 1.변수를 생성한 함수를 가져옴
        if f is not None: # 초기의 입력 x를 제외하면 None이 아닐것임
            x = f.input # 2.해상 생성자 함수의 입력을 가져온다.
            x.grad = f.backward(self.grad) # 3.함수의 backward 메서드 호출
            x.backward() # 한 단계 앞 변수의 backward 메서드를 호출 (재귀)

In [70]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 역전파
y.grad = np.array(1.0)
y.backward()
print(x.grad)

3.297442541400256
