# $제 1고지$

## Step1. 상자로서의 변수

### Variable 클래스 구현

In [14]:
class Variable:
    def __init__(self,data):
        self.data = data

In [15]:
import numpy as np

data = np.array(1.0)
x = Variable(data)
print (x.data)

1.0


In [16]:
x.data = np.array(2.0)
print (x.data)

2.0


## Step2. 변수를 낳는 함수

### Function 클래스 구현

In [17]:
class Function:
    def __call__(self, input):
        x = input.data # 데이터를 꺼낸디
        y = x**2 # 실제 계산
        output = Variable(y) # Variable 형대로 되돌린다.
        return output

### Function 클래스 이용

In [18]:
x = Variable(np.array(10))
f = Function()
y = f(x)

print (type(y))
print (y.data)

<class '__main__.Variable'>
100


In [19]:
# Function 클래스 수정
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        return output
    
    def forward(self, x):
        raise NotImplementedError()

In [20]:
# Function 클래스를 상속받음
class Square(Function):
    def forward(self, x):
        return x**2

In [12]:
x = Variable(np.array(10))
f = Square()
y = f(x)

print (type(y))
print (y.data)

<class '__main__.Variable'>
100


## Step3. 함수연결

### Exp 함수 구현

In [21]:
class Exp(Funtion):
    def forward(self, x):
        return np.exp(x)

NameError: name 'Funtion' is not defined

## 함수 연결

In [22]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

print(y.data)

1.648721270700128


## Step4. 수치 미분

### 수치 미분 구현

In [23]:
def numerical_diff(f, x, eps=1e-4):
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    y0 = f(x0)
    y1 = f(x1)
    return (y1.data - y0.data) / (2*eps)

In [24]:
f = Square()
x = Variable(np.array(2.0))
dy = numerical_diff(f, x)
print (dy)

4.000000000004


### 합성 함수의 미분

In [25]:
def f(x):
    A = Square()
    B = Exp()
    C = Square()
    return C(B(A(x)))

x = Variable(np.array(0.5))
dy = numerical_diff(f, x)
print (dy)

3.2974426293330694


## Step6. 수동 역전파

### Variable 클래스 추가 구현

In [26]:
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None

### Function 클래스 추가 구현

In [27]:
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        self.input = input # 입력 변수를 기억(보관)한다.
        return output
    
    def forward(self, x):
        raise NotImplementedError()
        
    def backward(self, gy):
        raise NotImplementedError()

### Square와 Exp 클래스 추가 구현

In [4]:
class Square(Function):
    def forward(self, x):
        y = x**2
        return y
    
    def backward(self, gy):
        x = self.input.data
        gx = 2*x*gy
        return gx

In [5]:
class Exp(Function):
    def forward(self, x):
        y = np.exp(x)
        return y
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx

### 역전파 구현

In [30]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

In [31]:
y.grad = np.array(1.0)
b.grad = C.backward(y.grad)
a.grad = B.backward(b.grad)
x.grad = A.backward(a.grad)
print(x.grad)

3.297442541400256


## Step7. 역전파 자동화

### 역전파 자동화의 시작

In [7]:
import numpy as np

In [1]:
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func

In [2]:
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self) # 출력 변수에 창조자를 설정한다.
        self.input = input
        self.output = output # 출력도 저장한다.
        return output

In [8]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 계산 그래프의 노드들을 거꾸로 거슬러 올라간다.
assert y.creator == C
assert y.creator.input == b
assert y.creator.input.creator == B
assert y.creator.input.creator.input == a
assert y.creator.input.creator.input.creator == A
assert y.creator.input.creator.input.creator.input == x

### 역전파 도전

In [9]:
y.grad = np.array(1.0)

C = y.creator # 1. 함수를 가져온다.
b = C.input # 2. 함수의 입력을 가져온다.
b.grad = C.backward(y.grad) # 3. 함수의 backward 메서드를 호출한다.

In [10]:
B = b.creator # 1. 함수를 가져온다.
a = B.input # 2. 함수의 입력을 가져온다.
a.grad = B.backward(b.grad) # 3. 함수의 backward 메서드를 호출한다.

In [11]:
A = a.creator # 1. 함수를 가져온다.
x = A.input # 2. 함수의 입력을 가져온다.
x.grad = A.backward(a.grad) # 3. 함수의 backward 메서드를 호출한다.

print (x.grad)

3.297442541400256


### backward 메서드 추가

In [12]:
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        f = self.creator # 1. 함수를 가져온다.
        if f is not None:
            x = f.input # 2. 함수의 입력을 가져온다.
            x.grad = f.backward(self.grad) # 3. 함수의 backward 메서드를 호출한다.
            x.backward() # 하나 앞 변수의 backward 메서드를 호출한다(재귀).

In [13]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 역전파
y.grad = np.array(1.0)
y.backward()
print (x.grad)

3.297442541400256


## Step.8 재귀에서 반복문으로

### 현재의 Variable 클래스

In [15]:
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None

    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        f = self.creator
        if f is not None:
            x = f.input
            x.grad = f.backward(self.grad)
            x.backward()

### 반복문을 이용한 구현

In [16]:
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None

    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        funcs = [self.creator]
        while funcs:
            f = funcs.pop() # 함수를 가져온다.
            x, y = f.input, f.output # 함수의 입력과 출력을 가져온다.
            x.grad = f.backward(y.grad) # backward 메서드를 호출한다.
            
            if x.creator is not None:
                funcs.append(x.creator) # 하나 앞의 함수를 리스트에 추가한다.

### 동작 확인

In [17]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 역전파
y.grad = np.array(1.0)
y.backward()
print (x.grad)

3.297442541400256
