<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#step01" data-toc-modified-id="step01-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>step01</a></span></li><li><span><a href="#stepo02" data-toc-modified-id="stepo02-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>stepo02</a></span></li><li><span><a href="#step03" data-toc-modified-id="step03-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>step03</a></span></li><li><span><a href="#step04" data-toc-modified-id="step04-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>step04</a></span></li><li><span><a href="#Step05" data-toc-modified-id="Step05-5"><span class="toc-item-num">5&nbsp;&nbsp;</span>Step05</a></span></li><li><span><a href="#Step07" data-toc-modified-id="Step07-6"><span class="toc-item-num">6&nbsp;&nbsp;</span>Step07</a></span></li><li><span><a href="#Step08" data-toc-modified-id="Step08-7"><span class="toc-item-num">7&nbsp;&nbsp;</span>Step08</a></span></li></ul></div>

## step01
- 변수 클래스

In [1]:
class Variable:
    def __init__(self, data):
        self.data = data

In [2]:
import numpy as np

data = np.array(1.0)

x = Variable(data)
print(x.data)

1.0


In [3]:
# x라는 상자에 다른 데이터 넣어보기
x.data = np.array(3.0)
print(x.data)

3.0


## stepo02
- 함수 클래스

In [5]:
class Function:
    def __call__(self, input):
        """ 
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = x ** 2
        output = Variable(y)
        return output

In [5]:
data = np.array(12.0)
x = Variable(data)
f = Function()
y = f(x)

print(type(y))
print(y.data)

<class '__main__.Variable'>
144.0


In [9]:
class Variable:
    def __init__(self, data):
        self.data = data
        

# 하지만 Function 클래스는 공통 함수들의 기반 클래스(부모 클래스)로 만들고 이를 상속받도록 하자!
class Function:
    def __call__(self, input):
        """ 
        [args] input: Variable 클래스에 저장되어 있는 데이엍
        """
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        

class Square(Function):
    def forward(self, x):
        return x ** 2

In [8]:
# # error 발생하는 case
# data = np.array(12.0)
# x = Variable(data)
# f = Function()
# y = f(x)

In [11]:
data = np.array(12.0)
x = Variable(data)
f = Square()
y = f(x)
print(type(y))
print(y.data)

<class '__main__.Variable'>
144.0


## step03

In [12]:
import numpy as np

# 변수 클래스
class Variable:
    def __init__(self, data):
        self.data = data

        
# 함수 Base 클래스
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        return output
    
    
# Square 함수
class Square(Function):
    def forward(self, x):
        return x ** 2
    

# Exp 함수
class Exp(Function):
    def forward(self, x):
        return np.exp(x)    

In [15]:
# 함수 연결 즉, 여러함수를 연결한 큰 합성함수 만들기 -> 가능한 이유: 각 함수를 적용해 나오는 결과값이 인스턴스 변수에 저장되기 때문!

func1 = Square()
func2 = Exp()

data = np.array(0.5)
x = Variable(data)
a = func1(x)
b = func2(a)
c = func1(b)

print(type(c))
print(c.data)

<class '__main__.Variable'>
1.648721270700128


## step04

In [18]:
# 수치 미분하는 함수
def numerical_diff(f, x, eps=1e-4):
    """
    [args] f: 미분할 함수
    [args] x: 어떤 변수를 사용해서 미분을 할지 -> 이것도 Variable 클래스
    [args] eps: 수치미분 공식에 사용되는 h값
    """
    # x-h, x+h
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    # f(x-h), f(x+h)
    y0 = f(x0)
    y1 = f(x1)
    
    return (y1.data - y0.data) / (2*eps)

In [19]:
f = Square()
x = Variable(np.array(2.0))
d = numerical_diff(f, x)
print(d)

4.000000000004


In [20]:
# 이번에는 합성함수를 사용해서 수치미분
def composite_f(x):
    func1 = Square()
    func2 = Exp()
    
    return func1(func2(func1(x)))

In [21]:
x = Variable(np.array(0.5))
dy = numerical_diff(composite_f, x)
print(dy)

3.2974426293330694


---

In [6]:
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data

        
x = Variable(np.array(12.0))
print(x.data)

12.0


In [8]:
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        
        
class Function:
    def __call__(self, input):
        """ 
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = x ** 2
        output = Variable(y)
        return output
    

x = Variable(np.array(10))
f = Function()
output = f(x)
print(type(output), output.data)

<class '__main__.Variable'> 100


In [14]:
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        
        
# 함수의 공통 클래스
class Function:
    def __call__(self, input):
        """ 
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
    

# 제곱 함수
class Square(Function):
    def forward(self, x):
        return x ** 2
    
# 지수 함수
class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    

data = Variable(np.array(12.0))
A = Square()
B = Exp()
C = Square()

output = C(B(A(data)))
print(type(output), output.data)

<class '__main__.Variable'> 1.1934680253072107e+125


In [16]:
def numerical_diff(func, x, eps=1e-4):
    """
    [args] func: 수치 미분을 적용할 함수
    [args] x : 미분을 적용할 기준이 되는 변수가 담긴 Variable 클래스
    [args] eps : 수치 미분 수행할 때 사용하는 미세한 차이(epsilon)값
    """
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    y0 = func(x0)
    y1 = func(x1)
    return (y1.data - y0.data) / (2*eps)


def composite_f(x):
    A = Square()
    B = Exp()
    C = Square()
    
    return C(B(A(x)))

x = Variable(np.array(2.0))
dy = numerical_diff(composite_f, x)
print(dy)

23847.666917060906


## Step05

In [3]:
# 역전파 클래스를 구현하는 것을 전제하고 만드는 변수 클래스 다시 작성
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        

# Function 클래스
class Function:
    def __call__(self, input):
        """
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        self.input = input  # 입력 변수를 캐싱 for 역전파 시 사용
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        

# 제곱 함수 클래스 구현
class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy=1):
        x = self.input.data    # 순전파 시 캐싱해두었던 값을 가져오기
        gx = 2 * x * gy
        return gx
    

# 지수 함수 클래스 구현 -> 지수 함수 미분 공식은 예전 포스팅 참조 https://techblog-history-younghunjo1.tistory.com/376?category=1021615
class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy=1):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx
    

# 합성함수 순전파 구현
data = Variable(np.array(0.5))
A = Square()
B = Exp()
C = Square()

a = A(data)
b = B(a)
y = C(b)

print(type(y), '순전파 결과값:', y.data)

# 합성함수 역전파 구현
y.grad = np.array(1.0)
b.grad = C.backward(gy=y.grad)
a.grad = B.backward(gy=b.grad)
data.grad = A.backward(gy=a.grad)
print(type(data), '역전파 결과값(미분값):', data.grad)

        

<class '__main__.Variable'> 순전파 결과값: 1.648721270700128
<class '__main__.Variable'> 역전파 결과값(미분값): 3.297442541400256


## Step07
- Step06은 역전파 이론

In [9]:
# 모든 함수와 모든 변수의 연결을 기록!
# 함수 = 변수의 창조자(부모)
import numpy as np

class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None     # 변수의 기울기를 기록
        self.creator = None  # 변수를 만든 함수를 기록
        
    def set_creator(self, func):
        self.creator = func
        
        
class Function:
    def __call__(self, input):
        """
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self)  # y 변수를 만든 창조자(함수) 설정. self를 활용해서 선언된 함수의 종류로 설정가능!
        self.input = input        # 역전파 시 사용하기 위해 캐싱
        self.output = output      # 출력도 캐싱
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        

class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy=1):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    
class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy=1):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx
    
A = Square()
B = Exp()
C = Square()

data = Variable(np.array(0.5))
a = A(data)
b = B(a)
y = C(b)

assert y.creator == C    # y를 만든 창조자 함수는 C
assert y.creator.input == b # C 함수의 입력은 b
assert y.creator.input.creator == B  # b를 만든 창조자 함수는 B
assert y.creator.input.creator.input == a # B 함수의 입력은 a
assert y.creator.input.creator.input.creator == A # a를 만든 창조자 함수는 A
assert y.creator.input.creator.input.creator.input == data # A함수의 입력은 data
assert y.creator.input.creator.input.creator.input.creator == None # data를 만든 함수는 없음!


# 역전파를 하나씩 구현해보기
y.grad = np.array(1.0)  # = y의 기울기 값
C = y.creator  # 1.y를 만든 함수 C 가져오기
b = C.input    # 2.함수 C의 입력인 b 가져오기 for b의 기울기 값
b.grad = C.backward(y.grad)

B = b.creator
a = B.input
a.grad = B.backward(b.grad)

A = a.creator
data = A.input
data.grad = A.backward(a.grad)

print('역전파 결과 미분값:', data.grad)

역전파 결과 미분값: 3.297442541400256


In [5]:
# Variable 클래스에 backward 메소드를 추가해서 재귀적으로 호출하도록 만들기!
import numpy as np

class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        f = self.creator                    # 1.현재 변수를 만든 창조함수를 가져옴(순전파를 거치면 창조자 함수가 생김)
        if f is not None:                   # 역전파 재귀함수 종단 조건 = 최초의 입력까지 다다랐다는 의미!
            x = f.input                     # 2.가져온 창조함수의 입력(앞쪽의 변수)을 가져옴!
            x.grad = f.backward(self.grad)  # 3.현재 변수의 grad를 입력(이것은 이전 역전파로 인해서 생김)
            x.backward()                    # 4.재귀적으로 호출
            

class Function:
    def __call__(self, input):
        """
        [args] input: Variable 클래스에 저장되어 있는 데이터
        """
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self)
        self.ouput = output
        self.input = input
        return output

    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        
        
class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy=1):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    
    
class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy=1):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx
    
    
A = Square()
B = Exp()
C = Square()

data = Variable(np.array(0.5))
a = A(data)
b = B(a)
y = C(b)

y.grad = np.array(1.0)
y.backward()

print(data.grad)

3.297442541400256


In [3]:
# Step6

import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        
        
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        self.input = input   # 순전파 시의 통상값을 저장 for 역전파 시 사용
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        
        
class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    

class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx

In [4]:
A = Square()
B = Exp()
C = Square()

x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

print(type(y), y.data)

<class '__main__.Variable'> 1.648721270700128


In [5]:
y.grad = np.array(1.0)
b.grad = C.backward(y.grad)
a.grad = B.backward(b.grad)
x.grad = A.backward(a.grad)
print(type(x), x.grad)

<class '__main__.Variable'> 3.297442541400256


In [11]:
import numpy as np


class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
        
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self)
        self.input = input
        self.output = output
        
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        
        
class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    

class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx

In [14]:
A = Square()
B = Exp()
C = Square()

# 순전파 수행
x = Variable(np.array(10))
a = A(x)
b = B(a)
y = C(b)

# 순전파로 연결된 변수와 함수 간의 관계를 통해 거슬러 올라가기
assert y.creator == C
assert y.creator.input == b
assert y.creator.input.creator == B
assert y.creator.input.creator.input == a
assert y.creator.input.creator.input.creator == A
assert y.creator.input.creator.input.creator.input == x


In [17]:
A = Square()
B = Exp()
C = Square()

# 순전파 수행
x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 역전파 수행
y.grad = np.array(1.0)

C = y.creator                # 1.출력변수의 창조자 함수 가져오기
b = C.input                  # 2.가져온 함수의 입력변수 가져오기
b.grad = C.backward(y.grad)  # 3.가져온 함수의 역전파 메소드 호출

B = b.creator
a = B.input
a.grad = B.backward(b.grad)

A = a.creator
x = A.input
x.grad = A.backward(a.grad)

print(y.grad, b.grad, a.grad, x.grad)

1.0 2.568050833375483 3.297442541400256 3.297442541400256


In [19]:
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        f = self.creator                   # 1.출력 변수의 창조자 함수 가져오기
        if f is not None:                  # 2.가져온 함수의 입력변수 가져오기
            x = f.input                      
            x.grad = f.backward(self.grad) # 3.가져온 함수의 역전파 호출
            x.backward()                   # 4.재귀적으로 수행! for 자동화

In [21]:
A = Square()
B = Exp()
C = Square()

# 순전파 수행
x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# 역전파 수행
y.grad = np.array(1.0)
y.backward()

# 역전파 후 최종 미분값 출력
print(x.grad)

3.297442541400256


---
- 중간 정리

In [26]:
import numpy as np


# 변수 클래스
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        f = self.creator
        if f is not None:
            x = f.input
            x.grad = f.backward(self.grad)
            x.backward()
    
    
# 함수 공통 클래스      
class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(y)
        output.set_creator(self)
        self.input = input
        self.output = output
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")


class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    

class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx

In [27]:
A = Square()
B = Exp()
C = Square()

# forward
x = Variable(np.array(0.5))
a = A(x)
b = B(a)
y = C(b)

# backward
y.grad = np.array(1.0)
y.backward()

print(y.grad, b.grad, a.grad, x.grad)

1.0 2.568050833375483 3.297442541400256 3.297442541400256


## Step08

In [28]:
# 재귀에서 반복문으로 변경
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        funcs = [self.creator]
        while funcs:
            f = funcs.pop()
            x, y = f.input, f.output
            x.grad = f.backward(y.grad)
            
            if x.creator is not None:
                funcs.append(x.creator)

In [30]:
a = np.array(1.0)
b = np.ones_like(a)
print(a.dtype, b.dtype)

float64 float64


In [44]:
a = np.array(10.0)
b = a ** 2
print(a, type(a))
print(b, type(b))

10.0 <class 'numpy.ndarray'>
100.0 <class 'numpy.float64'>


In [None]:
# 1.Functional API가 아닌 Python API로 변경하도록 하기
def square(x):
    return Square()(x)

def exp(x):
    return Exp()(x)


x = Variable(np.array(0.5))
a = square(x)
print(a.data)

In [36]:
# 2.backward 메서드 간소화 -> 역전파 시, 출력의 gradient 값 초기화하는 부분 생략하기 위함
class Variable:
    def __init__(self, data):
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        if self.grad is None:
            self.grad = np.ones_like(self.data)
            
        funcs = [self.creator]
        while funcs:
            f = funcs.pop()
            x, y = f.input, f.output
            x.grad = f.backward(y.grad)
            
            if x.creator is not None:
                funcs.append(x.creator)

In [39]:
# 3-1. nd-array 입력 유효성 검증
class Variable:
    def __init__(self, data):
        if data is not None:
            if not isinstance(data, np.ndarray):
                raise TypeError(f"{type(data)} 타입은 지원하지 않습니다.")
                
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        if self.grad is None:
            self.grad = np.ones_like(self.data)
        
        funcs = [self.creator]
        while funcs:
            f = funcs.pop()
            x, y = f.input, f.output
            x.grad = f.backward(y.grad)
            
            if x.creator is not None:
                funcs.append(x.creator)

In [45]:
# 3-2. 0차원의 nd-array일 경우, 연산을 수행하면 np 스칼라값으로 변형됨. 이를 막기 위함
class Variable:
    def __init__(self, data):
        if data is not None:
            if not isinstance(data, np.ndarray):
                raise TypeError(f"{type(data)} 타입은 지원하지 않습니다.")
        
        self.data = data
        self.grad = None
        self.creator = None
        
    def set_creator(self, func):
        self.creator = func
        
    def backward(self):
        if self.grad is None:
            self.grad = np.ones_like(self.data)
            
        funcs = [self.creator]
        while funcs:
            f = funcs.pop()
            x, y = f.input, f.output
            x.grad = f.backward(y.grad)
            
            if x.creator is not None:
                funcs.append(x.creator)
                
def as_array(x):
    if np.isscalar(x):
        return np.array(x)
    return x


class Function:
    def __call__(self, input):
        x = input.data
        y = self.forward(x)
        output = Variable(as_array(y))
        output.set_creator(self)
        self.input = input
        self.output = output
        return output
    
    def forward(self, x):
        raise NotImplementedError("This method should be called in other function class")
        
    def backward(self, gy):
        raise NotImplementedError("This method should be called in other function class")
        
class Square(Function):
    def forward(self, x):
        return x ** 2
    
    def backward(self, gy):
        x = self.input.data
        gx = 2 * x * gy
        return gx
    

class Exp(Function):
    def forward(self, x):
        return np.exp(x)
    
    def backward(self, gy):
        x = self.input.data
        gx = np.exp(x) * gy
        return gx
    
def square(x):
    return Square()(x)

def exp(x):
    return Exp()(x)

In [46]:
import unittest

class SquareTest(unittest.TestCase):
    def test_forward(self):
        x = Variable(np.array(3.0))
        y = square(x)
        
        expected = np.array(4.0)
        self.assertEqual(y.data, expected)

In [47]:
def numerical_diff(f, x, eps=1e-4):
    x0 = Variable(x.data - eps)
    x1 = Variable(x.data + eps)
    y0 = f(x0)
    y1 = f(x1)
    
    return (y1.data - y0.data) / (2*eps)

class SquareTest(unittest.TestCase):
    def test_gradient_check(self):
        x = Variable(np.random.rand(1))
        y = square(x)
        y.backward()
        num_grad = numerical_diff(square, x)
        flg = np.allclose(x.grad, num_grad)
        self.assertTrue(flg)