# Overview
## 다루게 될 주제
- **tensor, reshape, transpose, sum, broad-casting, matrix multiplication, linear regression, Neural network**
- 이 노트북 셋팅에서는  ~ 를 다루도록 한다.
- 

# Google drive mount

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

pwd 명령어 실행시 gdrive인 상태에서 !git clone 

# 신경망 만들기


1. 텐서
2. 형상 변환 함수
3. 합계 함수
4. 브로드캐스트 함수

## 텐서

### 원소별 계산

In [29]:
import numpy as np
import dezero.functions as F
from dezero import Variable

In [30]:
# scalar or vector
x = Variable(np.array(1.0))
y1 = F.sin(x)

# matrix
x = Variable(np.array([[1,2,3],[4,5,6]]))
y2 = F.sin(x)

print(y1)
print(y2)

variable(0.8414709848078965)
variable([[ 0.84147098  0.90929743  0.14112001]
          [-0.7568025  -0.95892427 -0.2794155 ]])


In [10]:
# element-wise summation

print(y2.shape) # (2,3)

c = np.array([[10,20,30],[40,50,60]])
y2 + c

(2, 3)


variable([[10.84147098 20.90929743 30.14112001]
          [39.2431975  49.04107573 59.7205845 ]])

### 텐서 사용시의 역전파
- 텐서를 이용한 역전파를 구현해봅니다.

In [13]:
x = Variable(np.array([[1,2,3],[4,5,6]]))
c = Variable(np.array([[10,20,30],[40,50,60]]))

t = x + c
y = F.sum(t)

In [14]:
print(y)

variable(231)


In [16]:
y.backward(retain_grad=True)
print(y.grad)
print(t.grad)
print(x.grad)
print(c.grad)

# backward 메서드 호출시 입력했던 t, x, c에 대해서도 역전파가 이루어진 것을 확인할 수 있다.

variable(1)
variable([[2 2 2]
          [2 2 2]])
variable([[3 3 3]
          [3 3 3]])
variable([[3 3 3]
          [3 3 3]])


## 형상 변환 함수
- reshape, transpose

In [20]:
import numpy as np

x = np.array([[1,2,3],[4,5,6]])
y = np.reshape(x, (6,))
print(y)
print("shape of x :",x.shape,"\nshape of y :", y.shape)

[1 2 3 4 5 6]
shape of x : (2, 3) 
shape of y : (6,)


![title](pictures/picture_38-1.png)

역전파는 출력 쪽에서부터 gradient를 전달한다. 이 기울기를 x.data.shape와 x.grad.shape가 동일하도록 변환이 필요하다. 위 그림에서 볼 수 있듯이 vector로 바뀌어 forward 진행을 하고, 다시 backward 할때 2x3의 형태로 바뀌는 것을 볼 수 있다.

Dezero에서 reshape의 함수 구현에 대해서 살펴보자.

In [3]:
import dezero

class Reshape(dezero.Function): 
    # Function을 상속
    def __init__(self, shape):
        self.shape = shape
        
    def forward(self, x):
        self.x_shape = x.shape
        y = x.reshape(self.shape)
        return y
    
    def backward(self, gy):
        return reshape(gy, self.x_shape) 
    
# 1. note : gy는 Variable 인스턴스이므로 np.array나 int, float의 값을 넣어주면 계산이 당연히 되지 않는다.
# 2. note : forward, backward 모두 형상변환(reshape)이 일어나는 것을 볼 수 있다. forward시에는 변환해야 하는 shape(6,)로 변환해주고, 
# backward 시에는 기존 x의 shape로 바꿔준다.

reshape 함수의 구현

In [4]:
from dezero.core import as_variable

def reshape(x, shape):
    if x.shape == Shape:
        return as_variable(x) # Variable 인스턴스로 바꿔줌
    return Reshape(shape)(x) 

# Function에서 __call__ 때문에 가능하다. p46참고

reshape 함수를 사용해보자.

In [7]:
import numpy as np
from dezero import Variable
import dezero.functions as F

x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.reshape(x, (6,))
y.backward(retain_grad=True)

print("y is :",y)
print("gradient of x :",x.grad)

y is : variable([1 2 3 4 5 6])
gradient of x : variable([[1 1 1]
          [1 1 1]])


어떤 일이 일어나고 있는 것일까?

![title](pictures/picture_38-2.png)

즉, 형상변환함수에 의해 reshape이 일어나고 이에 대해서 각 원소별로 gradient를 계산한 후 다시 형상변환을 적용하고 backward를 진행한 것을 볼 수 있다.

### Variable에서 reshape 사용하기
- dezero의 reshape 함수를 numpy의 reshape와 비슷하게 만들어보자.

먼저 numpy에서 reshape이 어떻게 쓰이는지 보자.

In [8]:
x = np.random.rand(1,2,3)

y = x.reshape((2,3)) # 튜플로 받는다.
y = x.reshape([2,3]) # 리스트도 가능하다.
y = x.reshape(2,3) # 인수를 그대로 받는 것도 가능

dezero에서 이를 구현해봅니다.

In [43]:
import dezero

class Variable_exp(dezero.Variable):
        
    def reshape(self, *shape):
        if len(shape) == 1 and isinstance(shape[0], (tuple, list)):
            shape = shape[0]
        return dezero.functions.reshape(self, shape)
    
# 1. note : isinstance - 인풋된 shape가 튜플 혹은 리스트인지 혹은 어떤 자료형, 클래스인지 확인해준다.

In [44]:
x = Variable_exp(np.random.randn(1,2,3))
y1 = x.reshape((2,3))
y2 = x.reshape(2,3)

print("x looks like : \n", x, "\n")
print(y1,'\n', y2)

x looks like : 
 variable([[[-0.69601877 -0.0803951   0.01445537]
           [-0.15785208 -0.31852705  0.74669398]]]) 

variable([[-0.69601877 -0.0803951   0.01445537]
          [-0.15785208 -0.31852705  0.74669398]]) 
 variable([[-0.69601877 -0.0803951   0.01445537]
          [-0.15785208 -0.31852705  0.74669398]])


### 행렬 전치

![title](pictures/picture_38-3.png)

행렬 전치는 numpy에서 어떻게 이루어지는가?

In [53]:
x = np.array([[1,2,3],[4,5,6]])
y = np.transpose(x)
print(y, '\n shape of x : ' ,x.shape, '\n shape of y : ' , y.shape)     

[[1 4]
 [2 5]
 [3 6]] 
 shape of x :  (2, 3) 
 shape of y :  (3, 2)


dezero에서 transpose 함수 구현

In [55]:
class Transpose(dezero.Function):
    
    def forward(self, x):
        y = np.transpose(x)
        return y
    
    def backward(self, gy):
        gx = transpose(gy)
        return gx

def transpose(x):
    return Transpose()(x)

In [56]:
x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.transpose(x)
y.backward()
print(x.grad)

variable([[1 1 1]
          [1 1 1]])


Variable 인스턴세에서 transpose 함수를 사용할 수 있도록 다음의 코드를 dezero/core.py에 추가한다.

In [None]:
class Variable(dezero.Variable):
    
    def transpose(self):
        return dezero.functions.transpose(self)
    
    @property
    def T(self):
        return dezero.functions.transpose(self)
    
# 1. note : property 데코레이터는 '인스턴스 변수'로 사용할 수 있게 해준다.

In [65]:
# property 데코레이터 사용 e.g

x = Variable(np.random.rand(2,3))
y1 = x.transpose()
y2 = x.T

print('y1 is ',y1, '\n y2 is', y2, '\n')
print(y1 - y2)

y1 is  variable([[0.67546866 0.29496431]
          [0.89068117 0.12516986]
          [0.62906504 0.47936913]]) 
 y2 is variable([[0.67546866 0.29496431]
          [0.89068117 0.12516986]
          [0.62906504 0.47936913]]) 

variable([[0. 0.]
          [0. 0.]
          [0. 0.]])


## 합계 함수
Dezero에 합계를 구하는 함수 sum을 추가해보도록 하겠다. 먼저 덧셈의 미분을 복습한 후 sum 함수의 미분을 도출해보도록 한다.

$ y = x_{0} + x_{1}$ 일때, $ dy/dx_{0} = 1, dy/dx_{1} = 1$이라는 것을 볼 수 있다.
![title](pictures/picture_39-1.png)

위 그림은 sum을 진행한 후 역전파를 하는 것을 나타낸다.
기울기 1을 2개로 '복사'해서 다시 back propagation을 진행한다. 

![text](pictures/picture_39-2.png)

위 그림은 벡터로 만든 상태에서 벡터에 sum 연산을 진행한 후 역전파하는 것을 나타낸다.
기울기가 각 벡터 원소별로 계산되어 [1,1]이 나오는 것을 볼 수 있다.

### sum 함수 구현
우리는 위에서 봤던 첫번째 방법으로 sum 함수를 구현한다. 즉, 역전파시 입력 변수의 형상과 같아지도록 기울기의 원소를 **복사**할 것이다.

In [66]:
class Sum(dezero.Function):
    def forward(self, x):
        self.x_shape = x.shape
        y = x.sum()
        return y
    
    def backward(self, gy):
        gx = broadcast_to(gy, self.x_shape)
        return gx

def sum(x):
    return Sum()(x)

# 1. note : 다음 단계에서 구현할 broadcast_to 함수를 미리 사용해서 구현한다.
# broadcast_to 를 이용해서 기존 x_shape과 같은 모양으로 바꿔준다.

In [67]:
import numpy as np
from dezero import Variable
import dezero.functions as F

X = Variable(np.array([1,2,3,4,5,6]))
y = F.sum(x)
y.backward() # 역전파 진행.
print(y)
print(x.grad)

variable(3.094718172802661)
variable([[1. 1. 1.]
          [1. 1. 1.]])


2차원에서도 가능한지 확인해보자

In [68]:
x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.sum(x)
y.backward()

print(y)
print(x.grad)

variable(21)
variable([[1 1 1]
          [1 1 1]])


기존 input의 모양대로 나오는 것을 볼 수 있다.

### axis & keepdims
단순히 덧셈을 진행하는 것 외에 '축'을 지정해서 해보도록 하자.

In [69]:
x = np.array([[1,2,3],[4,5,6]])
y = np.sum(x, axis=0)
print(y)
print(x.shape, ' -> ', y.shape)

# numpy에서는 이와같이 축을 지정할 수 있다.   
# Q. 만일 axis = 1로 했을 경우 어떤 결과가 나올 까?

[5 7 9]
(2, 3)  ->  (3,)


![title](pictures/picture_39-4.png)

axis에 따른 계산 결과는 다음과 같다.

![title](pictures/picture_39-5.png)

이 외에도 keepdims라는 인수도 존재한다. keepdim는 입력과 출력의 차원 수를 똑같게 유지할지 정하는 플래그이다.

In [72]:
x = np.array([[1,2,3],[4,5,6]])
y = np.sum(x, keepdims = True)

print(x.shape)
print(y)
print(y.shape)

# 입력 dim이 유지가 되는 것을 볼 수 있다.

(2, 3)
[[21]]
(1, 1)


Sum 함수에 axis 기능과 keepdim 기능을 부여해보자.

In [73]:
from dezero import utils

class Sum(dezero.Function):
    
    def __init__(self, axis, keepdims):
        self.axis = axis
        self.keepdims = keepdims
        
    def forward(self, x):
        self.x_shape = x.shape
        y = x.sum(axis = self.axis, keepdims = self.keepdims)
        return y
    
    def backward(self, gy):
        gy = utils.reshape_sum_backward(gy, self.x_shape, self.axis, self.keepdims)
        gx = broadcast_to(gy, self.x_shape)
        return gx
    
def sum(x, axis=None, keepdims =False):
    return Sum(axis, keepdims)(x)

완성된 sum 함수를 Variable의 메서드로 사용할 수 있도록 추가해준다.

In [74]:
class Variable:
    
    def sum(self, axis=None, keepdims=False):
        return dezero.functions.sum(self, axis, keepdims)

In [76]:
# 사용예시
from dezero import Variable

x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.sum(x, axis=0)
y.backward()
print(y)
print(x.grad)

x = Variable(np.random.rand(2,3,4,5))
y = x.sum(keepdims=True)
print(y.shape)

variable([5 7 9])
variable([[1 1 1]
          [1 1 1]])
(1, 1, 1, 1)


# discussion questions

1. 텐서란 무엇인가?
2. 텐서를 왜 이용하는가?
3. 텐서로 역전파를 시행하는데, 그 과정을 구체적으로 말해보라.
4. 행렬 전치란 무엇인가?