# step 37. Tensor handling

In [1]:
# element-wise operation

import numpy as np
import dezero.functions as F
from dezero import Variable

x = Variable(np.array(1.0))
y = F.sin(x)
print(y)

x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.sin(x)
print(y)

x = Variable(np.array([[1,2,3],[4,5,6]]))
c = Variable(np.array([[10,20,30],[40,50,60]]))
y = x + c
print(y)

variable(0.8414709848078965)
variable([[ 0.84147098  0.90929743  0.14112001]
          [-0.7568025  -0.95892427 -0.2794155 ]])
variable([[11 22 33]
          [44 55 66]])


### tensor 사용 시 역전파
지금까지의 역전파 구현은 '스칼라'를 대상으로 하였음. 텐서를 사용한 계산에 역전파를 적용하려면?<br/>
사실 이미 텐서에 대해서도 역전파 정상적으로 진행 될 것임.<br/>
* 그동안 스칼라를 대상으로 역전파를 구현하였음
* 지금까지 구현한 DeZero 함수에 '텐서'를 전달하면 텐서의 원소마다 '스칼라'로 계산한다.
* 텐서의 원소별 '스칼라'계산이 이루어지면 '스칼라'를 가정해 구현한 역전파는 '텐서'의 원소별 계산에서도 성립

In [3]:
# 원소별 연산에서는 역전파도 미분을 원소별로 곱하여 구한다.
x = Variable(np.array([[1,2,3],[4,5,6]]))
c = Variable(np.array([[10,20,30],[40,50,60]]))
t = 2*(x + c)
y = F.sum(t)

y.backward(retain_grad = True)
print(y.grad)
print(t.grad)
print(x.grad)
print(c.grad)

variable(1)
variable([[1 1 1]
          [1 1 1]])
variable([[2 2 2]
          [2 2 2]])
variable([[2 2 2]
          [2 2 2]])


기울기의 shape와 데이터의 shape가 일치한다는 것에 주목하자.  
즉, x.shape == x.grad.shape (다른변수들도 마찬가지)  
이 성질을 이용하여 원소별 계산이 아닌 함수 (sum, reshape를 구현할 수 있다.)

# step 38. 형상 변환 함수
앞으로의 step들에서는 원소별 계산이 아닌 다른 함수들에 대해서도 살펴보려고 한다.  
그것을 위해 이번 단계에서 reshape와 transpose 함수를 구현해야한다.

In [4]:
# reshape 함수의 구현
import numpy as np

x = np.array([[1,2,3],[4,5,6]])
y = np.reshape(x, (6,))
print(y)

[1 2 3 4 5 6]


reshape 함수는 구체적인 계산은 아무것도 하지 않고 단순히 형상(shape)만 변환한다.  
따라서 역전파 시 출력 쪽에서 전해지는 기울기에 어떠한 연산없이 그대로 입력쪽으로 흘려보내는데,  
이때 기울기의 형상이 입력의 형상과 같아지도록 변환한다.
<그림38-1>

In [None]:
class Reshape(Function):
    def __init__(self, shape):
        self.shape = shape # 변형 목표가 되는 shape
    
    def forward(self, x):
        self.x_shape = x.shape # x의 original shape를 기억
        y = x.reshape(self.shape) # 넘파이의 reshape함수 이용
        return y
    
    # 연산 없이 형상만 변형 (원래 x의 shape대로)
    def backward(self, gy):
        return reshape(gy, self.x_shape) # gy는 Variable 객체이므로 별도의 reshape함수 만들어야함
    
from dezero.core import as_variable

def reshape(x, shape):
    if x.shape == shape:
        return as_variable(x)
    return Reshape(shape)(x)

In [None]:
import numpy as np
from dezero import Variable
import dezero.functions as f

x = Variable(np.array([[1,2,3],[4,5,6]]))
y = F.reshape(x, (6,))
y.backward(retain_grad = True)
print(x.grad)