# Pytorch Autograd (automatic gradient calculation)

- torch.autograd에 있는 Variable 클래스를 사용하여 back propagation 시 gradient 값을 자동으로 계산함

출처: http://taewan.kim/trans/pytorch/tutorial/blits/02_autograd/

## 1) Variable

- torch.autograd 패키지의 핵심 클래스
- Variable 클래스는 Tensor를 감싸고 있으며, Tensor에 정의된 거의 모든 연산을 지원
- 모든 계산을 마친 후에 .backward()를 호출하면, 자동으로 모든 기울기가 계산됨

- Variable 객체의 .data 속성으로 Tensor의 실제 데이터에 접근할 수 있습니다. 
- Variable에 대한 기울기는 .grad 속성에 저장됩니다.

<img src="Variable.png" width="300">

- 각 Variable 객체에는 .grad_fn 속성이 있습니다. 이 속성은 해당 Variable 객체를 생성하는 Function 객체를 참조합니다. (예외 상황, Variable을 사용자가 직접 생성한 경우에는 grad_fn이 값은 None입니다.)

- 미분계수를 계산해야 한다면, Variable 객체의 .backward()를 호출합니다. 

**Example**:

In [1]:
import torch
from torch.autograd import Variable

Variable 생성:

In [2]:
x = Variable(torch.ones(2, 2), requires_grad=True)
print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)


Variable 연산 수행:

In [4]:
y = x + 2
print(y)

tensor([[3., 3.],
        [3., 3.]], grad_fn=<AddBackward0>)


앞의 연산으로 부터 y 객체가 생성되었습니다. 이 객체의 grad_fn 속성을 다음과 같이 확인할 수 있습니다.

In [5]:
print(y.grad_fn)

<AddBackward0 object at 0x00000174BA86C430>


y 에 추가 연산을 적용합니다.

In [6]:
z = y * y * 3
out = z.mean()

print(z)
print("---"*5)
print(out)

tensor([[27., 27.],
        [27., 27.]], grad_fn=<MulBackward0>)
---------------
tensor(27., grad_fn=<MeanBackward0>)


## 2) Gradients

역전파를 해보겠습니다. 

In [7]:
out.backward()

기울기 $\frac{\partial out}{\partial x}$ 를 다음과 같이 출력할 수 있습니다.

In [8]:
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


값이 4.5인 행렬이 출력됩니다. 위의 수식을 다음과 같이 정리할 수 있습니다.

- $out = \frac{1}{4} \sum_i z_i$
- $z_i = 3(x_i + 2)^2$
- $out \rvert _{x_i=1} = z_i \rvert _{x_i=1} = 27$

기울기는 chain rule에 의해 다음과 같이 계산할 수 있습니다.

- $\frac{\partial out}{\partial x_i} = \frac{\partial out}{\partial z_i} \frac{\partial z_i}{\partial y_i} \frac{\partial y_i}{\partial x_i}$

따라서, 이 기울기는 다음과 같이 정리할 수 있습니다.

- $\frac{\partial out}{\partial x_i} = \frac{3}{2}(x_i + 2)$
- $\frac{\partial out}{\partial x_i} \rvert _{x_i=1} = \frac{9}{2} = 4.5$

여러 값에 대한 기울기 계산:

In [9]:
x = torch.ones(3)
x = Variable(x, requires_grad=True)
y = x**2
z = y*3
print(z)
grad = torch.Tensor([0.1,1,10])
z.backward(grad)    # z와 x의 dimension이 일치해야 함
print(x.grad)

tensor([3., 3., 3.], grad_fn=<MulBackward0>)
tensor([ 0.6000,  6.0000, 60.0000])
