# Automatic differentiation with autograd

In [1]:
from mxnet import nd
from mxnet import autograd

### Basic usage

In [2]:
x = nd.array([[1, 2], [3, 4]])
x


[[1. 2.]
 [3. 4.]]
<NDArray 2x2 @cpu(0)>

- x에 대하여 f(x)의 gradient를 계산하기 위해서는 저장할 장소가 필요
- mxnet에서는 `attach_grad` 메소드에 의해 호출되어 NDArray에 gradient를 저장

In [4]:
x.attach_grad()

In [6]:
# Now we’re going to define the function  y=f(x) . To let MXNet store  y , so that we can compute gradients later, 
# we need to put the definition inside a autograd.record() scope.

with autograd.record():
    y = 2 * x * x

- y에 대하여 back propagation을 진행
- 만약 `y`가 더 많은 entry를 가지고 있다면 `y.sum().backword()`와 동일

In [7]:
y.backward()

- $y=2x^2$의 기울기는 ${dx \over dy} = 4x$ 이므로 예측 값은 [[4, 8], [12, 16]]이 되는것을 확인할 수 있음

In [8]:
x.grad


[[ 4.  8.]
 [12. 16.]]
<NDArray 2x2 @cpu(0)>

### Using Python control flows

In [21]:
def f(a):
    b = a * 2
    while b.norm().asscalar() < 1000:
        b = b * 2
    if b.sum().asscalar() >= 0:
        c = b[0]
    else:
        c = b[1]
    return c

In [22]:
a = nd.random.uniform(shape=2)
a.attach_grad()

with autograd.record():
    c = f(a)
    
c.backward()

In [23]:
[a.grad, c/a]

[
 [2048.    0.]
 <NDArray 2 @cpu(0)>,
 
 [2048.     1391.4297]
 <NDArray 2 @cpu(0)>]