## 36단계: 고차 미분 이외의 용도도

> 지금까지 여러 단계를 거쳐 DeZero로 고차 미분을 계산해봤습니다. 본질적으로는 한 가지 일을 한 셈인데, 바로 역전파 시 수행되는 계산에 대해서도 '연결'을 만들도록 했습니다. 여기에서 중요한 점은 역전파의 계산 그래프를 만드는 기능 자체가 DeZero의 새로운 능력이라는 사실입니다. 고차 미분은 이 능력을 응용한 한 가지 예에 지나지 않습니다. 그래서 이번 단계에서는 새로워진 DeZero를 고차 미분 외에 또 어떻게 활용할 수 있는지 살펴보겠습니다.

### 36.1 double backprop의 용도

2계도함수는 다음과 같은 문제에서도 사용이 가능하다.

> 문제: 다음 두 식이 주어졌을 때 $x=2.0$에서 $x$에 대한 $z$의 미분 $\frac{\partial z}{\partial x}$를 구하라. \
$ y = x^2 \\ z = \left( \frac{\partial y}{\partial x} \right)^3 + y$


위를 손으로 계산한다면 $\frac{\partial y}{\partial x}$를 먼저 계산하여 $\frac{\partial z}{\partial x} = 24x^2 + 2x$를 얻을 수 있다.

여기에 $x=2.0$을 대입하면 `100.0`이라는 답을 얻을 수 있다.

In [1]:
import numpy as np
from dezero import Variable

x = Variable(np.array(2.0))
y = x ** 2
y.backward(create_graph=True)
gx = x.grad
x.cleargrad()

z = gx ** 3 + y
z.backward()
print(x.grad)

Variable(100.0)


### 36.2 딥러닝 연구에서의 사용 예

다양한 예시가 있는데, 먼저 [WGAN-GP](https://arxiv.org/pdf/1704.00028) 논문에서는 `그림 36-1`의 수식을 최적화한다.

<img src="images/그림 36-1.png" width=500/>

위 식에는 1차 미분값이 들어있고, 위 식을 최적화하기 위해 다시 미분하므로 결국 2차 미분값을 사용하게 된다.

이 외에도 [MAML](https://arxiv.org/pdf/1703.03400)과 [TRPO](https://arxiv.org/pdf/1502.05477) 등 유명한 연구에서 double backprop 기능이 실제로 사용되고 있다.

이상으로 제 3고지를 마친다. 이번 고지에서는 DeZero의 역전파를 수정하여 double backprop이 가능하게 되었다. 다음 고지에서는 DeZero를 본격 신경망용으로 탈바꿈시킨다.