## 오차역전파
지금까지 신경망 학습에 관한 내용에선, 신경망의 가중치 매개변수에 대한 손실 함수의 기울기를 수치 미분을 통해 구했다.  
수치 미분은 단순하지만 계산 시간이 오래 걸린다는 단점이 있다.

따라서 더 빠른 계산법인 오차역전파를 알아보고 도입해보자.

### 계산 그래프
오차역전파를 좀 더 이해하기 쉽게 하고자 계산 그래프라는 것을 통해 먼저 알아보려한다.  
계산 그래프는 계산 과정을 노드와 화살표로 표현하는 것으로,
- 노드는 동그라미로 표기하고, 그 안에 연산 내용을 적는다.
- 계산 결과를 화살표 위에 적어 각 노드의 계산 결과가 왼쪽에서 오른쪽으로 전해지게 한다.

예를 들면,  
***슈퍼에서 1개에 100원인 사과 2개를 구매하려 할 때 지불 금액을 구하라. 단, 소비세 10%가 부과된다.***
<img src="img/deep_learning_images/fig_5-1.png" height=448 width=448>

이를 좀 더 세분화하여 **사과의 개수**와 **소비세를 변수**로 취급하고, 노드에는 연산자만을 담아 재구성하면,
<img src="img/deep_learning_images/fig_5-2.png" height=448 width=448>

계산 과정이 왼쪽에서 오른쪽으로 진행되는 단계를 순전파(forward propagation)라하고, 반대로 오른쪽에서 왼쪽으로 진행하는 것을 역전파(back propagation)이라 한다.

### 계산 그래프 특징
1. 주목해야 할 점은 국소적 계산이 가능하다는 것으로 각 노드는 자신과 관련된 계산 외에는 아무것도 신경 쓰지 않아도 된다는 뜻이다.  
   사과의 개수와 가격이 곱해질 때는 이후 단계인 소비세가 어떻게 되는지 관련이 없다는 것.
   
2. 중간 계산 결과를 보관할 수 있다.
   사과 2개를 계산했을 때의 금액은 200원. 소비세를 더한 후의 값은 220원.
   
이 두 가지의 특징들을 종합했을 때의 강점은 바로 미분을 효과적으로 계산할 수 있다는 점이다.  
가령 사과의 가격이 올랐을 때 최종 계산 금액이 어떻게 변하는지 알고 싶을 때면 ***사과 가격에 대한 지불 금액의 미분을 구하는 문제***이다.  
사과 값을 $x$, 지불 금액을 $L$이라 했을 때 $\frac {\partial L}{\partial x}$

<img src="img/deep_learning_images/fig_5-5.png" width=448 height=448>
사과 값이 1원 오르면 최종 금액은 2.2원 오르게 된다는 뜻

## 연쇄법칙

그렇다면 역전파에서 국소적인 미분을 오른쪽에서 왼쪽으로 어떻게 전달한다는 것인가? 바로 연쇄법칙의 원리를 이용한다.  
먼저 합성 함수에 대해 알아야 한다.

### 합성 함수
합성 함수는 여러 함수로 구성된 함수로 $z=(x+y)^2$라는 식은 다음 두 개의 식으로 구성된다.
<img src="img/deep_learning_images/e_5.1.png" width=150 height=150>
> 합성 함수의 미분은 합성 함수를 구성하는 각 함수의 미분의 곱으로 나타낼 수 있으며 이것이 바로 연쇄법칙의 원리이다.

가령 x에 대한 z의 미분($\frac {\partial z}{\partial x}$)은 t에 대한 z의 미분($\frac {\partial z}{\partial t}$)과 x에 대한 t의 미분($\frac {\partial t}{\partial x}$)의 곱으로 나타낼 수 있다.

<img src="img/deep_learning_images/e_5.2.png" width=150 height=150>
<img src="img/deep_learning_images/e_5.3.png" width=100 height=100>
<img src="img/deep_learning_images/e_5.4.png" width=320 height=320>

이를 계산 그래프로 나타내보면,
<img src="img/deep_learning_images/fig_5-7.png" width=384 height=384>

입력은 $\frac {\partial z}{\partial z}$이고, 이에 국소적인 미분인 $\frac {\partial z}{\partial t}$가 곱해진다.  
(순전파에서 입력이 t이고 출력이 z이므로 해당 노드에서의 국소적 미분은 $\frac {\partial z}{\partial t}$이다.)  

가장 왼쪽을 보면 연쇄법칙에 의해 $\frac {\partial z}{\partial z}\frac {\partial z}{\partial t}\frac {\partial t}{\partial x} = \frac {\partial z}{\partial t}\frac {\partial t}{\partial x} = \frac {\partial z}{\partial x}$가 성립되어 x에 대한 z의 미분이 된다.
<img src="img/deep_learning_images/fig_5-8.png" height=384 width=384>