# 밑바닥부터 시작하는 딥러닝

# Deep Learning from Scratch


# 5 오차역전파법

오차역전파법(backpropagation): 가중치 매개변수의 기울기를 효율적으로 계산

오차를 역(반대 방향)으로 전파하는 방법(backward propagation of errors)

가중치 매개변수의 기울기를 효과적으로 계산하는 방법
1. 결과값을 손실함수로 변환한다.
2. 손실함수의 기울기를 수치미분 한다
3. 기울기가 0이 되는 지점까지 weight를 변화한다.

수치 미분을 통하여 기울기를 구하는데 이는 단순하고 쉽지만 계산이 오래 걸리는 단점이 있다.
따라서 가중치 매개변수의 기울기를 가장 효과적으로 구할 수 있는 오차역전파법을 사용한다.

순전파 :  왼쪽에서 오른쪽
역전파 :  오른쪽에서 왼쪽

## 5.1 계산 그래프

계산 그래프(computational graph): 계산 과정을 그래프로 나타낸 것

복수의 노드(node)와 에지(edge)로 표현됨.

에지: 노드 사이의 직선

### 5.1.1 계산 그래프로 풀다

계산 그래프를 이용한 문제풀이는 다음 흐름으로 진행

* 계산 그래프를 구성한다.
* 그래프에서 계산을 왼쪽에서 오른쪽으로 진행한다.

순전파: 계산을 왼쪽에서 오른쪽으로 진행. 계산 그래프의 출발점부터 종착점으로의 전파.

### 5.1.2 국소적 계산

국소적: 자신과 직접 관련된 작은 범위

국소적 계산: 자신과 관계된 정보만으로 다음 결과를 출력할 수 있음

각 노드는 자신과 관련된 계산 외에는 아무 것도 신경 쓸게 없음

복잡한 계산을 '단순하고 국소적 계산'으로 분할하고 계산 결과를 다음 노드로 전달

복잡한 계산도 분해하면 단순한 계산으로 구성됨

### 5.1.3 왜 계산 그래프로 푸는가?

계산 그래프의 이점 : 국소적 계산으로 문제를 단순화할 수 있음. 중간 계산 결과를 모두 보관 가능

계산 그래프를 쓰는 가장 큰 이유는 역전파를 통해 '미분'을 효율적으로 계산할 수 있음

중간까지 구한 미분 결과를 공유할 수 있어 다수의 미분을 효율적으로 계산할 수 있음

![](./img/01.png)

역전파는 오른쪽에서 왼쪽으로 미분값을 전달. 사과가 1원 오르면 최종금액은 2.2원 오른다.

## 5.2 연쇄법칙

'국소적 미분'을 전달하는 원리는 연쇄 법칙(chain rule)에 따른 것

### 5.2.1 계산 그래프의 역전파

계산 그래프의 역전파: 순방향과는 반대 방향으로 국소적 미분을 곱한다.

역전파의 계산 절차는 신호 E에 노드의 국소적 미분을 곱한 후 다음 노드로 전달

역전파의 계산 순에 따르면 목표로 하는 미분 값을 효율적으로 구할 수 있음

![](./img/02.png)

여기서 말하는 국소적 미분은 순전파때의 y=f(x) 계산의 미분을 말하며 이는 x에 대한 y의 미분을 구한다는 뜻.

y=x**2 의 미분은 dy/dx = 2x 이다. 이 국소적 미분을 상류에서 전달된 값(여기서는 E)에 곱하여 하류로 전달한다.

### 5.2.2 연쇄법칙이란?

합성 함수: 여러 함수로 구성된 함수

예를 들어 z= (x+y)**2 은 z = t**2, t = x+y 의 합성 함수이다.

#### 식 5.1

\begin{equation*}
z = t^{2}
\end{equation*}

\begin{equation*}
t = x + y
\end{equation*}

연쇄법칙은 함성 함수의 미분에 대한 성질

합성 함수의 미분은 합성 함수를 구성하는 각 함수의 미분의 곱으로 나타낼 수 있다.

#### 식 5.2

\begin{equation*}
\frac{\partial z}{\partial x} = \frac{\partial z}{\partial t} \frac{\partial t}{\partial x}
\end{equation*}

x에 대한 z의 미분은 t에 대한 z의 미분과 x에 대한 t의 미분의 곱으로 나타낼 수 있음

∂t를 서로 지울 수 있음.

\begin{equation*}
\frac{\partial z}{\partial x} = \frac{\partial z}{} \frac{}{\partial x}
\end{equation*}

#### 식 5.3

식 5.1에 대한 국소적 미분(편미분)을 구함

\begin{equation*}
\frac{\partial z}{\partial t} = 2t
\end{equation*}

\begin{equation*}
\frac{\partial t}{\partial x} = 1
\end{equation*}

최종적으로 구하고 싶은 x에 대한 z의 미분은 다음 두 미분을 곱해 계산

#### 식 5.4

\begin{equation*}
\frac{\partial z}{\partial x} = \frac{\partial z}{\partial t} \frac{\partial t}{\partial x} = 2t · 1 = 2(x+y)
\end{equation*}