# 순환신경망 (RNN - Recurrent Neural Network)
Sequence Data(순차데이터) 분석을 위한 모형

## Sequence Data(순차데이터) 
- 순서가 의미가 있으며, 순서가 달라질 경우 의미가 바뀌거나 손상되는 데이터를 말한다.

![image.png](attachment:image.png)

##  sequence data의 예

### Sequence-to-vector (many to one)

- Sequence가 들어가면 Vector(하나)가 나온다. 

- 예: 주가예측 : 4일간의 주가가 들어가면 그 다음날 주가가 나온다.
![image.png](attachment:image.png)
- Input: 4일간 주가
- Output: 5일째 주가

 ![image.png](attachment:image.png)

### sequence-to-sequence(many to many)
- 예: Machine translation (번역)
![image.png](attachment:image.png)    

- Input: 영어 문장 전체를 단어 단위로 순차적 입력
- Output: 번역된 한글 문장을 단어 단위로 순차적 출력
    

![image.png](attachment:image.png)

### Vector-to-sequence (one to many)
- 이미지 하나(Vector)가 들어가면 단어들(문장) 이 나온다 
- 예: Image captioning (이미지를 설명하는 문장을 만드는 것): 하나의 그림에 문장(단어들)이 나온다.
    ![image.png](attachment:image.png)

    - Input: 이미지
    - Output: 이미지에 대한 설명을 단어 단위로 순차적으로 출력 
    

![image.png](attachment:image.png)

## RNN (Recurrent neural networks)

### Memory System (기억시스템)

![image.png](attachment:image.png)

- 4일간의 주가 변화로 5일째 주가를 예측하려면 입력받은 4일간의 주가를 순서를 기억하고 있어야 한다.
- DNN 의 예측 결과(출력)은 이전 출력에 영향을 받지 않는다.

# G : 
- 1000, 1100, 1200 => 1300 이지만 이걸 만약 꺼꾸로 하면 900 이 된다. 순서가 있는 데이터는 그 순서가 바뀌면 예측이 어렵다. 그런데 단순 신경망은 그런 순서를 고려하지 않는다.

### 기본적인 순환신경망 (Vanilla RNN)

![image.png](attachment:image.png)

- 기존 DNN 구조에 순환의 개념이 들어간다. 
- 각 입력 데이터는 순차적으로 들어오며 Node/Unit은 입력데이터와 이전 입력에 대한 출력 데이터를 같이 입력받는다.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

$$y_n = tanh(W_{xh} * X_n + W_{hh} * h_{n-1} + b_n)$$

# G: 
위의 두번째  그림은 위의 것을 푼 것이다.

### 기본 순환신경망의 문제
- Sequence가 긴 경우 앞쪽의 기억이 뒤쪽에 영향을 미치지 못해 학습능력이 떨어진다.
    - 경사 소실 문제로 처음의 input값이 점점 잊혀지는 현상 발생 
- ReLU activation, parameter initialization의 조정 등 보다 모형의 구조적으로 해결하려는 시도 
    - Long Short Term Memory(LSTM; Hochreiter & Schmidhuber, 1997)
    - Gated Recurrent Unit(GRU; Kyunghyun Cho et al., 2014) 

## LSTM (Long Short Term Memory)
- RNN을 개선한 변형 알고리즘
- 오래 기억할 것은 유지하고 잊어버릴 것은 빨리 잊어버리자

![image.png](attachment:image.png)

LSTM의 노드는 RNN의 hidden state에 Cell state 를 추가로 출력을 한다.
- Cell State 
    - 기억을 오래 유지하기 위해 전달 하는 값.
    - 이전 노드들에의 출력 값에 현재 입력에 대한 값을 더한다.
-     
![image.png](attachment:image.png)

### Cell State의 구성
- Forget gate
- Input gate

#### Forget gate
- 현재 노드의 입력값을 기준으로 Cell state의 값에서 **얼마나 잊을지** 결정
![image.png](attachment:image.png)

#### Input gate
- 현재 노드의 입력값을 Cell state에 추가
![image.png](attachment:image.png)