# Part 4.1. RNN

## 1. RNN
### 1.1. Sequntial Data
RNN(Recurrent Neural Network)은 **sequential data**를 다루기 위해 만들어졌다. **sequential data**란 data의 value(값)뿐만 아니라 order(순서)까지 고려를 해야하는 데이터를 말한다.

예를 들어, `hello`라는 글자를 예측하고 싶다고 할 때 `h` 다음에 `e`가 와야 하고, `e` 다음에 `l`이 와야한다. 즉, 문자의 배열 순서가 매우 중요하다. 그래야 해당 단어의 의미를 파악할 수 있기에.

## 1.2. RNN Structure

![17-1.png](./img/17-1.png)

RNN은 모델이 순서를 이해할 수 있는 **Cell**이라는 것이 존재하는데 이 Cell 안의 학습해야할 모든 파라미터가 있으며 **해당 파라미터를 업데이트 하면서 데이터의 순서를 이해**할 수 있게 된다.

또한 입력을 받으면 동일한 출력이 두 개 나오는 데 다음 입력 때 한 출력을 또 다른 입력으로 사용한다. 즉, 출력되지 않은 출력을 다음 Cell에 전달하여 사용한다. 이 때의 출력을 **hidden state**라고 한다.

![17-2.png](./img/17-2.png)

셀 A에서는 기본적으로 함수 연산이 일어나는데 전 단계의 hidden state와 현재 단계의 입력값을 가지고 현재 단계의 hidden state를 만든다. 각 단계 별 hidden state를 구한 뒤에 y를 위한 weight를 곱하면 우리가 원하는 예측값을 얻을 수 있다.

구조가 복잡한 셀을 쓰면 좋은 성능을 낼 수 는 있으나 더 많은 학습 자원이 필요하다. 복잡도를 기준으로 `RNN`이 가장 낮고 `LSTM`이 가장 높으며 `GRU`가 그 사이 중간 정도에 위치한다.


## 1.3. Usages of RNN

![17-3.png](./img/17-3.png)

* `one-to-one` : 우리가 전부터 사용하던 신경망 구조 
* `one-to-many` : 이미지를 입력으로 넣고 해당 이미지를 설명하는 문장을 출력
* `many-to-one` : 여러 개의 단어들 즉, 문장을 입력으로 넣으면 감정에 대한 레이블을 출력
* `many-to-many` : 번역할 때 한 문장을 다 보고 새로운 문장을 출력
* `many-to-many` : 비디오에서 한 프레임을 입력으로 넣고 프레임 전후의 변화를 출력

## 2. Vanilla RNN Implementation

In [0]:
import torch
import numpy as np

In [2]:
torch.manual_seed(0)

<torch._C.Generator at 0x7f38929c5310>

In [0]:
# 하이퍼 파라미터 설정
input_size = 4
hidden_size = 2

![17-4.png](./img/17-4.png)

In [0]:
# 각 문자를 one-hot-encoding 해줌
# input size는 벡터의 차원 = 4
h = [1, 0, 0, 0]
e = [0, 1, 0, 0]
l = [0, 0, 1, 0]
o = [0, 0, 0, 1]

# sequential data 예제
input_data_np = np.array([[h, e, l, l, o], [e, o, l, l, l], [l, l, e, e, l]], dtype=np.float32)

In [0]:
# 예제를 numpy에서 tensor로 변환
input_data = torch.Tensor(input_data_np)

![17-5.png](./img/17-5.png)

![17-6.png](./img/17-6.png)

![17-7.png](./img/17-7.png)

In [0]:
# RNN 모델 정의
# input만 잘 만들어주면 sequence length(5)와 batch size(3)는 알아서 계산
rnn = torch.nn.RNN(input_size, hidden_size)

In [7]:
# 결과 확인
# input_size (3, 5, 4), output_size (3, 5, 2)
outputs, _status = rnn(input_data)
print(outputs)
print(outputs.size())

tensor([[[-0.7497, -0.6135],
         [-0.5282, -0.2473],
         [-0.9136, -0.4269],
         [-0.9136, -0.4269],
         [-0.9028,  0.1180]],

        [[-0.5753, -0.0070],
         [-0.9052,  0.2597],
         [-0.9173, -0.1989],
         [-0.9173, -0.1989],
         [-0.8996, -0.2725]],

        [[-0.9077, -0.3205],
         [-0.8944, -0.2902],
         [-0.5134, -0.0288],
         [-0.5134, -0.0288],
         [-0.9127, -0.2222]]], grad_fn=<StackBackward>)
torch.Size([3, 5, 2])
