## 순환 신경망 (Recurrent Neural Network, RNN)

### 1. 순환 신경망 (Recurrent Neural Network, RNN)

In [2]:
from IPython.display import Image
Image(url='https://wikidocs.net/images/page/22886/rnn_image2_ver3.PNG', width=600)

* 셀(Cell): RNN의 은닉층에서 활성화 함수를 통해 결과를 내보내는 역할을 하는 노드
    - 이전의 값을 기억하려고 하는 일종의 메모리
    - 메모리 셀, RNN 셀
* 은닉 상태(hidden state): 메모리 셀이 출력층 방향으로 또는 다음 시점 $t+1$의 자신에게 보내는 값

In [None]:
Image(url='https://wikidocs.net/images/page/22886/rnn_image4_ver2.PNG', width=600)

**은닉층**
$$
h_t = tanh(W_x x_t + W_h h_{t-1} +b)
$$

**출력층**
$$
y_t = f(W_y h_t +b)
$$

In [5]:
Image(url='https://wikidocs.net/images/page/22886/rnn_images4-5.PNG', width=800)

In [11]:
import torch
import torch.nn as nn

In [12]:
input_size = 5 # 입력의 크기
hidden_size = 8 # 은닉 상태의 크기

In [13]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)

In [14]:
cell = nn.RNN(input_size, hidden_size, batch_first=True)

In [15]:
outputs, _status = cell(inputs)

In [16]:
print(outputs.shape) # 모든 time-step의 hidden_state

torch.Size([1, 10, 8])


In [17]:
print(_status.shape) # 최종 time-step의 hidden_state

torch.Size([1, 1, 8])


### 2. 깊은 순환 신경망(Deep Recurrent Neural Network)

In [22]:
Image(url='https://wikidocs.net/images/page/22886/rnn_image4.5_finalPNG.PNG', width=600)

In [18]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)

In [19]:
cell = nn.RNN(input_size = 5, hidden_size = 8, num_layers = 2, batch_first=True)
outputs, _status = cell(inputs)

In [20]:
print(outputs.shape) # 모든 time-step의 hidden_state

torch.Size([1, 10, 8])


In [21]:
torch.Size([1, 10, 8])


torch.Size([1, 10, 8])

### 3. 양방향 순환 신경망(Bidirectional Recurrent Neural Network)

시점 $t$에서의 출력값을 예측할 때 이전 시점의 데이터뿐만 아니라, 이후 데이터로도 예측할 수 있다는 아이디어에 기반

```python
Exercise is very effective at [          ] belly fat.

1) reducing
2) increasing
3) multiplying
```

In [23]:
Image(url='https://wikidocs.net/images/page/22886/rnn_image5_ver2.PNG', width=600)

* 첫번째 메모리셀: 앞 시점의 은닉 상태 (Forward States)를 전달받음
* 두번째 메모리셀: 뒤 시점의 은닉 상태 (Backward States)를 전달받음

In [24]:
# 깊은 양방향 순환 신경망
Image(url='https://wikidocs.net/images/page/22886/rnn_image6_ver3.PNG', width=600)

In [25]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)

In [26]:
cell = nn.RNN(input_size = 5, hidden_size = 8, num_layers = 2, batch_first=True, bidirectional = True)

In [27]:
outputs, _status = cell(inputs)

In [28]:
print(outputs.shape) # (배치 크기, 시퀀스 길이, 은닉 상태의 크기 x 2)

torch.Size([1, 10, 16])


In [29]:
print(_status.shape) # (층의 개수 x 2, 배치 크기, 은닉 상태의 크기)

torch.Size([4, 1, 8])
