# RNN with torch

In [1]:
import torch
import torch.nn as nn

## nn.RNN()

### 하이퍼파라미터

In [2]:
input_size = 5 # 입력의 크기
hidden_size = 8 # 은닉 상태의 크기

### 입력 텐서
- 입력 텐서의 크기 : (batch_size, timesteps, input_size)
    - 배치크기 : 1
    - 10번의 시점
    - 5차원의 입력 벡터

In [3]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)

### RNN cell
- batch_first=True : 입력 텐서의 첫번째 차원이 배치크기로 설정

In [7]:
cell = nn.RNN(input_size, hidden_size, batch_first=True)

outputs, _status = cell(inputs)
print(outputs.shape) # 모든 time-step의 hidden_state
print(_status.shape) # 최종 time-step의 hidden_state


torch.Size([1, 10, 8])
torch.Size([1, 1, 8])


## Deep Recurrent Neural Network
층이 2개인 깊은 순환 신경망

### 하이퍼 파라미터

In [9]:
input_size = 5 # 입력의 크기
hidden_size = 8 # 은닉 상태의 크기
num_layers = 2

### 입력텐서
- 입력 텐서의 크기 : (batch_size, timesteps, input_size)


In [10]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)

### RNN cell

In [14]:
cell = nn.RNN(input_size = input_size, hidden_size = hidden_size, num_layers = num_layers, batch_first=True)
outputs, _status = cell(inputs)
print(outputs.shape) # 모든 time-step의 hidden_state
print(_status.shape) # (층의 개수, 배치 크기, 은닉 상태의 크기)

torch.Size([1, 10, 8])
torch.Size([2, 1, 8])


## Bidirectional Recurrent Neural Network
- nn.RNN()의 인자인 bidirectional에 값을 True로 전달

In [17]:
cell = nn.RNN(input_size = input_size, hidden_size = hidden_size, num_layers = num_layers, batch_first=True,  bidirectional = True)
outputs, _status = cell(inputs)

print(outputs.shape) # (배치 크기, 시퀀스 길이, 은닉 상태의 크기 x 2)
print(_status.shape) # (층의 개수 x 2, 배치 크기, 은닉 상태의 크기)

torch.Size([1, 10, 16])
torch.Size([4, 1, 8])
