파이썬으로 RNN 구현

In [None]:
import numpy as np

timesteps = 10 # 시점의 수. NLP에서는 보통 문장의 길이가 된다.
input_size = 4 # 입력의 차원. NLP에서는 보통 단어 벡터의 차원이 된다.
hidden_size = 8 # 은닉 상태의 크기. 메모리 셀의 용량이다.

inputs = np.random.random((timesteps, input_size)) # 입력에 해당되는 2D 텐서

hidden_state_t = np.zeros((hidden_size,)) # 초기 은닉 상태는 0(벡터)로 초기화
# 은닉 상태의 크기 hidden_size로 은닉 상태를 만듬.

In [None]:
Wx = np.random.random((hidden_size, input_size))  # (8, 4)크기의 2D 텐서 생성. 입력에 대한 가중치.
Wh = np.random.random((hidden_size, hidden_size)) # (8, 8)크기의 2D 텐서 생성. 은닉 상태에 대한 가중치.
b = np.random.random((hidden_size,)) # (8,)크기의 1D 텐서 생성. 이 값은 편향(bias).

In [None]:
print(np.shape(Wx))
print(np.shape(Wh))
print(np.shape(b))

(8, 4)
(8, 8)
(8,)


In [None]:
total_hidden_states = []

# 메모리 셀 동작
for input_t in inputs: # 각 시점에 따라서 입력값이 입력됨.
  output_t = np.tanh(np.dot(Wx,input_t) + np.dot(Wh,hidden_state_t) + b) # Wx * Xt + Wh * Ht-1 + b(bias)
  total_hidden_states.append(list(output_t)) # 각 시점의 은닉 상태의 값을 계속해서 축적
  print(np.shape(total_hidden_states)) # 각 시점 t별 메모리 셀의 출력의 크기는 (timestep, output_dim)
  hidden_state_t = output_t

total_hidden_states = np.stack(total_hidden_states, axis = 0)
# 출력 시 값을 깔끔하게 해준다.

print(total_hidden_states) # (timesteps, output_dim)의 크기. 이 경우 (10, 8)의 크기를 가지는 메모리 셀의 2D 텐서를 출력.


(1, 8)
(2, 8)
(3, 8)
(4, 8)
(5, 8)
(6, 8)
(7, 8)
(8, 8)
(9, 8)
(10, 8)
[[0.99995464 0.99998704 0.99903235 0.99977859 0.99975936 0.99989827
  0.99998879 0.99978704]
 [0.9999949  0.99999712 0.99969861 0.99989173 0.99997639 0.99999203
  0.99999886 0.99999047]
 [0.9999825  0.99998704 0.99927554 0.99955645 0.99993869 0.99998167
  0.99999839 0.99993569]
 [0.99998687 0.99999485 0.99949546 0.99977206 0.99992133 0.99997526
  0.99999582 0.99996283]
 [0.99998294 0.9999885  0.99895068 0.99980577 0.99976617 0.99994112
  0.99999312 0.99992419]
 [0.99999185 0.999993   0.99947605 0.99983941 0.99996075 0.9999879
  0.9999989  0.99997769]
 [0.99999655 0.99999832 0.99978251 0.999932   0.99998349 0.99999404
  0.99999898 0.99999495]
 [0.9999901  0.99999805 0.99977715 0.99993784 0.99997678 0.99998577
  0.99999768 0.99998367]
 [0.99999334 0.9999961  0.9996769  0.99978532 0.99997903 0.99999313
  0.99999908 0.99998643]
 [0.99996072 0.99999435 0.99943376 0.99980346 0.99983299 0.9999173
  0.99998427 0.99986769]]


파이토치의 nn.RNN()

In [None]:
import torch
import torch.nn as nn
input_size = 5 # 입력의 크기
hidden_size = 8 # 은닉 상태의 크기
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)


In [None]:
cell = nn.RNN(input_size, hidden_size, batch_first=True)
outputs, _status = cell(inputs)

In [None]:
print(outputs.shape) # 모든 time-step의 hidden_state

torch.Size([1, 10, 8])


In [None]:
print(_status.shape) # 최종 time-step의 hidden_state

torch.Size([1, 1, 8])


**깊은 순환 신경망(Deep RNN)**

In [None]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)
cell = nn.RNN(input_size = 5, hidden_size = 8, num_layers = 2, batch_first=True)
outputs, _status = cell(inputs)
print(outputs.shape) # 모든 time-step의 hidden_state
print(_status.shape) # (층의 개수, 배치 크기, 은닉 상태의 크기)

torch.Size([1, 10, 8])
torch.Size([2, 1, 8])


**양방향 순환 신경망(Bidirectional RNN)**

In [None]:
# (batch_size, time_steps, input_size)
inputs = torch.Tensor(1, 10, 5)
cell = nn.RNN(input_size = 5, hidden_size = 8, num_layers = 2, batch_first=True, bidirectional = True)
outputs, _status = cell(inputs)
print(outputs.shape) # (배치 크기, 시퀀스 길이, 은닉 상태의 크기 x 2)
print(_status.shape) # (층의 개수 x 2, 배치 크기, 은닉 상태의 크기)


torch.Size([1, 10, 16])
torch.Size([4, 1, 8])


**LSTM**

In [None]:
nn.LSTM(input_dim, hidden_size, batch_fisrt=True)

NameError: name 'input_dim' is not defined

**GRU**

In [None]:
nn.GRU(input_dim, hidden_size, batch_fisrt=True)