In [1]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN

model = Sequential()
model.add(SimpleRNN(3, input_shape=(2,10)))
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 simple_rnn (SimpleRNN)      (None, 3)                 42        
                                                                 
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________


In [4]:
model = Sequential()
model.add(SimpleRNN(3, batch_input_shape=(8,2,10)))
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 simple_rnn_3 (SimpleRNN)    (8, 3)                    42        
                                                                 
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________


In [6]:
model = Sequential()
model.add(SimpleRNN(3, batch_input_shape=(8,2,10), return_sequences=True))
model.summary()

Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 simple_rnn_4 (SimpleRNN)    (8, 2, 3)                 42        
                                                                 
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________


In [7]:
# (수식 관점에서) 파이썬으로 RNN 구현

import numpy as np

timesteps = 10 # 보통 자연어 처리에서는 문장의 길이
input_dim = 4 # 단어 벡터의 차원
hidden_units = 8 # 메모리 셀의 용량

# 입력에 해당하는 2D 텐서 (실제로는 3D 텐서이나 구현상의 편의를 위해 2D로 설정)
inputs = np.random.random((timesteps, input_dim))

# 초기 은닉상태를 0(vector)로 초기화
hidden_state_t = np.zeros((hidden_units,))

print('초기 은닉 상태:', hidden_state_t)

초기 은닉 상태: [0. 0. 0. 0. 0. 0. 0. 0.]


In [9]:
# 가중치와 편향 정의

# (8,4) 크기의 2D 텐서 생성 - 입력에 대한 가중치
W_x = np.random.random((hidden_units, input_dim))

# (8,8) 크기의 2D 텐서 생성 - 은닉 상태에 대한 가중치
W_h = np.random.random((hidden_units, hidden_units))

# (8,) 크기의 1D 텐서 생성 - 편향(bias)
b = np.random.random((hidden_units,))

In [10]:
# 모든 시점의 은닉 상태를 출력하며 RNN 층 동작

total_hidden_states = []

# 각 시점의 입력값
for input_t in inputs:

  output_t = np.tanh(np.dot(W_x, input_t) + np.dot(W_h, hidden_state_t) + b)
  total_hidden_states.append(list(output_t))
  hidden_state_t = output_t

total_hidden_states = np.stack(total_hidden_states, axis = 0)

print('모든 시점의 은닉 상태 :')
print(total_hidden_states)

모든 시점의 은닉 상태 :
[[0.91229187 0.89673828 0.84992962 0.85941851 0.97195501 0.90249924
  0.85230396 0.8672287 ]
 [0.99999436 0.99997561 0.99999348 0.99995339 0.99998801 0.99943374
  0.99947089 0.99995495]
 [0.9999986  0.99998985 0.99999805 0.99996839 0.99999261 0.99933106
  0.99972783 0.99997704]
 [0.99999147 0.99996498 0.99998965 0.9999449  0.99997233 0.99930274
  0.99792801 0.99990146]
 [0.99999839 0.999988   0.99999756 0.99997596 0.99999381 0.99932655
  0.9996975  0.99997594]
 [0.99999824 0.99998893 0.99999797 0.99998386 0.99999571 0.99965949
  0.99970231 0.99997985]
 [0.99999756 0.99998193 0.99999653 0.99997372 0.99999362 0.99942061
  0.99959916 0.99997149]
 [0.99999444 0.99997298 0.99999494 0.99998136 0.99999411 0.99978029
  0.99918992 0.99996285]
 [0.99999537 0.99997124 0.99999449 0.99998008 0.99999439 0.99964841
  0.99933565 0.99996439]
 [0.9999977  0.99998478 0.99999654 0.99996134 0.99998866 0.99915412
  0.99951215 0.99996345]]


# 점검 퀴즈

모델에 대한 설명이 다음과 같을 때, 총 마라미터의 개수를 구하여라.

1. Embedding을 사용하며, 단어 집합(Vocabulary)의 크기가 5,000이고 임베딩 벡터의 차원은 100입니다.
2. 은닉층에서는 Simple RNN을 사용하며, 은닉 상태의 크기는 128입니다.
3. 훈련에 사용하는 모든 샘플의 길이는 30으로 가정합니다.
4. 이진 분류를 수행하는 모델로, 출력층의 뉴런은 1개로 시그모이드 함수를 사용합니다.
5. 은닉층은 1개입니다.

In [11]:
# 점검 퀴즈 정답

from keras.models import Sequential
from keras.layers import SimpleRNN, Embedding, Dense

vocab_size = 5000
embedding_dim = 100
hidden_size = 128

model = Sequential()
model.add(Embedding(vocab_size, embedding_dim))
model.add(SimpleRNN(hidden_size))
model.add(Dense(1, activation = 'sigmoid'))
model.summary()

Model: "sequential_6"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding (Embedding)       (None, None, 100)         500000    
                                                                 
 simple_rnn_5 (SimpleRNN)    (None, 128)               29312     
                                                                 
 dense (Dense)               (None, 1)                 129       
                                                                 
Total params: 529,441
Trainable params: 529,441
Non-trainable params: 0
_________________________________________________________________
