# 순환신경망(Recurrent Neural Network,RNN)
---

- Sequence 모델
- Recursive Neural Network와는 다른 신경망.
- LSTM, GRU가 RNN에 속한다.
- 작동 원리
  - 은닉층의 출력 결과를 출력층으로 전달함과 동시에 은닉층의 다음 시점(timestep) 계산 입력으로 전달.
  - one-to-many :  하나의 입력으로 부터 여러 개의 출력(sequence output)을 하는 모델. 하나의 이미지 입력으로 부터 사진의 제목을 출력하는 이미지 캡셔닝(Image Captioning)에 사용할 수 있다.
  - many-to-one : 단어 시퀀스에 대해서 하나의 출력을 하는 모델. 감성 분류나 스팸 메일 분류에 사용할 수 있다.
  - many-to-many : 입력 문장으로 부터 대답 문장을 출력. 개체명 인식이나 품사 태깅에 사용한다. 
  - 은닉층
  $$ h_t = tanh(W_x x_t + W_h h_{t-1} + b)$$
  - 출력층
  $$ y_t = f(W_y h_t + b) $$
    - f는 비선형 활성 함수중 하나 


# RNN in keras
---

In [0]:
!pip install tensorflow-gpu==2.0.0-rc1

In [0]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN

In [0]:
## psuedo code
model = Sequential()

# hidden_size : 은닉 상태의 크기를 정의. 
#               메모리 셀이 다음 시점의 메모리 셀과 출력층으로 보내는 값의 크기와 동일
# timesteps : 입력 시퀀스의 길이, 시점의 수
# input_dim : 입력의 크기

# 추가 인자 사용
model.add(SimpleRNN(hidden_size, input_shape=(timesteps, input_dim)))

# 다른 표기
model.add(SimpleRNN(hidden_size, input_length=M, input_dim=N)) # M과 N은 정수

- return sequence를 true로 설정하면 모든 은닉 상태를 전달, many-to-many가 되며, false로 설정 시 마지막 은닉 상태만 전달하도록 해서 many-to-one 문제를 풀 수 있게 된다.

In [6]:
model=Sequential()
model.add(SimpleRNN(3, input_shape=(2,10)))
model.summary() # output shape에서  batch size를 알 수 없기 때문에 None으로 출력

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
simple_rnn (SimpleRNN)       (None, 3)                 42        
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________


In [8]:
model=Sequential()
model.add(SimpleRNN(3, batch_input_shape=(8,2,10)))
model.summary() # batch size를 8로 설정

Model: "sequential_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
simple_rnn_2 (SimpleRNN)     (8, 3)                    42        
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________


In [9]:
model = Sequential()
model.add(SimpleRNN(3, batch_input_shape=(8,2,10), return_sequences=True))
model.summary()

Model: "sequential_4"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
simple_rnn_3 (SimpleRNN)     (8, 2, 3)                 42        
Total params: 42
Trainable params: 42
Non-trainable params: 0
_________________________________________________________________
