# 1. RNN

- 순환신경망은 시퀀스의 원소를 순회하면서 지금까지 처리한 정보를 상태에 저장합니다.
- RNN은 다른 시퀀스를 처리하는 사이에 재설정됩니다. (2개의 다른 IMDB 리뷰) 하나의 시퀀스가 여전히 하나의 데이터 포인트로 간주된다. 즉 네트워크에 하나의 입력을 주입한다고 가정합니다. 이 데이터 포ㅇ니트가 한 번에 처리되지 않는다는 것이 다르다. 그 대신 네트워크는 시퀀스의 원소를 차례대로 방문합니다.

- 이 RNN은 크기가 (timesteps, input_features)인 2D 텐서로 인코딩된 벡터의 시퀀스를 받는다. 이 시퀀스는 타임스템을 따라서 반복된다. 각 타임스템 t에서 현재 상태와 입력을 연결하여 출력을 계산한다.

In [1]:
# pseudocode
state_t = 0 # timestep t

# initial state 
# for input_t in input_sequence: # repeat
#    output_t = f(input_t, state_t)
#    state_t = output_t

In [2]:
# f 함수는 입력과 상태를 출력으로 반환한다. 이를 2개의 W, U 행렬 그리고 편향 벡털르 사용하는 변환으로 바꿀 수 있다. 
# state_t = 0

# for input_t in input_sequence:
#     output_t = activation(dot(W, input_t) + dot(U, state_t) + b)
#     state_t =ouput_t

In [4]:
import numpy as np

timesteps = 100
input_features = 32
output_features = 64

inputs = np.random.random((timesteps, input_features))
inputs.shape

(100, 32)

In [6]:
state_t = np.zeros((output_features,))
state_t.shape

(64,)

In [8]:
W = np.random.random((output_features, input_features))
U = np.random.random((output_features, output_features))
b = np.random.random((output_features, ))

In [9]:
W.shape, U.shape, b.shape

((64, 32), (64, 64), (64,))

In [13]:
succesive_outputs = []

for input_t in inputs:
    output_t = np.tanh(np.dot(W, input_t) + np.dot(U, state_t) + b)
    succesive_outputs.append(output_t)
    state_t = output_t
    
final_output_sequence = np.stack(succesive_outputs, axis=0)
final_output_sequence.shape

(100, 64)