# SimpleRNN / LSTM input/output shape

- return_sequences = False, True 일 때의 output 비교

- Bidirectional LSTM 의 output 비교

In [2]:
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Input, SimpleRNN, LSTM, Bidirectional, Lambda, Dense
import tensorflow as tf
import numpy as np
import warnings
warnings.filterwarnings('ignore')

B = 4   # batch size
T = 30   #Time Steps
D = 1   #features
U = 3   #LSTM units

X = np.random.randn(B, T, D)
print(X.shape)

(4, 30, 1)


## SimpleRNN

## return_sequences

- False (default) - last time step 의 output 만 반환
- True - 모든 timestep 의 output 을 모두 반환  

<img src="rnn_output2.png" width=400 />
<img src="rnn_output1.png" width=500 />

In [4]:
def simple_RNN(return_sequences=False):
    inp = Input(shape=(T, D)) 
    out = SimpleRNN(U, return_sequences=return_sequences)(inp)
    
    model = Model(inputs=inp, outputs=out)
    return model.predict(X)

print("---- return_sequences=False ----> last timestep 의 output 만 반환")
lstm_out = simple_RNN(return_sequences=False)
print(lstm_out.shape)
# print(lstm_out)

print("\n---- return_sequences=True ----> 모든 timestep 별 output 출력")
lstm_out = simple_RNN(return_sequences=True)
print(lstm_out.shape)
# print(lstm_out)

---- return_sequences=False ----> last timestep 의 output 만 반환
(4, 3)

---- return_sequences=True ----> 모든 timestep 별 output 출력
(4, 30, 3)


## LSTM

## return_sequences

- False (default) - last time step 의 output 만 반환
- True - 모든 timestep 의 output 을 모두 반환

In [6]:
def lstm(return_sequences=False):
    inp = Input(shape=(T, D)) 
    out = LSTM(U, return_sequences=return_sequences)(inp)
    
    model = Model(inputs=inp, outputs=out)
    return model.predict(X)

print("---- return_sequences=False ----> last timestep 의 output 만 반환")
lstm_out = lstm(return_sequences=False)
print(lstm_out.shape)
# print(lstm_out)

print("\n---- return_sequences=True ----> 모든 timestep 별 output 출력")
lstm_out = lstm(return_sequences=True)
print(lstm_out.shape)
# print(lstm_out)

---- return_sequences=False ----> last timestep 의 output 만 반환
(4, 3)

---- return_sequences=True ----> 모든 timestep 별 output 출력
(4, 30, 3)


## Bidirectional LSTM

- 순방향, 역방향이 concatenate 된 output 출력  

- hidden state, cell state 는 순방향, 역방향 별도 출력

In [7]:
T, D, U

(30, 1, 3)

In [10]:
def bi_lstm(return_sequences=False):
    inp = Input(shape=(T, D))
    out = Bidirectional(
            LSTM(U, return_sequences=return_sequences))(inp)
    
    model = Model(inputs=inp, outputs=out)
    return model.predict(X)

print("*** 순방향, 역방향이 concatenate ***")
print("---- return_sequences=False ----> last timestep 의 output 만 반환")
lstm_out = bi_lstm(return_sequences=False)
print(lstm_out.shape)
# print(lstm_out)
print()
print("---- return_sequences=True ----> 모든 timestep 별 output 출력")
lstm_out = bi_lstm(return_sequences=True)
print(lstm_out.shape)
# print(lstm_out)

*** 순방향, 역방향이 concatenate ***
---- return_sequences=False ----> last timestep 의 output 만 반환
(4, 6)

---- return_sequences=True ----> 모든 timestep 별 output 출력
(4, 30, 6)


## Lambda Layer

kares의 기능을 효과적으로 확장하기 위해 임의의 작업을 수행할 수 있게 해주는 레이어이며 모델 정의 자체 내에서 수행.

In [11]:
model = Sequential([
    #2D input을 3D로 변경 
    Lambda(lambda x: tf.expand_dims(x, axis=-1), input_shape=[None]),
    LSTM(20, return_sequences=True),
    LSTM(20),
    Dense(1),
    Lambda(lambda x: x * 100.0)  #output을 scale-up
])

In [13]:
X = np.random.randn(B, T) * 100
print(X.shape)
# print(X)

(4, 30)


In [16]:
np.expand_dims(X, axis=-1).shape

(4, 30, 1)

In [14]:
model.predict(X)

array([[-46.436344],
       [-44.43851 ],
       [-52.882313],
       [-48.94781 ]], dtype=float32)