# 불안정한 그레이디언트 문제와 싸우기
tf.keras를 사용해 간단한 메모리 셀 안에 층 정규화를 구현해보겠습니다.<br>
이렇게 하려면 사용자 정의 메모리 셀을 정의해야 합니다.<br>
이 층은 call() 메소드가 다음 두 개의 매개변수를 받는 것을 제외하고는 일반적인 층입니다.

현재 타임 스텝의 inputs와 이전 타임 스텝의 은닉 states입니다.<br>
states 매개변수는 하나 이상의 텐서를 담은 리스트입니다.

셀은 state_size와 output_size 속성을 가져야 합니다.<br>
간단한 RNN에서는 둘 다 모두 유닛 개수와 동일합니다.<br>
다음 코드는 SimpleRNNCell 처럼 작동하는 사용자 정의 메모리 셀을 구현합니다.<br>
각 타임 스텝마다 층 정규화를 적용한다는 점이 다릅니다.

In [26]:
from tensorflow.keras.layers import LayerNormalization

In [27]:
class LNSimpleRNNCell(keras.layers.Layer):
    def __init__(self, units, activation="tanh", **kwargs):
        super().__init__(**kwargs)
        self.state_size = units
        self.output_size = units
        self.simple_rnn_cell = keras.layers.SimpleRNNCell(units,
                                                          activation=None)
        self.layer_norm = LayerNormalization()
        self.activation = keras.activations.get(activation)
    def get_initial_state(self, inputs=None, batch_size=None, dtype=None):
        if inputs is not None:
            batch_size = tf.shape(inputs)[0]
            dtype = inputs.dtype
        return [tf.zeros([batch_size, self.state_size], dtype=dtype)]
    def call(self, inputs, states):
        # 현재 입력과 이전 은닉 상태의 선형 조합 계산
        outputs, new_states = self.simple_rnn_cell(inputs, states)
        # 층 정규화와 활성화 함수를 차례대로 적용
        norm_outputs = self.activation(self.layer_norm(outputs))
        # 출력과 은닉 상태 반환
        return norm_outputs, [norm_outputs]

In [28]:
model = keras.models.Sequential([
    keras.layers.RNN(LNSimpleRNNCell(20), return_sequences=True,
                     input_shape=[None, 1]),
    keras.layers.RNN(LNSimpleRNNCell(20), return_sequences=True),
    keras.layers.TimeDistributed(keras.layers.Dense(10))
])

model.compile(loss="mse", optimizer="adam", metrics=[last_time_step_mse])
history = model.fit(X_train, Y_train, epochs=20,
                    validation_data=(X_valid, Y_valid))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


비슷하게 타임 스텝 사이에 드롭아웃을 적용하는 사용자 정의 셀을 만들 수 있습니다.<br>
하지만 이는 그냥 keras.layers.RNN을 제외한 모든 순환 층과 케라스에서 제공하는 모든 셀은 dropout 매개변수(타임 스텝마다 입력에 적용하는 드롭아웃 비율)와 recurrent_dropout 매개변수(타임 스텝마다 은닉 상태에 대한 드롭아웃 비율)를 지원하므로 따로 사용자 정의 셀을 만들 필요는 없습니다.