# 5章　リカレントニューラルネットワーク(RNN)
ここからはゼロつく5章を見てみましょう．

RNNの構造は以下のような計算式で表されます．P186の（5.9）式です．
$$
h_t = tanh(h_{t-1}W_h + x_tW_x + b)
$$

ここで，$h_t$は時刻$t$における隠れ層の状態ベクトル，$x_t$は時刻$t$における入力ベクトル，$W_h$は隠れ層の重み，$W_x$は入力層の重み，$b$はバイアスです．

各時刻のRNNレイヤは，そのレイヤへの入力と一つ前のRNNレイヤからの出力を受け取ります．

そして，そのふたつの情報を元に，その時刻の出力が計算されます．

In [2]:
import numpy as np

In [4]:
np.zeros_like([1,2,3]) # 0で埋める

array([0, 0, 0])

In [7]:
class RNN:
    def __init__(self , Wx ,Wh ,b):
        self.params = [Wx ,Wh ,b]
        self.grads = [np.zeros_like(Wx) ,np.zeros_like(Wh) ,np.zeros_like(b)] # パラメータの初期化
        self.cache = None 
    
    def forward(self ,x ,h_prev):
        Wx ,Wh ,b = self.params
        t = np.dot(h_prev ,Wh) + np.dot(x ,Wx) + b
        h_next = np.tanh(t)
        
        self.cache = (x ,h_prev ,h_next)
        return h_next

    def backward(self ,dh_next):
        Wx ,Wh ,b = self.params
        x ,h_prev ,h_next = self.cache
        
        dt = dh_next * (1 - h_next**2) 
        db = np.sum(dt ,axis = 0)
        dWh = np.dot(h_prev.T ,dt)
        dh_prev = np.dot(dt ,Wh.T)
        dWx = np.dot(x.T ,dt)
        dx = np.dot(dt ,Wx.T)
        
        self.grads[0][...] = dWx
        self.grads[1][...] = dWh
        self.grads[2][...] = db
        
        return dx ,dh_prev