In [None]:
import numpy as np

In [None]:
class RNN:
    def __init__(self, Wx, Wh, h0):
        '''
        Wx: 入力xにかかる重み（1、隠れ層のノード数）
        Wh: 1時刻前のhにかかる重み（隠れ層のノード数、隠れ層のノード数）
        h0: 隠れ層の初期値（データ数、隠れ層のノード数）
        '''
        # パラメータのリスト
        self.params = [Wx, Wh]

        # 隠れそうの初期値を設定
        self.h_prev = h0

    def forward(self, x):
        '''
        順伝播計算
        x: 入力（データ数、1）
        '''
        Wx, Wh = self.params
        h_prev = self.h_prev

        t = np.dot(h_prev, Wh) + np.dot(x, Wx)

        # 活性化関数は恒等写像関数とする
        h_next = t

        # 隠れ層の状態の保存
        self.h_prev = h_next

        return h_next

In [None]:
# LSTM
def forward(x, h_prev, c_prev, Wx, Wh, b):
    '''
    順伝播計算
    x: 入力（データ数、特徴量の数）
    h_prev: 前状態の隠れ状態の出力（データ数、隠れ層のノード数）
    c_prev: 前状態のメモリの状態（データ数、隠れ層のノード数）
    Wx: 入力x用の重みパラメータ（特徴量の数、4＊隠れ層のノード数）
    Wh: 隠れ状態h用の重みパラメータ（隠れ層のノード数、4＊隠れ層のノード数）
    b: バイアス（4＊隠れ層のノード数）
    '''
    N, H = h_prev.shape

    A = np.dot(x, Wx) + np.dot(h_prev, Wh) + b

    f = A[:, :H]
    g = A[:, H:2*H]
    i = A[:, 2*H:3*H]
    o = A[:, 3*H:]

    f = sigmoid(f)
    g = np.tanh(g)
    i = sigmoid(i)
    o = sigmoid(o)

    print(f.shape, c_prev.shape, g.shape, i.shape)
    c_next = f * c_prev + g * i
    h_next = o * np.tanh(c_next)

    return h_next, c_next

In [None]:
# グローバル・アテンションモデル
def forward(self, hs, h):
    '''
    順伝播
    重みベクトルを求めるための関数
    hs: エンコーダーにおける全ての隠れ状態（データ数、時刻数、隠れ層のノード数）
    h: デコーダーにおけるある時刻の隠れ状態（データ数、隠れ層のノード数）
    '''
    N, T, H = hs.shape

    hr = h.reshape(N, 1, H).repeat(T, axis=1)

    t = hs * hr
    s = np.sum(t, axis=2)

    # ソフトマックス関数に通すことで、正規化する
    a = softmax(s)

    return a