# Sprint 深層学習スクラッチリカレントニューラルネットワーク

## Sprintの目的  
スクラッチを通してリカレントニューラルネットワークの基礎を理解する  

In [1]:
import numpy as np

## 【問題1】SimpleRNNのフォワードプロパゲーション実装

In [66]:
class SimpleRNN:
    """
    SimpleRNN
    
    Parameters
    ----------
    n_nodes : int
      ノード数
    initializer : 初期化方法のインスタンス
    optimizer : 最適化手法のインスタンス
    """
    def __init__(self, n_nodes, initializer, optimizer):
        self.n_nodes = n_nodes
        self.optimizer = optimizer
        # 初期化
        # initializerのメソッドを使い、self.Wとself.Bを初期化する
        self.Wx = initializer.W(n_features, n_nodes)
        self.Wh = initializer.W(n_nodes, n_nodes)
        self.B = initializer.W(n_nodes)
        
    def forward(self, X):
        """
        フォワード
        Parameters
        ----------
        X : 次の形のndarray, shape (batch_size, n_sequences, n_features)
            入力
        Returns
        ----------
        A : 次の形のndarray, shape (batch_size, n_nodes)
            出力
        """
        self.X = X
        self.batch_size, self.n_sequences, self.n_features = X.shape
        self.a = np.zeros((self.batch_size, self.n_sequences, self.n_nodes))
        self.h = np.zeros((self.batch_size, self.n_sequences, self.n_nodes))
        
        for t in range(self.n_sequences):
            self.h[:, t-1] = np.tanh(self.a[:, t-1])
            self.a[:, t] = X[:, t]@self.Wx + self.h[:, t-1]@self.Wh + self.B
        finally:
            self.h[:, -1] = np.tanh(self.a[:, -1])
        A = self.h[:, -1]
        return A

class SimpleInitializer:
    """
    ガウス分布によるシンプルな初期化
    Parameters
    ----------
    sigma : float
      ガウス分布の標準偏差
    """
    def __init__(self, sigma):
        self.sigma = sigma
    def W(self, *shape0):
        """
        重みの初期化
        Parameters
        ----------
        shape0 : int
            パラメータのshape

        Returns
        ----------
        W : (shape0)
        """
        W = self.sigma * np.random.randn(*shape0)
        return W

## 【問題2】小さな配列でのフォワードプロパゲーションの実験

In [67]:
x = np.array([[[1, 2], [2, 3], [3, 4]]])/100 # (batch_size, n_sequences, n_features)
w_x = np.array([[1, 3, 5, 7], [3, 5, 7, 8]])/100 # (n_features, n_nodes)
w_h = np.array([[1, 3, 5, 7], [2, 4, 6, 8], [3, 5, 7, 8], [4, 6, 8, 10]])/100 # (n_nodes, n_nodes)
batch_size = x.shape[0] # 1
n_sequences = x.shape[1] # 3
n_features = x.shape[2] # 2
n_nodes = w_x.shape[1] # 4
h = np.zeros((batch_size, n_nodes)) # (batch_size, n_nodes)
b = np.array([1, 1, 1, 1]) # (n_nodes,)

In [68]:
rnn = SimpleRNN(n_nodes=n_nodes, initializer=SimpleInitializer(0.01), optimizer=None)
rnn.Wx, rnn.Wh, rnn.B = w_x, w_h, b
rnn.forward(x)

array([[0.79494228, 0.81839002, 0.83939649, 0.85584174]])

## 【問題3】（アドバンス課題）バックプロパゲーションの実装