# Sprint23課題 深層学習スクラッチRNN

NumPyなど最低限のライブラリのみを使いアルゴリズムを実装していきます。

Sprint11で作成したディープニューラルネットワークのクラスを拡張する形でRNNを作成します。

In [3]:
import numpy as np

# 【問題1】SimpleRNNのフォワードプロパゲーション実装
SimpleRNNのクラスSimpleRNNを作成してください。基本構造はFCクラスと同じになります。

今回はバッチサイズをbatch_size、入力の特徴量数をn_features、RNNのノード数をn_nodesとして表記します。活性化関数はtanhとして進めますが、これまでのニューラルネットワーク同様にReLUなどに置き換えられます。

フォワードプロパゲーションの数式は以下のようになります。ndarrayのshapeがどうなるかを併記しています。

$$
a_t = x_{t}\cdot W_{x} + h_{t-1}\cdot W_{h} + b\\
h_t = tanh(a_t)
$$

In [59]:
class SimpleRNN:
    """
    ノード数n_nodes1からn_nodes2への全結合層
    Parameters
    ----------
    batch_size : int
      入力データのバッチサイズ
    n_sequences : int
      入力データの時系列数
    n_features : int
      入力データの特徴量数
    n_nodes : int
      RNNのノード数
    W_x : ndarray, shape (n_features, n_nodes)
        入力に対する重み
    W_h : ndarray, shape (n_nodes, n_nodes)
        状態に対する重み
    B : ndarray, shape(1,)
        バイアス項
    initializer : 初期化方法のインスタンス(今回は未使用)
    optimizer : 最適化手法のインスタンス(今回は未使用)
    
    Attribute
    ------------
    self.H : ndarray, shape  (batch_size, n_nodes)
        時刻tの状態・出力
    """
    
    def __init__(self, batch_size, n_sequences, n_fetures, n_nodes, 
                         initializer, optimizer, W_x=None, W_h=None, B=None):
        
        self.optimizer = optimizer
        self.n_sequences = n_sequences
        
        # を初期化する
        if W_x is None:
            self.W_x = initializer.W(n_features, n_nodes)
        else:
            self.W_x = W_x
            
        if W_h is None:
            self.W_h = initializer.W(n_nodes, n_nodes)
        else:
            self.W_h = W_h
            
        if B is None:
            self.B = initializer.B(1)
        else:
            self.B = B
            
        self.H = np.zeros((batch_size, n_nodes))
                    
    def forward(self, X):
        """
        フォワード
        Parameters
        ----------
        X : 次の形のndarray, shape (batch_size, n_sequences, n_features)
            入力
        Returns
        ----------
        H : 次の形のndarray, shape (batch_size, n_nodes)
            出力
        """                
        for t in range(self.n_sequences):
            A = X[:, t] @ self.W_x + self.H @ self.W_h + self.B
            self.H = np.tanh(A)
        
        return self.H
    

## 【問題2】小さな配列でのフォワードプロパゲーションの実験
小さな配列でフォワードプロパゲーションを考えてみます。

入力x、初期状態h、重みw_xとw_h、バイアスbを次のようにします。

ここで配列xの軸はバッチサイズ、系列数、特徴量数の順番です。

In [60]:
x = np.array([[[1, 2], [2, 3], [3, 4]]])/100
w_x = np.array([[1, 3, 5, 7], [3, 5, 7, 8]])/100
w_h = np.array([[1, 3, 5, 7], [2, 4, 6, 8], [3, 5, 7, 8], [4, 6, 8, 10]])/100
batch_size = x.shape[0] # 1
n_sequences = x.shape[1] # 3
n_features = x.shape[2] # 2
n_nodes = w_x.shape[1] # 4
h = np.zeros((batch_size, n_nodes))
b = np.array([1])

フォワードプロパゲーションの出力が次のようになることを作成したコードで確認してください。

```python
h = np.array([[0.79494228, 0.81839002, 0.83939649, 0.85584174]])
```

In [61]:
srnn = SimpleRNN(
    batch_size=batch_size, 
    n_sequences=n_sequences, 
    n_fetures=n_features, 
    n_nodes=n_nodes,
    initializer=None, 
    optimizer=None, 
    W_x=w_x, 
    W_h=w_h, 
    B=b)

In [62]:
srnn.forward(x)

array([[0.79494228, 0.81839002, 0.83939649, 0.85584174]])

## 【問題3】（アドバンス課題）バックプロパゲーションの実装
バックプロパゲーションを実装します。

RNNの内部は全結合層を組み合わせた形になっているので、更新式は全結合層などと同様です。

**※省略**

## 【問題4】（アドバンス課題）データセットでの学習・推定
これまで使ってきたニューラルネットワークにSimpleRNNを組み込み学習させ、動くことを確認してください。

[IMDB Review Dataset | Kaggle](https://www.kaggle.com/utathya/imdb-review-dataset)

映画レビューデータセットを使用します。ベクトル化を行い、作成したRNNに入力してください。

**※省略**