本セクションでは、ニューラルネットワークの各層をPythonのクラスとして実装する。

### 出力層 ~回帰~
以下は、回帰の場合の出力層を表すクラスである

In [1]:
# __ 出力層 __
class OutputLayer:
    # 初期設定
    def __init__(self, n_upper, n) :
        """
        n_upper : 上の層のニューロン数
        n　: 現在のニューロン数
        """
        # 重み行列、wb_widthは値の広がり
        self.w = wb_width * np.random.randn(n_upper, n)
        # バイアス（ベクトル）、wb_widthは値の広がり
        self.b = wb_width * np.random.randn(n)
        
    # 順伝播
    def forward(self, x):
        """
        x : 入力
        入力と出力でselfがついているのは、逆伝播のメソッドでこれらを利用するから
        """
        self.x = x
        # uとは重みと入力の積の総和にバイアスを加えた値
        u = np.dot(x, self.w) + self.b
        # 恒等関数
        self.y = u
        
    # 逆伝播
    def backward(self, t):
        """
        t : 正解
        grad_xにselfgついているのは上の値に渡すため
        """
        delta = self.y - t
        
        self.grad_w = np.dot(self.x.T, delta)
        self.grad_b = np.sum(delta, axis = 0)
        
        self.grad_x = np.dot(delta, self.w.T)
        
    # 重みとバイアスの更新
    def update(self, eta):
        """
        eta : 学習係数
        """
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

OutputLayerクラスには4つのメソッドが定義されている
前のセクションでは関数として層を実装したが、クラスにすることで層がより機能的になっている

### 出力層 ~分類~
ほぼほぼ、回帰と一緒  
唯一の違いは、出力層の活性化関数にソフトマックス関数を使用する点

In [3]:
# __ 出力層 __
class OutputLayer:
    # 初期設定
    def __init__(self, n_upper, n) :
        """
        n_upper : 上の層のニューロン数
        n　: 現在のニューロン数
        """
        # 重み行列、wb_widthは値の広がり
        self.w = wb_width * np.random.randn(n_upper, n)
        # バイアス（ベクトル）、wb_widthは値の広がり
        self.b = wb_width * np.random.randn(n)
        
    # 順伝播（ここが重要！！！！！）
    def forward(self, x):
        """
        x : 入力
        入力と出力でselfがついているのは、逆伝播のメソッドでこれらを利用するから
        """
        self.x = x
        # uとは重みと入力の積の総和にバイアスを加えた値
        u = np.dot(x, self.w) + self.b
        # ソフトマックス関数
        # keepdims=Trueとすることで元の配列の次元が保たれる
        # 計算結果が(バッチサイズ×1）の行列となる
        # ブロードキャストで割り算ができる。これによりバッチに対応したソフトマックス関数となる
        self.y = np.exp(u)/np.sum(np.exp(u), axis=1, keepdims=True)
        
    # 逆伝播
    def backward(self, t):
        """
        t : 正解
        grad_xにselfgついているのは上の値に渡すため
        """
        delta = self.y - t
        
        self.grad_w = np.dot(self.x.T, delta)
        self.grad_b = np.sum(delta, axis = 0)
        
        self.grad_x = np.dot(delta, self.w.T)
        
    # 重みとバイアスの更新
    def update(self, eta):
        """
        eta : 学習係数
        """
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

### 中間層
以下は、回帰、分類共通の中間層を表すクラス。

In [4]:
# __ 中間層 __
class MiddleLayer:
    # 初期設定
    def __init__(self, n_upper, n) :
        """
        n_upper : 上の層のニューロン数
        n　: 現在のニューロン数
        """
        # 重み行列、wb_widthは値の広がり
        self.w = wb_width * np.random.randn(n_upper, n)
        # バイアス（ベクトル）、wb_widthは値の広がり
        self.b = wb_width * np.random.randn(n)
        
    # 順伝播
    def forward(self, x):
        """
        x : 入力
        入力と出力でselfがついているのは、逆伝播のメソッドでこれらを利用するから
        """
        self.x = x
        # uとは重みと入力の積の総和にバイアスを加えた値
        u = np.dot(x, self.w) + self.b
        # シグモイド関数(違うところ)
        self.y = 1/(1+np.exp(-u))
        
    # 逆伝播
    def backward(self, grad_y):
        """
        grad_y : この層の出力の勾配
        grad_xにselfgついているのは上の値に渡すため
        """
        # シグモイド関数の微分をかけている(違うところ)
        delta = grad_y * (1-self.y)*self.y
        
        self.grad_w = np.dot(self.x.T, delta)
        self.grad_b = np.sum(delta, axis = 0)
        
        self.grad_x = np.dot(delta, self.w.T)
        
    # 重みとバイアスの更新
    def update(self, eta):
        """
        eta : 学習係数
        """
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

このクラスを用いれば、例えば以下のように中間層をいくつでもインスタンスとして生成することができます

In [5]:
middle_layer_1 = MiddleLayer(3, 4)
middle_layer_2 = MiddleLayer(4, 5)
middle_layer_3 = MiddleLayer(5, 6)

NameError: name 'wb_width' is not defined