<a href="https://colab.research.google.com/github/kotrying/ML_Theory/blob/main/Back_Propagation.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# 中間層
class MiddleLayer:
    def __init__(self, n_upper, n):  # 初期設定
        self.w = wb_width * np.random.randn(n_upper, n)  # 重み（行列）
        self.b = wb_width * np.random.randn(n)  # バイアス（ベクトル）

    def forward(self, x):  # 順伝播
        self.x = x
        u = np.dot(x, self.w) + self.b
        self.y = 1/(1+np.exp(-u))  # シグモイド関数
    
    def backward(self, grad_y):  # 逆伝播
        delta = grad_y * (1-self.y)*self.y  # シグモイド関数の微分
        
        self.grad_w = np.dot(self.x.T, delta)
        self.grad_b = np.sum(delta, axis=0)
        
        self.grad_x = np.dot(delta, self.w.T) 
        
    def update(self, eta):  # 重みとバイアスの更新
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

In [None]:
# 出力層
class OutputLayer:
    def __init__(self, n_upper, n):  # 初期設定
        self.w = wb_width * np.random.randn(n_upper, n)  # 重み（行列）
        self.b = wb_width * np.random.randn(n)  # バイアス（ベクトル）
    
    def forward(self, x):  # 順伝播
        self.x = x
        u = np.dot(x, self.w) + self.b
        self.y = u  # 恒等関数
    
    def backward(self, t):  # 逆伝播
        delta = self.y - t
        
        self.grad_w = np.dot(self.x.T, delta)
        self.grad_b = np.sum(delta, axis=0)
        
        self.grad_x = np.dot(delta, self.w.T) 

    def update(self, eta):  # 重みとバイアスの更新
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

In [None]:
# Back Propagation（誤差逆伝搬）の実装

# 各層の初期化
# クラスからインスタンス化する
middle_layer = MiddleLayer(n_in, n_mid) # （入力層のニューロン数、中間層のニューロン数）
output_layer = OutputLayer(n_mid, n_out) # （中間層のニューロン数、出力層のニューロン数）

# 学習
# エポック数分の学習を実行
for i in range(epoch):

    # 入力データの数分の要素を持つインデックス行列を作成
    index_random = np.arange(n_data)
    # インデックスをランダムにシャッフル
    np.random.shuffle(index_random)
    
    # 結果の表示用：誤差、入力、出力を保存し、後で学習の結果を確認する
    total_error = 0 # 誤差の初期値：各学習ステップで計算される入力と出力との誤差を加算して
    plot_x = [] # 各学習ステップごとに使用した入力
    plot_y = [] # 各学習ステップごとに得られた出力
    
    # インデックス行列から順にインデックスを取り出す
    for idx in index_random:
        
        x = input_data[idx:idx+1]  # 入力：指定のインデックスにおける入力データの値
        t = correct_data[idx:idx+1]  # 正解：指定のインデックスにおける正解データの値
        
        # 順伝播
        middle_layer.forward(x.reshape(1, 1)) # 入力を行列に変換
        output_layer.forward(middle_layer.y) # 中間層→出力層

        # 逆伝播
        output_layer.backward(t.reshape(1, 1))  # 正解を行列に変換
        middle_layer.backward(output_layer.grad_x) # 出力層→中間層
        
        # 重みとバイアスの更新
        middle_layer.update(eta)
        output_layer.update(eta)