In [None]:
import numpy as np

# 權重初始化
w1 = 0.11
w2 = 0.21
w3 = 0.12
w4 = 0.08
w5 = 0.14
w6 = 0.15

# 偏置項初始化 (每個神經元都有自己的偏置項)
b1 = np.array([0.1, 0.1])  # 第一層的偏置項(對應2個神經元)
b2 = np.array([0.05])  # 第二層的偏置項(對應1個神經元)

# 輸入值與目標值
inputs = np.array([2, 3])
target = np.array([1])

# 第一層與第二層的權重矩陣
L_1_W = np.array([[w1, w3], [w2, w4]])  # 第一層的權重，形狀(2, 2)
L_2_W = np.array([[w5], [w6]])  # 第二層的權重，形狀(2, 1)

# 學習率、誤差閾值及最大迭代次數
a = 0.05
set_diff_val = 0.00001
now_diff_val = 100
iteration = 100

# 均方誤差(MSE)損失函數
def loss_function(y_pred, y_true):
    return 0.5 * np.sum((y_pred - y_true) ** 2)

# 迭代過程
i = 0
while abs(now_diff_val) > set_diff_val and i < iteration:
    # 計算第一層的輸出，加入偏置項
    h1 = np.dot(inputs, L_1_W) + b1  # 輸入和第一層權重的點積，加上偏置項b1

    # 計算第二層的輸出，加入偏置項
    prediction = np.dot(h1, L_2_W) + b2  # 輸出層計算，加上偏置項b2

    # 計算損失（即誤差）
    loss = loss_function(prediction, target)
    print(f'第{i + 1}次迭代，估計值是{prediction[0]:.5f}')

    # 計算誤差
    now_diff_val = prediction - target

    # ---- 反向傳播 ----
    # 更新第二層的權重
    L_2_W[0] = L_2_W[0] - a * h1[0] * now_diff_val  # 更新L_2_W[0]權重
    L_2_W[1] = L_2_W[1] - a * h1[1] * now_diff_val  # 更新L_2_W[1]權重

    # 更新第二層的偏置項
    b2 = b2 - a * now_diff_val  # 更新偏置b2

    # 計算第一層的誤差對應的梯度
    delta_L1 = np.dot(now_diff_val, L_2_W.T)

    # 更新第一層的權重
    L_1_W[0][0] = L_1_W[0][0] - a * inputs[0] * delta_L1[0]  # 更新L_1_W[0][0]權重
    L_1_W[0][1] = L_1_W[0][1] - a * inputs[0] * delta_L1[1]  # 更新L_1_W[0][1]權重
    L_1_W[1][0] = L_1_W[1][0] - a * inputs[1] * delta_L1[0]  # 更新L_1_W[1][0]權重
    L_1_W[1][1] = L_1_W[1][1] - a * inputs[1] * delta_L1[1]  # 更新L_1_W[1][1]權重

    # 更新第一層的偏置項
    b1 -= a * delta_L1  # 更新偏置 b1

    # 輸出修正後的權重，逐個輸出每個權重和偏置
    print(f'修正後權重 w1 = {L_1_W[0][0]:.2f}, w2 = {L_1_W[1][0]:.2f}, w3 = {L_1_W[0][1]:.2f}, w4 = {L_1_W[1][1]:.2f}, '
          f'w5 = {L_2_W[0][0]:.2f}, w6 = {L_2_W[1][0]:.2f}, b1 = {b1[0]:.2f}, b1 = {b1[1]:.2f}, b2 = {b2[0]:.2f}')

    i = i + 1