In [18]:
import numpy as np

In [19]:
# 定义sigmoid函数
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

In [20]:
# 定义sigmoid函数的导数
def sigmoid_derivative(x):
    return x * (1 - x)

In [21]:
# 定义数据集，即异或运算可能的所有输入情况
x = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
# 定义数据集的标签，即异或运算的结果
y = np.array([[0], [1], [1], [0]])

In [22]:
# 设置随机数种子，使得每次运行结果相同
np.random.seed(1)

通过设置一个特定的种子值，可以确保每次运行代码时生成的随机数序列是相同的，这对于实验的可重复性非常有用。

In [23]:
# 初始化权重
syn0 = 2 * np.random.random((2, 3)) - 1
syn1 = 2 * np.random.random((3, 1)) - 1

此处将第1层的权重syn0设置为2*3的矩阵，第2层的权重syn1设置为3*1的矩阵，这是因为输入的数据为4*2的矩阵，设置的隐藏层有3个隐藏节点，最终输出的结果为4*1的矩阵

In [24]:
alpha = 0.5

学习率的大小会很大程度的影响算法的性能，学习率决定了网络权重在训练过程中更新的步长。
如果学习率太高，权重更新的步长可能会太大，导致网络在最优解附近振荡，甚至发散，从而减慢收敛速度或无法收敛。
如果学习率太低，权重更新的步长太小，导致网络收敛过慢，需要更多的迭代次数才能达到最优解，并且有时候可能导致网络陷入局部最小值。

In [25]:
# BP神经网络的训练
for j in range(50000):
    # 前向传播预测（即数据正向的输入）
    layer0 = x
    layer1 = sigmoid(np.dot(layer0, syn0))
    layer2 = sigmoid(np.dot(layer1, syn1))

    # 计算均方误差（这一步是神经网络训练过程中的一个关键环节，不仅提供了模型性能的量化指标，还帮助我们理解模型的学习动态，从而做出相应的调整以优化模型。）
    layer2_error = y - layer2 # layer2_error 是输出层的预测值与真实值之间的差异
    mse = np.mean(np.square(layer2_error))
    if j % 10000 == 0:
        print("MSE:", str(mse))

    # 反向传播学习（通过计算的损失函数来反向更新隐藏层的权重）
    # layer2_delta 表示输出层每个节点的误差梯度，这是损失函数相对于输出层权重的偏导数
    layer2_delta = layer2_error * sigmoid_derivative(layer2) 
    # layer1_error 是第一隐层的误差，它是输出层误差梯度与连接第一隐层和输出层的权重矩阵转置的点积。
    layer1_error = layer2_delta.dot(syn1.T)
    # layer1_delta 表示第一隐层每个节点的误差梯度，这是损失函数相对于第一隐层权重的偏导数。
    layer1_delta = layer1_error * sigmoid_derivative(layer1)

    # 更新权重
    syn1 = syn1 + alpha * layer1.T.dot(layer2_delta)
    syn0 = syn0 + alpha * layer0.T.dot(layer1_delta)

MSE: 0.26331752528341845
MSE: 0.06342548719876152
MSE: 0.0629135305294538
MSE: 0.0627559763578736
MSE: 0.0626720349748278


In [26]:
# 输出结果
predicted_output = (layer2 > 0.5).astype(int)
print("Predicted output:")
print(layer2)
print(predicted_output)

Predicted output:
[[0.01331162]
 [0.98806019]
 [0.98802719]
 [0.49987118]]
[[0]
 [1]
 [1]
 [0]]
