In [4]:
import numpy as np


## 一层神经网络
## ![image.png](attachment:image.png)

In [45]:
# 设置随机数种子
np.random.seed(1)
# 将权重转化为一个3x1的矩阵，其值分布为-1~1，并且均值为0 （模型训练最初时，每个权重的初始化都是随机数）
synaptic_weights = 2 * np.random.random((3, 1)) - 1
print(synaptic_weights)

[[-0.16595599]
 [ 0.44064899]
 [-0.99977125]]


# 训练数据

In [47]:
training_inputs = np.array([[0,0,1],

                            [1,1,1],

                            [1,0,1],

                            [0,1,1]])

training_outputs = np.array([[0,1,1,0]]).T

## resons for sigmoid function
## ![image.png](attachment:image.png)
## 为什么引入非线性激励函数？
如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与没有隐藏层效果相当，这种情况就是最原始的感知机（Perceptron）了。
正因为上面的原因，我们决定引入非线性函数作为激励函数，这样深层神经网络就有意义了（不再是输入的线性组合，可以逼近任意函数）。最早的想法是sigmoid函数或者tanh函数，输出有界，很容易充当下一层输入（以及一些人的生物解释balabala）


In [60]:
def sigmoid(x):
    # 应用sigmoid激活函数
    return 1 / (1 + np.exp(-x))

In [62]:
# 前向传播
def think(inputs):
    # 输入通过网络得到输出   
    # 转化为浮点型数据类型
    inputs = inputs.astype(float) # i guess this is for dot product two vectors
    #print(inputs)
    sig_input = np.dot(inputs, synaptic_weights)
    output = sigmoid(sig_input)
    return output

In [57]:
training_inputs

array([[0, 0, 1],
       [1, 1, 1],
       [1, 0, 1],
       [0, 1, 1]])

In [67]:
# 得到输出（到此，前向传播的过程就结束了）
output = think(training_inputs)
output

array([[0.2689864 ],
       [0.3262757 ],
       [0.23762817],
       [0.36375058]])

In [66]:
training_outputs

array([[0],
       [1],
       [1],
       [0]])

In [65]:
# 计算误差 （计算反向传播的错误率，在这种情况下，它是神经元预测得到的输出与训练数据集的预期输出之间的误差）
error = training_outputs - output
error

array([[-0.2689864 ],
       [ 0.6737243 ],
       [ 0.76237183],
       [-0.36375058]])

## 根据得到的误差范围，使用误差加权导数公式进行一些小的权重调整

In [35]:
def sigmoid_derivative(x):
    #计算Sigmoid函数的偏导数
    return x * (1 - x)

In [75]:
# 微调权重 
derivative = sigmoid_derivative(output)
derivative

array([[0.00780232],
       [0.00637283],
       [0.00519392],
       [0.00636242]])

In [77]:
error_adj = error * derivative

array([[-6.13586612e-05],
       [ 4.08750898e-05],
       [ 2.71184017e-05],
       [-4.07413047e-05]])

In [None]:
adjustments = np.dot(training_inputs.T, error_adj)

In [42]:
synaptic_weights

array([[-0.16595599],
       [ 0.44064899],
       [-0.99977125]])

In [82]:
# 训练模型
training_iterations = 15000
# 开始优化
for iteration in range(training_iterations):
        # 得到输出
        output = think(training_inputs)
        # 计算误差
        error = training_outputs - output
        # 微调权重
        adjustments = np.dot(training_inputs.T, error * sigmoid_derivative(output))
        synaptic_weights += adjustments

In [83]:


 

user_input_one = str(input("User Input One: "))

user_input_two = str(input("User Input Two: "))

user_input_three = str(input("User Input Three: "))



print("Considering New Situation: ", user_input_one, user_input_two, user_input_three)

print("New Output data: ")

print(think(np.array([user_input_one, user_input_two, user_input_three])))

print("Wow, we did it!")

User Input One: 358
User Input Two: 4
User Input Three: 22
Considering New Situation:  358 4 22
New Output data: 
[1.]
Wow, we did it!
