**感知机是什么？**

- 感知机（Perceptron）是神经网络的起源算法。
- 感知机接收多个输入信号，输出一个信号。信号形成流，向前方输送信息，其取值只有流/不流（0/1）两种。
图中$x_1,x_2$是输入信号，$y$是输出信号，$w_1,w_2$是权重。〇是神经元或节点。输入信号进入神经元后，会被分别乘以固定的权重，然后神经元计算传送过来的信号的总和，当这个综合超过一个阈值$θ$时，输出”1“，称之为”神经元被激活“。
<img  src="../img/perceptron.png" width="30%"> </img>

函数表示为：
$$
y=\left\{\begin{array}{ll}
0 & \left(w_{1} x_{1}+w_{2} x_{2} \leqslant \theta\right) \\
1 & \left(w_{1} x_{1}+w_{2} x_{2}>\theta\right)
\end{array}\right.
$$


**逻辑电路**

1. 与门<br>
仅在两个输入都为1时输出1
2. 与非门<br>
仅在两个输入都不同时为1时输出1
3. 或门<br>
两个输入若有一个为1，就输出1


In [1]:
## 实现简单的感知机
def AND(x1, x2):
    w1 = 0.5
    w2 = 0.5
    theta = 0.7
    tmp = w1*x1+w2*x2
    if tmp<theta:
        return 0
    return 1

In [2]:
print(AND(0,0),AND(1,1),AND(1,0),AND(0,1))

0 1 0 0


**导入权重(weight)和和偏置(bias)**

将$θ$换成$-b$，可以用如下式表示感知机的行为
$$
y=\left\{\begin{array}{ll}
0 & \left(b+w_{1} x_{1}+w_{2} x_{2} \leqslant 0\right) \\
1 & \left(b+w_{1} x_{1}+w_{2} x_{2}>0\right)
\end{array}\right.
$$
其中b称之为偏置值。

In [3]:
import numpy as np
x = np.array([0,1])
w = np.array([0.5, 0.5])
b = -0.7

In [4]:
w*x

array([0. , 0.5])

In [5]:
np.sum(w*x)

0.5

In [6]:
np.sum(w*x)+b

-0.19999999999999996

In [7]:
def AND(x1, x2):
    x= np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp > 0:
        return 1
    return 0

In [8]:
print(AND(0,0),AND(1,1),AND(1,0),AND(0,1))

0 1 0 0


In [9]:
def NAND(x1, x2): # 与非
    x= np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp > 0:
        return 1
    return 0 

print(NAND(0,0),NAND(1,1),NAND(1,0),NAND(0,1))

1 0 1 1


In [10]:
def OR(x1, x2): # 或
    x= np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp > 0:
        return 1
    return 0 

print(OR(0,0),OR(1,1),OR(1,0),OR(0,1))

0 1 1 1


**异或门与感知机的局限性**

1. 异或门<br>
当且仅当输入中有一个为1时才输出1。 <br>
$$
y=\left\{\begin{array}{ll}
0 & \left(-0.5+x_{1}+x_{2} \leqslant 0\right) \\
1 & \left(-0.5+x_{1}+x_{2}>0\right)
\end{array}\right.
$$

2. 感知机的局限性<br>
但是，单个感知机无法实现异或门。这是因为，在线性空间中，一条直线无法将下图中的Δ和〇分别划分到直线的同一侧，而曲线可以。
<img  src="../img/XOR.png" width="30%"> </img>
<img  src="../img/XOR_2.png" width="30%"> </img>
但是，异或可以通过不同感知机的组合实现：

<img  src="../img/XOR_3.png" width="30%"> </img>

**多层感知机**
下面代码实现的是异或多层感知机。叠加了多层的感知机被称为多层感知机。
<img  src="../img/MLP.png" width="30%"> </img>
工作原理为：
1. 第0 层的两个神经元接收输入信号，并将信号发送至第1 层的神经元。
2. 第1 层的神经元将信号发送至第2 层的神经元，第2 层的神经元输出y。

In [11]:
def XOR(x1, x2):
    return AND(NAND(x1,x2),OR(x1,x2))

print(XOR(0,0),XOR(1,1),XOR(1,0),XOR(0,1))

0 0 1 1
