# 一、感知机的概念



感知机也称“人工神经元”。它的作用是**接收多个**输入信号，**输出一个**信号（这里的信号可以理解为数据）。但是，感知机中的信号只有**两种取值0和1**。

![image-20230310101155161](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310101155161.png)

上图中为一个二输入的感知机，$x_1,x_2$是输入信号，$y$是输出信号，$w_1,w_2$是权重，图里的圆圈代表神经元（**取值只能是0和1**）。

输入信号被送往神经元的时候，都会**乘以对应的权重**，然后**求和**。如果**求和结果大于某个阈值**$\theta$，输出信号$y$才会输出1，这个过程被称为“神经元被激活”。公式如下：

![image-20230310101920151](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310101920151.png)

感知机的每个输入信号都有各自的权重，**权重**代表了信号的**重要程度**。权重越大，对应该权重的信号的重要性就越高。

# 二、感知机与门电路


与门真值表：

![image-20230310103412515](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310103412515.png)

设计感知机，就是确定$w_1,w_2,\theta$的值，计算式如下：

<img src="https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/QQ%E5%9B%BE%E7%89%8720230310103853.jpg" alt="QQ图片20230310103853" style="zoom:25%;" />

即：两个权重都不大于阈值，且权重之和大于阈值。

其他门电路转感知机的步骤与这个一致，就不详细叙述了。

在上述过程中，可以发现确定感知机参数的不是计算机，而是**人根据真值表（训练数据），想出参数的值**。而机器学习的目标就是把这个过程让计算机自动完成，而人需要做的就是确定感知机的构造（确定模型），并把训练数据交给机器。

**在门电路的例子中，与门、或门、与非门等门电路的构造都是一样的（二输入一输出），只要改变参数和阈值就能实现不同的功能。**

# 三、感知机的实现



使用python来实现刚刚的逻辑电路。

In [1]:
# 定义与门函数
def AND(x1, x2):
    # 确定参数
    w1, w2, theta = 0.5, 0.5, 0.9

    # 确定感知机结构
    y = w1 * x1 + w2 * x2
    if y <= theta:
        y = 0
    else:
        y = 1

    # 返回输出结果
    return y


# 测试
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))


0
0
0
1


【tips】：上述感知机只要修改权重和阈值，就能实现其他的二输入一输出门电路。

# 四、权重和偏执项



把感知机的公式改写成如下形式（阈值变为$b$并移项，虽然形式不同但表达的意思不变）：

![image-20230310111350098](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310111350098.png)

其中，$b$称为偏置项。

下面使用numpy实现该公式表达的感知机：

In [1]:
import numpy as np


# 使用numpy实现与门


def AND(x1, x2):
    # 确定参数
    x = np.array([x1, x2])
    w = np.array([0.5, 0.4])
    b = -0.8

    # 确定网络结构
    tmp = np.sum(x * w) + b
    if tmp <= 0:
        y = 0
    else:
        y = 1

    return y


# 测试
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))


0
0
0
1


- 权重：控制神经元的重要程度
- 偏置项：控制神经元被激活的难易程度

# 五、感知机的局限性



使用感知机实现异或门。真值表如下：

![image-20230310164256034](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310164256034.png)

代入感知机的模型，得出权重和偏置项表达式如下：

<img src="https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/1.png" alt="1" style="zoom:25%;" />

经过观察发现，这个不等式组不可能成立。理由如下：

$b≤0、b+x_2>0$ 推出 $x_2>0$ 

又$b+x_1>0$ 推出 $b+x_1+x_2>0$

与$b+x_1+x_2≤0$矛盾

从感知机公式中可以看出，最核心的是这个式子$b+x_1w_1+x_2w_2>0$（决定了y的输出），这是一个二元一次不等式，在二维坐标系上对$x_1x_2$画图，图像必然为一条斜率小于0的直线，且在该直线的上方和下方的区域$y$取值都是0或1。图像如下：

![image-20230310173701995](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310173701995.png)

$(x_1,x_2,y)$的取值一共有四个，图中圆圈代表y取值为0，三角代表取值y为1。由**二输入感知机**的公式可以得到结论：**感知机的必要条件是对能够找到一条斜率<0的直线，将不同输出区分开来。**

所以异或门的输入输出对在图中应该是这个样子：

![image-20230310174738332](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310174738332.png)

显然，没办法找到一条斜率<0的直线，将不同输出区分开来，所以感知机不成立。但是能通过一条曲线，将两个不同输出分隔开：

![image-20230310175114929](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310175114929.png)

- 由曲线分割而成的空间称为**非线性空间**。
- 由直线分割而成的空间称为**线性空间**。

# 六、多层感知机



可以通过感知机的**叠加**（多层感知机）来实现异或门。

即问题转换成：**使用与门、与非门、或门组合成一个异或门（这三个门都能用感知机表示）**

![image-20230310180721834](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310180721834.png)

![image-20230310180737782](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310180737782.png)

使用numpy实现异或门：

In [3]:
import numpy as np


# 与门


def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.4])
    b = -0.8
    tmp = np.sum(x * w) + b
    if tmp <= 0:
        return 0
    else:
        return 1


# 与非门


def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(x * w) + b
    if tmp <= 0:
        return 0
    else:
        return 1


# 或门


def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(x * w) + b
    if tmp <= 0:
        return 0
    else:
        return 1


# 异或门


def EOR(x1, x2):
    return AND(NAND(x1, x2), OR(x1, x2))


print(EOR(0, 0))
print(EOR(1, 0))
print(EOR(0, 1))
print(EOR(1, 1))


0
1
1
0


用感知机表示异或门如下：

![image-20230310184853985](https://zyc-learning-1309954661.cos.ap-nanjing.myqcloud.com/machine-learning-pic/image-20230310184853985.png)

感知机是一种非常简单的算法，很快就能理解它的构造。感知机是下一章要学习的神经网络的基础，因此非常重要。