# 第2章 感知机

感知机（perceptron）算法
感知机也是作为神经网络（深度学习）的起源算法。

## 2.1 感知机是什么

感知机接收多个输入信号，输出一个信号。

![图2-1.有两个输入的感知机](../images/图2-1.有两个输入的感知机.PNG)

$$
    x_1、x_2是输入信号，y是输出信号，w_1、w_2是权重
$$

感知机的数学表达：

$$ y = \begin{cases} 0  \ (w_1x_1 + w_2x_2 \le \theta) \\  0 \ (w_1x_1 + w_2x_2 > \theta) \end{cases} \tag{2.1} $$

## 2.2 简单的逻辑电路

### 2.2.1 与门

![图2-2.与门的真值表](../images/图2-2.与门的真值表.PNG)

### 2.2.2 与非门和或门

![图2-3.与非门的真值表](../images/图2-3.与非门的真值表.PNG)
![图2-4.或门的真值表](../images/图2-4.或门的真值表.PNG)

机器学习的课题就是将决定参数的工作交由计算机自动进行。
**学习**是确定合适的参数的过程。

## 2.3 感知机的实现



### 2.3.1 简单的实现

In [3]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1 * w1 + x2 * w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1


AND(0, 0)
AND(1, 0)
AND(0, 1)
AND(1, 1)

1

### 2.3.2 导入偏置和权重

$$ y = \begin{cases} 0  \ (b + w_1x_1 + w_2x_2 \le 0) \\  1 \ (b + w_1x_1 + w_2x_2 > 0) \end{cases} \tag{2.2} $$

$b$ 称为**偏置**，$w_1,w_2$ 称为**权重**

In [4]:
import numpy as np

x = np.array([0, 1])  # 输入
w = np.array([0.5, 0.5])  # 权重
b = -0.7  # 偏置

w * x

array([0. , 0.5])

In [5]:
np.sum(w * x)

0.5

In [6]:
np.sum(w * x) + b

-0.19999999999999996

### 2.3.3 权重和偏置的实现

权重是控制输入信号的重要性的参数，偏置是调整神经元被激活的容易程度的参数。


In [7]:
def AND(x1, x2):
    x = np.array([x1, x2])  # 输入
    w = np.array([0.5, 0.5])  # 权重
    b = -0.7  # 偏置
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1


# 与非门，仅权重和偏置和AND不同
def NAND(x1, x2):
    x = np.array([x1, x2])  # 输入
    w = np.array([-0.5, -0.5])  # 权重
    b = 0.7  # 偏置
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1


# 或门，仅权重和偏置和AND不同
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

与门、与非门、或门是具有相同构造的感知机，区别只在于权重参数的值。

## 2.4 感知机的局限性

### 2.4.1 异或门

![图2-5.异或门的真值表](../images/图2-5.异或门的真值表.PNG)
图2-5.异或门的真值表

![图2-6.感知机的可视化：灰色区域是感知机输出0的区域，这个区域与或门的性质一致](../images/图2-6.感知机的可视化：灰色区域是感知机输出0的区域，这个区域与或门的性质一致.PNG)
图2-6.感知机的可视化：灰色区域是感知机输出0的区域，这个区域与或门的性质一致

![图2-7](../images/图2-7.PNG)
图2-7

无法用一条直线将异或门的输出分隔开

### 2.4.2 线性和非线性

![图2-8](../images/图2-8.PNG)
图2-8

由图2-6直线分割而成的空间称为**线性**空间
由图2-8曲线分割而成的空间称为**非线性**空间

## 2.5 多层感知机

感知机可以“叠加层”。

### 2.5.1 已有门电路的组合
![图2-9.与门、与非门、或门的符号](../images/图2-9.与门、与非门、或门的符号.PNG)
图2-9.与门、与非门、或门的符号

![图2-10.将与门、与非门、或门代入到“？”中，就可以实现异或门！](../images/图2-10.将与门、与非门、或门代入到“？”中，就可以实现异或门！.PNG)
图2-10.将与门、与非门、或门代入到“？”中，就可以实现异或门！

![图2-11.通过组合与门、与非门、或门实现异或门](../images/图2-11.通过组合与门、与非门、或门实现异或门.PNG)
图2-11.通过组合与门、与非门、或门实现异或门

![图2-12.异或门的真值表](../images/图2-12.异或门的真值表.PNG)
图2-12.异或门的真值表



### 2.5.2 异或门的实现

In [8]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y


XOR(0, 0), XOR(0, 1), XOR(1, 0), XOR(1, 1) # (0, 1, 1, 0)

(0, 1, 1, 0)


![图2-13.用感知机表示异或门](../images/图2-13.用感知机表示异或门.PNG)
图2-13.用感知机表示异或门

与门、或门是单层感知机，异或门是2层感知机。
叠加了多层的感知机称为**多层感知机（multi-layered-perceptron）**。

## 2.6 从与非门到计算机

实际上只需要通过与非门的组合，就能再现计算机的处理。说明使用感知机也可以表示计算机。

已有研究证明，2层感知机（激活函数使用了非线性sigmoid函数的感知机）可以表示任意函数。

感知机通过叠加层能够进行非线性的表示，理论上还可以表示计算机进行的处理。

## 2.7 小结

