# 深度学习入门(day4) - 感知机
## 感知机是什么
感知机接受多个信号，输出一个信号（1或0）。也可以称为人工神经元，以下是一个接收两个信号的感知机的例子。$x_1$ 、 $x_2$ 是输入信号，$y$ 是输出信号，$w_1$、$w_2$ 是权重。输入信号传入神经元的时候会被分别乘以权重（$x_1w_1 、 x_2w_2$）。只有传过来信号的总和大于某个阈值 $\theta$ 时，神经元才会被激活。

<div style="text-align:center">
  <img src="./assets/4-1.drawio.svg" alt="两个输入的感知机" style="width: 20%;">
</div>

用数学公式表示就是

$$
y=\left\{ 
\begin{array}{ll}
0 & (w_1x_1 + w_2x_2 \leq \theta) \\
1 & (w_1x_1 + w_2x_2 > \theta)
\end{array}
\right.
$$

感知机多个输入都有各自固有的权重，权重越大，对应该权重的信号的重要性就越高。

## 简单逻辑电路
### 与门（AND）
接下来用感知机来表示逻辑电路，与门只有在两个输入都为1的时候才输出1，其他时候输出0

|  x1  |  x2  | y |  
|:---:|:---:|:---:|  
| 0   | 0   | `0` |  
| 0   | 1   | `0` |  
| 1   | 0   | `0` |  
| 1   | 1   | `1` |  

当 $(w_1, w_2, \theta)=(0.5, 0.5, 0.7)$ 时，设定这样的参数后，感知机满足与门的条件。当然，满足条件的参数选择方法可以有无数种。

用python代码表示：

In [6]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1 * w1 + x2 * w2
    if tmp <= theta:
        return 0
    else:
        return 1

input = [(0, 0), (0, 1), (1, 0), (1, 1)]

for i in input:
    print(f'输入：{i[0]} {i[1]} 输出：{AND(*i)}')

输入：0 0 输出：0
输入：0 1 输出：0
输入：1 0 输出：0
输入：1 1 输出：1





### 与非门（NAND）、或门（OR）
与非门就是颠倒了与门的输出

|  x1  |  x2  | y |  
|:---:|:---:|:---:|  
| 0   | 0   | `1` |  
| 0   | 1   | `1` |  
| 1   | 0   | `1` |  
| 1   | 1   | `0` |  

可以用 $(w_1, w_2, \theta)=(-0.5, -0.5, -0.7)$ 来实现与非门

要表示或门

|  x1  |  x2  | y |  
|:---:|:---:|:---:|  
| 0   | 0   | `0` |  
| 0   | 1   | `1` |  
| 1   | 0   | `1` |  
| 1   | 1   | `1` |  

可以设定 $(w_1, w_2, \theta)=(0.5, 0.5, 0.4)$。


接下来用另一种实现来表示感知机的行为：

$$
y=\left\{ 
\begin{array}{ll}
0 & (b + w_1x_1 + w_2x_2 \leq 0) \\
1 & (b + w_1x_1 + w_2x_2 > 0)
\end{array}
\right.
$$

至此，与门、与非门、或门可以用相同的构造的感知机表示，只有权重和偏置的值不同。

In [7]:
import numpy as np

def logic_gate(x1, x2, logic_gate):
    x = np.array([x1, x2])
    w = np.array(logic_gate[0:2])
    b = logic_gate[2]
    tmp = w @ x + b
    if tmp <= 0:
        return 0
    else:
        return 1

AND = (0.5, 0.5, -0.7)
NAND = (-0.5, -0.5, 0.7)
OR = (0.5, 0.5, -0.2)


input = [(0, 0), (0, 1), (1, 0), (1, 1)]

for i in input:
    print(f'输入：{i[0]}    {i[1]} \
        与门输出：{logic_gate(*i, AND)} \
        与非门输出：{logic_gate(*i, NAND)} \
        或门输出：{logic_gate(*i, OR)}')

输入：0    0         与门输出：0         与非门输出：1         或门输出：0
输入：0    1         与门输出：0         与非门输出：1         或门输出：1
输入：1    0         与门输出：0         与非门输出：1         或门输出：1
输入：1    1         与门输出：1         与非门输出：0         或门输出：1


## 感知机的极限
### 异或门
如果要用感知机实现异或门

|  x1  |  x2  | y |  
|:---:|:---:|:---:|  
| 0   | 0   | `0` |  
| 0   | 1   | `1` |  
| 1   | 0   | `1` |  
| 1   | 1   | `0` |  

在单层感知机中是无法实现异或门的，可以通过画图来解释其中原因。在下图中，直线下方表示输出为0的空间，上方表示输出为1的空间，四个点代表异或门的输入，要如何设定参数才能使直线 $x_1w_1 + x_2w_2 + b$ 正好把四个点正确的分开？

<div style="text-align:center">
  <img src="./assets/4-2.svg" alt="两个输入的感知机" style="width: 40%;">
</div>

无论如何用一条直线是做不到的。

## 多层感知机
在电路中，通过与门、或门、非门之间的组合，是可以实现异或门的：

<div style="text-align:center">
  <img src="./assets/4-3.drawio.svg" alt="两个输入的感知机" style="width: 40%;">
</div>

真值表表示就是

|  x1  |  x2  | y1 | y2 | y |
|:---:|:---:|:---:|:---:|:---:|  
| 0   | 0 | `1` | `0` | `0` | 
| 1   | 0 | `1` | `1` | `1` |   
| 0   | 1 | `1` | `1` | `1` | 
| 1   | 1 | `0` | `1` | `0` | 

下面试着用python实现异或门

In [8]:
def XOR(x1, x2):
    s1 = logic_gate(x1, x2, NAND)
    s2 = logic_gate(x1, x2, OR)
    y = logic_gate(s1, s2, AND)
    return y

input = [(0, 0), (0, 1), (1, 0), (1, 1)]

for i in input:
    print(f'输入：{i[0]}    {i[1]} \
        异或门输出：{XOR(*i)}')

输入：0    0         异或门输出：0
输入：0    1         异或门输出：1
输入：1    0         异或门输出：1
输入：1    1         异或门输出：0


与门、或门是单层感知机，异或门是2层感知机，叠加了多层的感知机也称为多层感知机。

<div style="text-align:center">
  <img src="./assets/4-4.drawio.svg" alt="两个输入的感知机" style="width: 40%;">
</div>

## 总结
理论上多层感知机可以像逻辑电路一样表示计算机。