# 1. 感知机(Perceptron)

感知机是由美国学者Frank Rosenblatt 在1957 年提出来的。感知机是作为神经网络（深度学习）的起源的算法，学习感知机的构造也是学习通向神经网络和深度学习的一种重要思想。

感知机接收多个输入信号，输出一个信号信号。感知机的输出信号只有激活或未激活两种状态，使用1代表激活，0代表未激活。下图是一个接收两个输入信号的感知机的例子。x1、x2 是输入信号，y 是输出信号，w1、w2 是权重。

![9.perceptron.png](image/9.perceptron.png)

图中的 ○ 称为“神经元”或者“节点”。输入信号被送往神经元时，会被分别乘以固定的权重（w1x1、w2x2）。神经元会计算传送过来的信号的总和，只有当这个总和超过了某个界限值时，才会输出1。这也称为“神经元被激活” 。这里将这个界限值称为阈值，用符号 θ 表示。

$$y=
\begin{cases}
0&w_1 x_1 + w_2 x2 <= \theta \\
1&w_1 x_1 + w_2 x2 > \theta
\end{cases}$$

如果将阈值 θ 改记为 -b，我们将 b 称为偏置(bias)，则

$$y=
\begin{cases}
0&w_1 x_1 + w_2 x2 + b <= 0 \\
1&w_1 x_1 + w_2 x2 + b > 0
\end{cases}$$

## 1.1 实现逻辑运算

现在让我们考虑用感知机来解决简单的逻辑电路问题。这里首先以逻辑电路为题材来思考一下**与门**（AND gate）。与门是有两个输入和一个输出的门电路。

|输入x1|输入x2|输出y|
|--|--|-|
| 0| 0|0|
| 1| 0|0|
| 0| 1|0|
| 0| 0|1|

与门仅在两个输入均为 1 时输出 1，其他时候则输出 0。

我们使用 Python 和 Numpy 实现一个 AND() 函数，这个函数接受两个参数 x1 和 x2，并在函数内初始化参数 w1、w2 和 b：

In [5]:
import numpy as np

def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b           # np.sum(w*x)计算相乘后的各个元素的总和
    if tmp <= 0:
        return 0
    else:
        return 1

In [6]:
print(AND(0, 0)) # 输出0
print(AND(1, 0)) # 输出0
print(AND(0, 1)) # 输出0
print(AND(1, 1)) # 输出1

0
0
0
1


除了“与”门，逻辑电路还有两种常用的门：**或门** (OR gate) 和**非门** (NOT gate)。其中**或门**是“只要有一个输入信号是1，输出就为1”的逻辑电路。

|输入x1|输入x2|输出y|
|--|--|-|
| 0| 0|0|
| 1| 0|1|
| 0| 1|1|
| 0| 0|1|

**非门**只有一个输入端，并且输入端和输出端的电平状态总是反相的：

|输入x|输出y|
|--|--|
| 0| 1|
| 1| 0|

我们继续使用 Python 实现或门和非门，其中在或门的实现中，仅设置权重和偏置的值这一点和与门的实现不同。

In [7]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])   # 仅权重和偏置与AND不同
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [9]:
def NOT(x):
    return 1 if x <= 0 else 0

## 1.2 感知机的局限性

现在我们来考虑一下**异或门**（XOR gate）。仅当x1 或x2 中的一方为1 时，才会输出1（“异或”是拒绝其他的意思）。

|输入x1|输入x2|输出y|
|--|--|-|
| 0| 0|0|
| 1| 0|1|
| 0| 1|1|
| 0| 0|0|

那么，要用感知机实现这个异或门的话，应该设定什么样的权重参数呢？

**实际上，用前面介绍的感知机是无法实现这个异或门的。**

只拥有一层功能神经元，其学习能力非常有限。与、或、非问题都是线性可分(linearly separable)的问题，而异或属于非线性可分问题。

![img](image/9.linearly_separable.png)

## 1.3 多层感知机

感知机不能表示异或门让人深感遗憾，但也无需悲观。实际上，感知机的绝妙之处在于它可以“叠加层”（通过叠加层来表示异或门是本节的要点）。

下面我们试着用 Python 来实现异或门。使用之前定义的AND函数、OR函数，可以像下面这样轻松实现。

In [27]:
def XOR(x1, x2):
    s1 = not AND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [28]:
print(XOR(0, 0)) # 输出0
print(XOR(1, 0)) # 输出1
print(XOR(0, 1)) # 输出1
print(XOR(1, 1)) # 输出0

0
1
1
0


与门、或门是单层感知机，而异或门是一种多层感知机（multi-layered perceptron）。

![img](image/9.multi_layer_perceptron.png)

- 第0 层的两个神经元接收输入信号，并将信号发送至第1 层的神经元。
- 第1 层的神经元将信号发送至第2 层的神经元，第2 层的神经元输出y。

# 2. 神经网络

![img](image/9.neural_network.png)

最左边的一列称为输入层，最右边的一列称为输出层，中间的一列称为中间层。中间层有时也称为隐藏层。

# 3. 反向传播算法