In [18]:
from IPython.core.interactiveshell import InteractiveShell 
InteractiveShell.ast_node_interactivity = "all"

import numpy as np

# 感知机简介

感知机接收多个输入信号，输出一个信号。

这里所说的“信号”可以想象成电流或河流那样具备“流动性”的东西。像电流流过导线，向前方输送电子一样，感知机的信号也会形成流，向前方输送信息。

但是，和实际的电流不同的是，感知机的信号只有“流/不流”（1/0）两种取值。

在本书中，0对应“不传递信号”，1对应“传递信号”。

<img src="img/2_1.png" alt="Drawing" style="width: 500px;"/>

- x1、x2是输入信号
- y是输出信号，
- w1、w2是权重（w是weight的首字母）。
- 图中的○称为“神经元”或者“节点”。输入信号被送往神经元时，会被分别乘以固定的权重（w1x1、w2x2）。
- 神经元会计算传送过来的信号的总和，只有当这个总和超过了某个界限值时，才会输出1。这也称为“神经元被激活”。


<img src="img/formula_2_1.png" alt="Drawing" style="width: 500px;"/>

感知机的多个输入信号都有各自固有的权重，这些权重发挥着控制各个
信号的重要性的作用。也就是说，权重越大，对应该权重的信号的重要性就
越高。

# 简单逻辑电路&实现

## 与门
与门是有两个输入和一个输出的门电路。如真值表：

<img src="img/2_2.png" alt="Drawing" style="width: 500px;"/>

实际上，满足图2-2的条件的参数的选择方法有无数多个。比如，当
(w1, w2, θ) = (0.5, 0.5, 0.7) 时，可以满足图 2-2 的条件。此外，当 (w1, w2, θ) 为(0.5, 0.5, 0.8)或者(1.0, 1.0, 1.0)时，同样也满足与门的条件。

In [11]:
# 代码实现
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

AND(0, 0) # 输出0
AND(1, 0) # 输出0
AND(0, 1) # 输出0
AND(1, 1) # 输出1

0

0

0

1

## 与非门

我们再来考虑一下与非门（NAND gate）。NAND是Not AND的意思，与非门就是颠倒了与门的输出。

用真值表表示的话，如图2-3所示：
<img src="img/2_3.png" alt="Drawing" style="width: 500px;"/>

要表示与非门，可以用(w1, w2, θ) = (−0.5, −0.5, −0.7)这样的组合（其
他的组合也是无限存在的）。实际上，只要把实现与门的参数值的符号取反，
就可以实现与非门。

In [23]:
# 代码实现
def NAND(x1, x2):
    w1, w2, theta = -0.5, -0.5, -0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1
    
NAND(0, 0) # 输出0
NAND(1, 0) # 输出0
NAND(0, 1) # 输出0
NAND(1, 1) # 输出1

1

1

1

0

## 或门

或门是“只要有一个输入信号是1，输出就为1”的逻辑电路。

<img src="img/2_3.png" alt="Drawing" style="width: 500px;"/>

那么我们来思考一下，应该为这个或门设定什么样的参数呢？

## 导入权重和偏置&实现



<img src="img/formula_2_2.png" alt="Drawing" style="width: 500px;"/>

此处，b称为偏置，w1和w2称为权重。如式（2.2）所示，感知机会计算输入
信号和权重的乘积，然后加上偏置，如果这个值大于0则输出1，否则输出0。


但是请注意，偏置和权重w1、w2的作用是不
一样的。具体地说，w1和w2是控制输入信号的重要性的参数，而偏置是调
整神经元被激活的容易程度（输出信号为1的程度）的参数。

比如，下面的例子：
若b为 −0.1，则只要输入信号的加权总和超过0.1，神经元就会被激活。但是如果b 为−20.0，则输入信号的加权总和必须超过20.0，神经元才会被激活。像这样，
偏置的值决定了神经元被激活的容易程度。

### 与门 + 偏置 + numpy

In [19]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1
    
AND(0, 0) # 输出0
AND(1, 0) # 输出0
AND(0, 1) # 输出0
AND(1, 1) # 输出1

0

0

0

1

### 与非门 + 偏置 + numpy

In [20]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5]) # 仅权重和偏置与AND不同！
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1
    
NAND(0, 0) # 输出1
NAND(1, 0) # 输出1
NAND(0, 1) # 输出1
NAND(1, 1) # 输出0

1

1

1

0

### 或门 + 偏置 + numpy

In [22]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) # 仅权重和偏置与AND不同！
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

OR(0, 0) # 输出0
OR(1, 0) # 输出1
OR(0, 1) # 输出1
OR(1, 1) # 输出1

0

1

1

1


# 感知机的局限：异或门

## 异或门

异或门也被称为逻辑异或电路。如图2-5所示，仅当x1或x2中的一方为
1时，才会输出1（“异或”是拒绝其他的意思）。

<img src="img/2_5.png" alt="Drawing" style="width: 500px;"/>

感知机是无法实现这个异或门的，原因如下图：


<img src="img/2_7.png" alt="Drawing" style="width: 500px;"/>




## 感知机的局限：

感知机的局限性就在于它只能表示由一条直线分割的空间。图2-8这样弯曲的曲线无法用感知机表示。

<img src="img/2_8.png" alt="Drawing" style="width: 500px;"/>

由图2-8这样的曲线分割而成的空间称为
非线性空间，由直线分割而成的空间称为线性空间。线性、非线性这两个术
语在机器学习领域很常见

# 多层感知机

感知机
的绝妙之处在于它可以“叠加层”（通过叠加层来表示异或门是本节的要点）。

## 已有门电路的组合

<img src="img/2_9.png" alt="Drawing" style="width: 500px;"/>


感知机的局限性，严格地讲，应该是“单层感知机无法
表示异或门”或者“单层感知机无法分离非线性空间”。接下来，我
们将看到通过组合感知机（叠加层）就可以实现异或门。

<img src="img/2_11.png" alt="Drawing" style="width: 500px;"/>

- x1和x2表示输入信号，
- y表示输出信号。
- x1和x2是与非门和或门的输入，
- 而与非门和或门的输出则是与门的输入。

<img src="img/2_12.png" alt="Drawing" style="width: 500px;"/>


## 异或门的实现

In [26]:
# 代码实现
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

XOR(0, 0) # 输出0
XOR(1, 0) # 输出1
XOR(0, 1) # 输出1
XOR(1, 1) # 输出0

0

1

1

0

- 异或门是一种多层结构的神经网络。这里，将最左边的一列称为第0层，中间的一列称为第1层，最右边的一列称为第2层。
- 与门、或门是单层感知机，而异或门是2层感知机。叠加了多层的感知机也称为多层感知机（multi-layered perceptron）。

<img src="img/2_13.png" alt="Drawing" style="width: 500px;"/>


通过叠加层（加深
层），感知机能进行更加灵活的表示。

# 从与非门到计算机

多层感知机可以实现比之前见到的电路更复杂的电路。

- 比如，进行加法运算的加法器也可以用感知机实现。
- 此外，将二进制转换为十进制的编码器、满足某些条件就输出1的电路（用于等价检验的电路）等也可以用感知机表示。
- 实际上，使用感知机甚至可以表示计算机！
- 《计算机系统要素：从零开始构建现代计算机》这本书论述了通过 NAND构建可运行俄罗斯方块的计算机的过程

# 小结

本章所学的内容
- 感知机是具有输入和输出的算法。给定一个输入后，将输出一个既
定的值。
- 感知机将权重和偏置设定为参数。
- 使用感知机可以表示与门和或门等逻辑电路。
- 异或门无法通过单层感知机来表示。
- 使用2层感知机可以表示异或门。
- 单层感知机只能表示线性空间，而多层感知机可以表示非线性空间。
- 多层感知机（在理论上）可以表示计算机。