# 线性推理
> ”合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。“
>
> 《道德经：第六十四章》

伟大的成就往往开始于简单的思想。例如**深度学习**（Deep Learning），就开始于1943年的一个简单数学模型：**人工神经元**（Artificial Neuron）。

-----------------

我们的大脑并非是一个整体的超级处理器，而是由大约860亿个神经元组成的复杂网络。单个神经元的能力非常有限，仅仅是接收信号，判断信号强度，然后决定是否通知下一个神经元。这种机制简单得令人发指：*输入*、*加权*、*过滤*、*输出*。

神经科学家麦卡洛克（McCulloch）与逻辑学家皮茨（Pitts）据此提出了人工神经元模型：

$$
\text{output} =
\begin{cases}
1 & \text{if } \sum\limits_{i=1}^{n} w_i x_i \geq \theta \\
0 & \text{otherwise}
\end{cases}
$$

这里包含两层概念：
1. **线性回归**（Linear Regression）：对应加权。
2. **激活函数**（Activation Function）：对应过滤。

-----------------

单个的人工神经元并不能处理复杂的逻辑。但是当我们把成百、上千、甚至上百亿个这样的人工神经元连接并层层堆叠，就构成了功能强大的**深度神经元网络**（Deep Neural Networks）。

现在我们就从最简单的单个人工神经元开始，逐步堆叠构建出能理解语言、输出内容的人工智能系统。

## 最简单的人工神经元网络

最简单的人工神经元网络只包括一个人工神经元，但是已经可以完成一些简单的趋势预测（Trend Prediction），如房价预测、股票估值等；或者影响因素分析（Relationship Strength），如健康评估、经营回报等。

-----------------

我们以一个销售预测的项目为例：

小明是一家冰激凌店的老板。冰激凌的销售非常依赖于天气情况。小明想建立一个可以根据天气预报（温度、湿度）来预测冰激凌销量的系统。

In [6]:
# NumPy是Python的科学计算核心库，它通过高性能的多维数组对象（ndarray）以及
# 丰富的矢量数学函数，为大规模数值运算提供了极高的效率。
#
# 我们将利用NumPy来完成全部的数据保存和计算。

import numpy as np

## 数据

单个的人工神经元功能非常简单，就是完成一次加权求和（线性回归）：

$$
\hat{y} = \sum_{i=1}^{n} w_i x_i + b
$$

这里：
* $x_i$代表n个输入数据，也称为**特征**（Feature）。
* $w_i$代表和输入数据对应的n个**权重**（Weight），$b$代表**偏差**（Bias）。
* $\hat{y}$代表的是加权求和的计算结果，也称为**预测**（Prediction）。

### 特征

输入数据包括两个特征值：温度、湿度。我们用一个NumPy数组来保存，其中第一个值为温度，第二个值为湿度。

根据今天的天气预报，我们有了第一组输入数据：

In [7]:
feature = np.array([28.1, 58.0])

## 模型

完成计算所需要的参数（比如：权重、偏差）和逻辑（比如：加权求和）总称为**模型**（Model）。

### 参数：权重、偏差

我们同样用NumPy的数组来保存参数。作为初始值，对应于特征值的数量（2），我们使用NumPy的函数生成一个包括两个数值（总和为1）的权重数组，和只有一个数值的偏差数组。

In [8]:
weight = np.ones([1, 2]) / 2
bias = np.zeros(1)

### 逻辑：推理函数（前向传播）

推理函数实现加权求和（线性回归）的功能。这种数据从输入数据向输出数据方向的流动，被称为**前向传播**（Forward Propagation）。

我们利用NumPy提供的矩阵运算（比如：矩阵转置、矩阵乘法）来实现推理函数。最终的计算结果是一个只有一个数值的数组，也就是我们希望获得的预测值。

In [9]:
def forward(x, w, b):
    return x @ w.T + b

## 验证

寥寥数行代码，我们已经实现了一个最简单的人工神经元网络。效果如何呢？

### 推理

运行一个人工神经元网络模型，并获得输出结果的过程，被称为**模型推理**（Model Inference）。

现在，让我们帮小明推理一下：

In [10]:
prediction = forward(feature, weight, bias)

print(f'prediction: {prediction}')

prediction: [43.05]


系统预测，今天小明的冰激凌店大概可以卖出43个冰激凌。

这个预测靠谱吗？等到今天晚上我们就知道结果了。