# 损失函数

如何判断预测是否合理？最简单的办法就是把预测值和实际值直接比较，称为**误差**（Error）：

$$
\text{error} = \hat{y} - y
$$

-----------------

实际比较常用的办法是误差的平方，称为**平方差**（Squared Error）：

$$
\text{squared error} = (\hat{y} - y)^2
$$

平方差主要有三个方面的优点：
1. 所有的结果都是正数，易于统计，易于比较。
2. 对较大的误差加大惩罚。
3. 可以微分。

## 平均平方差（MSE）

更进一步，如果预测值和实际值都不是一个数值，而是一组n个数值。那么可以计算每个对应值的平方差，并最终比较所有平方差的平均值，称为**平均平方差**（Mean Squared Error）：

$$
\text{mean squared error} = \frac{1}{n} \sum\limits_{i=1}^{n} (\hat{y}_i - y_i)^2
$$

这里：
* 预测值：$\hat{y} = [\hat{y}_1, \hat{y}_2, ..., \hat{y}_n]$
* 实际值：$y = [y_1, y_2, ..., y_n]$


In [1]:
import numpy as np

## 数据

现在，我们回到小明的冰激凌店。

当天晚上，销售额统计出来了。今天一共卖出了165个冰激凌。

### 特征、标签

我们把实际值称为**标签**（Label），同样使用NumPy的数组来保存。

In [2]:
feature = np.array([28.1, 58.0])
label = np.array([165])

## 模型

### 参数：权重、偏差

In [3]:
weight = np.ones([1, 2]) / 2
bias = np.zeros(1)

### 逻辑：推理函数（前向传播）

In [4]:
def forward(x, w, b):
    return x @ w.T + b

### 损失函数（平均平方差）

损失函数计算预测值和标签值的平均平方差。

In [5]:
def mse_loss(p, y):
    return ((p - y) ** 2).mean()

## 验证

### 推理

In [6]:
prediction = forward(feature, weight, bias)

print(f'prediction: {prediction}')

prediction: [43.05]


### 评估

有了损失函数，我们就可以评估人工神经元网络模型推理的准确度。

In [7]:
error = mse_loss(prediction, label)

print(f'error: {error}')

error: 14871.802500000002


看来，我们的第一个人工神经元网络并不准确，那么怎么办呢？