# 预测的误差

一天的工作结束之后，作为冰淇淋店老板的你统计出来今天冰淇淋的销量是120。

In [1]:
# 实际结果
actual = 120

这和早上的模型推理的预测结果116略有不同。

# 损失函数

预测结果与实际结果之间可能存在或大或小的误差。多种方法可以用来衡量这种误差。对于线性回归模型最常用的是平均平方差（MSE），公式为：

$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (\hat{y}_i - y_i)^2$

其中，$\hat{y}$ 是预测结果，而 $y$ 是实际结果。 

在机器学习中，我们把这类公式称之为损失函数。损失函数主要用来衡量模型优劣，以及指导模型优化。

In [2]:
# 损失函数（平均平方差）
def mse_loss(p, y):
    return ((p - y) ** 2).mean()

现在，作为冰淇淋店老板的你可以衡量预测的准确性了。

In [3]:
import numpy as np

# 观测数据（温度，湿度）
obs = np.array([25.3, 65.0])

# 模型参数（权重，偏差）
weight = np.array([2.0, 1.0])
bias = 0.5

# 模型推理函数
def predict(x, w, b):
    return x.dot(w.T) + b

# 模型推理
pred = predict(obs, weight, bias)
print(f'销量预测：{pred:.0f}')

# 模型评价
error = mse_loss(pred, actual)
print(f'平均平方差：{error:.4f}')

销量预测：116
平均平方差：15.2100
