前面我们学习了通过最小二乘法求解回归模型，既可以求解线性回归，也可以扩展到非线性回归。最小二乘法是机器学习中的最基础的算法，这种求解损失函数最小值的思路可以延伸到更多的机器学习算法中，包括分类和聚类问题。

但是求得的模型损失函数最小，模型就是最好吗？如何评估模型是不是好呢？这就是这一节要讨论的问题。

其实，在前面介绍损失函数时提到了两种损失函数，一种是 **绝对损失（Absolute Loss）**，一种是 **平方损失（Squared Loss）**。

绝对损失函数：$$ loss = |y - \hat{y}| $$

平方损失函数：$$ loss = (y - \hat{y})^2 $$

这实际上也是两种评估模型好坏的指标，分别是：**平均绝对误差**（Mean Absolute Error，MAE） 和 **均方误差**（Mean Squared Error，MSE）。

$$
MAE = \frac{1}{N} \sum_{i=1}^{N} \left| y_i - \hat{y_i} \right|
$$

$$
MSE = \frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y_i})^2
$$

除此之外，从 MAE 还可以演变成一个新的指标，**平均绝对百分误差**（Mean Absolute Percentage Error，MAPE）：

$$
MAPE = \frac{100}{N} \sum_{i=1}^{N} \left| \frac{y_i - \hat{y_i}}{y_i} \right|, y_i \ne 0
$$

MAPE 通过计算绝对误差的百分比来表示预测效果，其取值越小越好，如果 MAPE = 10，这表明预测平均偏离真实值 10%。

从 MSE 也可以演变成一个新的指标，**均方根误差**（Root Mean Squared Error，RMSE），它就是对 MSE 求开方：

$$
RMSE = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y_i})^2} = \sqrt{MSE}
$$

基于 RMSE 还有一个变种指标，叫**均方根对数误差**（Root Mean Squared Logarithmic Error，RMSLE），将上面公式中的 $y_i$ 和 $\hat{y_i}$ 换成对数形式：

$$
RMSLE = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (log(y_i+1) - log(\hat{y_i}+1))^2}
$$

最后，**$R^2$**（R-Square）也是一个常见的评估指标，它的公式如下：

$$
R^2 = 1 - \frac{\sum_{i=1}^{N} (y_i - \hat{y_i})^2}{\sum_{i=1}^{N} (y_i - \bar{y_i})^2}
$$

$R^2$ 用于度量因变量的变异中可由自变量解释部分所占的比例，一般取值范围是 0~1，$R^2$ 越接近 1，表明回归平方和占总平方和的比例越大，回归线与各观测点越接近，用 x 的变化来解释 y 值变差的部分就越多，回归的拟合程度就越好。

#### 参考

[一份非常全面的机器学习分类与回归算法的评估指标汇总](https://juejin.im/post/5bbbc1d6f265da0af40726fb)

#### TODO

* 为什么需要这么多的评估指标？
* 每一种评估指标的优缺点，举例说明
* 还有没有其他的评估指标？
* RMSE 代表的是预测值和真实值差值的样本标准差？