## 模型评估与选择
#### 1. **损失函数**

对于模型一次预测的结果而言, 我们需要一个度量标准来评估模型的好坏。损失函数本质上是对函数中参数的函数.

对于监督学习而言, 给定一个输入X, 选取的模型就相当于一个"决策函数"f, 它可以输出一个预测结果f(x), 真实的结果(标签)记为Y. f(X)和Y之间可能会有偏差, 我们就需要定义一个**损失函数**(loss function)来度量预测偏差的程度, 记作L(Y, f(X))

    1. 损失函数是用来衡量模型预测与真实值误差大小的函数, 损失函数越小, 模型预测越准确
    2. 损失函数是f(X)和Y的非负实数值函数

**0-1损失函数:**

$$
L(y, \hat{y}) =
\begin{cases}
0, & \text{如果 } y = \hat{y} \\
1, & \text{如果 } y \ne \hat{y}
\end{cases}
$$


**平方损失函数:**

$$
L(y, \hat{y}) = \sum_{j=1}^{m} (y_j - \hat{y}_j)^2
$$


**绝对损失函数:**

$$
L(y, \hat{y}) = |y - \hat{y}|
$$


**对数似然损失函数:**

$$
L(\theta) = - \sum_{i=1}^{n} \log p_\theta(y_i | x_i)
$$


#### 2. **经验误差与泛化误差**

给定一个训练的数据集, 数据个数为n:

$$
T = \{ (x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n) \}
$$

根据所选取的损失函数L, 就可以计算出模型f(X)在训练集上的平均误差, 称之为训练误差, 也被称为**经验误差**(empirical error)或**经验风险**(empirical risk)

$$
R_{emp}(f) = \frac{1}{n} \sum_{i=1}^{n} L(y_i, f(x_i))
$$

类似的, 模型f(X)在测试集上的平均误差, 称之为测试误差, 也被称为**泛化误差**(generalization error)或**泛化风险**(generalization risk)

在一般情况下对模型进行评估就是评估模型的经验误差, 当经验误差越小, 就认为取得了更好的模型, 这种策略叫做**经验误差最小化**(minimize empirical error)

经验误差最小不代表泛化误差最小


#### 3. **拟合**

机器学习模型在训练数据集上学习**数据的规律**（模式），从而最小化**经验误差**、并能够对新的未知数据做出预测的过程。

- **欠拟合**(underfitting) : 模型在训练集上表现不佳, 无法捕捉数据规律, 欠拟合的模型在训练集上和测试集上表现都差
- **过拟合**(overfitting) : 模型在训练集上表现的很好, 但是在测试集和新数据上表现的很差, 模型将训练集的一些自身特征或噪声认为是一般特征, 失去了泛化能力

产生欠拟合的原因:

- 模型过于简单, 模型无法捕捉数据规律, 增加模型复杂度
- 训练数据不足, 模型无法捕捉数据规律, 增加特征或改进特征工程
- 训练不充分, 轮数过少, 增加训练迭代次数
- 正则化过强, 强制模型简单化, 减少正则化参数, 让模型更灵活

产生过拟合的原因:

- 模型过于复杂, 模型将训练集的一些自身特征或噪声认为是一般特征, 丢失了泛化能力, 减少模型复杂度
- 训练数据不足, 模型无法捕捉数据规律, 增加样本数

使用正则化: 引入L1, L2正则化, 避免过度拟合训练数据

使用交叉验证: 评估模型在不同数据集上的表现以减少过拟合的风险

当模型损失函数并不再下降时, 可以提早停止训练

### **代码展示拟合过程**:   在[-3, 3]上拟合sin(x)

见 1_fitting_test.py