# 机器学习模型的评估

## 往期回顾

#### 机器学习的三要素

- 经验 (Expierence)  
- 任务 (Task)  
- 性能 (Performance)

#### 所解决的问题类型

- 监督式学习（Supervised Learning)  
    - 回归  
    - 分类  
- 非监督学习（Unsupervised Learning）  
    - 聚类
    - 非聚类
- 半监督学习 (Semi-supervised Learning)  
    - 协同过滤
- 强化学习 (Reinforcement Learning)  
    - 反馈机制：Alpha-Zero, AI打Dota

### 线性回归  (Linear Regression)

#### 解析法：正规方程

- 各个维度的偏导数均为0的数学解  
- 算法复杂度：$ O(n^3) $    
- 计算公式：$ \theta = (X^T X)^{-1} X^T Y $

#### 数值法

假设函数 (Hypothesis Function)  
$ \hat{y} = h(x)=\theta_1 x + \theta_0 $

代价函数 (Cost Function)  
$ J_\theta = \frac{1}{2m} \sum_{i=1}^{m}((\hat{y} - y^i)^2) $  

##### 梯度下降法

宏观思想：选取合适的初始值与学习率，不断迭代  
算法复杂度：$ O(n^2) $  
- 梯度 $ \frac{\partial{J}}{\partial{\theta}} $ 
- 学习率 $ \alpha $
- 迭代公式 $ \theta_j := \theta_j - \alpha\frac{\partial{J}}{\partial{\theta_j}} $  

### 逻辑回归

#### 决策边界 (decision boundary)
<img src="./images/LR-decision-boundary.png" align="left" />

#### Sigmoid函数   
公式：$ S(x)=\frac{1}{1+e^{-x}} $  
<img src="./images/sigmoid.png" align="left" />

#### 假设函数  
$ \hat{y} = h(x)= \frac{1}{1+e^{-z}} = \frac{1}{1+e^{-\theta^T x}} $  

#### 总结用到的框架工具

- [sklearn](http://scikit-learn.org)
- [numpy](https://github.com/teadocs/numpy-cn)
- [scipy](https://docs.scipy.org/doc/scipy-0.19.0/reference/index.html)

#### 微积分与线性代数基础回顾（谷良） 
[详情链接](https://github.com/TapasTech/EasyShare-ML/blob/master/%E9%AB%98%E6%95%B0%E7%BA%BF%E4%BB%A3%E5%9F%BA%E7%A1%80%E5%9B%9E%E9%A1%BE-%E8%B0%B7%E8%89%AF.ipynb)

## 模型评估  
目的：评估训练好的模型的表现(performance)

机器学习的魔性训练环节经常遇到的问题  
- 过拟合
- 欠拟合

<div><img src="./images/overfit.png" align="left" style="display:block"/></div>   

<img src="./images/underfit.jpg" align="left"/> 

### 泛化能力
模型要能够适用于新的数据

- 训练数据
- 测试数据
- 交叉验证

### 回归问题

#### 平方根误差(RMSE: root mean square error）  
$ RMSE(y,\hat{y}) = \sqrt{ \frac{\sum_{i=1}^n (y_i - \hat{y_i})^2} {n} } $

#### 均方差（MSE: mean squared error） 
$ MSE(y,\hat{y}) = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y_i})^2 $

#### 平均绝对误差（MAS: Mean Absolute Error）
$ MAE(y,\hat{y}) = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y_i}| $

### 分类问题

鱼与熊掌不可兼得  
衡量指标：
- 正确率
- 精准率
- 召回率

#### 混淆矩阵(Confusion Matrix)
- 真阳性（True Positive，TP）：指被分类器正确分类的正例数据  
- 真阴性（True Negative，TN）：指被分类器正确分类的负例数据  
- 假阳性（False Positive，FP）：被错误地标记为正例数据的负例数据  
- 假阴性（False Negative，FN）：被错误地标记为负例数据的正例数据

| 实例 | 预测 | |
| ------ | ------ | ------ |
|  结果 | 1 | 0 |
| 1 | TP | FN |
| 0 | FP | TN |
| 总计 | TP+FP | FN+TN |

True, False 针对的是预测结果是否正确，Positive, Negative 针对的是预测结果为正还是负

#### 精确率(Precision)
强调的是“不能冤枉好人”
所有分正确的正样本/所有预测为正类的样本数。  

$ Precision= \frac{TP}{TP+FP} $

#### 召回率(Recall)
强调的是“宁可错杀一千，不可放过一个”，不能有“漏网之鱼”  
所有分正确的正样本/所有的正样本数: 

$ Recall=\frac{TP}{TP+FN} $

#### 正确率(accuracy)

$ Accuracy = \frac{TP+TN}{TP+FP+TN+FN} $

#### F1-score
精确率和召回率两者一般同时使用，F1-score中和了二者的评估  

$ F_1score=\frac{2 \times Precision \times Recall}{Precision+Recall} $

### 分享一点轻松的话题

- 温故而知新，可以为师矣《论语》  
- 学而不思则罔，思而不学则殆《论语》  
- 吾尝终日而思矣，不如须臾之所学也《荀子.劝学》  
- 不积跬步，无以至千里《荀子.劝学》  

温故知新：从训练数据中得出新数据的规律  
学：增加训练数据  
思：训练模型  
跬步：每一次迭代的步长都很小，但是最终却能到达收敛