# 10-1 准确度的陷阱和混淆矩阵 10-2 精准率和召回率

## 什么时候不能使用准确度评价分类算法

+ 当数据有极度偏斜的时候，使用准确度来评价分类算法就不合适。

例如，患癌症病例预测：健康样本占比 99%，患者样本占比 1%。如果我们的模型是这样的，就预测所有的人都是健康的，这个模型的准确度就是 99%。这不是很奇怪么，什么都不做就有这么好的准确度，所以说准确度在数据有极度偏斜的情况下用于评价分类算法是不合适的。

所以，我们希望获得一些新的指标，可以多方面地评估模型的表现。

## 混淆矩阵

|       | 预测值：0 | 预测值：1 |
| :---: | :---: | :---: |
| 真实值：0 |  TN   |  FP   |
| 真实值：1 |  FN   |  TP   |

### 如何理解混淆矩阵

表格的内容是由两个数字组成的，它们的含义分别如下：
+ 第 1 个字母表示真实值和预测值是否一致：对角线上的才一致。T 表示 Ture，F 表示 False；
+ 第 2 个字母是我们预测的结果。

### 什么是 P 什么是 N
+ P 表示 Positive，是**数量上占整体样本数很少，是少数群体，是我们的关注对象**

例如：众多股票中，我们一般关注上升的股票。患癌症病例预测中，我们一般关注患癌症的人数。

+ N 表示，Negative，数量上占整体样本的绝大多数，并不是我们关注的对象

### 如何记忆混淆矩阵

+ 真实值比预测值重要，所以真实值占第 1 个维度，就是行那个维度，预测值占第 2 个维度，就是列那个维度
+ 用一个具体的例子加深理解，假设我们的模型预测结果如下：

| 癌症病例一共 10000 例 | 预测值：0 | 预测值：1 |
| :------------: | :---: | :---: |
|     真实值：0      | 9978  |  12   |
|     真实值：1      |   2   |   8   |

我们一行一行来解读，即从真实患病的角度来解读我们的预测模型。
第 1 行：健康的人有 9990 人，其中 9978 个人我们都预测他们是健康的，但是有 12 个人我们预测错了，预测他们患病
第 2 行：有 10 个人是患病的，但是我们只预测出来 8 个，有 2 个是漏网之鱼，真实患病有 2 个人，但是我们却预测他们没有患病

## 精准率和召回率

我们先把混淆矩阵摆在这里，方便我们理解精准率和召回率的定义，因为精准率和召回率就是根据混淆矩阵中的一些指标来定义的。

|       | 预测值：0 | 预测值：1 |
| :---: | :---: | :---: |
| 真实值：0 |  TN   |  FP   |
| 真实值：1 |  FN   |  TP   |

### 什么是精准率

$${\rm precision} = \cfrac{TP}{TP+FP}$$

+ 可以看到分母的第 2 个字母都是 P ，所以精准率是针对我们预测的结果而言的，即<b><font size='3' color='ff0000'>精准率的意思是：我们到底预测正确了多少，我们希望这个数值越高越好</font></b>；
+ 一个典型的例子：股票预测，TP 表示我们预测上升正确的股票数量，当然我们希望越多越好啦，FP 表示我们预测上升错了，即这部分数量表示我们买的跌的股票数量，这部分数量是我们真真切切的损失，真金白银，会心疼的，再看 FN 是啥，FN 表示我们预测会下跌的股票预测错了，我们肯定不会去买我们以为会下跌的股票，所以即使我们预测错了，我们没有并没有买，所以最多只是惋惜（当然你要非觉得有钱不赚也是亏钱，我就无言以对了）

### 什么是召回率

$${\rm recall} = \cfrac{TP}{TP+FN}$$

+ 可以看到分母的两个指标都来自混淆矩阵的第 2 行，即对真实值的预测的两个指标，所以<b><font size='3' color='ff0000'>召回率的意思是：在真实的关注的对象中，我们预测正确的比例是多少</font></b>；
+ 一个典型的例子：癌症患病预测中，TP 表示真实患病，我们且预测正确的数量，显然这就是我们要干的事情，FN 表示，我们预测没有患病但预测错了，即真实患病的病人我们没有预测出来，这是很糟糕的一件事情；再看看 FP 此时表示什么，FP 表示我们预测这部分人群得病，但预测错了，这部分人其实是健康的，在这种情况下，我们只要他们继续复诊就能排除他们患病的可能性

### 再看看看什么是准确率

之前我们使用的准确率其实就是模型正确分类标签的比例，即对角线的和占整个矩阵总和的比例：

$${\rm accuracy} = \cfrac{TP + TN}{TP + TN + FP + FN}$$

### 总结精准率和召回率

+ 从上面的分析中，我们可以看到精准率和召回率，我们都希望他们越高越好，但事实上，这两者是此消彼长的，所以我们总想找到一个合适的“点”，使得精准率和召回率在一个都不错的数值上，而不是一个值很高，另一个值很低。
+ 那么有一个指标就综合了精准率和召回率，那就是 F1-score，这个我们在后两节就会看到。

In [2]:
from sklearn.metrics import confusion_matrix

y_true = [2, 0, 2, 2, 0, 1]
y_pred = [0, 0, 2, 2, 0, 2]
confusion_matrix(y_true, y_pred)

array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])