# 分类评估指标学习目标
- 知道混淆矩阵的概念
- 掌握精准率、召回率、AUC、F1-score指标计算方法

---



# 1、什么是混淆矩阵？
概念：是一个评估分类模型性能的工具，其中包含四个部分
- 真正例（TP ：True Positive）
- 真反例（TN：True Negative）
- 伪正例（FP：False Positive）
- 伪反例（FN：False Negative）

# 2、什么是精准率（Precision）？

![精准率公式](../img/精准率公式.png)

概念：是一个评估分类模型性能的指标，主要衡量模型预测为正例中实际正例的比例


# 3、什么是召回率（Recall）？

![召回率公式](../img/召回率公式.png)

概念：衡量模型识别正样本数量所占实际样本数量多比率，实际上召回率关注的是模型捕捉到所有应该被识别出来的正样本的能力

# 4、什么是F1-score？

![f1-score](../img/f1-score.png)

概念：衡量尔分类模型的精准性，是精确度（Precision）和召回率（Recall）的调和平均数


# 5、什么是ROC曲线？

![ROC曲线图](../img/ROC曲线图.png)

概念：接受者操作特征曲线（Receiver operating Characteristic Curve）是一种评估分类模型的图表，绘制是真正例率（True Positive Rate）和假正例率（False Positive Rate）之间关系

# 6、什么是AUC指标？

概念：是评估分类模型性能指标，模型预测的概率只和实际标签的一致性，通常是绘制ROC曲线并计算其下面积得到

# 7、分类评估API介绍

```python
'''
    函数介绍：分类评估报告
    y_true：真实目标值
    y_pred：估计器预测目标值
    labels:指定类别对应的数字
    target_names：目标类别名称
    return：每个类别精确率与召回率
'''
from sklearn.metrics import classification_report 
classification_report(y_true, y_pred, labels=[], target_names=None)

'''
    函数介绍：计算ROC曲线面积，即AUC值
    y_true：每个样本的真实类别，必须为0(反例),1(正例)标记
    y_score：预测得分，可以是正例的估计概率、置信值或者分类器方法的返回值
'''
from sklearn.metrics import roc_auc_score 
metrics.roc_auc_score(y_true, y_score)

```
# 小结：
- 当样本分布不均衡，使用准确率（accuracy_score）进行模型评估不能反映模型真是效果
- 通过混淆矩阵可以计算出精准率、召回率、F1-Score等指标
- 通过ROC曲线可以计算出AUC指标
