# 评估指标综述

## 分类指标
- 准确率(Accuracy)：整体预测正确的比例，类别均衡时直观。
- 精确率(Precision)：预测为正类中有多少是真正的正类，关注误报。
- 召回率(Recall)：真实正类中有多少被识别出来，关注漏报。
- F1分数(F1)：Precision 与 Recall 的调和平均，兼顾查准与查全。
- 混淆矩阵(Confusion Matrix)：统计 TP/FP/FN/TN，直观查看错误类型。
- ROC-AUC：基于概率/分数的整体性能，阈值不敏感。

多分类：使用 macro/micro/weighted 平均综合各类别表现。

## 回归指标
- MAE：平均绝对误差，鲁棒、量纲一致。
- MSE：均方误差，惩罚大误差更重，优化友好。
- RMSE：均方根误差，直观可比目标量纲。
- R²：拟合优度，衡量模型解释方差的能力。

下方给出二分类/多分类/回归的简例与计算方式。

MSE越小,模型的预测能力越强.
R2分数越接近1,模型对数据的解释能力越强.

In [4]:
#1.给出预测结果和真实结果
y_pred=[1,0,1,0,1,0,0,0,1,0]
y_true=[1,0,1,0,1,0,1,0,1,0]

import sklearn.metrics as metrics
confusion_matrix=metrics.confusion_matrix
cm=confusion_matrix(y_true,y_pred)
print(cm)
'''
混淆矩阵:
真正例TP:1 -> 预测为1,真实为1      伪反例FN:4 -> 预测为0,真实为1 
伪正例FP:1 -> 预测为1,真实为0      真反例TN:4 -> 预测为0,真实为0
'''

[[5 0]
 [1 4]]


'\n混淆矩阵:\n真正例TP:1 -> 预测为1,真实为1      伪反例FN:4 -> 预测为0,真实为1 \n伪正例FP:1 -> 预测为1,真实为0      真反例TN:4 -> 预测为0,真实为0\n'

In [None]:
import numpy as np
from sklearn.metrics import (
    accuracy_score, precision_score, recall_score, f1_score,
    roc_auc_score, confusion_matrix, classification_report,
    mean_absolute_error, mean_squared_error, r2_score
)

# 二分类示例
y_true_bin = np.array([1,0,1,0,1,0,1,0,1,0])
y_pred_bin = np.array([1,0,1,0,1,0,0,0,1,0])
y_score_bin = np.array([0.9,0.2,0.8,0.1,0.7,0.3,0.4,0.2,0.85,0.05])

print('二分类-混淆矩阵:\n', confusion_matrix(y_true_bin, y_pred_bin))
print('二分类-准确率:', accuracy_score(y_true_bin, y_pred_bin))
print('二分类-精确率:', precision_score(y_true_bin, y_pred_bin))
print('二分类-召回率:', recall_score(y_true_bin, y_pred_bin))
print('二分类-F1:', f1_score(y_true_bin, y_pred_bin))
print('二分类-ROC-AUC:', roc_auc_score(y_true_bin, y_score_bin))

# 多分类示例
y_true_mc = np.array([0,1,2,1,0,2,2,1,0,1])
y_pred_mc = np.array([0,2,2,1,0,0,2,1,0,1])
print('\n多分类-综合报告(含macro/micro/weighted):\n')
print(classification_report(y_true_mc, y_pred_mc, digits=3))

# 回归示例
y_true_reg = np.array([3.0, -0.5, 2.0, 7.0])
y_pred_reg = np.array([2.5,  0.0, 2.0, 8.0])
mae = mean_absolute_error(y_true_reg, y_pred_reg)
mse = mean_squared_error(y_true_reg, y_pred_reg)
rmse = np.sqrt(mse)
r2 = r2_score(y_true_reg, y_pred_reg)
print('回归-MAE:', mae)
print('回归-MSE:', mse)
print('回归-RMSE:', rmse)
print('回归-R²:', r2)


二分类-混淆矩阵:
 [[5 0]
 [1 4]]
二分类-准确率: 0.9
二分类-精确率: 1.0
二分类-召回率: 0.8
二分类-F1: 0.8888888888888888
二分类-ROC-AUC: 1.0

多分类-综合报告(含macro/micro/weighted):

              precision    recall  f1-score   support

           0      0.750     1.000     0.857         3
           1      1.000     0.750     0.857         4
           2      0.667     0.667     0.667         3

    accuracy                          0.800        10
   macro avg      0.806     0.806     0.794        10
weighted avg      0.825     0.800     0.800        10

回归-MAE: 0.5
回归-MSE: 0.375
回归-RMSE: 0.6123724356957945
回归-R²: 0.9486081370449679
