# 练习1：从零实现评估指标

## 练习目标

通过从零实现常用的分类和回归评估指标，深入理解评估指标的计算原理。

## 任务说明

本练习要求你从零实现以下评估指标（不能使用scikit-learn的评估函数）：

1. 分类评估指标：准确率、精确率、召回率、F1分数、混淆矩阵
2. 回归评估指标：MSE、RMSE、MAE、R²

## 提示

- 使用NumPy进行数值计算
- 注意处理边界情况（如除零错误）
- 确保实现的指标与scikit-learn的结果一致


In [None]:
# 导入必要的库
import numpy as np
from sklearn.datasets import make_classification, make_regression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression, LinearRegression

# 设置随机种子
np.random.seed(42)

print("环境准备完成！")


## 任务1：实现分类评估指标

### 1.1 实现准确率（Accuracy）

**要求**：实现准确率计算函数

**公式**：$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$

**提示**：准确率 = 正确预测的样本数 / 总样本数


In [None]:
def accuracy(y_true, y_pred):
    """
    计算分类准确率
    参数:
        y_true: 真实标签，形状为(n,)
        y_pred: 预测标签，形状为(n,)
    返回:
        float: 准确率值
    """
    # TODO: 在这里实现你的代码
    # 提示：使用NumPy比较y_true和y_pred，计算正确预测的比例
    pass

# 测试数据
X, y = make_classification(n_samples=1000, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LogisticRegression(random_state=42)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

# 测试你的实现
# acc = accuracy(y_test, y_pred)
# print(f"准确率: {acc:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import accuracy_score
# acc_sklearn = accuracy_score(y_test, y_pred)
# print(f"sklearn准确率: {acc_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(acc, acc_sklearn)}")


### 1.2 实现混淆矩阵

**要求**：实现混淆矩阵计算函数

**提示**：
- 混淆矩阵是一个2x2矩阵（对于二分类问题）
- 行表示真实标签，列表示预测标签
- 矩阵元素：[[TN, FP], [FN, TP]]


In [None]:
def confusion_matrix_custom(y_true, y_pred):
    """
    计算混淆矩阵
    参数:
        y_true: 真实标签
        y_pred: 预测标签
    返回:
        numpy.ndarray: 混淆矩阵，形状为(2, 2)
        格式：[[TN, FP], [FN, TP]]
    """
    # TODO: 在这里实现你的代码
    # 提示：
    # 1. 计算TP（真正例）：y_true==1 且 y_pred==1
    # 2. 计算TN（真负例）：y_true==0 且 y_pred==0
    # 3. 计算FP（假正例）：y_true==0 且 y_pred==1
    # 4. 计算FN（假负例）：y_true==1 且 y_pred==0
    pass

# 测试你的实现
# cm = confusion_matrix_custom(y_test, y_pred)
# print("混淆矩阵:")
# print(cm)

# 验证：与sklearn的结果对比
# from sklearn.metrics import confusion_matrix
# cm_sklearn = confusion_matrix(y_test, y_pred)
# print("sklearn混淆矩阵:")
# print(cm_sklearn)
# print(f"结果是否一致: {np.array_equal(cm, cm_sklearn)}")


### 1.3 实现精确率（Precision）

**要求**：实现精确率计算函数

**公式**：$Precision = \frac{TP}{TP + FP}$

**提示**：精确率 = 真正例 / (真正例 + 假正例)


In [None]:
def precision(y_true, y_pred, pos_label=1):
    """
    计算精确率（针对正类）
    参数:
        y_true: 真实标签
        y_pred: 预测标签
        pos_label: 正类标签，默认为1
    返回:
        float: 精确率值
    """
    # TODO: 在这里实现你的代码
    # 提示：可以使用上面实现的混淆矩阵函数
    pass

# 测试你的实现
# prec = precision(y_test, y_pred)
# print(f"精确率: {prec:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import precision_score
# prec_sklearn = precision_score(y_test, y_pred)
# print(f"sklearn精确率: {prec_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(prec, prec_sklearn)}")


### 1.4 实现召回率（Recall）

**要求**：实现召回率计算函数

**公式**：$Recall = \frac{TP}{TP + FN}$

**提示**：召回率 = 真正例 / (真正例 + 假负例)


In [None]:
def recall(y_true, y_pred, pos_label=1):
    """
    计算召回率（针对正类）
    参数:
        y_true: 真实标签
        y_pred: 预测标签
        pos_label: 正类标签，默认为1
    返回:
        float: 召回率值
    """
    # TODO: 在这里实现你的代码
    pass

# 测试你的实现
# rec = recall(y_test, y_pred)
# print(f"召回率: {rec:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import recall_score
# rec_sklearn = recall_score(y_test, y_pred)
# print(f"sklearn召回率: {rec_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(rec, rec_sklearn)}")


### 1.5 实现F1分数

**要求**：实现F1分数计算函数

**公式**：$F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}$

**提示**：F1分数是精确率和召回率的调和平均


In [None]:
def f1_score_custom(y_true, y_pred, pos_label=1):
    """
    计算F1分数
    参数:
        y_true: 真实标签
        y_pred: 预测标签
        pos_label: 正类标签，默认为1
    返回:
        float: F1分数值
    """
    # TODO: 在这里实现你的代码
    # 提示：使用上面实现的精确率和召回率函数
    pass

# 测试你的实现
# f1 = f1_score_custom(y_test, y_pred)
# print(f"F1分数: {f1:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import f1_score
# f1_sklearn = f1_score(y_test, y_pred)
# print(f"sklearn F1分数: {f1_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(f1, f1_sklearn)}")


## 任务2：实现回归评估指标

### 2.1 实现MSE（均方误差）

**要求**：实现MSE计算函数

**公式**：$MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$


In [None]:
# 生成回归数据
X_reg, y_reg = make_regression(n_samples=1000, n_features=10, random_state=42)
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(
    X_reg, y_reg, test_size=0.2, random_state=42
)

model_reg = LinearRegression()
model_reg.fit(X_train_reg, y_train_reg)
y_pred_reg = model_reg.predict(X_test_reg)

def mse(y_true, y_pred):
    """
    计算均方误差（MSE）
    参数:
        y_true: 真实值，形状为(n,)
        y_pred: 预测值，形状为(n,)
    返回:
        float: MSE值
    """
    # TODO: 在这里实现你的代码
    # 提示：计算预测值与真实值差的平方的平均值
    pass

# 测试你的实现
# mse_value = mse(y_test_reg, y_pred_reg)
# print(f"MSE: {mse_value:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import mean_squared_error
# mse_sklearn = mean_squared_error(y_test_reg, y_pred_reg)
# print(f"sklearn MSE: {mse_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(mse_value, mse_sklearn)}")


### 2.2 实现RMSE（均方根误差）

**要求**：实现RMSE计算函数

**公式**：$RMSE = \sqrt{MSE}$


In [None]:
def rmse(y_true, y_pred):
    """
    计算均方根误差（RMSE）
    参数:
        y_true: 真实值
        y_pred: 预测值
    返回:
        float: RMSE值
    """
    # TODO: 在这里实现你的代码
    # 提示：RMSE是MSE的平方根
    pass

# 测试你的实现
# rmse_value = rmse(y_test_reg, y_pred_reg)
# print(f"RMSE: {rmse_value:.4f}")

# 验证：与手动计算的结果对比
# mse_value = mse(y_test_reg, y_pred_reg)
# rmse_manual = np.sqrt(mse_value)
# print(f"手动计算RMSE: {rmse_manual:.4f}")
# print(f"结果是否一致: {np.isclose(rmse_value, rmse_manual)}")


### 2.3 实现MAE（平均绝对误差）

**要求**：实现MAE计算函数

**公式**：$MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|$


In [None]:
def mae(y_true, y_pred):
    """
    计算平均绝对误差（MAE）
    参数:
        y_true: 真实值
        y_pred: 预测值
    返回:
        float: MAE值
    """
    # TODO: 在这里实现你的代码
    # 提示：计算预测值与真实值差的绝对值的平均值
    pass

# 测试你的实现
# mae_value = mae(y_test_reg, y_pred_reg)
# print(f"MAE: {mae_value:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import mean_absolute_error
# mae_sklearn = mean_absolute_error(y_test_reg, y_pred_reg)
# print(f"sklearn MAE: {mae_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(mae_value, mae_sklearn)}")


### 2.4 实现R²（决定系数）

**要求**：实现R²计算函数

**公式**：$R^2 = 1 - \frac{\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}{\sum_{i=1}^{n}(y_i - \bar{y})^2}$

其中 $\bar{y} = \frac{1}{n}\sum_{i=1}^{n}y_i$ 是真实值的均值


In [None]:
def r2_score_custom(y_true, y_pred):
    """
    计算决定系数（R²）
    参数:
        y_true: 真实值
        y_pred: 预测值
    返回:
        float: R²值
    """
    # TODO: 在这里实现你的代码
    # 提示：
    # 1. 计算残差平方和（SS_res）
    # 2. 计算总平方和（SS_tot）
    # 3. R² = 1 - SS_res / SS_tot
    pass

# 测试你的实现
# r2_value = r2_score_custom(y_test_reg, y_pred_reg)
# print(f"R²: {r2_value:.4f}")

# 验证：与sklearn的结果对比
# from sklearn.metrics import r2_score
# r2_sklearn = r2_score(y_test_reg, y_pred_reg)
# print(f"sklearn R²: {r2_sklearn:.4f}")
# print(f"结果是否一致: {np.isclose(r2_value, r2_sklearn)}")


## 总结

完成本练习后，你应该：

1. ✅ 理解各种评估指标的计算原理
2. ✅ 能够从零实现评估指标
3. ✅ 验证实现的正确性

### 思考问题

1. 为什么需要多种评估指标？
2. 在什么情况下应该使用精确率而不是召回率？
3. MSE和MAE的区别是什么？各有什么优缺点？
4. R²为负数意味着什么？
