# 模型评估

在本 Notebook 中，我们将：

1. 加载测试数据和已训练好的模型
2. 生成模型的预测结果
3. 计算并展示模型的准确率、分类报告和混淆矩阵
4. 保存混淆矩阵和分类报告的图片

这是模型评估的最后一步，帮助我们了解模型在测试数据上的性能。


In [None]:
# 导入必要的库
import os
import pandas as pd
import joblib
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import matplotlib.pyplot as plt
import seaborn as sns

# 定义前 30 个重要特征的列表
TOP_30_FEATURES = [
    'Packet Length Variance', 'Packet Length Std', 'Max Packet Length', 'Subflow Bwd Bytes',
    'Avg Bwd Segment Size', 'Average Packet Size', 'Packet Length Mean', 'Bwd Packet Length Max',
    'Total Length of Bwd Packets', 'Bwd Packet Length Std', 'Init_Win_bytes_backward',
    'Flow Bytes/s', 'Min Packet Length', 'Bwd Packet Length Mean', 'Flow IAT Max',
    'Total Length of Fwd Packets', 'Fwd Packet Length Mean', 'Flow Duration', 'Flow IAT Min',
    'Init_Win_bytes_forward', 'act_data_pkt_fwd', 'Total Fwd Packets', 'Fwd Header Length',
    'Subflow Fwd Bytes', 'ACK Flag Count', 'Avg Fwd Segment Size', 'Flow IAT Std',
    'Bwd IAT Mean', 'Fwd IAT Min', 'Idle Max'
]


### 单元格解释：
在此单元格中，我们导入了需要的库，包括 `pandas`、`joblib`、`matplotlib`、`seaborn` 以及 `sklearn` 的评估指标工具。`TOP_30_FEATURES` 列表包含前 30 个重要特征，我们将在加载测试数据时使用这些特征进行模型评估。


In [None]:
# 加载测试数据和训练好的模型
data_dir = '../data/processed'  # 数据目录
model_path = '../models/random_forest_model_top30.pkl'  # 已训练好的模型路径
output_dir = '../results'  # 输出结果保存目录

# 加载测试数据并选择前 30 个特征
X_test = pd.read_csv(os.path.join(data_dir, 'X_test.csv'))[TOP_30_FEATURES]
y_test = pd.read_csv(os.path.join(data_dir, 'y_test.csv')).values.ravel()

# 加载训练好的模型
model = joblib.load(model_path)


### 单元格解释：
这个单元格加载了测试数据和训练好的随机森林模型。我们从 `X_test.csv` 中选择前 30 个重要特征的数据，并加载 `y_test.csv` 作为测试集标签。随后，我们使用 `joblib.load` 函数加载预先保存的模型文件。


In [None]:
# 生成预测结果并计算准确率、分类报告和混淆矩阵
y_pred = model.predict(X_test)  # 生成预测结果
accuracy = accuracy_score(y_test, y_pred)  # 计算准确率
report = classification_report(y_test, y_pred)  # 生成分类报告
cm = confusion_matrix(y_test, y_pred)  # 生成混淆矩阵


### 单元格解释：
在此单元格中，我们使用训练好的模型对 `X_test` 进行预测，并生成预测结果 `y_pred`。然后，我们计算模型的准确率 `accuracy`，生成分类报告 `report` 和混淆矩阵 `cm`。这些评估指标帮助我们全面了解模型在测试集上的表现。


In [None]:
# 保存混淆矩阵和分类报告图片
os.makedirs(output_dir, exist_ok=True)  # 创建结果保存目录（若不存在）

# 绘制混淆矩阵
plt.figure(figsize=(10, 7))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.savefig(os.path.join(output_dir, 'confusion_matrix.png'))  # 保存混淆矩阵图片
plt.show()

# 绘制分类报告
plt.figure(figsize=(10, 7))
plt.text(0.01, 0.05, str(report), fontproperties='monospace')  # 将分类报告作为文本显示
plt.axis('off')
plt.title('Classification Report')
plt.savefig(os.path.join(output_dir, 'classification_report.png'))  # 保存分类报告图片
plt.show()

print("模型评估完成")


### 单元格解释：
这个单元格保存并展示混淆矩阵和分类报告图片：

1. 使用 `seaborn` 库的 `heatmap` 函数绘制混淆矩阵，并保存为 `confusion_matrix.png`。
2. 将分类报告转换为文本格式显示，并保存为 `classification_report.png`。

通过可视化这些结果，我们可以更直观地评估模型的性能。最后打印 "模型评估完成" 以确认整个流程的结束。
