该模块用于将预测后的DDG与数据集中原本的EXP_DDG根据文件名称相匹配，并以匹配后的结果计算相关的Spearman 相关系数，Pearson 相关系数以及RMSE（均方根误差）。

In [None]:
import pandas as pd
from scipy.stats import spearmanr, pearsonr
from sklearn.metrics import mean_squared_error
import numpy as np

#  读取 CSV 文件
file_path = "ddg_predictions.csv"  # 确保路径正确
df = pd.read_csv(file_path)

#  确保 CSV 包含 `EXP_DDG` 和 `predicted_ddG` 列
if "EXP_DDG" not in df.columns or "predicted_ddG" not in df.columns:
    raise ValueError("CSV 文件缺少 'EXP_DDG' 或 'predicted_ddG' 列")

#  计算 Spearman、Pearson 相关性
spearman_corr, spearman_p = spearmanr(df["EXP_DDG"], df["predicted_ddG"])
pearson_corr, pearson_p = pearsonr(df["EXP_DDG"], df["predicted_ddG"])

#  计算 RMSE
rmse = np.sqrt(mean_squared_error(df["EXP_DDG"], df["predicted_ddG"]))

#  输出结果
print(f" Spearman 相关系数: {spearman_corr:.4f}，p 值: {spearman_p:.4e}")
print(f" Pearson 相关系数: {pearson_corr:.4f}，p 值: {pearson_p:.4e}")
print(f" RMSE（均方根误差）: {rmse:.4f}")
