In [1]:
def calculate_auc(y_true, y_scores):
    """
    手写实现 AUC (Area Under the Curve).
    
    :param y_true: 实际标签列表 (1 表示正例，0 表示负例)
    :param y_scores: 预测得分列表（可以是概率或模型输出的分数）
    :return: AUC 值
    """
    # 将实际标签和预测得分按预测得分降序排列
    sorted_indices = sorted(range(len(y_scores)), key=lambda i: y_scores[i], reverse=True)
    sorted_y_true = [y_true[i] for i in sorted_indices]
    
    # 计算正例和负例的数量
    num_positive = sum(sorted_y_true)
    num_negative = len(sorted_y_true) - num_positive

    # 初始化 AUC 和累加正例数
    auc = 0.0
    cum_positive_count = 0

    # 遍历排序后的标签
    for i in range(len(sorted_y_true)):
        if sorted_y_true[i] == 1:
            cum_positive_count += 1
        else:
            # 每次遇到负例，累加当前的正例数量，表示正例在负例之前的数量
            auc += cum_positive_count

    # 归一化 AUC，计算正负样本对中，正样本得分高于负样本的比例
    auc /= (num_positive * num_negative)
    return auc

# 示例用法
y_true = [0, 1, 1, 0, 1]  # 实际标签
y_scores = [0.1, 0.4, 0.35, 0.8, 0.7]  # 预测得分

auc_value = calculate_auc(y_true, y_scores)
print(f"AUC: {auc_value:.4f}")


AUC: 0.5000
