# SHAP - 模型解释性与可解释性教程

欢迎来到 SHAP 教程！在机器学习中，特别是在高风险决策领域（如医疗、金融），仅仅得到一个预测结果往往是不够的，理解模型为什么会做出这样的预测（模型的可解释性）变得越来越重要。SHAP (SHapley Additive exPlanations) 是一个基于博弈论中 Shapley 值理论的强大框架，旨在提供一种统一的方法来解释任何机器学习模型的输出。

**为什么需要模型解释性 (XAI - Explainable AI)？**

1.  **建立信任**: 用户和利益相关者需要理解模型的决策依据。
2.  **调试模型**: 发现模型可能存在的偏见、错误或意想不到的行为。
3.  **满足合规性**: 某些法规（如 GDPR）要求对自动化决策提供解释。
4.  **改进模型**: 通过理解特征的重要性，可以指导特征工程和模型选择。
5.  **科学发现**: 在科学研究中，理解模型学到了什么模式本身就很有价值。

**SHAP 的核心思想：**

*   将模型的每个预测视为一个“合作博弈”的结果，其中每个输入特征都是一个“玩家”。
*   SHAP 值量化了每个特征（玩家）对特定预测结果（相对于所有特征的平均预测或基线预测）的**贡献度**。
*   SHAP 值具有良好的理论性质（如一致性、加性），使得解释更加可靠。

**本教程将涵盖 SHAP 库的核心用法：**

1.  安装 SHAP
2.  SHAP 值的基本概念
3.  不同类型的 Explainer (TreeExplainer, KernelExplainer, DeepExplainer - 简介)
4.  计算 SHAP 值
5.  可视化解释 (`force_plot`, `summary_plot`, `dependence_plot`)
6.  解释 Scikit-learn 模型示例 (树模型、线性模型)
7.  (简介) 解释深度学习模型

## 1. 安装 SHAP

```bash
pip install shap

# 示例中可能用到的其他库
pip install numpy pandas scikit-learn matplotlib ipython
# 对于深度学习示例 (可选)
# pip install torch torchvision # or tensorflow
```
**注意**: `DeepExplainer` 可能对特定版本的 TensorFlow 或 PyTorch 有要求。

In [None]:
import shap
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import fetch_california_housing, load_breast_cancer # 使用不同的数据集
import matplotlib.pyplot as plt

# 让 SHAP 的 Plot 在 Notebook 中正确显示
shap.initjs()

print(f"SHAP version: {shap.__version__}")

# --- 准备数据 (乳腺癌数据集 - 分类) ---
cancer = load_breast_cancer()
X_cancer = pd.DataFrame(cancer.data, columns=cancer.feature_names)
y_cancer = cancer.target # 0: malignant, 1: benign

X_cancer_train, X_cancer_test, y_cancer_train, y_cancer_test = train_test_split(
    X_cancer, y_cancer, test_size=0.2, random_state=42
)

print(f"Breast Cancer dataset loaded: X_train shape={X_cancer_train.shape}, X_test shape={X_cancer_test.shape}")
print("Sample features:")
print(X_cancer_train.head(2))

## 2. SHAP 值的基本概念

对于模型的一个特定预测 `f(x)`，SHAP 值 `phi_i` 表示第 `i` 个特征对该预测**相对于基线预测 `E[f(X)]` (所有样本的平均预测值) 的贡献**。

它们满足**加性 (Additivity)** 的重要性质：
`f(x) = E[f(X)] + phi_1 + phi_2 + ... + phi_n`
其中 `n` 是特征的数量。

这意味着，一个预测值可以分解为基线值加上每个特征的贡献值。
*   **正的 SHAP 值**: 表示该特征将预测值**推高** (相对于基线)。
*   **负的 SHAP 值**: 表示该特征将预测值**推低** (相对于基线)。

## 3. 不同类型的 Explainer

SHAP 库提供了针对不同类型模型的优化 Explainer：

*   **`shap.TreeExplainer`**: 
    *   用于基于树的模型（如 Scikit-learn 的 `RandomForest`, `GradientBoosting`, XGBoost, LightGBM, CatBoost）。
    *   利用树的结构高效精确地计算 SHAP 值。
    *   **推荐用于支持的树模型**。
*   **`shap.KernelExplainer`**: 
    *   模型无关的方法，理论上可以解释任何返回数值输出的函数（黑盒模型）。
    *   通过对输入特征进行扰动并观察模型输出的变化来近似计算 SHAP 值。
    *   计算成本较高，特别是对于高维数据。
    *   需要一个**背景数据集 (background dataset)** 来表示特征的基线分布。
*   **`shap.DeepExplainer`**: 
    *   专门用于解释深度学习模型 (PyTorch, TensorFlow)。
    *   结合了 DeepLIFT 和 Shapley 值的思想。
    *   通常比 `KernelExplainer` 更快，但对模型架构和激活函数有一定要求。
*   **`shap.LinearExplainer`**: 
    *   用于解释线性模型，SHAP 值直接与特征系数相关。
*   **其他**: 还有针对特定场景的 Explainer，如 `PermutationExplainer`。

## 4. 计算 SHAP 值

基本流程：
1.  训练你的机器学习模型。
2.  根据模型类型选择并创建合适的 SHAP `Explainer` 实例。
3.  调用 `explainer.shap_values(X_to_explain)` 计算 SHAP 值。
    *   `X_to_explain`: 你想要解释其预测的数据样本（通常是测试集或特定实例）。
    *   返回的 `shap_values` 的结构取决于模型输出：
        *   对于回归或二分类（通常解释正类的概率），返回一个数组 `[n_samples, n_features]`。
        *   对于多分类，通常返回一个列表，列表中的每个元素是对应一个类别的 SHAP 值数组 `[n_samples, n_features]`。

In [None]:
print("--- Calculating SHAP values for RandomForestClassifier ---")

# 1. 训练模型 (Random Forest)
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
rf_model.fit(X_cancer_train, y_cancer_train)
print("RandomForestClassifier trained.")

# 2. 创建 TreeExplainer
explainer_rf = shap.TreeExplainer(rf_model)
print("TreeExplainer created.")

# 3. 计算测试集的 SHAP 值
# 对于二分类，TreeExplainer 通常返回一个列表 [shap_values_class_0, shap_values_class_1]
# 或者只返回正类 (类别 1) 的 SHAP 值，取决于模型的输出结构和 explainer 配置
# Let's compute for the test set
shap_values_rf = explainer_rf.shap_values(X_cancer_test)

# 检查返回的 shap_values 结构
if isinstance(shap_values_rf, list):
    print(f"SHAP values returned as a list of length: {len(shap_values_rf)}")
    print(f"Shape of SHAP values for class 0: {shap_values_rf[0].shape}") # (n_samples, n_features)
    print(f"Shape of SHAP values for class 1: {shap_values_rf[1].shape}") # (n_samples, n_features)
    # 我们通常关注解释正类 (Benign, 类别 1) 的 SHAP 值
    shap_values_rf_pos_class = shap_values_rf[1]
else:
    print(f"Shape of SHAP values (likely for positive class): {shap_values_rf.shape}")
    shap_values_rf_pos_class = shap_values_rf

# explainer 对象还有一个 expected_value 属性，代表基线预测值
# 对于二分类，它通常也是一个列表 [expected_value_class_0, expected_value_class_1]
if isinstance(explainer_rf.expected_value, (list, np.ndarray)) and len(explainer_rf.expected_value) > 1:
     print(f"Explainer expected value (base prediction for class 1): {explainer_rf.expected_value[1]:.4f}")
     base_value_rf = explainer_rf.expected_value[1]
else:
     print(f"Explainer expected value (base prediction): {explainer_rf.expected_value:.4f}")
     base_value_rf = explainer_rf.expected_value

# 验证加性原理 (对第一个测试样本)
first_sample_prediction_proba = rf_model.predict_proba(X_cancer_test.iloc[[0]])[0, 1] # 预测为正类(1)的概率
sum_shap_values_first_sample = np.sum(shap_values_rf_pos_class[0, :])
print(f"\nVerifying additivity for first test sample:")
# 注意：TreeExplainer 的输出通常是对 log-odds 或其他内部表示的解释，不直接等于概率。
# 需要检查 explainer 的 `model_output` 属性或文档来确定解释的是哪个输出。
# 这里我们仅展示 SHAP 值求和与基线的关系，与直接的概率输出可能需要转换。
# print(f"  Prediction probability (class 1): {first_sample_prediction_proba:.4f}")
print(f"  Base value (expected output): {base_value_rf:.4f}")
print(f"  Sum of SHAP values for class 1: {sum_shap_values_first_sample:.4f}")
print(f"  Base value + Sum of SHAP values: {base_value_rf + sum_shap_values_first_sample:.4f}")
# 这个值应该接近模型内部对于该样本的原始输出（例如 log-odds），不一定是概率。


## 5. 可视化解释

SHAP 提供了多种强大的可视化工具来帮助理解 SHAP 值。

*   **`shap.force_plot(base_value, shap_values[sample_index], features[sample_index])`**: 
    *   解释**单个预测**。
    *   显示基线值、每个特征如何将预测推高（红色）或推低（蓝色）以及最终的预测值。
*   **`shap.force_plot(base_value, shap_values, features)`**: 
    *   解释**多个预测** (通常是整个数据集)。
    *   生成一个可交互的图，可以将样本按相似的 SHAP 值模式聚类。
*   **`shap.summary_plot(shap_values, features, plot_type="bar"|"dot"|"violin")`**: 
    *   展示**全局特征重要性**。
    *   `plot_type="bar"`: 显示每个特征 SHAP 值绝对值的平均值（总体重要性）。
    *   `plot_type="dot"` (默认) 或 `"violin"`: 显示每个特征的 SHAP 值分布。点根据特征值着色（通常高值红色，低值蓝色），可以揭示特征值与预测贡献方向的关系。
*   **`shap.dependence_plot(feature_index, shap_values, features, interaction_index="auto")`**: 
    *   展示特定特征的值如何影响其自身的 SHAP 值。
    *   可以自动或手动选择另一个特征进行着色，以揭示潜在的**交互效应 (interaction effects)**。

In [None]:
print("--- SHAP Visualizations (Random Forest) ---")

# --- 1. Force Plot (Single Prediction) ---
# 解释测试集中第一个样本的预测 (解释类别 1 - Benign)
sample_index = 0
print(f"\nExplaining prediction for test sample {sample_index} (Class 1 - Benign):")
shap.force_plot(base_value_rf, 
                shap_values_rf_pos_class[sample_index, :], 
                X_cancer_test.iloc[sample_index, :],
                matplotlib=True) # Use matplotlib=True for static plot in some environments
# plt.show() # Might be needed if matplotlib=True and plot doesn't show
# 交互式版本通常直接在 Notebook 输出中显示

# --- 2. Force Plot (Multiple Predictions) ---
# 解释测试集中前 N 个样本 (可能需要滚动查看)
# print("\nExplaining multiple predictions (interactive plot):")
# shap.force_plot(base_value_rf, shap_values_rf_pos_class[:50,:], X_cancer_test.iloc[:50,:])
# ^^ This plot is interactive and might be large, commented out by default

# --- 3. Summary Plot (Global Feature Importance) ---
print("\nShowing Summary Plot (dot plot):")
shap.summary_plot(shap_values_rf_pos_class, X_cancer_test, plot_type="dot")
# X轴: SHAP 值 (对类别 1 的贡献)
# Y轴: 特征名称 (按重要性排序)
# 颜色: 特征值的高低 (红高蓝低)

print("\nShowing Summary Plot (bar plot):")
shap.summary_plot(shap_values_rf_pos_class, X_cancer_test, plot_type="bar")
# 显示平均绝对 SHAP 值

# --- 4. Dependence Plot (Feature Dependence & Interaction) ---
# 查看 'worst perimeter' 特征如何影响 SHAP 值，并自动选择交互特征着色
feature_to_plot = "worst perimeter"
print(f"\nShowing Dependence Plot for '{feature_to_plot}':")
shap.dependence_plot(feature_to_plot, 
                     shap_values_rf_pos_class, 
                     X_cancer_test, 
                     interaction_index="auto") # 自动寻找交互特征
# X轴: 特征 'worst perimeter' 的值
# Y轴: 该特征的 SHAP 值
# 颜色: 交互特征的值

## 6. 解释 Scikit-learn 模型示例 (其他类型)

SHAP 可以用于解释多种模型。

In [None]:
print("\n--- Explaining Logistic Regression ---")

# 1. 训练模型 (需要标准化特征)
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_cancer_train_scaled = scaler.fit_transform(X_cancer_train)
X_cancer_test_scaled = scaler.transform(X_cancer_test)

lr_model = LogisticRegression(max_iter=5000, random_state=42)
lr_model.fit(X_cancer_train_scaled, y_cancer_train)
print("LogisticRegression trained.")

# 2. 创建 Explainer
# a) LinearExplainer (最适合线性模型)
# explainer_lr = shap.LinearExplainer(lr_model, X_cancer_train_scaled)

# b) KernelExplainer (模型无关，较慢，需要背景数据)
# 通常从训练集中采样一部分作为背景数据 (e.g., k-means 聚类中心或随机样本)
# background_data = shap.sample(X_cancer_train_scaled, 50) # Sample 50 points
# 或者使用 kmeans
background_data_kmeans = shap.kmeans(X_cancer_train_scaled, 10) # Use 10 k-means centroids
explainer_lr_kernel = shap.KernelExplainer(lr_model.predict_proba, background_data_kmeans)
print("KernelExplainer created for Logistic Regression.")

# 3. 计算 SHAP 值 (解释类别 1 的概率)
# KernelExplainer 可能需要较长时间，我们只解释前几个样本
num_samples_to_explain = 10
print(f"Calculating SHAP values for first {num_samples_to_explain} test samples using KernelExplainer...")
shap_values_lr_kernel = explainer_lr_kernel.shap_values(X_cancer_test_scaled[:num_samples_to_explain])
print("SHAP values calculated.")

# KernelExplainer for predict_proba returns list [class0_shap, class1_shap]
shap_values_lr_kernel_pos_class = shap_values_lr_kernel[1]
base_value_lr_kernel = explainer_lr_kernel.expected_value[1]

# 4. 可视化 (单个样本)
print(f"\nExplaining prediction for test sample 0 (Logistic Regression - Kernel):")
shap.force_plot(base_value_lr_kernel, 
                shap_values_lr_kernel_pos_class[0,:],
                X_cancer_test.iloc[0,:], # Use original feature names for display
                matplotlib=True)
# plt.show()

## 7. (简介) 解释深度学习模型

对于 PyTorch 和 TensorFlow 模型，可以使用 `shap.DeepExplainer`。

**基本流程 (PyTorch 示例):**
1.  训练你的 PyTorch 模型。
2.  选择一个背景数据集 (通常是训练集的一个子集，或代表性的样本)。
3.  创建 `shap.DeepExplainer(model, background_data_tensor)`。
4.  计算 SHAP 值: `shap_values = explainer.shap_values(input_data_tensor)`。
5.  使用 SHAP 可视化工具。

```python
# import torch
# import shap

# # 假设 model 是你训练好的 PyTorch 模型
# # 假设 background_data 是一个 PyTorch 张量
# # 假设 input_data 是你想解释的输入张量

# model.eval()
# background_data = background_data.to(device)
# input_data = input_data.to(device)

# explainer = shap.DeepExplainer(model, background_data)
# shap_values = explainer.shap_values(input_data)

# # shap_values 的结构取决于模型输出层
# # 例如，对于多分类，可能是 list of tensors [num_classes, num_samples, *input_shape]

# # 可视化 (可能需要将 shap_values 和 input_data 移回 CPU 并转为 NumPy)
# shap.summary_plot(shap_values[class_index].cpu().numpy(), input_data.cpu().numpy())
```
**注意**: `DeepExplainer` 的细节和行为可能因模型架构、激活函数和 PyTorch/TensorFlow 版本而异，需要仔细阅读 SHAP 文档。

## 总结

SHAP 提供了一个强大且理论基础扎实的框架来解释机器学习模型的预测。通过计算和可视化 SHAP 值，我们可以深入了解每个特征对单个预测和模型整体行为的贡献。

**关键要点：**
*   SHAP 值量化了每个特征对预测结果（相对于基线）的贡献。
*   选择合适的 Explainer (`TreeExplainer`, `KernelExplainer`, `DeepExplainer`等) 取决于你的模型类型。
*   `force_plot` 用于解释单个或多个预测。
*   `summary_plot` 用于展示全局特征重要性和特征值与贡献的关系。
*   `dependence_plot` 用于探索特征依赖性和交互效应。
*   模型可解释性对于建立信任、调试模型和满足合规性要求至关重要。

熟练使用 SHAP 可以极大地增强你理解和沟通机器学习模型的能力。