# 验证 Inference 模型预测的 Local Mask

本notebook用于加载保存的inference模型，创建环境，并验证模型预测的local mask是否正确。

In [1]:
import os
import sys
import numpy as np
import torch
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 设置显示格式
np.set_printoptions(precision=3, suppress=True)
torch.set_printoptions(precision=3, sci_mode=False)

# 确保当前目录在path中
if not os.getcwd() in sys.path:
    sys.path.append(os.getcwd())

In [2]:
# 导入必要的模块
from fcdl.env.chemical_env import Chemical
from fcdl.model.encoder import make_encoder
from fcdl.model.inference_ours_masking import InferenceOursMask
from fcdl.model.inference_dwm import InferenceDWM
from fcdl.utils.utils import TrainingParams, get_env, update_obs_act_spec
from fcdl.utils.replay_buffer import ReplayBuffer

## 1. 加载保存的参数和模型

In [3]:
# 设置模型路径
model_path = "data1/iwhwang/causal_rl/Chemical/9z2xtmg8/trained_models/inference_15k"
params_path = "data1/iwhwang/causal_rl/Chemical/r6aueau2/params"
env_params_path = "data1/iwhwang/causal_rl/Chemical/r6aueau2/params"

# 检查文件是否存在
assert os.path.exists(model_path), f"模型文件不存在: {model_path}"
assert os.path.exists(params_path), f"参数文件不存在: {params_path}"
assert os.path.exists(env_params_path), f"环境参数文件不存在: {env_params_path}"

In [4]:
# 加载参数
params_dict = torch.load(params_path)
params = TrainingParams(training_params_fname="policy_params.json", train=False)

# 将加载的参数字典复制到params对象
for key, value in params_dict.items():
    setattr(params, key, value)

# 加载环境参数
env_params = torch.load(env_params_path)
print(f"已加载参数和环境设置")

已加载参数和环境设置


In [5]:
# 设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
params.device = device
print(f"使用设备: {device}")

使用设备: cuda


## 2. 创建环境和推理模型

In [6]:
# 创建环境
# 强制使用单个环境，不使用向量化环境
params.env_params.num_env = 1  # 确保只使用一个环境
env = get_env(params)
print(f"环境创建完成: {params.env_params.env_name}")

# 更新观测和动作空间
update_obs_act_spec(env, params)

环境创建完成: Chemical


In [7]:
# 创建编码器和推理模型
encoder = make_encoder(params)
inference = InferenceDWM(encoder, params)

# 加载保存的模型
inference.load(model_path, device)
inference.eval()
print(f"推理模型加载完成")

[32m2025-03-13 12:30:42.090[0m | [1mINFO    [0m | [36mfcdl.model.inference_dwm[0m:[36m__init__[0m:[36m11[0m - [1mInferenceDWM[0m
[32m2025-03-13 12:30:42.092[0m | [1mINFO    [0m | [36mfcdl.model.inference_ours_masking[0m:[36m__init__[0m:[36m10[0m - [1mInferenceOursMask[0m
[32m2025-03-13 12:30:42.092[0m | [1mINFO    [0m | [36mfcdl.model.inference_ours_base[0m:[36m__init__[0m:[36m17[0m - [1mInferenceOursBase[0m
[32m2025-03-13 12:30:42.093[0m | [1mINFO    [0m | [36mfcdl.model.inference_ours_base[0m:[36minit_model[0m:[36m44[0m - [1mset up local causal model[0m
[32m2025-03-13 12:30:42.098[0m | [1mINFO    [0m | [36mfcdl.model.gumbel[0m:[36m__init__[0m:[36m153[0m - [1mSet up EMB[0m


inference loaded data1/iwhwang/causal_rl/Chemical/9z2xtmg8/trained_models/inference_15k
推理模型加载完成


## 3. 获取样本数据进行预测

In [16]:
# 创建缓冲区来收集样本
buffer = ReplayBuffer(params)
num_samples = 100
current_samples = 0

# 收集样本 - 使用单个环境
obs = env.reset()
done = False

while current_samples < num_samples:
    # 随机选择动作 - 单环境
    action = np.random.randint(0, 5 * 10, size=1)  # 根据环境动作空间调整
    next_obs, reward, done, info = env.step(action.item())
    
    # 添加到缓冲区 - 单环境
    buffer.add(obs, action, reward, next_obs, done, info, True)
    current_samples += 1
    
    # 如果回合结束，重置环境
    if done:
        obs = env.reset()
    else:
        obs = next_obs

print(f"收集了 {current_samples} 个样本")

收集了 100 个样本


In [19]:
from fcdl.utils.utils import preprocess_obs, postprocess_obs
obs, postprocess_obs(preprocess_obs(obs, params))

({'obj0': array([4]),
  'obj1': array([1]),
  'obj2': array([1]),
  'obj3': array([1]),
  'obj4': array([3]),
  'obj5': array([2]),
  'obj6': array([3]),
  'obj7': array([2]),
  'obj8': array([4]),
  'obj9': array([4]),
  'target_obj0': array([4]),
  'target_obj1': array([1]),
  'target_obj2': array([0]),
  'target_obj3': array([2]),
  'target_obj4': array([1]),
  'target_obj5': array([2]),
  'target_obj6': array([3]),
  'target_obj7': array([4]),
  'target_obj8': array([4]),
  'target_obj9': array([4])},
 {'obj0': array([4.], dtype=float32),
  'obj1': array([1.], dtype=float32),
  'obj2': array([1.], dtype=float32),
  'obj3': array([1.], dtype=float32),
  'obj4': array([3.], dtype=float32),
  'obj5': array([2.], dtype=float32),
  'obj6': array([3.], dtype=float32),
  'obj7': array([2.], dtype=float32),
  'obj8': array([4.], dtype=float32),
  'obj9': array([4.], dtype=float32),
  'target_obj0': array([4.], dtype=float32),
  'target_obj1': array([1.], dtype=float32),
  'target_obj2': ar

In [9]:
# 从缓冲区获取样本
batch_size = 13
obs_batch, actions_batch, next_obses_batch, info_batch = buffer.sample_inference(batch_size, "all")

In [15]:
obs_batch['obj0']

tensor([[3.],
        [3.],
        [2.],
        [2.],
        [4.],
        [4.],
        [4.],
        [2.],
        [4.],
        [2.],
        [3.],
        [2.],
        [4.]], device='cuda:0')

In [10]:
info_batch['lcms'].shape

torch.Size([13, 3, 10, 11])

In [18]:
info_batch['lcms'][0][0], actions_batch[0] // 5

(tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
         [1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 1.],
         [1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 1.],
         [1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1.]], device='cuda:0'),
 tensor([[6],
         [4],
         [9]], device='cuda:0'))

## 4. 验证模型预测的 Local Mask

In [83]:
# 使用推理模型进行预测
with torch.no_grad():
    # 获取模型预测的local mask
    pred_results = inference.eval_local_mask(obs_batch, actions_batch)
    
    # # 提取预测的local mask
    # if hasattr(inference, 'pred_local_mask'):
    #     pred_local_mask = inference.pred_local_mask
    #     print("获取到模型预测的local mask")
    # else:
    #     # 如果模型没有直接暴露pred_local_mask，尝试从pred_results获取
    #     if 'local_mask' in pred_results:
    #         pred_local_mask = pred_results['local_mask']
    #         print("从pred_results获取了local mask")
    #     else:
    #         print("警告：无法获取local mask预测结果")
    #         pred_local_mask = None
    
    # # 提取真实的local mask（如果有）
    # if 'gt_local_mask' in info_batch:
    #     gt_local_mask = info_batch['gt_local_mask']
    #     print("获取到真实的local mask")
    # else:
    #     print("警告：数据中没有真实的local mask")
    #     gt_local_mask = None

In [84]:
pred_results[0].squeeze().shape, info_batch['lcms'].shape

(torch.Size([13, 10, 11]), torch.Size([13, 3, 10, 11]))

In [96]:
torch.abs(pred_results[0].squeeze().cpu()[2] - info_batch['lcms'][2, 0].cpu()).sum()

tensor(21.)

In [87]:
torch.tensor([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 1.],
        [0., 0., 0., 0., 0., 1., 1., 1., 0., 1., 0.]]).abs().sum()

tensor(19.)

In [72]:
pred_results[0].squeeze().cpu()[0] - info_batch['lcms'][0, 0].cpu()

tensor([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 1.],
        [0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 1.],
        [0., 0., 0., 0., 0., 1., 1., 1., 0., 1., 0.]])

In [None]:
# 分析和可视化local mask（如果有）
if pred_local_mask is not None:
    print("预测的local mask形状:", pred_local_mask.shape)
    
    # 显示第一个样本的预测mask
    sample_idx = 0
    plt.figure(figsize=(10, 8))
    
    # 获取矩阵的维度
    mask_shape = pred_local_mask[sample_idx].shape
    
    # 创建热力图
    sns.heatmap(pred_local_mask[sample_idx].cpu().numpy(), 
                annot=True, 
                fmt=".2f", 
                cmap="YlGnBu",
                xticklabels=[f"Obj {i}" for i in range(mask_shape[1])],
                yticklabels=[f"Obj {i}" for i in range(mask_shape[0])])
    
    plt.title("预测的Local Mask (样本 #0)")
    plt.tight_layout()
    plt.show()
    
    # 如果有真实的local mask，比较准确性
    if gt_local_mask is not None:
        # 计算预测与真实值的差异
        accuracy = (pred_local_mask.round() == gt_local_mask).float().mean().item()
        print(f"Local mask准确率: {accuracy:.4f}")
        
        # 显示真实的local mask
        plt.figure(figsize=(10, 8))
        sns.heatmap(gt_local_mask[sample_idx].cpu().numpy(), 
                    annot=True, 
                    fmt=".0f", 
                    cmap="YlGnBu",
                    xticklabels=[f"Obj {j}" for j in range(mask_shape[1])],
                    yticklabels=[f"Obj {j}" for j in range(mask_shape[0])])
        
        plt.title("真实的Local Mask (样本 #0)")
        plt.tight_layout()
        plt.show()
else:
    print("没有可用的local mask信息进行可视化")

## 5. 额外的分析：检查预测结果

In [None]:
# 查看所有的预测结果
print("预测结果包含的键:")
for key in pred_results.keys():
    print(f"- {key}: {type(pred_results[key])}")

# 检查预测的状态转移
if 'pred_next_state' in pred_results:
    pred_next_state = pred_results['pred_next_state']
    true_next_state = next_obses_batch
    
    # 计算预测误差
    prediction_error = ((pred_next_state - true_next_state) ** 2).mean().item()
    print(f"\n平均预测误差 (MSE): {prediction_error:.6f}")
    
    # 显示第一个样本的预测与真实值比较
    sample_idx = 0
    
    print(f"\n样本 #{sample_idx} 的预测值与真实值比较:")
    print(f"预测下一状态:\n{pred_next_state[sample_idx]}")
    print(f"真实下一状态:\n{true_next_state[sample_idx]}")

## 6. 探索更多样本的local mask预测

In [None]:
# 可视化多个样本的local mask预测
if pred_local_mask is not None:
    n_samples = min(4, batch_size)  # 显示最多4个样本
    
    fig, axes = plt.subplots(n_samples, 1, figsize=(10, n_samples * 6))
    
    for i in range(n_samples):
        ax = axes[i] if n_samples > 1 else axes
        
        # 创建热力图
        sns.heatmap(pred_local_mask[i].cpu().numpy(), 
                    annot=True, 
                    fmt=".2f", 
                    cmap="YlGnBu",
                    ax=ax,
                    xticklabels=[f"Obj {j}" for j in range(mask_shape[1])],
                    yticklabels=[f"Obj {j}" for j in range(mask_shape[0])])
        
        ax.set_title(f"预测的Local Mask (样本 #{i})")
    
    plt.tight_layout()
    plt.show()

## 7. 保存分析结果

In [None]:
# 创建结果目录
results_dir = "local_mask_analysis_results"
os.makedirs(results_dir, exist_ok=True)

# 如果有预测的local mask，将其保存为CSV文件
if pred_local_mask is not None:
    for i in range(min(10, batch_size)):  # 保存前10个样本
        # 转换为DataFrame
        df = pd.DataFrame(pred_local_mask[i].cpu().numpy())
        df.columns = [f"Obj {j}" for j in range(df.shape[1])]
        df.index = [f"Obj {j}" for j in range(df.shape[0])]
        
        # 保存为CSV
        df.to_csv(os.path.join(results_dir, f"local_mask_sample_{i}.csv"))
    
    print(f"已保存local mask预测结果到 {results_dir} 目录")

## 8. 总结和解释

### 分析结论

我们通过以下步骤验证了推理模型预测的local mask:

1. 加载了保存的模型权重和参数
2. 重建了与训练时相同的环境
3. 收集了新的样本数据
4. 使用推理模型生成了local mask预测
5. 可视化并分析了预测结果

**Local Mask 解释**:
- Local mask矩阵中的每个元素表示行对象对列对象的影响程度
- 值接近1表示存在强影响关系，值接近0表示几乎没有影响
- 通过观察local mask，我们可以了解对象之间的因果关系结构

这些分析结果可以帮助我们理解模型是如何捕获环境中的因果关系，以及这些关系的准确性程度。