Skip to content

不支持sb3-contril库的train/approx_kl指标可视化 #1663

@Crimo99

Description

@Crimo99

确认项

  • 我已确认我遇到的问题在文档中未有说明。
  • 我已在 GitHub 上搜索过类似或已有的问题。
  • 我已确认此问题并非由网络错误引起。

问题描述

在使用stable-baselines3训练PPO模型时,在Tensorboard中可以查看train/approx_kl指标,但是swanlab没有该指标。

必须的复现代码

from stable_baselines3 import PPO
from swanlab.integration.sb3 import SwanLabCallback


swanlab_callback = SwanLabCallback(
    project="my-rl-project",
    experiment_name="ppo-cartpole",
)

model = PPO("MlpPolicy", "CartPole-v1", verbose=1)

model.learn(
    total_timesteps=100_000,
    callback=swanlab_callback
)

错误信息

在swanlab可视化界面找不到train/approx_kl指标

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No fields configured for Bug.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions