Soft Actor Critic 算法 pytorch 实现
已在ubuntu20.04,22.04上测试过,复现步骤:
step1 :
pip install -r requirements.txt
step2(optional):(需注册wandb账号)
python train_sac.py --track
step3(不需要wandb账号):
python train_sac.py
训练好的模型会保存到checkpoint目录,如果想用gym的mujoco环境请参考我知乎上的两篇文章如何在ubuntu20.04上安装mujoco,以及如何在ubuntu20.04上配置pytorch GPU版本。