Torch-rl

introduction

Torch和tensorflow是目前深度学习的主要两个框架，现如今在 TF 和 torch两个方面都有非常出色的代码，但是从使用程度上来讲torch这边的RL实现，很少有一个兼顾框架和易用的代码。这里借鉴了Keras-RL的框架以及 baseline的实现思路，建立一套基于Torch版本的RL实现。

本着以最简单的最快速的最实际的方式建立一个Torch DRL的框架，节省大家学习的时间直接利用。希望大家也能加入，一起实现。

本仓库兼容CPU与GPU，目前还未实现MPI。 算法（非严格）采用PET - 8编写，并带有注释。

仓库架构

agent 包含agent 内核（与环境交互的过程）以及所有强化学习算法
common 包含记录文件、loss函数、经验池、DQN策略
model 包含所有深度网络实现
savedata 记录训练结果 run_xxxxxxxxxxx 训练实例。

目前进展

基于Keras-RL建立交互以及算法框架，并借鉴了baseline的logger文件，可以直接输出 txt、CSV、tensorboard对训练过程进行观察

算法：

DQN（包含Double DQN、 Dueling DQN）source code
DRQN source code
DDPG source code
PPO source code
Batch-PPO source code
TD3 source code

网络:

可以快速建立全联接网络、CNN、LSTM、CNN-LSTM。

example

有一些简单的训练example

RUN_Catrpole_with_DQN.py

RUN_Pendulum_with_DDPG.py

RUN_Pendulum_with_PPO.py

Name		Name	Last commit message	Last commit date
Latest commit History 67 Commits
.idea		.idea
Torch_rl		Torch_rl
.DS_Store		.DS_Store
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Torch-rl

introduction

仓库架构

目前进展

算法：

网络:

example

教程等待进一步更新。。。。。。

About

Releases

Packages

Languages

License

zachary2wave/Torch-rl

Folders and files

Latest commit

History

Repository files navigation

Torch-rl

introduction

仓库架构

目前进展

算法：

网络:

example

教程 等待进一步更新。。。。。。

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

教程等待进一步更新。。。。。。

Packages