GitHub

RLalgorithms

RL agents using various reinforcement learning algorithms. Test mainly on OpenAI gym environments. Currently, both discrete and continuous action space versions are working perfectly. Continuous versions can solve Pendulum in around 1000 episodes.

Dependencies: OpenAI Gym, PyTorch

Advantage Actor Critic (A2C)

Discrete action space version
a2c.py
a3c.py
Continuous action space version
a2c_continuous.py
A3C Paper

Proximal Policy Optimization

Discrete action space version
ppo.py
Continuous action space version
ppo_continuous.py
PPO Paper

Deep Deterministic Policy Gradient

Using replay memory and ornstein uhlenbeck noise
ddpg.py
DDPG Paper

Deep Q Learning and Double Q Learning

Using replay memory and asynchronous update
dqn.py
ddqn.py
DQN Paper
DDQN Paper

Policy Gradient

Discrete action space version
pg.py
Continuous action space version
pg_continuous.py
PG Blog

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RLalgorithms

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
common		common
.gitignore		.gitignore
README.md		README.md
a2c.py		a2c.py
a2c_continuous.py		a2c_continuous.py
a3c.py		a3c.py
ddpg.py		ddpg.py
ddqn.py		ddqn.py
dqn.py		dqn.py
pg.py		pg.py
pg_continuous.py		pg_continuous.py
ppo.py		ppo.py
ppo_continuous.py		ppo_continuous.py

peiranli/RL

Folders and files

Latest commit

History

Repository files navigation

RLalgorithms

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages