RDPG-Biped Code for 'Recurrent Network-based Deterministic Policy Gradient for Solving Bipedal Walking Challenge on Rugged Terrains'

https://arxiv.org/abs/1710.02896

Environment: Miniconda is recommended as pybox does not support pip

python 2.7: print format might become an issue with python 3 but other than that, is fine
numpy, scipy, matplotlib: up-to-date
tensorflow 1.2 : higher versions are fine and TF-GPU compatible
OpenAI gym and pybox: for gym, download the files in 'gym-files.tar.gz' and replace 'bipedal_walk.py(many other versions are provided in the tar file)' and 'time_limit.py' into the original files

Run default model (Our RDPG)

learn and run: run 'gym_ddpg.py' - be sure to make proper 'checkpoint' files for both 'saved_' folders and 'gym_ddpg' folder inside 'results' directory
record: run 'tester_r.py'
display: run 'display.py' in 'results' directory

Other models

DDPG(Feedforward network-based DPG): d3_9
RDPG with parameter noise: r17_41_opt0
Our RDPG with experience injection: TBA

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
results		results
saved_actor_networks		saved_actor_networks
saved_critic_networks		saved_critic_networks
README.md		README.md
actor_network.py		actor_network.py
critic_network.py		critic_network.py
d3_9.tar.gz		d3_9.tar.gz
ddpg.py		ddpg.py
gym-files.tar.gz		gym-files.tar.gz
gym_ddpg.py		gym_ddpg.py
ou_noise.py		ou_noise.py
r17_41_opt0.tar.gz		r17_41_opt0.tar.gz
replay_buffer_epi.py		replay_buffer_epi.py
tester_r.py		tester_r.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

results

results

saved_actor_networks

saved_actor_networks

saved_critic_networks

saved_critic_networks

README.md

README.md

actor_network.py

actor_network.py

critic_network.py

critic_network.py

d3_9.tar.gz

d3_9.tar.gz

ddpg.py

ddpg.py

gym-files.tar.gz

gym-files.tar.gz

gym_ddpg.py

gym_ddpg.py

ou_noise.py

ou_noise.py

r17_41_opt0.tar.gz

r17_41_opt0.tar.gz

replay_buffer_epi.py

replay_buffer_epi.py

tester_r.py

tester_r.py

Repository files navigation

RDPG-Biped Code for 'Recurrent Network-based Deterministic Policy Gradient for Solving Bipedal Walking Challenge on Rugged Terrains'

About

Releases

Packages

Languages

sdr2002/RDPG-Biped

Folders and files

Latest commit

History

Repository files navigation

RDPG-Biped Code for 'Recurrent Network-based Deterministic Policy Gradient for Solving Bipedal Walking Challenge on Rugged Terrains'

About

Resources

Stars

Watchers

Forks

Languages