Solving CartPole using Distributional RL

In this project,I implemented an agent that can learn to control a cartpole using C51 algorithm which is introduced by "A Distributional Perspective on Reinforcement Learning".Also I used double q-learning instead q-learning to keep stability during training.

graph

Final score(testing the agent)

It could achieve score of 195.19 over 100 episodes!

Run on a single episode(reward=200)

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
C51.ipynb		C51.ipynb
README.md		README.md
cartpole.gif		cartpole.gif
graph.png		graph.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Solving CartPole using Distributional RL

graph

Final score(testing the agent)

Run on a single episode(reward=200)

About

Releases

Packages

Languages

amirabbasii/Cartpole_C51

Folders and files

Latest commit

History

Repository files navigation

Solving CartPole using Distributional RL

graph

Final score(testing the agent)

Run on a single episode(reward=200)

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages