Direct Policy Gradients - RL with A* sampling and direct optimization

Pytorch impelentation for MiniGrid and DeepSea experiments from the paper "Direct Policy Gradients: Direct Optimization of Policies in Discrete Action Spaces"

Installation

clone repository, create new virtualenv and install dependencies:

git clone https://github.com/GuyLor/reinforcement_learning.git
python3 -m venv direct_rl
source direct_rl/bin/activate
cd reinforcment_learning
pip3 install -r requirements.txt

Usage

train from scratch:

python run.py --train

let the trained policy to "play" after training:

python run.py --train --play

save and/or load the model after training:

  python run.py --train --play --save_path my_policy_model_new.pkl --load_path my_policy_model.pkl

open tensorboard:

  tensorboard --logdir logs

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 131 Commits
.ipynb_checkpoints		.ipynb_checkpoints
gym_minigrid		gym_minigrid
saved_models		saved_models
scripts		scripts
.DS_Store		.DS_Store
.gitignore		.gitignore
DeepSea.ipynb		DeepSea.ipynb
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt
run.py		run.py
top-down_sampling_introduction.ipynb		top-down_sampling_introduction.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.ipynb_checkpoints

.ipynb_checkpoints

gym_minigrid

gym_minigrid

saved_models

saved_models

scripts

scripts

.DS_Store

.DS_Store

.gitignore

.gitignore

DeepSea.ipynb

DeepSea.ipynb

README.md

README.md

init.py

init.py

requirements.txt

requirements.txt

run.py

run.py

top-down_sampling_introduction.ipynb

top-down_sampling_introduction.ipynb

Repository files navigation

Direct Policy Gradients - RL with A* sampling and direct optimization

Installation

Usage

License

About

Releases

Packages

Languages

GuyLor/Direct-Policy-Gradients

Folders and files

Latest commit

History

Repository files navigation

Direct Policy Gradients - RL with A* sampling and direct optimization

Installation

Usage

License

About

Resources

Stars

Watchers

Forks

Languages