Factored World Model for Generalization

Old code below

Experiments to Run

Vanilla PPO
Encoder, MLP Transition + Reward Models
Encoder, Conv Transition + Reward Models
Encoder, Conv Transition + Factored Reward Models
Encoder, Conv Transition + Factored Reward Models
Graph Neural Networks via this paper and this code

Auto-DrAC: Automatic Data-Regularized Actor-Critic

This is a PyTorch implementation of the methods proposed in

Automatic Data Augmentation for Generalization in Deep Reinforcement Learning by

Roberta Raileanu, Max Goldstein, Denis Yarats, Ilya Kostrikov, and Rob Fergus.

Requirements

The code was run on a GPU with CUDA 10.2. To install all the required dependencies:

conda create -n auto-drac python=3.7
conda activate auto-drac

git clone git@github.com:rraileanu/auto-drac.git
cd auto-drac
pip install -r requirements.txt

git clone https://github.com/openai/baselines.git
cd baselines 
python setup.py install 

pip install procgen

Instructions

cd auto-drac

Train DrAC with crop augmentation on BigFish

python train.py --env_name bigfish --aug_type crop

Train UCB-DrAC on BigFish

python train.py --env_name bigfish --use_ucb

Train RL2-DrAC on BigFish

python train.py --env_name bigfish --use_rl2

Train Meta-DrAC on BigFish

python train.py --env_name bigfish --use_meta

Procgen Results

UCB-DrAC achieves state-of-the-art performance on the Procgen benchmark (easy mode), significantly improving the agent's generalization ability over standard RL methods such as PPO.

Test Results on Procgen

Train Results on Procgen

Acknowledgements

This code was based on an open sourced PyTorch implementation of PPO.

We also used kornia for some of the augmentations.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
baselines		baselines
figures		figures
logs/plunder/plunder-0		logs/plunder/plunder-0
ucb_rl2_meta		ucb_rl2_meta
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
data_augs.py		data_augs.py
plot_results.ipynb		plot_results.ipynb
plot_results.py		plot_results.py
requirements.txt		requirements.txt
run_all_grid.sh		run_all_grid.sh
tags		tags
test.py		test.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Factored World Model for Generalization

Experiments to Run

Auto-DrAC: Automatic Data-Regularized Actor-Critic

Requirements

Instructions

Train DrAC with crop augmentation on BigFish

Train UCB-DrAC on BigFish

Train RL2-DrAC on BigFish

Train Meta-DrAC on BigFish

Procgen Results

Acknowledgements

About

Releases

Packages

Languages

License

joshnroy/auto-drac

Folders and files

Latest commit

History

Repository files navigation

Factored World Model for Generalization

Experiments to Run

Auto-DrAC: Automatic Data-Regularized Actor-Critic

Requirements

Instructions

Train DrAC with crop augmentation on BigFish

Train UCB-DrAC on BigFish

Train RL2-DrAC on BigFish

Train Meta-DrAC on BigFish

Procgen Results

Acknowledgements

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages