Skipper

A PyTorch Implementation of Skipper, proposed in the ICLR 2024 paper

Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning

-- Mingde Zhao, Safa Alver, Harm van Seijen, Romain Laroche, Doina Precup, Yoshua Bengio

arXiv

blogpost

Python virtual environment configuration:

Create a virtual environment with conda or venv (we used Python 3.9)
Install PyTorch according to the official guidelines, make sure it recognizes your accelerators
pip install -r requirements.txt

For experiments, write bash scripts to call those Python files that start with string "run_":

run_minigrid_mp.py: a multi-processed experiment initializer for Skipper agents.

run_minigrid.py: a single-processed experiment initializer for modelfree baseline

run_minigrid_with_CVAE.py: a single-processed experiment initializer for training a checkpoint generator with the experience colleced by a modelfree or random baseline

run_leap_pretrain_vae.py: a single-processed experiment initializer for pretraining generator for the adapted LEAP agent

run_leap_pretrain_rl.py: a single-processed experiment initializer for pretraining distance estimator (policy) for the adapted LEAP agent

Please read carefully the args definition in runtime.py and pass the desired args in the commands.

Extras

There is a potential CUDA_INDEX_ASSERTION error that could cause hanging at the beginning of the Skipper runs. We don't know yet how to fix it
The Dynamic Programming solutions for environment ground truth are only compatible with deterministic experiments

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.gitattributes		.gitattributes
.gitignore		.gitignore
HER.py		HER.py
README.md		README.md
RandDistShift.py		RandDistShift.py
agents.py		agents.py
baselines.py		baselines.py
leap_utils.py		leap_utils.py
minigrid.py		minigrid.py
models.py		models.py
modules.py		modules.py
requirements.txt		requirements.txt
run_leap_pretrain_rl.py		run_leap_pretrain_rl.py
run_leap_pretrain_vae.py		run_leap_pretrain_vae.py
run_minigrid.py		run_minigrid.py
run_minigrid_mp.py		run_minigrid_mp.py
run_minigrid_with_CVAE.py		run_minigrid_with_CVAE.py
runtime.py		runtime.py
utils.py		utils.py
utils_mp.py		utils_mp.py
visual_utils.py		visual_utils.py

mila-iqia/Skipper

Folders and files

Latest commit

History

Repository files navigation

Skipper

Python virtual environment configuration:

For experiments, write bash scripts to call those Python files that start with string "run_":

Extras

About

Resources

Stars

Watchers

Forks

Languages