Toy Montezuma's Revenge

This is a reproduction of the Toy Montezuma's Revenge environment described in Deep Abstract Q-Networks (Roderick et al., 2017).

Rewards:

+100 for picking up a key
+300 for opening a door
+10000 for reaching at the goal location

Usage

Demo (play by hand):

python -m mr_pycolab.toy_montezuma

# All rooms are fully observable rather than partially:
python -m mr_pycolab.toy_montezuma --full-observation

OpenAI gym

import mr_pycolab, gym
env = gym.make("ToyMontezumaRevenge-v0")

s = env.reset()   # [11, 11, 5]

actions = ('D', 'U', 'L', 'R', '?')
s, r, done, info = env.step(env.action_space.sample())

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
assets		assets
mr_pycolab		mr_pycolab
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

assets

assets

mr_pycolab

mr_pycolab

.gitignore

.gitignore

LICENSE

LICENSE

MANIFEST.in

MANIFEST.in

README.md

README.md

setup.py

setup.py

Repository files navigation

Toy Montezuma's Revenge

Usage

OpenAI gym

About

Releases

Packages

Contributors 2

Languages

License

wookayin/toy-montezuma-pycolab

Folders and files

Latest commit

History

Repository files navigation

Toy Montezuma's Revenge

Usage

OpenAI gym

About

Resources

License

Stars

Watchers

Forks

Languages