Algorithm_Distillation

Implementation of algorithm distillation on darkroom environments

Original Paper

Results (after 50000 training timesteps)

Evaluation goals: [array([4, 2]), array([5, 6]), array([6, 8]), array([7, 2]), array([3, 6]), array([0, 5]), array([5, 8]), array([5, 4])]
Mean reward per environment: [17.062 17.102 14.094 0.022 16.1 14.434 6.82 0.49 ]
Overall mean reward: 10.7655
Std deviation: 7.961595929837183

Figures

Training Loss:

Testing Loss:

Learning Rate Schedule

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
__pycache__		__pycache__
algorithm		algorithm
config		config
env		env
figs		figs
model		model
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
collect.py		collect.py
dataset.py		dataset.py
evaluate.py		evaluate.py
export_fig.py		export_fig.py
requirements.txt		requirements.txt
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Algorithm_Distillation

Original Paper

Results (after 50000 training timesteps)

Figures

About

Uh oh!

Releases

Packages

Languages

tommyma3/Algorithm_Distillation

Folders and files

Latest commit

History

Repository files navigation

Algorithm_Distillation

Original Paper

Results (after 50000 training timesteps)

Figures

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages