GitHub - KohlerHECTOR/Tree-MBPO: Study Model-Based Policy Optimization by varying the model estimator classes (e.g Decision Trees vs MLP)

For Tree-Based-Exploration see: https://github.com/KohlerHECTOR/TREX-Tree-Reward-EXploration

Only Continuous actions

Install scikit-learn and SB3

pip3 install -r requirements.txt

Available Models are Decision Trees, best CV Trees, and MLPs

Available Policy Optim Algos are SAC and TD3

Launch MBPO for 100 iterations on InvertedPendulum with Decision Trees as Model estimators and SAC as policy optim. Results are saved in 'Experience_Results/pendul-tree-sac/':

python3 experience.py InvertedPendulum-v4 tree sac 100 pendul-tree-sac

Launch MBPO for 100 iterations on InvertedPendulum with 2x64 MLP as Model estimators and SAC as policy optim. Results are saved in 'Experience_Results/pendul-mlp-sac/':

python3 experience.py InvertedPendulum-v4 mlp sac 100 pendul-mlp-sac

Save Plots of comparisons 'Experience_Results/Comparison-date-time/':

python3 compare_experiences.py pendul-tree-sac pendul-mlp-sac

Save Plots of results in 'Experience_Results/pendul-tree-sac/':

python3 plot_experience.py pendul-tree-sac

MBPO: https://arxiv.org/abs/1906.08253

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
mbpo		mbpo
mbpo_schematics_rdme		mbpo_schematics_rdme
.gitignore		.gitignore
compare_experiences.py		compare_experiences.py
experience.py		experience.py
plot_experience.py		plot_experience.py
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

For Tree-Based-Exploration see: https://github.com/KohlerHECTOR/TREX-Tree-Reward-EXploration

Only Continuous actions

Available Models are Decision Trees, best CV Trees, and MLPs

Available Policy Optim Algos are SAC and TD3

About

Releases

Packages

Languages

KohlerHECTOR/Tree-MBPO

Folders and files

Latest commit

History

Repository files navigation

For Tree-Based-Exploration see: https://github.com/KohlerHECTOR/TREX-Tree-Reward-EXploration

Only Continuous actions

Available Models are Decision Trees, best CV Trees, and MLPs

Available Policy Optim Algos are SAC and TD3

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages