use beta distribution instead of gaussian when you add continuous actions #2

ethancaballero · 2017-09-18T15:07:17Z

Beta distribution seems to always work better than Gaussian on high dimensional continuous control tasks:

"Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution"
http://proceedings.mlr.press/v70/chou17a/chou17a.pdf

ikostrikov · 2017-10-01T01:49:30Z

Thanks! I will try to implement it sometime later.

sync with avivt

ikostrikov closed this as completed Oct 1, 2017

jakefoster954 mentioned this issue Feb 3, 2021

Unable to run enjoy.py #262

Open

avivt pushed a commit to avivt/pytorch-a2c-ppo-acktr-gail that referenced this issue Jun 8, 2021

Merge pull request ikostrikov#2 from avivt/master

f2b656e

sync with avivt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

use beta distribution instead of gaussian when you add continuous actions #2

use beta distribution instead of gaussian when you add continuous actions #2

ethancaballero commented Sep 18, 2017

ikostrikov commented Oct 1, 2017

use beta distribution instead of gaussian when you add continuous actions #2

use beta distribution instead of gaussian when you add continuous actions #2

Comments

ethancaballero commented Sep 18, 2017

ikostrikov commented Oct 1, 2017