trust-region-policy-optimization

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are still in progress)

algorithm deep-learning atari2600 flappy-bird deep-reinforcement-learning pytorch dqn ddpg sac actor-critic trpo dueling-dqn trust-region-policy-optimization proximal-policy-optimization ppo a2c soft-actor-critic

Updated Jan 16, 2021
Python

khansel01 / nes-npg

Star

Benchmarking the Natural Gradient in Policy Gradient Methods and Evolution Strategies

benchmarking reinforcement-learning robotics reinforcement-learning-algorithms trust-region-policy-optimization natural-evolution-strategies natural-policy-gradient quanser-robots

Updated Jan 22, 2021
Python

funnydman / BFGS-NelderMead-TrustRegion

Star

Python implementation of some numerical (optimization) methods

python machine-learning ai optimization machine-learning-algorithms mathematics numerical-methods numerical-optimization nelder-mead bfgs dogleg-method trust-region-policy-optimization trust-region dogleg-algorithm trust-region-dogleg-algorithm

Updated Feb 4, 2021
Python

Akella17 / Deep-Bayesian-Quadrature-Policy-Optimization

Star

Official implementation of the AAAI 2021 paper Deep Bayesian Quadrature Policy Optimization.

reinforcement-learning deep-learning monte-carlo deep-reinforcement-learning pytorch policy-gradient gaussian-processes continuous-control actor-critic mujoco trust-region-policy-optimization advantage-actor-critic roboschool probablistic-numerics bayesian-quadrature natural-policy-gradient

Updated Feb 17, 2021
Python

dodoseung / trpo-trust-region-policy-optimization-pytorch

Star

The pytorch implemetation of trpo

deep-reinforcement-learning pytorch trpo trust-region-policy-optimization trpo-pytorch

Updated Mar 14, 2022
Python

hcnoh / rl-collection-pytorch

Star

A collection of Reinforcement Learning implementations with PyTorch

reinforcement-learning deep-learning gae deep-reinforcement-learning openai-gym pytorch policy-gradient continuous-control actor-critic trpo trust-region-policy-optimization proximal-policy-optimization ppo generalized-advantage-estimation

Updated Mar 22, 2022
Python

Improve this page

Add a description, image, and links to the trust-region-policy-optimization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the trust-region-policy-optimization topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

trust-region-policy-optimization

Here are 10 public repositories matching this topic...

LihangLiu / CS395T-Numerical-Optimization

MahanFathi / TRPO-TensorFlow

ikostrikov / pytorch-trpo

RLOpensource / spinning_up_kr

TianhongDai / reinforcement-learning-algorithms

khansel01 / nes-npg

funnydman / BFGS-NelderMead-TrustRegion

Akella17 / Deep-Bayesian-Quadrature-Policy-Optimization

dodoseung / trpo-trust-region-policy-optimization-pytorch

hcnoh / rl-collection-pytorch

Improve this page

Add this topic to your repo