proximal-policy-optimization

An implementation from the state-of-the-art family of reinforcement learning algorithms Proximal Policy Optimization using normalized Generalized Advantage Estimation and optional batch mode training. The loss function incorporates an entropy bonus.

python machine-learning reinforcement-learning entropy deep-learning neural-network optimization gae pytorch rl actor-critic proximal-policy-optimization ppo open-ai open-ai-gym generalized-advantage-estimation ppo-pytorch

Updated Dec 26, 2022
Python

blahBlahhhJ / ProjectProcgen

Star

A pytorch project to easily run experiments on OpenAI's Procgen Benchmark

reinforcement-learning pytorch proximal-policy-optimization

Updated May 20, 2021
Python

TychoTheTaco / Car-Racing

Star

An implementation of Proximal Policy Optimization using TensorFlow. Tested on the OpenAI Gym car racing environment.

reinforcement-learning tensorflow openai-gym reinforcement-learning-algorithms proximal-policy-optimization tensorflow2

Updated Mar 12, 2021
Python

MoniFarsang / ppo-clipping-approaches

Star

Training PPO agents in OpenAI Gym and PyBullet environments.

reinforcement-learning proximal-policy-optimization

Updated Feb 3, 2021
Python

pmistry9597 / Reinforcement-Learning-Algo-Demo

Star

A demonstration of some prominent reinforcement learning algorithms

reinforcement-learning openai-gym policy-gradient deep-q-network proximal-policy-optimization

Updated Mar 28, 2023
Python

ays-dev / lunarlander-pytorch

Star

Single file implementation of Deep Reinforcement Learning algorithm (PPO) based on LunarLander-v2 environment

python machine-learning deep-neural-networks reinforcement-learning deep-learning torch python3 pytorch gym proximal-policy-optimization ppo lunar-lander

Updated Jul 13, 2023
Python

maik97 / wacky-rl

Star

Custom Reinforcement Learning Agents

reinforcement-learning deep-learning deep-reinforcement-learning rl-agents dqn gym policy-gradient sac actor-critic proximal-policy-optimization ppo a2c rl-algorithms soft-actor-critic

Updated Oct 25, 2023
Python

SECNetLabUNM / HTransRL

Star

Hybrid Transformer based Multi-agent Reinforcement Learning (HTransRL) is for drone coordination in air corridors, addressing the challenges of dynamic dimensions and types of state inputs, which cannot addressed by the traditional MARL.

reinforcement-learning transformer multiagent-reinforcement-learning unmanned-aerial-vehicle proximal-policy-optimization urban-air-mobility air-corridor advanced-air-mobility

Updated Jun 20, 2024
Python

fomorians / ppo

Star

Implementation of PPO with TF 2.0 and Pyoneer.

reinforcement-learning tensorflow proximal-policy-optimization ppo pyoneer

Updated Jul 14, 2019
Python

GiorgiaAuroraAdorni / CAT-optimal-hybrid-solver

Star

The CAT Optimal Hybrid Solver is a tool designed to tackle the cross array task (CAT) activity designed to assess algorithmic thinking skills in the context of K-12 education.

reinforcement-learning clustering problem-solving depth-first-search random-search computational-thinking proximal-policy-optimization hybrid-approach