Reinforcement Learning Portfolio

Pong-PPO – Improved PPO with vectorized Atari preprocessing, GAE, and augmentation.

BipedalWalker – PPO agent with normalized vector envs and deterministic evaluation.
Lunar-Landar – Simple policy-gradient style training for LunarLander; latest clip (epoch 526).

training_epoch_526.mp4

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
BipedalWalker		BipedalWalker
Lunar-Landar-main		Lunar-Landar-main
Pong-PPO		Pong-PPO
VizDoom-RL		VizDoom-RL
README.md		README.md

Provide feedback