Meta-Learning-for-Reinforcement-Learning

Reptile algorithm (Meta) for PPO (RL) on 'Reacher' environment.

The Reacher environment:

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
env.py		env.py
ppo_reptile.py		ppo_reptile.py
reacher.png		reacher.png

Provide feedback