GitHub - ming93/Safe_reinforcement_learning: Convergent Policy Optimization for Safe Reinforcement Learning

Description

Codes for the constrained Linear-Quadratic Regulator (LQR) experiment.

Ming Yu, Zhuoran Yang, Mladen Kolar, and Zhaoran Wang. Convergent Policy Optimization for Safe Reinforcement Learning. In NeurIPS 2019.

Run "Safe_RL_LQR_experiment.m"

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
README.md		README.md
Safe_RL_LQR_experiment.m		Safe_RL_LQR_experiment.m
iterate_calculate.m		iterate_calculate.m
poster.pdf		poster.pdf
quadconstr.m		quadconstr.m
quadhess.m		quadhess.m
quadobj.m		quadobj.m