Trust Region Policy Optimization

Description

This is the implementation code for Convex Optimization course project on "Reformulation and Analysis of Trust Region Policy Optimization" with its application on optimizing an industrial operation using a discrete event simulator. The final report can be found here (relative link)

Run command:

python DynaFork_Online_TRPO.py

Dependencies:

Python 2.7
Tensorflow 1.12.0

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
lib		lib
results		results
DynaFork_Online_TRPO.py		DynaFork_Online_TRPO.py
FinalReport_VivswanShitole.pdf		FinalReport_VivswanShitole.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

lib

lib

results

results

DynaFork_Online_TRPO.py

DynaFork_Online_TRPO.py

FinalReport_VivswanShitole.pdf

FinalReport_VivswanShitole.pdf

README.md

README.md

Repository files navigation

Trust Region Policy Optimization

Description

Run command:

Dependencies:

About

Releases

Packages

Languages

viv92/convoptfinal

Folders and files

Latest commit

History

Repository files navigation

Trust Region Policy Optimization

Description

Run command:

Dependencies:

About

Resources

Stars

Watchers

Forks

Languages