akifumi-wachi-4

Akifumi Wachi akifumi-wachi-4

Achievements

safe_near_optimal_mdp safe_near_optimal_mdp Public

Safe Reinforcement Learning in Constrained Markov Decision Processes

Python 55 10
spolf spolf Public

Safe Policy Optimization with Local Features

Python 6 1
website website Public

Personal website (https://akifumi-wachi-4.github.io/website/)

CSS
sacpo sacpo Public

Forked from line/sacpo

[NeurIPS 2024] SACPO (Stepwise Alignment for Constrained Policy Optimization)

Python