Introduction

Dependencies

python==3.8
torch==1.8.1
scipy==1.7.3
numpy==1.21.4
tensorboardX==2.4.1
tqdm==4.62.3

All scripts are in ./scripts.

Generate data.
- sh scripts/gen.sh
- The dataset in satellite's optimal attitude control problem is generated by HJB_NN.
- The adaptive dataset in quadrotor's optimal landing problem is generated by IVP Enhanced Sampling.
- You can fasten the generation by multi-processing, i.e., --num_processors 24.
Train with supervised learning.
- sh scripts/sl.sh
Train with direct policy optimization.
- sh scripts/direct.sh
- Note that we apply torch_ACA in the implementation.
Fine-tune a pre-trained network.
- sh scripts/finetune.sh
Compare performances via closed-loop simulations.
- scripts/test.sh

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
modules		modules
problems		problems
scripts		scripts
torch_ACA		torch_ACA
utils		utils
README.md		README.md
compare.py		compare.py
gen_fix.py		gen_fix.py
train_direct_qua.py		train_direct_qua.py
train_direct_sat.py		train_direct_sat.py
train_sl.py		train_sl.py