forked from tmoer/alphazero_singleplayer
-
Notifications
You must be signed in to change notification settings - Fork 0
/
run_riverswim_fail.sh
11 lines (7 loc) · 1.16 KB
/
run_riverswim_fail.sh
1
2
3
4
5
6
7
8
9
10
11
#!/bin/bash
for i in $(seq 0 0.1 0.7)
do
#python3 alphazero.py --game=RiverSwim-continuous --budget=600000 --gamma=0.99 --max_ep_len=20 --chain_dim 7 --fail_prob $i --particles 1 --unbiased --eval_freq=20 --n_epochs=50 --lr=0.1 --batch_size=2048 --temp=0 --c=3.2 --n_ep=20 --eval_episodes=20 --n_mcts=50 --mcts_only --n_experiments=1 --max_workers 5 --depth_based_bias --budget_scheduler --parallel &
#python3 alphazero.py --game=RiverSwim-continuous --budget=600000 --gamma=0.99 --max_ep_len=20 --chain_dim 7 --fail_prob $i --stochastic --n_hidden_layers=3 --n_hidden_units=16 --eval_freq=20 --n_epochs=50 --lr=0.1 --batch_size=2048 --temp=0 --c=4.0 --n_ep=1 --eval_episodes=20 --n_mcts=50 --mcts_only --n_experiments=1 --max_workers 5 --depth_based_bias --budget_scheduler --alpha 0.92 --parallel &
python3 alphazero.py --game=RiverSwim-continuous --budget=600000 --gamma=0.99 --max_ep_len=20 --chain_dim 7 --fail_prob $i --particles 1 --biased --eval_freq=20 --n_epochs=50 --lr=0.1 --batch_size=2048 --temp=0 --c=3.2 --n_ep=20 --eval_episodes=20 --n_mcts=50 --mcts_only --n_experiments=1 --max_workers 5 --depth_based_bias --budget_scheduler --parallel --alpha 0.92 &
done