有名なアルゴリズムを使ったバンディットシミュレーション
main.py
にてシミュレーション回数(trial),ステップ数(step),腕の本数(K)を設定してください.
def main():
trial = 1000
step = 100000
K = 4
simulator.py
のself.policy
で検証したいアルゴリズムを入れてください.
- random
- ε-greedy(ε=0.01)
- ThompsonSampling
- UCB1
- UCB1-Tuned
生成したCSVファイルをlogフォルダの現在時刻を示すフォルダ(例:202209200132
)に保存します.
また同時にlog.txt
にシミュレーション回数(trial),ステップ数(step),腕の本数(K)の情報も保存します.
python main.py
グラフのタイトルとプロットしたいCSVが格納されているフォルダ名(例:202209200132
)を指定してグラフのプロットを行います.
生成したグラフはCSVと同じ階層にcsv_plot.png
という名前で保存されます.
python plot.py [グラフのtitle] [プロットしたいCSVが格納されているフォルダ名]