conda install anaconda
pip install cupy chainer "gym[atari]"
確認した version は以下の通りです。
- cupy==2.0.0
- chainer==3.0.0
- gym==0.9.4
中央値の計算をします
python median.py # 何もエラーがでなければOKです
強化学習の入門問題であるポールと滑車の制御をします。方策勾配実装の簡単なテスト用
python pole.py | tee plot.log # スコアが200に到達すればOK
python plot_pole.py # 学習グラフ pole.pdf ができます
合格ライン(オレンジ)をスコア(青)が超えるようになればOK
実際にPacman用のゲームAIを学習してみます。
python atari.py |& tee pacman.log # スコアが700に到達すればOK
python plot_pacman.py # 学習グラフ pacman.pdf ができます
質問・不具合報告などは shigekikarita@gmail.com または twitter: @kari_tech まで