使用深度学习算法 DQN 来玩 flappy bird
pip install parl == 1.3.1
pip install pygame
pip install paddlepaddle
(PyGame-Learning-Environment)[https://github.com/ntasfi/PyGame-Learning-Environment]
使用了 百度 PARL 深度学习库直接调用 DQN 算法
由于游戏的 state 仅有 8 维,所以模型网络仅使用了 2 个全连接层
在训练了 1000 个 episode 以后可以明显看出在逐步收敛
在训练了 10000 个 episode 以后,测试中基本可以保持一直进行下去,所以不得不限制到达一定分数就终止游戏
需要保持较高的探索概率,30%-20%较佳