这里是一个提供各位 刚接触强化学习的老铁/学弟们 的 deep Q learning 算法 玩Cart-pole的例子
在运行这个DEMO之前你需要配置好:
1.pycharm IDE
2.conda python环境
而python环境中要至少包含:
pytorh (CPU版本) 【深度学习框架】
gym 【强化学习练习场】
安装教程:http://124.70.59.232/index.php/archives/41/ 【上面是linux 安装,新手推荐windows】
如果你是刚刚接触编程或者python,建议在做的时候不要太着急。 多看一些相关学习资料慢慢来,1周能跑起来这个demo就可以了。 组里的其他项目可以先不动。
如果你有更好的算法,尽情提交一个新的分支