Skip to content

lvliguoren/MsPacman

Repository files navigation

使用Q学习进行MsPacman游戏的练习
1、游戏者使用ε-greedy策略进行游戏,生成了游戏状态-行为数据
2、观察者计算每种状态-行为的Q值(相当于打标签),并训练网络预测准确的Q值
3、把观察者训练得到的参数复制给游戏者
4、使用游戏者进行游戏

About

使用Q学习进行MsPacman游戏的练习

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages