GitHub - lvliguoren/MsPacman: 使用Q学习进行MsPacman游戏的练习

lvliguoren / MsPacman Public

使用Q学习进行MsPacman游戏的练习

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
.gitignore		.gitignore
DQN.py		DQN.py
ReadMe		ReadMe
ReplayMemory.py		ReplayMemory.py
checkpoint		checkpoint
my_dqn.ckpt.data-00000-of-00001		my_dqn.ckpt.data-00000-of-00001
my_dqn.ckpt.index		my_dqn.ckpt.index
my_dqn.ckpt.meta		my_dqn.ckpt.meta
test.py		test.py

Repository files navigation

使用Q学习进行MsPacman游戏的练习
1、游戏者使用ε-greedy策略进行游戏，生成了游戏状态-行为数据
2、观察者计算每种状态-行为的Q值（相当于打标签），并训练网络预测准确的Q值
3、把观察者训练得到的参数复制给游戏者
4、使用游戏者进行游戏

使用Q学习进行MsPacman游戏的练习

No releases published