du-guai

基于机器学习的斗地主算法程序，我们一般只会用两个字来形容这种AI：赌怪！

环境依赖

python >= 3.7
numpy
pytest
sklearn

启动方式

运行主程序

cd duguai
python main.py

运行Q-Learnig脚本训练数据

cd script

# Q-Learning模型训练
python q_learning.py -t <训练次数>

运行基准测试

cd script

python benchmark.py -t <需要测试的AI的训练次数>

项目目录说明

duguai：程序源代码目录。main.py是入口程序
dataset：数据集目录
doc：项目文档
notebook：ipython notebook目录
script：一些脚本程序（如数据生成脚本）
test：单元测试

配置说明

配置文件为duguai/.env

调试/生产模式：mode = debug/prod 开启/关闭测试：test = on/off

算法设计

ALGORITHM.md

斗地主规则

RULES.md

训练结果

对局1000次的基准测试

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent （训练400次，约26秒）	176	370	546	54.6%
RandomAgent1	148	337	485	48.5%
RandomAgent2	155	335	490	49.3%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent （训练1000次，约64秒）	155	395	550	55.5%
RandomAgent1	122	385	507	50.7%
RandomAgent2	143	380	523	52.3%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent （训练2000次，约128秒）	141	403	544	54.4%
RandomAgent1	134	383	517	51.7%
RandomAgent2	148	368	516	51.6%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent （训练5000次，约325秒）	174	382	566	56.6%
RandomAgent1	123	378	501	50.1%
RandomAgent2	132	382	514	51.4%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent （训练10000次，约643秒）	167	392	559	55.9%
RandomAgent1	120	399	519	51.9%
RandomAgent2	127	381	508	50.8%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent（训练60000次，约3906秒）	163	407	570	57.0%
RandomAgent1	138	352	490	49.0%
RandomAgent2	147	345	492	49.2%

智能体	地主获胜场次	农民获胜场次	总获胜场次	胜率
QLAgent（训练18万次，约11700秒）	166	396	562	56.2%
RandomAgent1	143	366	509	50.9%
RandomAgent2	120	380	500	50.0%

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
dataset		dataset
doc		doc
duguai		duguai
notebook		notebook
script		script
test		test
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dataset

dataset

doc

doc

duguai

duguai

notebook

notebook

script

script

test

test

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

requirements.txt

requirements.txt

Repository files navigation

du-guai

环境依赖

启动方式

项目目录说明

配置说明

算法设计

斗地主规则

训练结果

对局1000次的基准测试

About

Releases 2

Packages

Contributors 3

Languages

License

jiangyinzuo/du-guai

Folders and files

Latest commit

History

Repository files navigation

du-guai

环境依赖

启动方式

项目目录说明

配置说明

算法设计

斗地主规则

训练结果

对局1000次的基准测试

About

Topics

Resources

License

Stars

Watchers

Forks

Languages