GitHub - mesakurax/BlackJackBattleEnv_Online_2: Reinforcement learning is used to train player agent and dealer agent in Black Jack games, mainly using Monte Carlo method

游戏介绍

两两对打，所有小组都会互相成为对手；按得分，选择一半的队伍进入下一阶段；
比赛分阶段进行，每一阶段会淘汰掉一半的小组，并且随着阶段推进，对打轮次会增加；（具体来说，第一阶段，小组A会和班上其他全部小组都比赛，每场比赛2000次并且每个组会获得该轮比赛得分，如果小组A的所有得分和大于0将进入下一阶段比赛，下一阶段比赛每一对比赛5000次，以后每轮增加5000次。）

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
StudentCode		StudentCode
rlcard		rlcard
Read me.txt		Read me.txt
readme.md		readme.md
score.log		score.log
test.log		test.log
test_agent.py		test_agent.py
得分表.xlsx		得分表.xlsx