Deep Monte-CarloによるUNO AI feat. RLCard

概要

NTT東日本主催のプログラミングコンテスト第一回に参加した時のUNO対戦プログラム

相手の手札が見えない不確定性の高いUNOという対戦ゲームにおいてDeep Monte-Carloによる強化学習を行い、手札と相手の枚数、出されたカードの状況から行動を決定する

強化学習フレームワークとゲーム環境はRLCard (UNOの特殊ルールなどは自前で実装する必要がある)

環境構築(>=3.8.6)

pip install -r requirements.txt

学習

python src/run_dmc.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
rlcard		rlcard
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
model.py		model.py
player.py		player.py
requirements.txt		requirements.txt
send_event.py		send_event.py
utils.py		utils.py