Othello3D_train

クソザコ強化学習

概要

CPU.csのMapをQ-Learningの要領で更新する。 BestCPUとRandomCPUをε-greedyをもちいて対戦し勝利した方をBestCPUに代入、 $回連続で勝利したCPUのMapをResource/TextFileData$$に保存する。

GameSystem.csの xLength,yLength,zLength を(4,4,4)か(4,6,4)に設定する
GameSystem.csの diagonal（falseを推奨）
GameSystem.csのGameClear()の if(successTime % $ == 0 & successTime != 0){ cpu.TextDetalog($$); }
- 連続成功回数（連続勝利回数のこと）$回で Resource/TextFileData$$ にデータを吐き出す
GameSystem.csのGameClear()の Debug.Log("勝者 : " + result + " 回数 : " + learnTime + "　連続成功回数 : " + successTime);
GameSystem.csのGameClear()の if(learnTime >= $$$){ Debug.Log("Be oversoon."); } if(learnTime >= $$$$){ cpu.LearningFinish(); }
- 連続成功回数$$$$回でプログラムを終了
CPU.csのRandomMap()でどの値を更新したいか設定

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
Assets		Assets
Packages		Packages
ProjectSettings		ProjectSettings
UserSettings		UserSettings
.gitignore		.gitignore
README.md		README.md