Skip to content
HalfGammon Neural Network
C++
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
HGNN
docs
result
.gitignore
HGNN.spr.txt
LICENSE
README.md

README.md

HGNN

HalfGammon Neural Network

  • ニューラルネットを使用し、ハーフギャモンの状態から得点期待値を予測する
  • 目標:NN予測によるモンテカルロ法 vs ランダムプレイヤー 勝率7割超  or 得点期待値 平方平均自乗誤差 0.3 以下
  • ニューラルネットは C++(11) による独自実装
    • NNet、Layer クラスなどを用意し、3-5 層NNを可能に
    • 活性化関数:sigmoid(), tanh(), ReLU()、(Softmax() は非サポート)
    • 全結合ネットワークのみ
    • 出力は回帰のみ(分類は非サポート)
  • 学習方法
    • プレイアウトを元に、局面→期待値を求め、教師あり学習を行う(最優先)
    • 深層強化学習(AlphaZero と同じ、上記がうまくいかなかった場合)
    • TD(γ) 学習(TD-Gammon と同じ、深層強化学習がうまくいかなかった場合)
  • ライセンス:MIT

使い方

docs/index.html 参照

スポンサー

本プロジェクトは下記スポンサー様のご支援を受けています。ありがとうございます。

You can’t perform that action at this time.