Skip to content

qhapaq-49/qhnotes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

課金データセットの使い方マニュアル

  • 本リポジトリはQhapaq開発チームがnote上で販売している各種データの使い方をまとめたものです。とくに開発者向けのデータ(e.g. 追加学習が可能なpthファイル)を購入される方については事前にこちらのページを確認していただくことをお勧めします
    • 本プロジェクトへのお布施として購入される場合についてはその限りではありません

dlshogi、ふかうら王向けの評価関数(.onnxファイル)

dlshogiや、ふかうら王から読み込むことで盤面解析・定跡作成・対局などの用途にお使いいただけます。本マニュアルではdlshogi・ふかうら王の導入方法は説明しません。例えば以下のリンクなどが役に立つことでしょう。

テスト用評価関数

テスト用の評価関数として第三回世界電竜戦で6位になったJust Stop 26歩の評価関数を公開しています。このリンクからファイルをダウンロードしてeval/model.onnxをdlshogi、ふかうら王で読み込むことができれば、本プロジェクトで扱っている各種onnxファイルを読み込むことも可能だと思われます。盤面解析・定跡作成・対局などをお楽しみいただければ幸いです

追加学習可能なdlshogi、ふかうら王向けの評価関数(.pthファイル)

本プロジェクトでは追加学習可能なpthファイルも販売しています。pthファイルを使うことでモデルのアーキテクチャや各変数などを読み取ることが容易になり、追加学習や転移学習なども行えるようになります。ただし、pthファイルを使いこなすにはdlshogiの学習部を動かすための環境が必要になります。

環境整備:テストしたいだけの人向け

dlshogi, cshogi, pytorchが揃っていればOKです。cudaなどのgpu環境は不要です(ただし、本当に学習を回すつもりならgpu環境は必須だと思います)

# dlshogiのインストール
git clone git@github.com:TadaoYamaoka/DeepLearningShogi.git
cd DeepLearningShogi
pip install -e .
# cshogiのインストール
git clone git@github.com:TadaoYamaoka/cshogi.git
cd cshogi
pip install -e .
# pytorchのインストール
pip3 install torch --extra-index-url https://download.pytorch.org/whl/cpu

環境整備:GPU+tensorrtなどのガチ環境を用意する人向け

dlshogiのDockerfileから環境構築をすることをお勧めします。

テスト用評価関数

テスト用の評価関数をこちらのリンクからダウンロードできます。関数付属のtest.pyが無事に動けば導入成功です。あとはdlshogiのtrainerに突っ込むなどして追加学習を楽しんでいただければ幸いです。dummy関数向けのtest.py(評価関数を読み込みベンチマークを行うスクリプト)とpolicy_value_network_qhapaq.py(配布した評価関数のアーキテクチャが記載されたスクリプト。配布する評価関数ごとに変わることに注意!)のコードはdummyフォルダからも参照いただけます。Qhapaqチームが配布する評価関数をdlshogiで追加学習していただくにあたり、このコードを読んで何をしているかが理解できるぐらいのdlshogiの知識があることを前提としていることをご注意ください。dlshogiの動作原理や運用方法について興味がある方はdlshogi開発チームが販売している書籍 「強い将棋ソフトの創りかた」を購入されることをお勧めします

# ダウンロードした関数があるフォルダに移動して
cd dummy
# test.pyを実行する
python test.py