Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

AobaZeroのweightの更新を10000棋譜から34285棋譜ごとに #51

Open
yssaya opened this issue Dec 28, 2020 · 0 comments
Open

AobaZeroのweightの更新を10000棋譜から34285棋譜ごとに #51

yssaya opened this issue Dec 28, 2020 · 0 comments

Comments

@yssaya
Copy link
Collaborator

yssaya commented Dec 28, 2020

重みの更新を10000棋譜から34285棋譜に変更しました。
これはAlphaZeroが2400万棋譜、70万回学習、mini-batch=4096、1000回学習ごとに重み更新、なので
3.4285万棋譜(=2400/(700000/1000))に合わせたためです。

今までは1万棋譜ごとで直近の50万棋譜からサンプリング、なので50世代、 3.4285万棋譜だと15世代が含まれます。

mini-batch=128 だと32000回学習((4096/128)*1000)ごとに重み更新、なので
3.4285万棋譜で32000回学習になるように 1棋譜あたり1.07142回学習されるように
棋譜追加時の学習回数も調整しています。
今までは1棋譜あたり1回の学習でした。
1回で128局面を学習するので現在の平均手数85手だと1局面あたり1.41回ほど学習することになります。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant