# 🤖 麻雀AI 学習ランチャー for Google Colab

このノートブックは、麻雀AIの**事前学習**と**強化学習**をGoogle Colab上で実行するためのものです。
セルを上から順番に実行してください。

## ステップ 0: 環境セットアップ

最初に、ハードウェアアクセラレータを**GPU**に設定し、Google Driveをマウントして、必要なライブラリをインストールします。

In [None]:
# GPUの確認 (メニュー > ランタイム > ランタイムのタイプを変更 で GPU を選択してください)
import tensorflow as tf
print(f"TensorFlow GPU Available: {len(tf.config.list_physical_devices('GPU')) > 0}")

In [None]:
# Google Driveのマウント
from google.colab import drive
drive.mount('/content/drive')

In [None]:
import os

# ★★★★★【重要】ご自身のプロジェクトパスに変更してください ★★★★★
PROJECT_PATH = '/content/drive/MyDrive/いろいろ/麻雀AI/googlecolab/MahjongEnhancedLeaning'
# ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★

os.chdir(PROJECT_PATH)
print(f"Working directory changed to: {os.getcwd()}")

### ライブラリのインストール

Colab環境とライブラリの依存関係を解決するため、インストールを2段階に分けて実行します。

In [None]:
#【根本対策 ①】tf-agentsの依存関係を手動で解決します。
# シェルの特殊文字(<, >)が誤認識されないよう、パッケージ名をクォーテーションで囲みます。
!pip install 'pygame>=2.5.0' 'gym<=0.23.0' tensorflow-probability

In [None]:
#【根本対策 ②】残りのライブラリと、tf-agents本体を「依存関係をチェックしない」オプション付きでインストールします。
!pip install -r requirements.txt --no-dependencies

---
## -ステップ 1: 事前学習 (Supervised Learning)-

天鳳のログデータを使って、Transformerモデルの初期学習を行います。
この処理は**非常に時間がかかります**。完了すると、`models/`ディレクトリに`.keras`モデルファイルが生成されます。

In [None]:
# データ生成スクリプト (もしあれば)
# !python generate_data.py

# 事前学習の実行
# !python train_transformer.py

---
## ステップ 2: 強化学習 (Reinforcement Learning)

事前学習で作成したモデルをベースに、自己対戦による強化学習を開始します。

**【初回のみ】`ngrok`のセットアップ:**
1. [ngrok公式サイト](https://ngrok.com/)でアカウントを登録し、[認証トークン](https://dashboard.ngrok.com/get-started/your-authtoken)をコピーします。
2. このノートブックの左側にある**鍵アイコン (シークレット)**を開きます。
3. `NGROK_AUTH_TOKEN` という名前で新しいシークレットを作成し、値にコピーしたトークンを貼り付けてください。

In [None]:
import os
from google.colab import userdata

# Colabのシークレットからngrokのトークンを環境変数に設定
try:
    NGROK_TOKEN = userdata.get('NGROK_AUTH_TOKEN')
    os.environ['NGROK_AUTH_TOKEN'] = NGROK_TOKEN
    print("✅ NGROK_AUTH_TOKEN has been set.")
except userdata.SecretNotFoundError:
    print("⚠️ NGROK_AUTH_TOKEN secret not found. Please set it up.")

In [None]:
# 強化学習を開始
!NGROK_AUTH_TOKEN=$NGROK_AUTH_TOKEN python train_rl_tf_agents.py

---
### ダッシュボードへの接続

上のセルを実行すると、ログの中に `ws://....ngrok.io` から始まる公開URLが出力されます。

1. そのURLをコピーします。
2. ローカルPCで `dashboard-colab.html` をブラウザで開きます。
3. コピーしたURLを入力欄に貼り付け、「接続」ボタンをクリックすると、学習状況がリアルタイムで表示されます。