<a href="https://colab.research.google.com/github/yuukienomoto/mahjong/blob/main/mj_pre_hyper.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

麻雀研究　SVRを用いた捨て牌の危険度
推定

In [None]:
import gzip
import xml.etree.ElementTree as ET
import glob
from google.colab import drive
import time
import numpy as np
from sklearn.svm import SVR
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
import random

print("--- ステップ1: Google Driveのマウント ---")
try:
    drive.mount('/content/drive')
except:
    pass

# 2. フォルダパス指定
log_folder_path = '/content/drive/MyDrive/mjlog_pf4-20_n28/'
file_pattern = log_folder_path + '*.mjlog'
log_files = glob.glob(file_pattern)

if not log_files:
    print(f"エラー: {log_folder_path} に .mjlog ファイルが見つかりません。")
else:
    print(f"全 {len(log_files)} 個のファイルが見つかりました。")

    # ★★★ 最終的なデータセット ★★★
    final_dataset = []

    # ★★★【最重要】本格的な特徴量計算関数 ★★★
    #  に基づく
    def calculate_features(game_state, player_index, tile):

        features = []

        # 1. 捨てようとしている牌の種類 [cite: 31]
        # (牌コードをそのまま特徴量とする)
        features.append(tile)

        # 2. 捨てようとしている牌が場に見えている枚数 [cite: 33]
        visible_count = 0
        for hand in game_state['hands']:
            visible_count += hand.count(tile)
        for discard_pile in game_state['discards']:
            visible_count += discard_pile.count(tile)
        features.append(visible_count)

        # 3. 相手のリーチの有無 [cite: 34]
        opponent_reach = False
        for i in range(4):
            if i != player_index and game_state['reach'][i]:
                opponent_reach = True
        features.append(1 if opponent_reach else 0)

        # 4. 捨てようとしている牌が相手の河に存在するか [cite: 36]
        in_opponent_discard = False
        for i in range(4):
            if i != player_index and tile in game_state['discards'][i]:
                in_opponent_discard = True
        features.append(1 if in_opponent_discard else 0)

        # 5. 1巡以内 (4打) に誰かが捨てているか [cite: 37]
        discarded_1_turn = False
        # 直近4回の打牌履歴 (自分も含む) をチェック
        recent_discards = game_state['history'][-4:]
        for (p, t) in recent_discards:
            if t == tile:
                discarded_1_turn = True
        features.append(1 if discarded_1_turn else 0)

        # 6. 2巡以内 (8打) に誰かが捨てているか [cite: 38]
        discarded_2_turns = False
        # 直近8回の打牌履歴 (自分も含む) をチェック
        recent_discards = game_state['history'][-8:]
        for (p, t) in recent_discards:
            if t == tile:
                discarded_2_turns = True
        features.append(1 if discarded_2_turns else 0)

        # (ここで特徴量 [cite: 32, 35] を追加実装できる)

        return features

--- ステップ1: Google Driveのマウント ---
Mounted at /content/drive
全 3181 個のファイルが見つかりました。


In [None]:

    # --- ステップ2: 全ファイル (100個) の処理 ---
    print("\n--- ステップ2: 全ファイルの解析を開始します ---")
    start_time = time.time()

    # (テストのため、まずは最初の100ファイルだけ処理)
    files_to_process = log_files

    for i, file_path in enumerate(files_to_process):

        if (i + 1) % 20 == 0: # 20ファイルごとに進捗を表示
            print(f"  処理中... {i+1} / {len(files_to_process)} ファイル")

        try:
            with gzip.open(file_path, 'rt', encoding='utf-8') as f:
                tree = ET.parse(f)
                root = tree.getroot()

            # --- ゲーム状態変数 (Game State) ---
            game_state = {
                'hands': [[], [], [], []],
                'discards': [[], [], [], []],
                'reach': [False, False, False, False],
                'history': [] # (player, tile) の打牌履歴
            }
            last_discard_event = None

            for tag in root:
                if tag.tag == 'INIT':
                    if last_discard_event:
                        final_dataset.append(last_discard_event)

                    game_state = {
                        'hands': [[], [], [], []],
                        'discards': [[], [], [], []],
                        'reach': [False, False, False, False],
                        'history': []
                    }
                    last_discard_event = None

                    hai_strings = [tag.attrib.get(h) for h in ['hai0', 'hai1', 'hai2', 'hai3']]
                    for p_idx in range(4):
                        if hai_strings[p_idx]:
                            game_state['hands'][p_idx] = [int(s) for s in hai_strings[p_idx].split(',')]

                # ツモ
                draw_prefix = tag.tag[0]
                if draw_prefix in {'T': 0, 'U': 1, 'V': 2, 'W': 3}:
                    try:
                        player_index = {'T': 0, 'U': 1, 'V': 2, 'W': 3}[draw_prefix]
                        tile_code = int(tag.tag[1:])
                        game_state['hands'][player_index].append(tile_code)
                    except (ValueError, KeyError):
                        pass

                # 打牌
                discard_prefix = tag.tag[0]
                if discard_prefix in {'D': 0, 'E': 1, 'F': 2, 'G': 3}:
                    try:
                        if last_discard_event:
                            final_dataset.append(last_discard_event)

                        player_index = {'D': 0, 'E': 1, 'F': 2, 'G': 3}[discard_prefix]
                        tile_code = int(tag.tag[1:])

                        # ★★★ 強化された特徴量でXを計算 ★★★
                        features_X = calculate_features(
                            game_state, player_index, tile_code
                        )
                        last_discard_event = {'X': features_X, 'y': 0}

                        # ゲーム状態の更新
                        if tile_code in game_state['hands'][player_index]:
                            game_state['hands'][player_index].remove(tile_code)
                        game_state['discards'][player_index].append(tile_code)
                        game_state['history'].append((player_index, tile_code)) # 打牌履歴を記録

                    except (ValueError, KeyError):
                        pass

                # リーチ
                if tag.tag == 'REACH':
                    if tag.attrib.get('step') == '1':
                         player_index = int(tag.attrib.get('who'))
                         game_state['reach'][player_index] = True

                # 和了 (ロン)
                if tag.tag == 'AGARI':
                    winner = int(tag.attrib.get('who'))
                    loser = tag.attrib.get('fromWho')

                    if loser and winner != int(loser):
                        score = int(tag.attrib.get('ten').split(',')[1])

                        if last_discard_event:
                            last_discard_event['y'] = score
                            final_dataset.append(last_discard_event)
                            last_discard_event = None

        except Exception as e:
            print(f"  ファイル {file_path} の処理中にエラー: {e}")

    # --- ステップ2 完了 ---
    end_time = time.time()
    print("\n-------------------------")
    print(f"全 {len(files_to_process)} ファイルの解析が完了しました。")
    print(f"処理時間: {end_time - start_time:.2f} 秒")
    print(f"作成された総データセット件数: {len(final_dataset)}")





--- ステップ2: 全ファイルの解析を開始します ---
  処理中... 20 / 3181 ファイル
  処理中... 40 / 3181 ファイル
  処理中... 60 / 3181 ファイル
  処理中... 80 / 3181 ファイル
  処理中... 100 / 3181 ファイル
  処理中... 120 / 3181 ファイル
  処理中... 140 / 3181 ファイル
  処理中... 160 / 3181 ファイル
  処理中... 180 / 3181 ファイル
  処理中... 200 / 3181 ファイル
  処理中... 220 / 3181 ファイル
  処理中... 240 / 3181 ファイル
  処理中... 260 / 3181 ファイル
  処理中... 280 / 3181 ファイル
  処理中... 300 / 3181 ファイル
  処理中... 320 / 3181 ファイル
  処理中... 340 / 3181 ファイル
  処理中... 360 / 3181 ファイル
  処理中... 380 / 3181 ファイル
  処理中... 400 / 3181 ファイル
  処理中... 420 / 3181 ファイル
  処理中... 440 / 3181 ファイル
  処理中... 460 / 3181 ファイル
  処理中... 480 / 3181 ファイル
  処理中... 500 / 3181 ファイル
  処理中... 520 / 3181 ファイル
  処理中... 540 / 3181 ファイル
  処理中... 560 / 3181 ファイル
  処理中... 580 / 3181 ファイル
  処理中... 600 / 3181 ファイル
  処理中... 620 / 3181 ファイル
  処理中... 640 / 3181 ファイル
  処理中... 660 / 3181 ファイル
  処理中... 680 / 3181 ファイル
  処理中... 700 / 3181 ファイル
  処理中... 720 / 3181 ファイル
  処理中... 740 / 3181 ファイル
  処理中... 760 / 3181 ファイル
  処理中... 780 / 3181 ファイ

In [None]:
import numpy as np
from sklearn.svm import SVR
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split, GridSearchCV # GridSearchCV をインポート
import random
import time

# (ステップ2で 'final_dataset' が作成されていることが前提)

print("\n--- ステップ3: 交差検証 (GridSearch) と SVRモデルの学習 ---")

if not final_dataset:
    print("データセットが空です。学習を中断します。")
else:
    # 1. サンプリング (前回と同じ)
    dataset_y_nonzero = [item for item in final_dataset if item['y'] > 0]
    dataset_y_zero = [item for item in final_dataset if item['y'] == 0]

    print(f"  ロンされたデータ (y>0): {len(dataset_y_nonzero)} 件")
    print(f"  ロンなしデータ (y=0): {len(dataset_y_zero)} 件")

    sample_rate = 0.01
    num_y_zero_to_sample = int(len(dataset_y_zero) * sample_rate)
    if len(dataset_y_nonzero) > num_y_zero_to_sample:
         num_y_zero_to_sample = len(dataset_y_nonzero)
         if num_y_zero_to_sample > len(dataset_y_zero):
             num_y_zero_to_sample = len(dataset_y_zero)

    sampled_y_zero = random.sample(dataset_y_zero, num_y_zero_to_sample)
    sampled_dataset = dataset_y_nonzero + sampled_y_zero
    random.shuffle(sampled_dataset)

    print(f"  サンプリング後 (y=0): {len(sampled_y_zero)} 件")
    print(f"  学習に使う総データ数: {len(sampled_dataset)} 件")

    # 2. Xとyに分離 (前回と同じ)
    X = np.array([item['X'] for item in sampled_dataset])
    y = np.array([item['y'] for item in sampled_dataset])

    print(f"\n特徴量Xの形状: {X.shape}")
    print(f"教師値yの形状: {y.shape}")

    # 3. スケーリング (前回と同じ)
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X)
    print("特徴量のスケーリング完了。")

    # --- 4. ★★★ここからが新しい部分 (GridSearch)★★★ ---

    # SVRのベースモデルを定義
    base_svr = SVR(kernel='rbf')

    # 1. 探索するハイパーパラメータの「グリッド（格子）」を定義
    # (元論文  の値 $c=2^{11}, g=2^{-8}$ の周辺を探索する例)
    param_grid = {
        'C': [2**9, 2**11, 2**13],       # [512, 2048, 8192]
        'gamma': [2**-10, 2**-8, 2**-6]  # [~0.00097, ~0.0039, ~0.0156]
    }

    # 2. グリッドサーチの設定
    #    cv=5 は「5分割交差検証」を意味します
    #    scoring='neg_mean_squared_error' は、元論文  の「平均二乗誤差」で評価することを意味します
    #    n_jobs=-1 は、Colabが使える全CPUコアを使って並列処理し、高速化します
    grid_search = GridSearchCV(
        estimator=base_svr,
        param_grid=param_grid,
        cv=5,
        scoring='neg_mean_squared_error',
        n_jobs=-1, # 高速化
        verbose=2  # 処理の進捗を表示
    )

    print("\nグリッドサーチ (5分割交差検証) を開始します...")
    print("!! 警告: この処理はデータ量とグリッド数に応じて、数十分～数時間かかる可能性があります !!")
    start_train_time = time.time()

    # 3. グリッドサーチ（学習）の実行
    #    ここで交差検証と全パターンの学習が自動で行われます
    grid_search.fit(X_scaled, y)

    end_train_time = time.time()
    print(f"\nグリッドサーチが完了しました！ (総時間: {end_train_time - start_train_time:.2f} 秒)")

    # 4. 最も良かった結果を表示
    print(f"\n最も良かった (平均二乗誤差が最小の) パラメータ:")
    print(grid_search.best_params_)
    print(f"その時のスコア (負の平均二乗誤差): {grid_search.best_score_:.2f}")

    # 5. 最適なパラメータで学習されたモデルを「svr_model」として保存
    #    (GridSearchCVは、最適だったモデルを .best_estimator_ に保存しています)
    svr_model = grid_search.best_estimator_





--- ステップ3: 交差検証 (GridSearch) と SVRモデルの学習 ---
  ロンされたデータ (y>0): 14674 件
  ロンなしデータ (y=0): 1350557 件
  サンプリング後 (y=0): 14674 件
  学習に使う総データ数: 29348 件

特徴量Xの形状: (29348, 6)
教師値yの形状: (29348,)
特徴量のスケーリング完了。

グリッドサーチ (5分割交差検証) を開始します...
!! 警告: この処理はデータ量とグリッド数に応じて、数十分～数時間かかる可能性があります !!
Fitting 5 folds for each of 9 candidates, totalling 45 fits

グリッドサーチが完了しました！ (総時間: 1735.68 秒)

最も良かった (平均二乗誤差が最小の) パラメータ:
{'C': 2048, 'gamma': 0.015625}
その時のスコア (負の平均二乗誤差): -14143563.82


In [None]:
 # --- 5. 予測テスト (最適化されたモデルを使用) ---
print("\n--- 予測テスト (最適化された新モデル) ---")

test_indices = random.sample(range(len(X)), 10)

test_X_scaled = X_scaled[test_indices]
test_y_actual = y[test_indices]

    # 最適化されたモデルで予測
test_y_pred = svr_model.predict(test_X_scaled)

for i in range(10):
        print(f"--- サンプル{i} ---")
        print(f"  特徴量(X): {X[test_indices[i]]}")
        print(f"  実際の点数(y): {test_y_actual[i]}")
        print(f"  SVRが予測した危険度: {test_y_pred[i]:.2f} 点")


--- 予測テスト (最適化された新モデル) ---
--- サンプル0 ---
  特徴量(X): [128   1   1   0   0   0]
  実際の点数(y): 12000
  SVRが予測した危険度: 1990.89 点
--- サンプル1 ---
  特徴量(X): [31  1  0  0  0  0]
  実際の点数(y): 0
  SVRが予測した危険度: 18.74 点
--- サンプル2 ---
  特徴量(X): [41  1  1  0  0  0]
  実際の点数(y): 5200
  SVRが予測した危険度: 3676.93 点
--- サンプル3 ---
  特徴量(X): [50  1  1  0  0  0]
  実際の点数(y): 2000
  SVRが予測した危険度: 3568.87 点
--- サンプル4 ---
  特徴量(X): [9 1 1 0 0 0]
  実際の点数(y): 0
  SVRが予測した危険度: 3907.29 点
--- サンプル5 ---
  特徴量(X): [73  1  1  0  0  0]
  実際の点数(y): 0
  SVRが予測した危険度: 3213.20 点
--- サンプル6 ---
  特徴量(X): [11  1  0  0  0  0]
  実際の点数(y): 0
  SVRが予測した危険度: 9.67 点
--- サンプル7 ---
  特徴量(X): [76  1  1  0  0  0]
  実際の点数(y): 5800
  SVRが予測した危険度: 3158.94 点
--- サンプル8 ---
  特徴量(X): [62  1  1  0  0  0]
  実際の点数(y): 0
  SVRが予測した危険度: 3397.03 点
--- サンプル9 ---
  特徴量(X): [98  1  1  0  0  0]
  実際の点数(y): 3900
  SVRが予測した危険度: 2712.26 点
