# PyTorchマルチタスク学習による競馬予想モデル

年度パックNPZファイルからデータを読み込み、PyTorchベースのマルチタスク学習モデルを学習します。

## PyTorchマルチタスク学習とは

着順予測（ListNet風Listwise Loss）と走破タイム予測（回帰）を**同時に学習**する真のマルチタスク学習です。

### アーキテクチャ
- **共有エンコーダー**: ResNet風のMLP（BatchNorm + Dropout + スキップ接続）
- **着順予測ヘッド**: ランキングスコア出力（ListNet Loss）
- **タイム予測ヘッド**: 正規化タイム出力（MSE Loss）

### 学習方法
- **ListNet Loss**: レース単位で順位確率分布を計算し、クロスエントロピーで損失を計算
- **損失関数の重み付け**: 着順予測 0.7、タイム予測 0.3
- **同時学習**: 2つのタスクを同時に学習することで、特徴量の共有により精度向上

### タスク構成
- **タスク1: 着順予測**（ListNet風Listwise Loss）
- **タスク2: 走破タイム予測**（回帰）

### 事実ベースの特徴量のみを使用
- JRDBの事前予想は除外（ペース予想、テン指数、上がり指数、位置指数など）
- オッズは除外
- 実力に基づいた予測を実現

### 期待される効果
- より高い的中率（ListNet Lossによる精度向上）
- タイム予測による実力評価
- マルチタスク学習による特徴量の共有と精度向上


## インポート


In [1]:
import sys
import os
from pathlib import Path
import importlib

# プロジェクトルート（apps/prediction/）をパスに追加
project_root = Path().resolve().parent  # notebooks/ -> apps/prediction/
sys.path.insert(0, str(project_root))

# 仮想環境のパスを確認（.venv/bin/python または .venv/Scripts/python）
venv_python = project_root / '.venv' / 'bin' / 'python'
if not venv_python.exists():
    venv_python = project_root / '.venv' / 'Scripts' / 'python.exe'

# 仮想環境が存在する場合、sys.executableを確認
if venv_python.exists():
    current_python = sys.executable
    venv_python_str = str(venv_python)
    if venv_python_str not in current_python:
        print(f"警告: 仮想環境が有効化されていない可能性があります")
        print(f"現在のPython: {current_python}")
        print(f"仮想環境のPython: {venv_python_str}")
        print(f"仮想環境を有効化するには、以下のコマンドを実行してください:")
        print(f"  source {project_root}/.venv/bin/activate  # macOS/Linux")
        print(f"  または")
        print(f"  {project_root}/.venv/Scripts/activate  # Windows")

# モジュールの再読み込みを確実にする
if 'src.preprocessor' in sys.modules:
    importlib.reload(sys.modules['src.preprocessor'])
if 'src.data_loader' in sys.modules:
    importlib.reload(sys.modules['src.data_loader'])
if 'src.pytorch_multitask_predictor' in sys.modules:
    importlib.reload(sys.modules['src.pytorch_multitask_predictor'])
if 'src.features' in sys.modules:
    importlib.reload(sys.modules['src.features'])

try:
    import numpy as np
    import pandas as pd
    import torch
    import matplotlib.pyplot as plt
    import seaborn as sns
except ImportError as e:
    print(f"エラー: 必要なライブラリがインストールされていません: {e}")
    print(f"現在のPython: {sys.executable}")
    print(f"仮想環境のパス: {venv_python if venv_python.exists() else '見つかりません'}")
    print("\n以下のコマンドで仮想環境を有効化してから、パッケージをインストールしてください:")
    print(f"  cd {project_root}")
    print(f"  source .venv/bin/activate  # macOS/Linux")
    print(f"  または")
    print(f"  .venv\\Scripts\\activate  # Windows")
    print(f"  pip install -r requirements.txt")
    raise

try:
    from src.data_loader import load_annual_pack_npz, load_multiple_npz_files
    from src.preprocessor import Preprocessor
    from src.pytorch_multitask_predictor import MultitaskPredictor
    from src.features import Features
except ImportError as e:
    print(f"エラー: プロジェクトモジュールのインポートに失敗しました: {e}")
    print(f"プロジェクトルート: {project_root}")
    print("プロジェクトルートが正しく設定されているか確認してください。")
    raise

# %reload_ext autoreload  # nbconvert実行時はコメントアウト
# %autoreload 2

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)

# PyTorch設定
print(f"Python: {sys.executable}")
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA device: {torch.cuda.get_device_name(0)}")


Python: /Users/soichiro/Dev/umayomi/apps/prediction/.venv/bin/python
PyTorch version: 2.9.0
CUDA available: False


## 設定


In [2]:
# NPZファイルが格納されているベースパス
BASE_PATH = Path('./data')  # apps/prediction/notebooks/data

# 使用するデータタイプ
# レース開始時点で利用可能なデータのみを含める
# オッズデータ（OZ, OW, OU, OT, OV）と払戻データ（HJC, HJB）は除外
# 注意: 実際のファイル名は SEC ですが、preprocessor は SED/SEC の両方をサポートしています
DATA_TYPES = [
    'BAC',  # 番組データ（レース条件・出走馬一覧）
    'KYI',  # 競走馬データ（牧場先情報付き・最も詳細）
    'SEC',  # 成績速報データ（過去の成績・前走データ抽出に使用、教師データとして使用）
    'UKC',  # 馬基本データ（血統登録番号・性別・生年月日・血統情報）
    'TYB',  # 直前情報データ（出走直前の馬の状態・当日予想に最重要）
]

# 使用する年度
YEARS = [2024]  # 必要に応じて複数年度を指定

# モデル保存パス
MODEL_PATH = Path('../models/pytorch_multitask_model_v1.pth')
MODEL_PATH.parent.mkdir(parents=True, exist_ok=True)

# ファイル名の確認（デバッグ用）
print(f"BASE_PATH: {BASE_PATH.absolute()}")
if BASE_PATH.exists():
    npz_files = list(BASE_PATH.glob('*.npz'))
    print(f"見つかったNPZファイル: {len(npz_files)}件")
    if len(npz_files) > 0:
        for f in npz_files[:5]:  # 最初の5件を表示
            print(f"  - {f.name}")
        # 必要なデータタイプが存在するか確認
        required_prefixes = [f'jrdb_npz_{dt}_' for dt in DATA_TYPES]
        found_types = []
        for prefix in required_prefixes:
            matching = [f for f in npz_files if f.name.startswith(prefix)]
            if matching:
                found_types.append(prefix.replace('jrdb_npz_', '').replace('_', ''))
        print(f"見つかったデータタイプ: {found_types}")
        missing_types = [dt for dt in DATA_TYPES if dt not in found_types]
        if missing_types:
            print(f"警告: 以下のデータタイプが見つかりません: {missing_types}")
    else:
        print("警告: NPZファイルが見つかりません")
else:
    print(f"警告: {BASE_PATH} が存在しません")
    print("データディレクトリを作成するか、正しいパスを指定してください。")


BASE_PATH: /Users/soichiro/Dev/umayomi/apps/prediction/notebooks/data
見つかったNPZファイル: 10件
  - jrdb_npz_SEC_2024.npz
  - jrdb_npz_UKC_2024.npz
  - jrdb_npz_KYH_2024.npz
  - jrdb_npz_KYI_2024.npz
  - jrdb_npz_SED_2024.npz
見つかったデータタイプ: ['BAC', 'KYI', 'SEC', 'UKC', 'TYB']


## データ読み込みと前処理


In [3]:
# 前処理を実行
preprocessor = Preprocessor()

print("データ読み込みと前処理を開始します...")
try:
    df = preprocessor.process(
        base_path=BASE_PATH,
        data_types=DATA_TYPES,
        years=YEARS,
        use_annual_pack=True
    )

    print(f"\nデータ読み込み完了: {len(df)}件")
    print(f"レース数: {df.index.nunique()}")
    print(f"\nデータ形状: {df.shape}")
    print(f"\n列名: {df.columns.tolist()[:20]}...")  # 最初の20列を表示
    
    # rankフィールドの確認
    if 'rank' in df.columns:
        print(f"\nrankフィールド: あり（欠損値: {df['rank'].isnull().sum()}件）")
        print(f"着順の分布: {df['rank'].value_counts().sort_index()}")
    else:
        print("\n警告: rankフィールドが見つかりません")
    
    # タイムフィールドの確認（SEDデータから取得）
    if 'タイム' in df.columns:
        print(f"\nタイムフィールド: あり（欠損値: {df['タイム'].isnull().sum()}件）")
        print(f"タイムの基本統計:")
        print(df['タイム'].describe())
    else:
        print("\n警告: タイムフィールドが見つかりません（SEDデータから取得する必要があります）")
        
except Exception as e:
    print(f"エラーが発生しました: {e}")
    import traceback
    traceback.print_exc()
    raise


データ読み込みと前処理を開始します...
データ読み込み中...


データ読み込み:  40%|████      | 2/5 [00:00<00:00, 16.85it/s]

読み込み完了: BAC - 合計 3454件
読み込み完了: KYI - 合計 47181件
読み込み完了: SEC - 合計 51211件


データ読み込み: 100%|██████████| 5/5 [00:00<00:00, 17.11it/s]


読み込み完了: UKC - 合計 47181件
読み込み完了: TYB - 合計 94380件
データ結合中...
KYIデータ: 総数=47181件
BACデータ: 総数=3454件, ユニークレース数=3454件
KYIデータ: ユニークレース数=3454件
  KYIのみのレース数: 0件
  BACのみのレース数: 0件


Traceback (most recent call last):
  File "/var/folders/mm/c2gn__y56p58dssh1byn5wbh0000gn/T/ipykernel_30489/346585666.py", line 6, in <module>
    df = preprocessor.process(
         ^^^^^^^^^^^^^^^^^^^^^
  File "/Users/soichiro/Dev/umayomi/apps/prediction/src/preprocessor.py", line 817, in process
    combined_df = self.combine_data_types(data_dict)
                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Users/soichiro/Dev/umayomi/apps/prediction/src/preprocessor.py", line 284, in combine_data_types
    df = FeatureConverter.add_race_key_to_df(
         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Users/soichiro/Dev/umayomi/apps/prediction/src/feature_converter.py", line 333, in add_race_key_to_df
    year, month, day = FeatureConverter.extract_ymd_from_df_vectorized(
                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Users/soichiro/Dev/umayomi/apps/prediction/src/feature_converter.py", line 155, in extract_ymd_from_df_vectorized
    ymd_str_primar

エラーが発生しました: cannot convert float NaN to integer


ValueError: cannot convert float NaN to integer

## データ分割


In [None]:
# 時系列でデータを分割（未来の情報を使わない）
if 'df' not in locals() or df is None:
    raise ValueError("エラー: データが読み込まれていません。先にCell 6を実行してください。")

if len(df) == 0:
    raise ValueError("エラー: データが空です。データ読み込みを確認してください。")

# 時系列ソート用のカラムを確認
sort_column = None
for col in ['start_datetime', '年月日', 'date', 'race_date']:
    if col in df.columns:
        sort_column = col
        break

if sort_column is None:
    print("警告: 時系列カラムが見つかりません。インデックスでソートします。")
    df_sorted = df.copy()
    # インデックスがrace_keyの場合、race_keyから日付を抽出を試みる
    if df.index.name == 'race_key' or 'race_key' in df.columns:
        print("race_keyから日付情報を抽出できないため、ランダムに分割します。")
        # ランダムに分割（時系列分割ができない場合）
        df_sorted = df.sample(frac=1, random_state=42).reset_index(drop=True)
    else:
        df_sorted = df.copy()
else:
    print(f"時系列カラム '{sort_column}' でソートします。")
    df_sorted = df.sort_values(sort_column, ascending=True)

# 学習データ: 80%
# 検証データ: 20%
split_idx = int(len(df_sorted) * 0.8)

if split_idx == 0:
    raise ValueError("エラー: データが少なすぎます（分割後0件）。")

train_df = df_sorted.iloc[:split_idx].copy()
val_df = df_sorted.iloc[split_idx:].copy()

print(f"学習データ: {len(train_df)}件 ({len(train_df) / len(df_sorted) * 100:.1f}%)")
print(f"検証データ: {len(val_df)}件 ({len(val_df) / len(df_sorted) * 100:.1f}%)")

if sort_column:
    print(f"\n学習データの期間: {train_df[sort_column].min()} ～ {train_df[sort_column].max()}")
    print(f"検証データの期間: {val_df[sort_column].min()} ～ {val_df[sort_column].max()}")

# rankとタイムの確認
if 'rank' in train_df.columns:
    train_rank_count = train_df['rank'].notna().sum()
    print(f"\n学習データのrank有効数: {train_rank_count} / {len(train_df)}")
else:
    print("\n警告: 学習データに'rank'カラムがありません")

if 'タイム' in train_df.columns:
    train_time_count = train_df['タイム'].notna().sum()
    print(f"学習データのタイム有効数: {train_time_count} / {len(train_df)}")
else:
    print("警告: 学習データに'タイム'カラムがありません")


## PyTorchマルチタスク学習


In [None]:
# マルチタスク学習モデルを初期化
if 'train_df' not in locals() or train_df is None:
    raise ValueError("エラー: 学習データが準備されていません。先にCell 8を実行してください。")
if 'val_df' not in locals() or val_df is None:
    raise ValueError("エラー: 検証データが準備されていません。先にCell 8を実行してください。")

# データの確認
if len(train_df) == 0:
    raise ValueError("エラー: 学習データが空です。")
if len(val_df) == 0:
    raise ValueError("エラー: 検証データが空です。")

# rankとタイムの有効データ数を確認
train_valid = train_df.dropna(subset=['rank', 'タイム']) if 'rank' in train_df.columns and 'タイム' in train_df.columns else train_df
val_valid = val_df.dropna(subset=['rank', 'タイム']) if 'rank' in val_df.columns and 'タイム' in val_df.columns else val_df

print(f"学習データ: {len(train_df)}件（有効データ: {len(train_valid)}件）")
print(f"検証データ: {len(val_df)}件（有効データ: {len(val_valid)}件）")

if len(train_valid) == 0:
    print("警告: 学習データに有効なrank/タイムデータがありません。")
if len(val_valid) == 0:
    print("警告: 検証データに有効なrank/タイムデータがありません。")

try:
    predictor = MultitaskPredictor(
        train_df=train_df,
        val_df=val_df,
        hidden_dims=[512, 256, 128, 64],  # ResNet風MLPの隠れ層サイズ
        dropout=0.3,  # 過学習防止
        rank_weight=0.7,  # 着順予測の重み
        time_weight=0.3,  # タイム予測の重み
        learning_rate=1e-3,
        device=None  # 自動選択（CUDAがあれば使用）
    )

    print(f"\nモデルアーキテクチャ:")
    print(f"  入力次元: {len(predictor.train_dataset.feature_names)}")
    print(f"  隠れ層: {[512, 256, 128, 64]}")
    print(f"  デバイス: {predictor.device}")
    print(f"\n学習データセット: {len(predictor.train_dataset)}レース")
    print(f"検証データセット: {len(predictor.val_dataset)}レース")
except Exception as e:
    print(f"エラーが発生しました: {e}")
    import traceback
    traceback.print_exc()
    print("\nデバッグ情報:")
    print(f"  train_df.shape: {train_df.shape}")
    print(f"  train_df.columns: {train_df.columns.tolist()[:10]}...")
    if 'rank' in train_df.columns:
        print(f"  rank有効数: {train_df['rank'].notna().sum()}")
    if 'タイム' in train_df.columns:
        print(f"  タイム有効数: {train_df['タイム'].notna().sum()}")
    raise


In [None]:
# 学習を実行
if 'predictor' not in locals() or predictor is None:
    raise ValueError("エラー: モデルが初期化されていません。先にCell 10を実行してください。")
if 'MODEL_PATH' not in locals():
    raise ValueError("エラー: MODEL_PATHが定義されていません。先にCell 4を実行してください。")

# データセットの確認
if len(predictor.train_dataset) == 0:
    raise ValueError("エラー: 学習データセットが空です。")
if len(predictor.val_dataset) == 0:
    print("警告: 検証データセットが空です。検証スキップモードで学習します。")

print("=" * 60)
print("PyTorchマルチタスク学習を開始")
print("=" * 60)
print(f"学習レース数: {len(predictor.train_dataset)}")
print(f"検証レース数: {len(predictor.val_dataset)}")
print(f"デバイス: {predictor.device}")
print("=" * 60)

try:
    history = predictor.train(
        num_epochs=50,
        early_stopping_patience=10,
        verbose=True
    )

    print("\n学習完了")
    print(f"モデル保存パス: {MODEL_PATH}")

    # モデルを保存
    predictor.save_model(str(MODEL_PATH))
    print(f"モデルを保存しました: {MODEL_PATH}")
    
    # 学習履歴の確認
    if history and len(history.get('total_loss', [])) > 0:
        print(f"\n最終損失: {history['total_loss'][-1]:.4f}")
        if len(history.get('val_ndcg', [])) > 0:
            print(f"最終NDCG@3: {history['val_ndcg'][-1]:.4f}")
except Exception as e:
    print(f"エラーが発生しました: {e}")
    import traceback
    traceback.print_exc()
    print("\nデバッグ情報:")
    print(f"  学習データセットサイズ: {len(predictor.train_dataset)}")
    print(f"  検証データセットサイズ: {len(predictor.val_dataset)}")
    print(f"  デバイス: {predictor.device}")
    if len(predictor.train_dataset) > 0:
        try:
            # 最初のサンプルを取得して確認
            sample = predictor.train_dataset[0]
            print(f"  サンプル特徴量形状: {sample['features'].shape}")
            print(f"  サンプルrank_targets形状: {sample['rank_targets'].shape}")
            print(f"  サンプルtime_targets形状: {sample['time_targets'].shape}")
        except Exception as sample_e:
            print(f"  サンプル取得エラー: {sample_e}")
    raise


## 学習結果の可視化


In [None]:
# 学習履歴を可視化
if 'history' not in locals() or history is None:
    raise ValueError("エラー: 学習履歴がありません。先にCell 11を実行してください。")

# 履歴が空でないか確認
if not isinstance(history, dict) or len(history) == 0:
    print("警告: 学習履歴が空です。学習が正常に完了していない可能性があります。")
else:
    fig, axes = plt.subplots(2, 2, figsize=(15, 10))

    # 損失の推移
    has_loss_data = False
    if len(history.get('total_loss', [])) > 0:
        axes[0, 0].plot(history['total_loss'], label='Total Loss')
        has_loss_data = True
    if len(history.get('rank_loss', [])) > 0:
        axes[0, 0].plot(history['rank_loss'], label='Rank Loss')
        has_loss_data = True
    if len(history.get('time_loss', [])) > 0:
        axes[0, 0].plot(history['time_loss'], label='Time Loss')
        has_loss_data = True
    
    if has_loss_data:
        axes[0, 0].legend()
        axes[0, 0].grid(True)
    else:
        axes[0, 0].text(0.5, 0.5, 'No loss data', ha='center', va='center')
    axes[0, 0].set_xlabel('Epoch')
    axes[0, 0].set_ylabel('Loss')
    axes[0, 0].set_title('Training Loss')

    # 検証NDCGの推移
    if len(history.get('val_ndcg', [])) > 0:
        axes[0, 1].plot(history['val_ndcg'], label='Validation NDCG@3', color='green')
        axes[0, 1].legend()
        axes[0, 1].grid(True)
    else:
        axes[0, 1].text(0.5, 0.5, 'No validation data', ha='center', va='center')
    axes[0, 1].set_xlabel('Epoch')
    axes[0, 1].set_ylabel('NDCG@3')
    axes[0, 1].set_title('Validation NDCG@3')

    # 最終エポックの損失内訳
    if len(history.get('rank_loss', [])) > 0 and len(history.get('time_loss', [])) > 0:
        axes[1, 0].bar(['Rank Loss', 'Time Loss'], 
                       [history['rank_loss'][-1], history['time_loss'][-1]])
        axes[1, 0].set_ylabel('Loss')
        axes[1, 0].set_title('Final Loss Breakdown')
    else:
        axes[1, 0].text(0.5, 0.5, 'No loss data', ha='center', va='center')
        axes[1, 0].set_title('Final Loss Breakdown')

    # ベストNDCG
    if len(history.get('val_ndcg', [])) > 0:
        best_ndcg = max(history['val_ndcg'])
        best_epoch = history['val_ndcg'].index(best_ndcg) + 1
        axes[1, 1].text(0.5, 0.5, f'Best NDCG@3: {best_ndcg:.4f}\nBest Epoch: {best_epoch}',
                        ha='center', va='center', fontsize=14, 
                        bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))
    else:
        axes[1, 1].text(0.5, 0.5, 'No validation data',
                        ha='center', va='center', fontsize=14, 
                        bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))
    axes[1, 1].axis('off')
    axes[1, 1].set_title('Best Performance')

    plt.tight_layout()
    plt.show()

    print(f"\n最終結果:")
    if len(history.get('val_ndcg', [])) > 0:
        best_ndcg = max(history['val_ndcg'])
        best_epoch = history['val_ndcg'].index(best_ndcg) + 1
        print(f"  最終NDCG@3: {history['val_ndcg'][-1]:.4f}")
        print(f"  ベストNDCG@3: {best_ndcg:.4f} (Epoch {best_epoch})")
    else:
        print(f"  最終NDCG@3: N/A（検証データなし）")
        print(f"  ベストNDCG@3: N/A")
    if len(history.get('rank_loss', [])) > 0:
        print(f"  最終Rank Loss: {history['rank_loss'][-1]:.4f}")
    else:
        print(f"  最終Rank Loss: N/A")
    if len(history.get('time_loss', [])) > 0:
        print(f"  最終Time Loss: {history['time_loss'][-1]:.4f}")
    else:
        print(f"  最終Time Loss: N/A")


## 予測と評価


In [None]:
# 検証データで予測
if 'predictor' not in locals() or predictor is None:
    raise ValueError("エラー: モデルが初期化されていません。先にCell 10を実行してください。")
if 'val_df' not in locals() or val_df is None:
    raise ValueError("エラー: 検証データが準備されていません。先にCell 8を実行してください。")

print("検証データで予測を実行...")
try:
    predictions = predictor.predict(val_df)
    print(f"予測完了: {len(predictions)}件の予測結果")
except Exception as e:
    print(f"予測中にエラーが発生しました: {e}")
    import traceback
    traceback.print_exc()
    raise

# インデックスがrace_keyかどうかを確認
if predictions.index.name == 'race_key':
    race_keys = predictions.index.unique()
    print(f"race_keyがインデックス: {len(race_keys)}レース")
else:
    # race_keyがカラムの場合
    if 'race_key' in predictions.columns:
        race_keys = predictions['race_key'].unique()
        print(f"race_keyがカラム: {len(race_keys)}レース")
    else:
        # race_keyが見つからない場合、インデックスから取得を試みる
        if hasattr(predictions.index, 'names') and 'race_key' in predictions.index.names:
            race_keys = predictions.index.get_level_values('race_key').unique()
            print(f"race_keyがマルチインデックス: {len(race_keys)}レース")
        else:
            raise ValueError("race_keyが見つかりません（インデックスにもカラムにも存在しません）")

# 予測結果を確認
print(f"\n予測結果のサンプル（最初の5レース）:")
sample_races = list(race_keys)[:5] if len(race_keys) > 0 else []

if len(sample_races) == 0:
    print("警告: 予測対象のレースがありません")
else:
    for race_key in sample_races:
        try:
            # レースデータを取得
            if predictions.index.name == 'race_key':
                race_pred = predictions.loc[race_key].copy()
            elif hasattr(predictions.index, 'names') and 'race_key' in predictions.index.names:
                race_pred = predictions.loc[predictions.index.get_level_values('race_key') == race_key].copy()
            else:
                race_pred = predictions[predictions['race_key'] == race_key].copy()
            
            if len(race_pred) == 0:
                print(f"\nレース: {race_key} - データが見つかりません")
                continue
            
            # rank_predでソート（降順：スコアが高い順）
            if 'rank_pred' in race_pred.columns:
                race_pred = race_pred.sort_values('rank_pred', ascending=False)
            
            print(f"\nレース: {race_key} ({len(race_pred)}頭)")
            
            # 表示するカラムを選択
            display_cols = []
            if 'rank' in race_pred.columns:
                display_cols.append('rank')
            if 'rank_pred' in race_pred.columns:
                display_cols.append('rank_pred')
            if 'time_pred' in race_pred.columns:
                display_cols.append('time_pred')
            if 'タイム' in race_pred.columns:
                display_cols.append('タイム')
            
            if display_cols:
                print(race_pred[display_cols].head(10))
            else:
                print("表示可能なカラムが見つかりません")
                print(f"利用可能なカラム: {race_pred.columns.tolist()[:10]}")
        except Exception as e:
            print(f"\nレース: {race_key} - エラー: {e}")
            continue

# NDCGを計算（レース単位）
from src.evaluator import calculate_ndcg

ndcg_scores = []
valid_races = 0
skipped_races = 0

for race_key in race_keys:
    try:
        # レースデータを取得
        if predictions.index.name == 'race_key':
            race_pred = predictions.loc[race_key].copy()
        elif hasattr(predictions.index, 'names') and 'race_key' in predictions.index.names:
            race_pred = predictions.loc[predictions.index.get_level_values('race_key') == race_key].copy()
        else:
            race_pred = predictions[predictions['race_key'] == race_key].copy()
        
        # rankとrank_predが存在し、NaNでないデータのみを使用
        if 'rank' not in race_pred.columns or 'rank_pred' not in race_pred.columns:
            skipped_races += 1
            continue
        
        # NaNを除外
        race_pred_clean = race_pred.dropna(subset=['rank', 'rank_pred'])
        
        if len(race_pred_clean) == 0:
            skipped_races += 1
            continue
        
        race_rank_preds = race_pred_clean['rank_pred'].values
        race_rank_targets = race_pred_clean['rank'].values
        
        # NaNチェック
        if np.isnan(race_rank_preds).any() or np.isnan(race_rank_targets).any():
            skipped_races += 1
            continue
        
        ndcg = calculate_ndcg(race_rank_targets, race_rank_preds, k=3)
        ndcg_scores.append(ndcg)
        valid_races += 1
    except Exception as e:
        skipped_races += 1
        continue

if len(ndcg_scores) > 0:
    print(f"\n検証データ全体のNDCG@3: {np.mean(ndcg_scores):.4f}")
    print(f"NDCG@3の標準偏差: {np.std(ndcg_scores):.4f}")
    print(f"評価対象レース数: {valid_races} / {len(race_keys)}")
    if skipped_races > 0:
        print(f"スキップされたレース数: {skipped_races}")
else:
    print("\n警告: 評価可能なレースがありません（rankまたはrank_predが欠損）")
    print(f"総レース数: {len(race_keys)}")
    print(f"スキップされたレース数: {skipped_races}")
