In [None]:

from pathlib import Path
import shutil
import zipfile

# Kaggle の入力データセット slug（username/slug の slug 部分）
DATASET_SLUG = 'gns-codes'
DATASET_ROOT = Path(f'/kaggle/input/{DATASET_SLUG}')
WORK_ROOT = Path('/kaggle/working')
repo_dir = WORK_ROOT / 'code'

code_dir = DATASET_ROOT / 'code'
code_zip = DATASET_ROOT / 'code.zip'

# 展開済み code/ を優先し、無ければ code.zip を展開
if code_dir.exists():
    src = code_dir
elif code_zip.exists():
    if repo_dir.exists():
        shutil.rmtree(repo_dir)
    with zipfile.ZipFile(code_zip) as zf:
        zf.extractall(repo_dir)
    src = repo_dir
else:
    raise FileNotFoundError(f"/kaggle/input/{DATASET_SLUG} に code も code.zip もありません。Add Data で {DATASET_SLUG} を追加してください。")

# フラット化（zip解凍で1階層挟まった場合）
if src != repo_dir:
    if repo_dir.exists():
        shutil.rmtree(repo_dir)
    shutil.copytree(src, repo_dir)
if repo_dir.exists():
    children = list(repo_dir.iterdir())
    if len(children) == 1 and children[0].is_dir():
        inner = children[0]
        for p in inner.iterdir():
            p.rename(repo_dir / p.name)
        inner.rmdir()

%cd $repo_dir


In [None]:

# PyG の radius_graph で必要になる torch-cluster だけインストール
import torch

torch_ver = torch.__version__.split('+')[0]
cuda_ver = torch.version.cuda
cuda_tag = 'cpu' if cuda_ver is None else 'cu' + cuda_ver.replace('.', '')
url = f"https://data.pyg.org/whl/torch-{torch_ver}+{cuda_tag}.html"
print('PyG wheels:', url)

!pip -q install torch-cluster -f {url}
!pip -q install torch_geometric


In [None]:

from pathlib import Path
import copy
import yaml

REPO = Path('/kaggle/working/code')
cfg_path = REPO / 'config_rollout.yaml'

# 推論に使うデータセット（Kaggle Dataset として追加してください）
dataset_root = "/kaggle/input/dam-break-left-800"

# 出力設定
output_root = REPO / 'rollouts'
viz_format = 'html'  # html|mp4|gif

with cfg_path.open('r', encoding='utf-8') as f:
    cfg = yaml.safe_load(f)

# データセットパスとロールアウト設定を上書き
cfg['method'] = 'gns'
cfg['rollout_inference_max_examples'] = 1
cfg['output_path'] = str(output_root)
cfg.setdefault('scenario_options', {}).setdefault('fluid', {})['dataset'] = dataset_root

# モデルは後続セルで差し替える（ベースを保存しておく）
cfg['model_path'] = str(REPO / 'models')
cfg['model_file'] = None
cfg['output_filename'] = 'rollout'

BASE_CFG = copy.deepcopy(cfg)

with cfg_path.open('w', encoding='utf-8') as f:
    yaml.safe_dump(cfg, f, allow_unicode=True)

print('ベース設定を書き出しました:', cfg_path)
print('dataset_root:', dataset_root)
print('output_path:', cfg['output_path'])


In [None]:
%cd /kaggle/working/code

import copy
import re
import subprocess
from pathlib import Path

from analyze_rollouts import analyze_rollout

# 比較対象モデルを集約（rollout_diff 優先）
model_roots = [
    REPO / 'models' / 'rollout_diff',
    REPO / 'models',
]
model_files: list[Path] = []
for root in model_roots:
    if not root.exists():
        continue
    for path in root.glob('model-*.pt'):
        model_files.append(path.resolve())

# 重複除去 & ソート（親ディレクトリ優先→ステップ番号）
seen = set()
unique_models: list[Path] = []
for p in model_files:
    if p in seen:
        continue
    seen.add(p)
    unique_models.append(p)

def _step_key(p: Path):
    m = re.search(r'(\d+)', p.stem)
    step = int(m.group(1)) if m else -1
    priority = 0 if p.parent.name == 'rollout_diff' else 1
    return (priority, p.parent.name, step)

model_files = sorted(unique_models, key=_step_key)

if not model_files:
    raise FileNotFoundError('model-*.pt が見つかりません。models/ 下に配置してください。')

print('評価対象モデル:')
for p in model_files:
    print(' -', p)

results = []

for model_path in model_files:
    tag = f"{model_path.parent.name}-{model_path.stem}"
    cfg = copy.deepcopy(BASE_CFG)
    cfg['model_path'] = str(model_path.parent)
    cfg['model_file'] = str(model_path)
    cfg['output_filename'] = f"rollout_{tag}"

    with cfg_path.open('w', encoding='utf-8') as f:
        yaml.safe_dump(cfg, f, allow_unicode=True)

    cmd = ['python', 'src/train.py', '--config', str(cfg_path)]
    print(f"\n=== {tag} ===")
    print('Running:', ' '.join(cmd))
    subprocess.run(cmd, check=True)

    output_dir = Path(cfg['output_path']) / cfg['method'] / cfg['output_filename']
    pkl_path = output_dir / f"{cfg['output_filename']}_ex0.pkl"
    if not pkl_path.exists():
        raise FileNotFoundError(f"{pkl_path} がありません。推論が成功したか確認してください。")

    res = analyze_rollout(pkl_path)
    res['tag'] = tag
    res['pkl_path'] = str(pkl_path)
    results.append(res)
    print(f"  タイムステップ数: {res['n_timesteps']} / 平均距離誤差: {res['mean_distance_error']:.6f}")


In [None]:

import re
import numpy as np
import matplotlib.pyplot as plt
from pathlib import Path

MAX_SUMMARY_STEPS = 100
MAX_PLOT_STEPS = 150  # 1ステップ誤差可視化の表示上限（長すぎると読みにくいため）
# モデルごとに評価を打ち切る最大ステップ数を指定（なければ全ステップ）
STEP_LIMITS = {
    # 'rollout_diff-model-100': 100,
    # 'rollout_diff-model-200': 200,
}
AUTO_LIMIT_FROM_TAG = True  # タグ末尾の数値 (例: model-400) を上限として使う

def resolve_limit(tag: str, total_len: int) -> int:
    if tag in STEP_LIMITS:
        return min(STEP_LIMITS[tag], total_len)
    if AUTO_LIMIT_FROM_TAG:
        m = re.search(r'(\d+)(?!.*\d)', tag)
        if m:
            return min(int(m.group(1)), total_len)
    return total_len

if not results:
    print('results が空です。前のセルを実行してください。')
else:
    # -------- 全タイムステップの距離誤差（従来のラインプロット） --------
    plt.figure(figsize=(10, 6))
    for r in results:
        err = np.array(r['distance_error_per_timestep'])
        limit = resolve_limit(r['tag'], len(err))
        err = err[:limit]
        timesteps = np.arange(len(err))
        plt.plot(
            timesteps,
            err,
            label=f"{r['tag']} (T={len(err)})",
        )
    plt.xlabel('timestep')
    plt.ylabel('mean distance error')
    plt.title('Rollout distance error per timestep')
    plt.grid(True, alpha=0.3)
    plt.legend()
    plt.tight_layout()

    plot_path = output_root / 'distance_error_comparison.png'
    plt.savefig(plot_path, dpi=150)
    plt.show()
    print('プロットを保存:', plot_path)

    # -------- 1ステップ誤差（タイムステップごと、散布＋線） --------
    plt.figure(figsize=(10, 6))
    for r in results:
        err = np.array(r['distance_error_per_timestep'])
        limit = resolve_limit(r['tag'], len(err))
        limit = min(limit, MAX_PLOT_STEPS)
        timesteps = np.arange(limit)
        plt.plot(timesteps, err[:limit], marker='o', markersize=3, linewidth=1.2,
                 label=f"{r['tag']} (T={limit})")
    plt.xlabel('timestep')
    plt.ylabel('mean distance error (1-step)')
    plt.title(f'1-step error per timestep (up to {MAX_PLOT_STEPS} or tag limit)')
    plt.grid(True, alpha=0.3)
    plt.legend()
    plt.tight_layout()

    plot_path_step = output_root / 'distance_error_per_timestep.png'
    plt.savefig(plot_path_step, dpi=150)
    plt.show()
    print('1ステップ誤差プロットを保存:', plot_path_step)

    # -------- サマリ --------
    print('\nサマリ（平均距離誤差と長さ）')
    for r in results:
        err = np.array(r['distance_error_per_timestep'])
        limit = resolve_limit(r['tag'], len(err))
        err = err[:limit]
        mean_full = float(err.mean())
        mean_100 = float(err[:min(MAX_SUMMARY_STEPS, len(err))].mean())
        print(f"- {r['tag']}: steps={len(err)}, mean_full={mean_full:.6f}, mean@<=100={mean_100:.6f}")
