# NeuralForecast 時系列 MLOps 拡張レポートノートブック

このノートブックでは、今回追加した以下のコンポーネントについて、

- ディレクトリ構成と役割の解説
- 代表的な API の実行・動作確認
- メタデータテーブル（DDL）の確認
- HTML レポートなどの成果物確認
- （オプション）pytest による一括テスト実行

を **段階的に** 実行しながら確認できるように構成しています。

対象モジュール:

- `src/nf_logging/`
  - `wandb_logger.py`
  - `mlflow_logger.py`
- `src/nf_monitoring/`
  - `prometheus_metrics.py`
  - `resource_monitor.py`
- `src/nf_analysis/`
  - `drift.py`
  - `anomaly.py`
  - `model_stats.py`
- `src/nf_reports/`
  - `html_reporter.py`
- `src/nf_metadata/`
  - `schema_definitions.py`
- `sql/002_extend_metadata_tables.sql`
- `tests/` 以下の各テストモジュール

このノートブックは **プロジェクトルート直下**（例: `C:\\nf\\nf_loto_webui`）に置いて実行する想定です。

## 1. 環境セットアップ（パス設定）

まず、`src/` を `sys.path` に追加し、追加したモジュール群をインポートできるようにします。

- 通常は、このノートブックをプロジェクトルートに置いた状態で `PROJECT_ROOT = Path.cwd()` のままで動きます。
- もし別ディレクトリに置く場合は、`PROJECT_ROOT` を明示的に書き換えてください。

In [1]:
from pathlib import Path
import sys

# ▼必要に応じて書き換え▼
# プロジェクトルートをこのノートブックのカレントディレクトリとみなす
PROJECT_ROOT = Path.cwd()

# 例: 固定で指定したい場合（Windows）
# PROJECT_ROOT = Path(r"C:\nf\nf_loto_webui")

SRC_ROOT = PROJECT_ROOT / "src"
TESTS_ROOT = PROJECT_ROOT / "tests"
SQL_ROOT = PROJECT_ROOT / "sql"

print("PROJECT_ROOT:", PROJECT_ROOT)
print("SRC_ROOT    :", SRC_ROOT)
print("TESTS_ROOT  :", TESTS_ROOT)
print("SQL_ROOT    :", SQL_ROOT)

if str(SRC_ROOT) not in sys.path:
    sys.path.insert(0, str(SRC_ROOT))

PROJECT_ROOT: c:\nf\nf_loto_webui
SRC_ROOT    : c:\nf\nf_loto_webui\src
TESTS_ROOT  : c:\nf\nf_loto_webui\tests
SQL_ROOT    : c:\nf\nf_loto_webui\sql


## 2. 追加ディレクトリ・ファイル構成の確認

まずは、今回追加した主なディレクトリ・ファイルが存在するかを確認します。

In [2]:
from pprint import pprint

expected_paths = [
    SRC_ROOT / "nf_logging" / "wandb_logger.py",
    SRC_ROOT / "nf_logging" / "mlflow_logger.py",
    SRC_ROOT / "nf_monitoring" / "prometheus_metrics.py",
    SRC_ROOT / "nf_monitoring" / "resource_monitor.py",
    SRC_ROOT / "nf_analysis" / "drift.py",
    SRC_ROOT / "nf_analysis" / "anomaly.py",
    SRC_ROOT / "nf_analysis" / "model_stats.py",
    SRC_ROOT / "nf_reports" / "html_reporter.py",
    SRC_ROOT / "nf_metadata" / "schema_definitions.py",
    SQL_ROOT / "002_extend_metadata_tables.sql",
]

for path in expected_paths:
    print(f"{path} -> {'OK' if path.exists() else 'MISSING'}")

c:\nf\nf_loto_webui\src\nf_logging\wandb_logger.py -> OK
c:\nf\nf_loto_webui\src\nf_logging\mlflow_logger.py -> OK
c:\nf\nf_loto_webui\src\nf_monitoring\prometheus_metrics.py -> OK
c:\nf\nf_loto_webui\src\nf_monitoring\resource_monitor.py -> OK
c:\nf\nf_loto_webui\src\nf_analysis\drift.py -> OK
c:\nf\nf_loto_webui\src\nf_analysis\anomaly.py -> OK
c:\nf\nf_loto_webui\src\nf_analysis\model_stats.py -> OK
c:\nf\nf_loto_webui\src\nf_reports\html_reporter.py -> OK
c:\nf\nf_loto_webui\src\nf_metadata\schema_definitions.py -> OK
c:\nf\nf_loto_webui\sql\002_extend_metadata_tables.sql -> OK


## 3. ロギングレイヤの動作確認

ここでは、`nf_logging` の W&B ロガー / MLflow ロガーを簡単に動かしてみます。

ポイント:

- 依存ライブラリ（`wandb`, `mlflow`）が **未インストールでも安全に no-op** になる設計です。
- 環境変数で `NF_WANDB_ENABLED`, `NF_MLFLOW_ENABLED` を `1` にすると実際に連携を有効化できます。
- このノートブックでは安全のため **デフォルトで無効** の動作を確認します。

In [3]:
import os

from nf_logging import wandb_logger, mlflow_logger

# 念のため無効化しておく
os.environ["NF_WANDB_ENABLED"] = "0"
os.environ["NF_MLFLOW_ENABLED"] = "0"

print("=== W&B ロガー（無効モード） ===")
ctx = wandb_logger.start_wandb_run(
    enabled=None,
    project="demo-project",
    run_name="demo-run",
    config={"demo": True},
)
print("ctx.enabled:", ctx.enabled)
ctx.log_metrics({"demo_loss": 0.123}, step=1)
ctx.set_summary({"status": "ok"})
ctx.finish()
print("W&B dummy run finished.\n")

print("=== MLflow ロガー（無効モード） ===")
with mlflow_logger.mlflow_run_context(
    enabled=None,
    run_name="demo-mlflow-run",
    experiment_name="demo-experiment",
    tags={"purpose": "demo"},
    params={"a": 1},
) as run:
    print("MLflow run object:", run)
print("MLflow dummy context exited.")

=== W&B ロガー（無効モード） ===
ctx.enabled: False
W&B dummy run finished.

=== MLflow ロガー（無効モード） ===
MLflow run object: None
MLflow dummy context exited.


上記のセルでは、`ctx.enabled` が `False` になっていれば、依存ライブラリに関わらず安全に no-op で動作していることが確認できます。

実際に W&B / MLflow にログを送りたい場合は、それぞれ

```bash
set NF_WANDB_ENABLED=1
set NF_MLFLOW_ENABLED=1
```

などで環境変数を有効化した上で再実行してください。

## 4. Prometheus メトリクスレイヤの動作確認

次に、`nf_monitoring.prometheus_metrics` を使って、

- メトリクス HTTP サーバの起動
- run 開始 / 終了メトリクスの記録
- 学習中の loss メトリクスの更新

を簡単に試します。

> ⚠️ 注意: すでに同じポートで Prometheus サーバが動いている環境ではポート衝突が起こり得ます。  
> エラーになった場合でも、ライブラリ側で例外を握りつぶす設計にしてあるため、ノートブックは継続実行されます。

In [4]:
from nf_monitoring import prometheus_metrics as pm

# メトリクスサーバを起動（複数回呼んでも OK）
pm.init_metrics_server(port=8000)

# ダミーの run を 1 回記録してみる
pm.observe_run_start(model_name="DemoModel", backend="ray")
pm.observe_train_step("DemoModel", "ray", train_loss=0.5, val_loss=0.6)
pm.observe_run_end("DemoModel", "ray", status="finished", duration_seconds=1.23, resource_after=None)

print("Recorded metrics for DemoModel / backend=ray.")
print("Prometheus が動いていれば http://localhost:8000/metrics から確認できます。")

Recorded metrics for DemoModel / backend=ray.
Prometheus が動いていれば http://localhost:8000/metrics から確認できます。


## 5. リソースモニタの確認

`nf_monitoring.resource_monitor.collect_resource_snapshot()` を使うと、CPU やメモリ使用状況を JSON 風の dict で取得できます。

- `psutil` が入っていない環境でも、最低限の情報（タイムスタンプ・プラットフォーム）は返るようになっています。

In [5]:
from nf_monitoring.resource_monitor import collect_resource_snapshot

snapshot = collect_resource_snapshot()
snapshot

{'timestamp': 1763022233.8812644,
 'platform': 'Windows-10-10.0.26200-SP0',
 'cpu_percent': 15.1,
 'memory_total': 8258199552,
 'memory_used': 7110676480,
 'memory_percent': 86.1,
 'process_rss': 218845184,
 'process_vms': 938889216}

## 6. ドリフト / 異常検知 / モデル比較統計の確認

ここでは `nf_analysis` の 3 つのモジュールをまとめて試します:

- `drift.compute_univariate_drift`, `compute_dataframe_drift`
- `anomaly.detect_zscore_anomalies`
- `model_stats.diebold_mariano`

In [6]:
import numpy as np
import pandas as pd

from nf_analysis import drift, anomaly, model_stats

# --- 6-1. ドリフト計算 ---
rng = np.random.RandomState(42)
base = pd.Series(rng.normal(loc=0.0, scale=1.0, size=500))
current = pd.Series(rng.normal(loc=0.5, scale=1.2, size=500))

univar = drift.compute_univariate_drift(base, current)
print("=== Univariate drift ===")
print(univar)

base_df = pd.DataFrame({"y": base, "x": rng.normal(size=500)})
current_df = pd.DataFrame({"y": current, "x": rng.normal(size=500)})
df_drift = drift.compute_dataframe_drift(base_df, current_df)
print("\n=== DataFrame drift ===")
display(df_drift)

# --- 6-2. 残差の異常検知 ---
residuals = pd.Series(
    np.concatenate([rng.normal(scale=1.0, size=100), np.array([10.0]), rng.normal(scale=1.0, size=100)])
)
anom = anomaly.detect_zscore_anomalies(residuals, threshold=3.0)
print("\n=== Anomaly detection ===")
print("Detected indices:", anom["indices"][:10], "... (total:", len(anom["indices"]), ")")

# --- 6-3. Diebold-Mariano 検定 ---
true_signal = rng.normal(size=300)
err1 = true_signal + rng.normal(scale=0.5, size=300)  # 良いモデル
err2 = true_signal + rng.normal(scale=1.5, size=300)  # 悪いモデル

dm_result = model_stats.diebold_mariano(pd.Series(err1), pd.Series(err2), h=1, loss="mse")
print("\n=== Diebold-Mariano test ===")
print(dm_result)

=== Univariate drift ===
{'mean_diff': 0.5313533458785565, 'std_ratio': 1.196018087487258, 'kl_div': 0.19150964832285422}

=== DataFrame drift ===


Unnamed: 0,column_name,mean_diff,std_ratio,kl_div
0,x,-0.075297,0.974085,0.311015
1,y,0.531353,1.196018,0.19151



=== Anomaly detection ===
Detected indices: [100] ... (total: 1 )

=== Diebold-Mariano test ===
{'stat': -8.358078814808186, 'p_value': 0.0}


## 7. HTML レポート生成と成果物確認

`nf_reports.html_reporter.render_run_report` を使って、

- テンプレートディレクトリに簡単な `run_report.html` を用意
- ダミーの run 情報・メトリクスを埋め込んだ HTML を生成
- 生成されたファイルのパスと内容を確認

という流れを確認します。

In [7]:
from pathlib import Path
import pandas as pd

from nf_reports import html_reporter

# 一時的なテンプレートディレクトリ・出力先をプロジェクト配下に作る
reports_root = PROJECT_ROOT / "demo_reports"
templates_dir = reports_root / "templates"
templates_dir.mkdir(parents=True, exist_ok=True)

template_path = templates_dir / "run_report.html"

# シンプルな Jinja2 テンプレート
template_path.write_text(
    '''<!DOCTYPE html>
<html>
  <body>
    <h1>Run Report: {{ run.run_id }}</h1>
    <p>Model: {{ run.model_name }}</p>
    <h2>Metrics</h2>
    <ul>
    {% for row in metrics %}
      <li>{{ row.name }} = {{ row.value }}</li>
    {% endfor %}
    </ul>
    <p>Generated at: {{ generated_at }}</p>
  </body>
</html>
''',
    encoding="utf-8",
)

run_info = {"run_id": 123, "model_name": "DemoModel"}
metrics_df = pd.DataFrame([{"name": "mse", "value": 0.123}, {"name": "smape", "value": 5.6}])

output_path = reports_root / "run_123_report.html"
result_path = html_reporter.render_run_report(
    template_dir=templates_dir,
    output_path=output_path,
    run_info=run_info,
    metrics_df=metrics_df,
)

print("Generated report path:", result_path)
print("\n--- Preview (first 500 chars) ---")
print(result_path.read_text(encoding="utf-8")[:500])

Generated report path: c:\nf\nf_loto_webui\demo_reports\run_123_report.html

--- Preview (first 500 chars) ---
<!DOCTYPE html>
<html>
  <body>
    <h1>Run Report: 123</h1>
    <p>Model: DemoModel</p>
    <h2>Metrics</h2>
    <ul>
    
      <li>mse = 0.123</li>
    
      <li>smape = 5.6</li>
    
    </ul>
    <p>Generated at: 2025-11-13T08:24:02.244721</p>
  </body>
</html>


上記セルを実行すると、`PROJECT_ROOT/demo_reports/` 配下に HTML レポートが生成されます。  
ブラウザで開くことで、Streamlit からダウンロードする時の挙動に近い形を確認できます。

## 8. メタデータテーブル DDL の確認

`nf_metadata.schema_definitions` には、メタデータ用テーブル群の DDL が Python 文字列として定義されています。  
ここではその内容を確認し、Postgres への適用コードの雛形も示します。

> ⚠️ DB 接続は環境依存なので、このノートブックでは **実際の接続・適用はコメントアウト** してあります。

In [8]:
from nf_metadata import schema_definitions as schemas

print("Feature sets table name:", schemas.NF_FEATURE_SETS_TABLE)
print("Datasets table name    :", schemas.NF_DATASETS_TABLE)
print("Model registry table   :", schemas.NF_MODEL_REGISTRY_TABLE)
print("Drift metrics table    :", schemas.NF_DRIFT_METRICS_TABLE)
print("Residual anomalies tbl :", schemas.NF_RESIDUAL_ANOMALIES_TABLE)
print("Reports table          :", schemas.NF_REPORTS_TABLE)

print("\n--- DDL (excerpt, first 500 chars) ---")
ddl = schemas.get_extend_metadata_ddl()
print(ddl[:500])

Feature sets table name: nf_feature_sets
Datasets table name    : nf_datasets
Model registry table   : nf_model_registry
Drift metrics table    : nf_drift_metrics
Residual anomalies tbl : nf_residual_anomalies
Reports table          : nf_reports

--- DDL (excerpt, first 500 chars) ---

-- Metadata tables for NeuralForecast MLOps extensions

CREATE TABLE IF NOT EXISTS nf_feature_sets (
    id              SERIAL PRIMARY KEY,
    name            TEXT NOT NULL,
    description     TEXT,
    created_at      TIMESTAMPTZ NOT NULL DEFAULT NOW()
);

CREATE TABLE IF NOT EXISTS nf_datasets (
    id              SERIAL PRIMARY KEY,
    table_name      TEXT NOT NULL,
    loto            TEXT NOT NULL,
    unique_ids      TEXT[] NOT NULL,
    ds_start        DATE,
    ds_end          DATE


In [9]:
# ▼オプション: 実際に Postgres に DDL を適用するサンプルコード
# 実環境に合わせて DSN を設定し、コメントアウトを外してください。

import psycopg2

dsn = "postgresql://user:password@host:5432/dbname"
with psycopg2.connect(dsn) as conn:
    with conn.cursor() as cur:
        cur.execute(ddl)  # schemas.get_extend_metadata_ddl() で取得した DDL
    conn.commit()

print("Metadata tables created/updated successfully.")

OperationalError: could not translate host name "host" to address: Name or service not known


テーブル作成後は、普段の SQL クライアント（psql / DBeaver / DataGrip など）や  
既存の `nf_model_runs` テーブルと JOIN して、

- モデルレジストリ（`nf_model_registry`）
- ドリフト結果（`nf_drift_metrics`）
- 残差異常（`nf_residual_anomalies`）
- レポートメタ情報（`nf_reports`）

を確認・活用できるようになります。

## 9. pytest による一括テスト実行（オプション）

最後に、今回追加したテストを含めて `pytest` をノートブック上から実行する方法を示します。

> ⚠️ 注意:  
> - すでに CLI から `pytest` を回している場合は再実行は必須ではありません。  
> - 実行には多少時間がかかる場合があります。  
> - プロジェクトルート直下で `pytest` を実行する前提です。

In [10]:
# このセルは任意です。実行するとプロジェクト全体の pytest が走ります。
# 実行したくない場合はスキップしてください。

import subprocess

result = subprocess.run(
    ["pytest", "-q"],
    cwd=str(PROJECT_ROOT),
    capture_output=True,
    text=True,
)

print("Return code:", result.returncode)
print("\n=== pytest stdout ===\n")
print(result.stdout[:2000])  # 長過ぎる場合は先頭だけ表示
print("\n=== pytest stderr ===\n")
print(result.stderr[:1000])

Return code: 0

=== pytest stdout ===

[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[33m                                                       [100%][0m
..\..\Users\hashimoto.ryohei\Miniconda3\envs\kaiseki\Lib\site-packages\mlflow\gateway\config.py:64
  C:\Users\hashimoto.ryohei\Miniconda3\envs\kaiseki\Lib\site-packages\mlflow\gateway\config.py:64: PydanticDeprecatedSince20: Pydantic V1 style `@validator` validators are deprecated. You should migrate to Pydantic V2 style `@field_validator` validators, see the migration guide for more details. Deprecated in Pydantic V2.0 to be removed in V3.0. See Pydantic V2 Migration Guide at https://errors.pydantic.dev/2.9/migration/
    @validator("togetherai_api_key", pre=True)

..\..\Users\hashimoto.ryohei\Miniconda3\envs\kaiseki\Lib\site-packages\mlflow\gateway\config.py:78
  C:\Users\hashimoto.ryohei\Miniconda3

## 10. まとめ

このノートブックでは、

1. 追加モジュールのディレクトリ構成と存在確認  
2. W&B / MLflow ロガーの no-op / ダミー動作確認  
3. Prometheus メトリクス・リソースモニタの確認  
4. ドリフト / 異常検知 / DM 検定のサンプル実行  
5. HTML レポート生成と成果物ファイルの確認  
6. メタデータテーブル DDL の確認と Postgres 適用の雛形  
7. pytest による一括テスト実行方法  

を一通りなぞりました。

このノートブックをベースに、

- 本番用の DSN を差し込んでメタテーブルを実際に作る
- 既存の `nf_model_runs` / `nf_loto%` テーブルと JOIN して分析する
- 生成された HTML レポートをメール送信・S3 保存などに発展させる

といった「運用寄りの確認フロー」を自分用にカスタマイズしていくと、  
時系列 MLOps 基盤としての整備状況を **一括でドキュメント＋検証** できるようになります。