# EDA2 パイプライン実行ノートブック
本ノートでは、`eda2_pipeline.py` に実装したユーティリティを利用して、
テストデータ `@ev_sessions_test.csv` から曜日×時間帯×クラスタ別のレポートを生成する。

In [1]:
# 必要な標準ライブラリと自作モジュールを読み込む。
from pathlib import Path

# 解析・可視化ライブラリを読み込み、日本語フォントを先に設定する。
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import font_manager

preferred_fonts = ['Yu Gothic', 'Meiryo', 'MS Gothic', 'Hiragino Sans', 'IPAexGothic']
for font in preferred_fonts:
    try:
        font_manager.findfont(font, fallback_to_default=False)
    except ValueError:
        continue
    else:
        plt.rcParams['font.family'] = font
        break
else:
    plt.rcParams['font.family'] = 'sans-serif'
plt.rcParams['axes.unicode_minus'] = False

# 可視化ユーティリティを読み込む。
from eda2_pipeline import ParkingAnalysisConfig, run_weekday_parking_analysis


In [2]:
# 入力 CSV を DataFrame として読み込み、日付列を datetime へ変換する。
DATA_PATH = Path('ev_sessions_test.csv')
df_sessions = pd.read_csv(DATA_PATH, parse_dates=['start_time', 'end_time'])

# 読み込んだデータの先頭行を確認して、列構成と値の雰囲気を把握する。
df_sessions.head()


Unnamed: 0,hashvin,session_cluster,session_type,start_time,end_time,duration_minutes,start_soc,end_soc,change_soc,start_lat,start_lon,end_lat,end_lon
0,hv_0001_demo,I_101,inactive,2025-08-31 20:30:00,2025-09-01 07:30:00,660.0,80.0,79.5,-0.5,35.68,139.76,35.68,139.76
1,hv_0001_demo,I_202,inactive,2025-09-01 09:00:00,2025-09-01 17:30:00,510.0,79.5,78.6,-0.9,35.69,139.7,35.69,139.7
2,hv_0001_demo,I_303,inactive,2025-09-01 18:00:00,2025-09-01 18:39:00,39.0,78.6,78.4,-0.1,35.66,139.75,35.66,139.75
3,hv_0001_demo,I_101,inactive,2025-09-01 20:30:00,2025-09-02 07:30:00,660.0,78.4,78.2,-0.2,35.68,139.76,35.68,139.76
4,hv_0001_demo,I_202,inactive,2025-09-02 09:00:00,2025-09-02 17:30:00,510.0,78.2,77.2,-1.0,35.69,139.7,35.69,139.7


In [3]:
# 出力ディレクトリと実行パラメータを設定する。
OUTPUT_ROOT = Path('result')

config = ParkingAnalysisConfig(
    top_n_clusters=15,
    metric='duration_ratio',  # 必要に応じて 'count_ratio' を選択可能。
    clip_percentile=0.95,
    other_position='top',
    share_color_scale=True,
    annotate_cells=True,
    min_coverage_weeks=1,
    panel_denominator_mode='per_panel',  # 'shared' で3面共通の分母を利用。
)

# パイプラインを実行し、画像とCSVを生成する。
run_weekday_parking_analysis(df_sessions, OUTPUT_ROOT, config=config)


  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)
  formatted = formatted.applymap(_format)


In [4]:
# 生成されたファイルを一覧し、期待通りの構造になっているか確認する。
for path in sorted(OUTPUT_ROOT.rglob('*')):
    print(path)


result\hv_0001_demo
result\hv_0001_demo\denominator_weeks.csv
result\hv_0001_demo\similarity_scores.csv
result\hv_0001_demo\weekday_0_comparison.png
result\hv_0001_demo\weekday_0_matrix_with.csv
result\hv_0001_demo\weekday_0_matrix_without.csv
result\hv_0001_demo\weekday_0_numerator_with.csv
result\hv_0001_demo\weekday_0_numerator_without.csv
result\hv_0001_demo\weekday_1_comparison.png
result\hv_0001_demo\weekday_1_matrix_with.csv
result\hv_0001_demo\weekday_1_matrix_without.csv
result\hv_0001_demo\weekday_1_numerator_with.csv
result\hv_0001_demo\weekday_1_numerator_without.csv
result\hv_0001_demo\weekday_2_comparison.png
result\hv_0001_demo\weekday_2_matrix_with.csv
result\hv_0001_demo\weekday_2_matrix_without.csv
result\hv_0001_demo\weekday_2_numerator_with.csv
result\hv_0001_demo\weekday_2_numerator_without.csv
result\hv_0001_demo\weekday_3_comparison.png
result\hv_0001_demo\weekday_3_matrix_with.csv
result\hv_0001_demo\weekday_3_matrix_without.csv
result\hv_0001_demo\weekday_3_num