In [1]:
import arcpy
import pandas as pd
import os
import numpy as np

# ==========================================
# 設定: ここを自分の環境に合わせて書き換えてください
# ==========================================
# 作業用フォルダのパス (CSVがある場所)
work_dir = r"C:\Users\ihser\Documents\sendai_flow\people_flow_analysis\eishinpy"

# 入力ファイル名
base_data_csv = os.path.join(work_dir, "base data.csv")
flow_data_csv = os.path.join(work_dir, "arcade_gravity_flow.csv")

# 出力するジオデータベースとレイヤー名
gdb_name = "Arcade_Flow.gdb"
out_fc_name = "Flow_Lines_TimeEnabled"
# ==========================================

# 1. 環境設定
arcpy.env.workspace = work_dir
arcpy.env.overwriteOutput = True

# ジオデータベースがなければ作成
gdb_path = os.path.join(work_dir, gdb_name)
if not arcpy.Exists(gdb_path):
    arcpy.management.CreateFileGDB(work_dir, gdb_name)

out_fc_path = os.path.join(gdb_path, out_fc_name)

print("1. データの読み込み中...")

# 2. 座標情報の取得 (base data.csvから)
# 場所名ごとの平均緯度経度を辞書にする
df_base = pd.read_csv(base_data_csv)
loc_group = df_base.groupby('LocationName').agg({'Longitude': 'mean', 'Latitude': 'mean'}).reset_index()
# 辞書形式: { "場所名": (経度, 緯度) }  ※ArcGISは(X, Y) = (経度, 緯度)
loc_dict = {row['LocationName']: (row['Longitude'], row['Latitude']) for index, row in loc_group.iterrows()}

# 3. 流量データの読み込み (arcade_gravity_flow.csvから)
df_flow = pd.read_csv(flow_data_csv)
# Timestamp列をdatetime型に変換
df_flow['Timestamp'] = pd.to_datetime(df_flow['Timestamp'])

print(f"データ期間: {df_flow['Timestamp'].min()} から {df_flow['Timestamp'].max()}")

# 4. フィーチャクラスの作成
spatial_ref = arcpy.SpatialReference(4326) # WGS84 (緯度経度)
arcpy.management.CreateFeatureclass(gdb_path, out_fc_name, "POLYLINE", spatial_reference=spatial_ref)

# フィールドの追加
arcpy.management.AddField(out_fc_path, "Link_ID", "TEXT", field_length=100)
arcpy.management.AddField(out_fc_path, "Time", "DATE")
arcpy.management.AddField(out_fc_path, "Flow_Value", "FLOAT") # 計算した重力モデル値
arcpy.management.AddField(out_fc_path, "Start_Node", "TEXT", field_length=50)
arcpy.management.AddField(out_fc_path, "End_Node", "TEXT", field_length=50)

print("2. ラインデータの生成を開始します（時間がかかる場合があります）...")

# 5. データの流し込み (InsertCursorを使用)
# CSVの列名（＝エッジ名 "A - B"）を取得。Timestamp列以外。
edge_columns = [c for c in df_flow.columns if c != "Timestamp"]

fields = ["SHAPE@", "Link_ID", "Time", "Flow_Value", "Start_Node", "End_Node"]

with arcpy.da.InsertCursor(out_fc_path, fields) as cursor:
    # 時間ごとにループ
    for index, row in df_flow.iterrows():
        current_time = row['Timestamp']
        
        # エッジ（列）ごとにループ
        for edge_name in edge_columns:
            flow_val = row[edge_name]
            
            # NaN（欠損値）の場合はスキップ
            if pd.isna(flow_val):
                continue
                
            # エッジ名 "地点A - 地点B" を分解
            try:
                # " - " で分割
                parts = edge_name.split(' - ')
                if len(parts) != 2:
                    continue
                node_a_name = parts[0]
                node_b_name = parts[1]
                
                # 座標を取得
                if node_a_name in loc_dict and node_b_name in loc_dict:
                    pt_a = loc_dict[node_a_name] # (lon, lat)
                    pt_b = loc_dict[node_b_name] # (lon, lat)
                    
                    # ラインジオメトリを作成
                    array = arcpy.Array([arcpy.Point(*pt_a), arcpy.Point(*pt_b)])
                    polyline = arcpy.Polyline(array, spatial_ref)
                    
                    # データを挿入
                    # [Geometry, LinkID, Time, Value, Start, End]
                    cursor.insertRow([polyline, edge_name, current_time, flow_val, node_a_name, node_b_name])
                    
            except Exception as e:
                print(f"Error processing {edge_name}: {e}")

print("完了しました！")
print(f"出力先: {out_fc_path}")

1. データの読み込み中...
データ期間: 2025-01-01 00:00:00 から 2025-12-01 05:00:00
2. ラインデータの生成を開始します（時間がかかる場合があります）...
完了しました！
出力先: C:\Users\ihser\Documents\sendai_flow\people_flow_analysis\eishinpy\Arcade_Flow.gdb\Flow_Lines_TimeEnabled
