In [18]:
import numpy as np
import pandas as pd
import psycopg2
from sqlalchemy import create_engine

# データベースの接続情報
connection_config = {
    'user': 'shin',
    'password': 'shin_password',
    'port': '5432',
    'database': 'mobaku_base',
    'host': '10.33.230.198'
}

# データベース接続
engine = create_engine(f"postgresql+psycopg2://{connection_config['user']}:{connection_config['password']}@{connection_config['host']}:{connection_config['port']}/{connection_config['database']}")

# メッシュIDリスト
mesh_list = [
    '513375753', '513375754', '513375763',
    '513375751', '513375752', '513375761',
    '513375653', '513375654', '513375663'
]

# 時間範囲
train_start_date = '2018-06-01 01:00:00'
test_end_date = '2018-07-11 23:59:59'

# SQLクエリでデータ取得
sql_query = f"""
SELECT datetime, mesh_id, population
FROM population_00000
WHERE mesh_id IN ({','.join(f"'{m}'" for m in mesh_list)})
AND datetime BETWEEN '{train_start_date}' AND '{test_end_date}'
ORDER BY datetime, mesh_id;
"""

# データ取得
df_pop = pd.read_sql(sql=sql_query, con=engine)

# datetime列を変換し、インデックスを設定
df_pop['datetime'] = pd.to_datetime(df_pop['datetime'])

# データをピボットテーブル形式に変換
df_pivot = df_pop.pivot(index='datetime', columns='mesh_id', values='population')

# 欠損値を埋める場合（必要なら適用）
df_pivot = df_pivot.reindex(pd.date_range(start=train_start_date, end=test_end_date, freq='h')).fillna(0)
df_ex=df_pivot
# 結果を表示
print(df_pivot)


mesh_id              513375653  513375654  513375663  513375751  513375752  \
2018-06-01 01:00:00      149.0      146.0      290.0       74.0      118.0   
2018-06-01 02:00:00      134.0      156.0      250.0       71.0      142.0   
2018-06-01 03:00:00      148.0      235.0      293.0       88.0      198.0   
2018-06-01 04:00:00      160.0      188.0      303.0      128.0      108.0   
2018-06-01 05:00:00      191.0      144.0      308.0      126.0      126.0   
...                        ...        ...        ...        ...        ...   
2018-07-11 19:00:00       56.0       30.0       56.0       57.0       41.0   
2018-07-11 20:00:00       10.0       37.0       24.0       64.0       48.0   
2018-07-11 21:00:00       30.0        0.0       86.0       36.0       32.0   
2018-07-11 22:00:00       29.0       29.0       61.0        0.0       18.0   
2018-07-11 23:00:00       28.0       44.0       24.0        0.0       47.0   

mesh_id              513375753  513375754  513375761  513375763

In [19]:
import numpy as np
import pandas as pd
from scipy.linalg import svd
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

# データフレームの読み込み (仮定: df_ex が与えられている)
# df_ex は行に変数、列に時系列データを持つ形式
# 必要に応じて変数名を確認
# print(df_ex.index)

# インデックスを英語表記に変更
df_ex.index = df_ex.index.strftime("%Y-%m-%d %H:%M:%S")

# 日本語の列名を英語に置き換える関数
def rename_columns_to_english(df, column_mapping):
    """
    データフレームの列名を日本語から英語に置き換える。

    Parameters:
    df (pd.DataFrame): 対象のデータフレーム。
    column_mapping (dict): 日本語列名をキー、対応する英語名を値とした辞書。

    Returns:
    pd.DataFrame: 列名が変更されたデータフレーム。
    """
    new_columns = [column_mapping.get(col, col) for col in df.columns]
    df.columns = new_columns
    return df

# 例: 日本語列名と英語列名の対応辞書
column_mapping = {
    "雷注意報": "Thunderstorm Warning",
    "大雨注意報": "Heavy Rain Advisory",
    "洪水注意報": "Flood Advisory",
    "強風注意報": "Strong Wind Advisory",
    "大雨警報": "Heavy Rain Warning",
    "洪水警報": "Flood Warning",
    "暴風警報": "Storm Warning",
    "大雨特別警報": "Heavy Rain Emergency Warning",
    "waterLevel": "Water Level",
}

df_ex = rename_columns_to_english(df_ex, column_mapping)
#########


# DMD解析用のデータ準備
def prepare_dmd_data(df):
    scaler = StandardScaler()
    # StandardScaler(): データを平均が0、標準偏差が1になるようにスケーリング
    scaled_data = scaler.fit_transform(df.T)  # 時系列方向を正規化
    # 同時刻にて異なる9種のメッシュ人口に対してそれぞれの時刻でスケーリングする．
    return scaled_data.T
# print(df_ex)
data = prepare_dmd_data(df_ex)
print(data.shape)
print(data)
# data: 時間をインデックス,メッシュ番号を列となる．（df_exと同じ形式）

(983, 9)
[[ 0.03419834 -0.0143993   2.31828724 ... -0.28978591  0.77936209
  -0.03059851]
 [-0.33709405  0.01235423  1.50545144 ...  0.96539501 -0.97245457
   1.37837934]
 [-0.53404133  0.68863224  1.50374795 ... -0.40755786 -0.35134298
   1.51780167]
 ...
 [-0.79635209 -1.91041979  1.28324094 ...  0.91188504  0.72620709
   0.16917324]
 [-0.43138176 -0.43138176  0.823547   ...  1.56866096 -0.39216524
   1.45101139]
 [-0.47936348  0.32329165 -0.68002727 ...  0.32329165 -0.47936348
   1.97876787]]


In [28]:

# データ行列の準備
X = data[:-1, :]  # 時刻 t のデータ
Y = data[1:, :]   # 時刻 t+1 のデータ
print(data.shape)
print(X.shape)
print(Y.shape)
print()

# SVD 分解
U, Sigma, Vh = svd(X, full_matrices=False)
print(U.shape)
print(Sigma.shape,type(Sigma))
print(Vh.shape)
print()

print(Sigma) 

(983, 9)
(982, 9)
(982, 9)

(982, 9)
(9,) <class 'numpy.ndarray'>
(9, 9)

[7.35452581e+01 2.81103157e+01 2.28012619e+01 2.24770633e+01
 2.20013724e+01 2.13649185e+01 1.90925876e+01 1.75710618e+01
 1.25645264e-14]


sigma:特異値は降順で格納され、重要な成分ほど先頭にあります

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [27]:

# ランク削減
rank = min(8, len(Sigma))  # 最大ランクを 16 に制限
U_r = U[:, :rank]   
Sigma_r = np.diag(Sigma[:rank]) # sigmaの最大ランクを制限し，体格成分のみのベクトルから行列の形式に変形
Vh_r = Vh[:rank, :]

print(Sigma_r)

[[73.5452581   0.          0.          0.          0.          0.
   0.          0.        ]
 [ 0.         28.11031574  0.          0.          0.          0.
   0.          0.        ]
 [ 0.          0.         22.80126194  0.          0.          0.
   0.          0.        ]
 [ 0.          0.          0.         22.47706326  0.          0.
   0.          0.        ]
 [ 0.          0.          0.          0.         22.00137236  0.
   0.          0.        ]
 [ 0.          0.          0.          0.          0.         21.3649185
   0.          0.        ]
 [ 0.          0.          0.          0.          0.          0.
  19.09258759  0.        ]
 [ 0.          0.          0.          0.          0.          0.
   0.         17.57106178]]


![image-2.png](attachment:image-2.png)

In [None]:

# A_tilde の計算
A_tilde = U_r.T @ Y @ Vh_r.T @ np.linalg.inv(Sigma_r)


![image.png](attachment:image.png)

In [None]:

# 固有値・固有ベクトルの計算
eigvals, eigvecs = np.linalg.eig(A_tilde)

# ダイナミクスモードの計算
modes = U_r @ eigvecs

# 結果の可視化
def plot_eigenvalues(eigvals):
    plt.figure(figsize=(6, 6))
    plt.scatter(eigvals.real, eigvals.imag, c="blue", label="Eigenvalues")
    plt.axhline(0, color="black", linewidth=0.5)
    plt.axvline(0, color="black", linewidth=0.5)
    plt.title("Eigenvalues (Real vs Imaginary)")
    plt.xlabel("Real Part")
    plt.ylabel("Imaginary Part")
    plt.grid()
    plt.legend()
    plt.show()

# 固有値プロット
plot_eigenvalues(eigvals)

# 時系列復元（オプション）
def reconstruct_time_series(modes, eigvals, X_initial, timesteps):
    time_dynamics = np.zeros((modes.shape[1], timesteps), dtype=complex)
    for i in range(modes.shape[1]):
        time_dynamics[i, :] = (eigvals[i] ** np.arange(timesteps)) * X_initial[i]
    
    reconstructed = np.real(modes @ time_dynamics)
    return reconstructed

# 初期状態を X の最初の列とする
initial_state = U_r.T @ X[:, 0]
reconstructed = reconstruct_time_series(modes, eigvals, initial_state, X.shape[1])

# 結果の可視化
def plot_original_vs_reconstructed(original, reconstructed, variable_index):
    plt.figure(figsize=(12, 6))
    plt.plot(original[variable_index, :], label="Original", alpha=0.7)
    plt.plot(reconstructed[variable_index, :], label="Reconstructed", linestyle="--")
    plt.title(f"Variable {variable_index}: Original vs Reconstructed")
    plt.xlabel("Time Steps")
    plt.ylabel("Value")
    plt.legend()
    plt.show()

# 例: 変数 0 をプロット
plot_original_vs_reconstructed(X, reconstructed, 0)

# 短期と長期のモードを分離
def separate_modes(eigvals, eigvecs, threshold=0.1):
    """
    短期モードと長期モードを分離する。

    Parameters:
    eigvals (np.ndarray): 固有値。
    eigvecs (np.ndarray): 固有ベクトル。
    threshold (float): 境界となる減衰率（実数部分の閾値）。

    Returns:
    dict: 短期モードと長期モードのインデックス。
    """
    short_term = []
    long_term = []
    for i, val in enumerate(eigvals):
        if val.real < -threshold:
            short_term.append(i)
        else:
            long_term.append(i)
    return {"short_term": short_term, "long_term": long_term}

modes_split = separate_modes(eigvals, eigvecs)
print("Short-term Modes:", modes_split["short_term"])
print("Long-term Modes:", modes_split["long_term"])

# 短期モードと長期モードを別々に可視化
def plot_modes(modes, eigvals, modes_indices, title):
    plt.figure(figsize=(12, 6))
    for idx in modes_indices:
        plt.plot(np.real(modes[:, idx]), label=f"Mode {idx} (Re: {eigvals[idx].real:.2f}, Im: {eigvals[idx].imag:.2f})")
    plt.title(title)
    plt.xlabel("Variables")
    plt.ylabel("Amplitude")
    plt.legend()
    plt.show()

plot_modes(modes, eigvals, modes_split["short_term"], "Short-term Modes")
plot_modes(modes, eigvals, modes_split["long_term"], "Long-term Modes")

# 各変数の寄与度を計算し、固有値プロットに反映
def calculate_variable_impact(modes, var_names, mesh_index):
    impact = np.abs(modes[mesh_index, :])  # Aメッシュの成分を抽出して絶対値を取る
    impact_normalized = impact / np.sum(impact)  # 寄与率を計算
    return np.array(list(impact_normalized))

def plot_eigenvalues_with_labels(eigvals, impacts, var_names):
    plt.figure(figsize=(6, 6))
    plt.scatter(eigvals.real, eigvals.imag, c="blue", label="Eigenvalues")
    for i, eig in enumerate(eigvals):
        main_var = var_names[np.argmax(impacts[:, i])]
        plt.annotate(main_var, (eig.real, eig.imag), fontsize=9, alpha=0.7)
    plt.axhline(0, color="black", linewidth=0.5)
    plt.axvline(0, color="black", linewidth=0.5)
    plt.title("Eigenvalues with Variable Labels")
    plt.xlabel("Real Part")
    plt.ylabel("Imaginary Part")
    plt.grid()
    plt.legend()
    plt.show()

# 変数名を取得し、影響度を計算
var_names = list(df_ex.columns)
impacts = np.array([calculate_variable_impact(modes, var_names, i) for i in range(len(var_names))])

# ラベル付き固有値プロット
plot_eigenvalues_with_labels(eigvals, impacts, var_names)
