In [1]:
# 得られたモデルを用いて、濁度の予測を行う
# １時間先の濁度予測だけでなく、n時間先の予測までを、行列として出力（縦：予測開始時刻、横：予測リードタイム）


In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader, TensorDataset, random_split
import pandas as pd
import numpy as np
import os
import random
from sklearn.metrics import r2_score
from copy import deepcopy

## データの読み込み

In [3]:
# 読み込むモデルの保存先のパスを指定【要変更】
model_path = r"C:\Users\ryoya\MasterThesis\MT_Furuie\results\Miwa_FFNN\Trial_1\best_model_trial_1.pth"


# データのパス指定【要確認】
data_folder = r"C:\Users\ryoya\MasterThesis\MT_Furuie\data\Miwa_FFNN_Data\Trial_1"
# data_folder = r"C:\Users\RYOYA\OneDrive\ドキュメント\データ整理\美和（修論）\Miwa_FFNN\Trial_1"
data_file_name = r"Miwa_data_for_FFNN.xlsx"
idx_file_name = r"Miwa_flood_idx_for_FFNN.xlsx"
data_path = os.path.join(data_folder, data_file_name)
idx_path = os.path.join(data_folder, idx_file_name)


# 予測結果保存先のエクセルファイル名【要変更】
result_folder = r"C:\Users\ryoya\MasterThesis\MT_Furuie\results\Miwa_FFNN\Trial_1"
train_result_excel_name = r"Miwa_FFNN_Trial_1_prediction_train.xlsx"
test_result_excel_name = r"Miwa_FFNN_Trial_1_prediction_test.xlsx"
train_result_path = os.path.join(result_folder, train_result_excel_name)
test_result_path = os.path.join(result_folder, test_result_excel_name)

# input, output変数の列番号を指定（0始まり）
# タイムラグもここで指定
input_cols = [2, 2, 1, 1] # [Q(t), Q(t-1), Tur(t-1), Tur(t-2)]
input_lags = [0, 1, 1, 2]
output_cols = [1] # [Tur(t)]
output_lags = [0]

# ファイルの読み込み
d_all = pd.read_excel(data_path, header=0)
idx_list = pd.read_excel(idx_path, header=0)
col_trial = 10 # 【要変更】どの列がtrain, testを指定する列か

train_idx = idx_list[idx_list.iloc[:, col_trial] == 'train']
test_idx = idx_list[idx_list.iloc[:, col_trial] == 'test']

## モデル構造の定義

In [4]:
# モデルの定義
def build_ffnn(cfg: dict) -> nn.Module:
    """
    Feed Forward Neural Network (FFNN) を構築する関数。
    cfg（辞書）でネットワーク構造・活性化関数・ドロップアウト率などを指定。

    Parameters
    ----------
    cfg : dict
        モデル設定を含む辞書。例：
        {
            "input_dim": 10,
            "hidden_dims": [256, 128, 64],
            "output_dim": 1,
            "activation": "ReLU",
            "dropout": 0.2
        }

    Returns
    -------
    model : torch.nn.Module
        指定条件に基づくFFNNモデル
    """

    # --- 活性化関数マッピング ---
    activation_funcs = {
        "ReLU": nn.ReLU(),
        "LeakyReLU": nn.LeakyReLU(),
        "ELU": nn.ELU(),
        "Sigmoid": nn.Sigmoid(),
        "Tanh": nn.Tanh(),
        "GELU": nn.GELU()
    }

    act = activation_funcs.get(cfg.get("activation", "ReLU"), nn.ReLU())
    dropout_rate = cfg.get("dropout", 0.0)
    hidden_dims = cfg.get("hidden_dims", [])
    input_dim = cfg["input_dim"]
    output_dim = cfg["output_dim"]

    layers = []
    in_dim = input_dim

    # --- 隠れ層を順に構築 ---
    for h in hidden_dims:
        layers.append(nn.Linear(in_dim, h))
        layers.append(act)
        if dropout_rate > 0:
            layers.append(nn.Dropout(dropout_rate))
        in_dim = h

    # --- 出力層（活性化関数なし） ---
    layers.append(nn.Linear(in_dim, output_dim))

    model = nn.Sequential(*layers)
    return model
    

## モデルの復元

In [5]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
checkpoint = torch.load(model_path, map_location=device)

# ハイパーパラメータ（cfg）を再現
cfg_loaded = checkpoint["cfg"]

# モデル構築（cfgに基づいて同じ構造を作る）
model = build_ffnn(cfg_loaded)
model.load_state_dict(checkpoint["model_state_dict"])
model = model.to(device)
model.eval()

# 標準化パラメータなども復元
x_mean = checkpoint["x_mean"]
x_std  = checkpoint["x_std"]
y_mean = checkpoint["y_mean"]
y_std  = checkpoint["y_std"]

  checkpoint = torch.load(model_path, map_location=device)


## 洪水イベントごとに予測を行う

In [6]:
# 指定範囲の抽出関数
def slice_L_nan(df, col, start, end, L):
    """
    df（例: d_all）から指定範囲を切り出し、
    データが存在しない部分は NaN でパディングして (L,1) 配列として返す。

    Parameters
    ----------
    df : pandas.DataFrame
        元データ
    col : int または str
        取り出す列（列番号または列名）
    start, end : int
        切り出す範囲（両端含む）
    L : int
        期待する行数（end - start + 1 など）

    Returns
    -------
    arr : numpy.ndarray, shape=(L,1)
        NaN パディング済みの配列
    """
    n = len(df)

    # 範囲をクリップ
    start_clip = max(0, start)
    end_clip   = min(n - 1, end)

    # 実データを取得
    arr = df.iloc[start_clip:end_clip+1, col].to_numpy().reshape(-1, 1)

    # パディング数を計算
    pad_top = max(0, 0 - start)             # start < 0 → 上をNaNで埋める
    pad_bottom = max(0, end - (n - 1))      # end > n-1 → 下をNaNで埋める

    # NaN パディングを適用
    if pad_top > 0 or pad_bottom > 0:
        arr = np.pad(arr, ((pad_top, pad_bottom), (0, 0)),
                     mode='constant', constant_values=np.nan)

    # 念のため長さを L に揃える
    if arr.shape[0] != L:
        if arr.shape[0] < L:
            # 不足分を NaN で埋める
            diff = L - arr.shape[0]
            pad_bottom = np.full((diff, 1), np.nan)
            arr = np.vstack([arr, pad_bottom])
        else:
            # 余分な行があれば切り詰め
            arr = arr[:L, :]

    return arr



## train洪水に対する予測

In [11]:
# リードタイムの指定（何時間先の予測までを出力するか）
lead_time = 240

pred_train = []

# trainデータについてのループ
for i in range(train_idx.shape[0]): # 洪水期間ごとのループ
    s = int(train_idx.iloc[i, 0]) - 1 - lead_time
    e = int(train_idx.iloc[i, 1]) - 1

    L = e - s + 1 # 洪水期間の長さ

    pred_cols = [] # リスト変数として、予測を保存
    pred_train_temp = []
    pred_train_temp = d_all.iloc[s-1:e, 0:4].copy() # まずは洪水期間の[Time, Turbidity, Q, r]を抽出（Timeは予測開始時刻）(開始時刻にするため1時刻ずらす)
    pred_train_temp["FloodID"] = i + 1

    X_raw_prev = None # 前時刻のinput保持用の変数

    for j in range(lead_time): # リードタイムごとのループ
    
        if j == 0: # 1番初め（1時間先）の予測
            cols_block = []
            for col, lag in zip(input_cols, input_lags):
                start = s - lag
                end = e - lag
                # lag分だけ前の行を取り出す
                x_part = slice_L_nan(d_all, col, start, end, L)
                cols_block.append(x_part)
    
            X_seg = np.hstack(cols_block) # (L, len(input_cols))
            X_raw_prev = X_seg
            X_seg_std = (X_seg - x_mean) / x_std # 標準化
            X_seg_std = torch.from_numpy(X_seg_std.astype(np.float32)) # torch.Tensor型に
            X_seg_std = X_seg_std.to(device)

            model.eval()
            with torch.no_grad():
                y_pred_std = model(X_seg_std) # modelで予測

            y_pred = y_pred_std.detach().cpu().numpy() * y_std + y_mean # 逆標準化

            # 予測値が負の場合、0に置き換える
            y_pred = np.clip(y_pred, 0, None)

            # 列名の指定
            col_name = "Tur(t+1)"
            # 得られた予測を記録
            pred_cols.append(pd.Series(y_pred.flatten(), index=pred_train_temp.index, name=col_name))
            
            
        else: # 2時間先以降の予測
            cols_block = []
            for col, lag in zip(input_cols, input_lags):
                
                if (col in output_cols) and (lag == 1): # inputがTur(t-1)のとき
                    # 前時刻での予測を次の予測の入力値に
                    x_part = y_pred.reshape(-1, 1)
                    cols_block.append(x_part)

                elif (col in output_cols) and (lag > 1): # inputがTur(t-2)以降の時
                    # colが同じで、lagがlag+1のものを探す
                    col_target = None
                    for idx, (c2, l2) in enumerate(zip(input_cols, input_lags)):
                        if (c2 == col) and (l2 == lag - 1):
                            col_target = idx
                            break  # 最初に見つかった時点で抜ける
                    if col_target is None:
                        raise ValueError(f"対応する列がありません: col={col}, lag={lag}")
                    
                    x_part = X_raw_prev[:, col_target:col_target+1]
                    cols_block.append(x_part)


                else: # inputがTur()以外の時
                    # リードタイム分（j）ずらす
                    start = max(0, s - lag + j)
                    end = min(len(d_all) - 1, e - lag + j)
                    x_part = slice_L_nan(d_all, col, start, end, L)
                    cols_block.append(x_part)
            
            X_seg = np.hstack(cols_block) # (L, len(input_cols))
            X_raw_prev = X_seg
            X_seg_std = (X_seg - x_mean) / x_std # 標準化
            X_seg_std = torch.from_numpy(X_seg_std.astype(np.float32)) # torch.Tensor型に
            X_seg_std = X_seg_std.to(device)

            model.eval()
            with torch.no_grad():
                y_pred_std = model(X_seg_std) # modelで予測

            y_pred = y_pred_std.detach().cpu().numpy() * y_std + y_mean # 逆標準化

            # 予測値が負の場合、0に置き換える
            y_pred = np.clip(y_pred, 0, None)

            # 列名の指定
            col_name = f"Tur(t+{j+1})"
            # 得られた予測を記録
            pred_cols.append(pd.Series(y_pred.flatten(), index=pred_train_temp.index, name=col_name))

    pred_train_temp = pd.concat([pred_train_temp] + pred_cols, axis=1)
    pred_train.append(pred_train_temp)

# 1) 縦方向に結合（行結合）
train_result = pd.concat(pred_train, axis=0, ignore_index=False)  # ignore_index=True で連番振り直し


In [12]:
# エクセルファイルに保存

train_result.to_excel(train_result_path, index=True)

## test洪水に対する予測

In [13]:
# リードタイムの指定（何時間先の予測までを出力するか）
lead_time = 240

pred_test = []

# testデータについてのループ
for i in range(test_idx.shape[0]): # 洪水期間ごとのループ
    s = int(test_idx.iloc[i, 0]) - 1 - lead_time
    e = int(test_idx.iloc[i, 1]) - 1

    L = e - s + 1 # 洪水期間の長さ

    pred_cols = [] # リスト変数として、予測を保存
    pred_test_temp = []
    pred_test_temp = d_all.iloc[s-1:e, 0:4].copy() # まずは洪水期間の[Time, Turbidity, Q, r]を抽出（Timeは予測開始時刻）(開始時刻にするため1時刻ずらす)
    pred_test_temp["FloodID"] = i + 1

    X_raw_prev = None # 前時刻のinput保持用の変数

    for j in range(lead_time): # リードタイムごとのループ
    
        if j == 0: # 1番初め（1時間先）の予測
            cols_block = []
            for col, lag in zip(input_cols, input_lags):
                start = s - lag
                end = e - lag
                # lag分だけ前の行を取り出す
                x_part = slice_L_nan(d_all, col, start, end, L)
                cols_block.append(x_part)
    
            X_seg = np.hstack(cols_block) # (L, len(input_cols))
            X_raw_prev = X_seg
            X_seg_std = (X_seg - x_mean) / x_std # 標準化
            X_seg_std = torch.from_numpy(X_seg_std.astype(np.float32)) # torch.Tensor型に
            X_seg_std = X_seg_std.to(device)

            model.eval()
            with torch.no_grad():
                y_pred_std = model(X_seg_std) # modelで予測

            y_pred = y_pred_std.detach().cpu().numpy() * y_std + y_mean # 逆標準化

            # 予測値が負の場合、0に置き換える
            y_pred = np.clip(y_pred, 0, None)

            # 列名の指定
            col_name = "Tur(t+1)"
            # 得られた予測を記録
            pred_cols.append(pd.Series(y_pred.flatten(), index=pred_test_temp.index, name=col_name))
            
            
        else: # 2時間先以降の予測
            cols_block = []
            for col, lag in zip(input_cols, input_lags):
                
                if (col in output_cols) and (lag == 1): # inputがTur(t-1)のとき
                    # 前時刻での予測を次の予測の入力値に
                    x_part = y_pred.reshape(-1, 1)
                    cols_block.append(x_part)

                elif (col in output_cols) and (lag > 1): # inputがTur(t-2)以降の時
                    # colが同じで、lagがlag+1のものを探す
                    col_target = None
                    for idx, (c2, l2) in enumerate(zip(input_cols, input_lags)):
                        if (c2 == col) and (l2 == lag - 1):
                            col_target = idx
                            break  # 最初に見つかった時点で抜ける
                    if col_target is None:
                        raise ValueError(f"対応する列がありません: col={col}, lag={lag}")
                    
                    x_part = X_raw_prev[:, col_target:col_target+1]
                    cols_block.append(x_part)


                else: # inputがTur()以外の時
                    # リードタイム分（j）ずらす
                    start = max(0, s - lag + j)
                    end = min(len(d_all) - 1, e - lag + j)
                    x_part = slice_L_nan(d_all, col, start, end, L)
                    cols_block.append(x_part)
            
            X_seg = np.hstack(cols_block) # (L, len(input_cols))
            X_raw_prev = X_seg
            X_seg_std = (X_seg - x_mean) / x_std # 標準化
            X_seg_std = torch.from_numpy(X_seg_std.astype(np.float32)) # torch.Tensor型に
            X_seg_std = X_seg_std.to(device)

            model.eval()
            with torch.no_grad():
                y_pred_std = model(X_seg_std) # modelで予測

            y_pred = y_pred_std.detach().cpu().numpy() * y_std + y_mean # 逆標準化

            # 予測値が負の場合、0に置き換える
            y_pred = np.clip(y_pred, 0, None)

            # 列名の指定
            col_name = f"Tur(t+{j+1})"
            # 得られた予測を記録
            pred_cols.append(pd.Series(y_pred.flatten(), index=pred_test_temp.index, name=col_name))

    pred_test_temp = pd.concat([pred_test_temp] + pred_cols, axis=1)
    pred_test.append(pred_test_temp)

# 1) 縦方向に結合（行結合）
test_result = pd.concat(pred_test, axis=0, ignore_index=False)  # ignore_index=True で連番振り直し


In [14]:
# エクセルファイルに保存
test_result.to_excel(test_result_path, index=True)
