<a href="https://colab.research.google.com/github/tourihasi/Openstudio/blob/main/Untitled16.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
# ============================================================
# ① Colab: Excel(2023神奈川) → 既存EPWへ列限定上書きスクリプト
#    - 乾球温度/露点/湿度/気圧/風速/風向のみ更新
#    - EPW第6列(Data Source Flag)は全行 0 に固定
# ============================================================

# ② 必要ライブラリ
import pandas as pd
import numpy as np
from google.colab import files

# ③ アップロード（ExcelとベースEPWを選択）
#    - Excel: 2023年神奈川県気象情報まとめ.xlsx
#    - EPW:   ベースにする「壊れていない」EPW（IWEC等）
uploaded = files.upload()

# ④ アップロードされたファイル名を自動取得
excel_path = None
epw_path = None
for fn in uploaded.keys():
    if fn.lower().endswith(".xlsx"):
        excel_path = fn
    if fn.lower().endswith(".epw"):
        epw_path = fn

if excel_path is None or epw_path is None:
    raise FileNotFoundError("xlsx と epw の両方をアップロードしてください。")

print("Excel:", excel_path)
print("EPW  :", epw_path)

# ⑤ 風向（方位文字列→度）変換テーブル
#    ※必要に応じて追記できます（例：静穏など）
DIR_MAP = {
    "北": 0.0,
    "北北東": 22.5,
    "北東": 45.0,
    "東北東": 67.5,
    "東": 90.0,
    "東南東": 112.5,
    "南東": 135.0,
    "南南東": 157.5,
    "南": 180.0,
    "南南西": 202.5,
    "南西": 225.0,
    "西南西": 247.5,
    "西": 270.0,
    "西北西": 292.5,
    "北西": 315.0,
    "北北西": 337.5,
}

def dir_text_to_deg(x):
    # ⑥-1 文字列でなければNaN
    if pd.isna(x):
        return np.nan
    x = str(x).strip()

    # ⑥-2 代表表記のゆらぎ対策（必要なら追加）
    x = x.replace("　", "").replace(" ", "")

    # ⑥-3 変換
    return DIR_MAP.get(x, np.nan)

# ⑦ Excel読み込み（先頭シートを想定）
df = pd.read_excel(excel_path, sheet_name=0)

# ⑧ Excel列の存在チェック（このExcelに合わせて固定）
required_cols = ["月", "日", "時間", "気温(℃)", "露点温度(℃)", "湿度(％)", "気圧(hPa)", "風向・風速(m/s)", "風向・風速(m/s)_2"]
missing = [c for c in required_cols if c not in df.columns]
if missing:
    raise KeyError(f"Excelに必要列が見つかりません: {missing}")

# ⑨ Excel→転記用データ整形
# ⑨-1 月日時間（1〜24時の想定）をキー化
df_key = df[["月", "日", "時間"]].copy()

# ⑨-2 乾球/露点
df_key["DryBulb_C"] = pd.to_numeric(df["気温(℃)"], errors="coerce")
df_key["DewPoint_C"] = pd.to_numeric(df["露点温度(℃)"], errors="coerce")

# ⑨-3 相対湿度（Excelは0〜1なので×100、%へ）
rh = pd.to_numeric(df["湿度(％)"], errors="coerce")
if rh.max(skipna=True) <= 1.5:
    rh = rh * 100.0
df_key["RH_pct"] = rh.clip(0, 100)

# ⑨-4 気圧（hPa→Pa）
p_hpa = pd.to_numeric(df["気圧(hPa)"], errors="coerce")
df_key["StationP_Pa"] = (p_hpa * 100.0)

# ⑨-5 風速（m/s）
df_key["WindSpd_mps"] = pd.to_numeric(df["風向・風速(m/s)"], errors="coerce")

# ⑨-6 風向（方位文字列→度）
df_key["WindDir_deg"] = df["風向・風速(m/s)_2"].apply(dir_text_to_deg)

# ⑩ 欠測の簡易補完（最小限）
#    ※欠測がある場合にRunを落としにくくする目的
for col in ["DryBulb_C", "DewPoint_C", "RH_pct", "StationP_Pa", "WindSpd_mps", "WindDir_deg"]:
    df_key[col] = df_key[col].astype(float)
    df_key[col] = df_key[col].ffill().bfill()

# ⑪ Excel側の時間数チェック（2023年非うるう年=8760が期待）
if len(df_key) != 8760:
    print(f"警告: Excel行数が8760ではありません: {len(df_key)}（転記は継続します）")

# ⑫ EPW読み込み（ヘッダ8行＋データ）
with open(epw_path, "r", encoding="utf-8", errors="ignore") as f:
    lines = f.read().splitlines()

if len(lines) < 10:
    raise ValueError("EPWの内容が短すぎます。ファイルを確認してください。")

header = lines[:8]
data_lines = lines[8:]

# ⑬ EPWデータ行のパース（CSVとして分解）
epw_rows = [ln.split(",") for ln in data_lines]

# ⑭ EPW列数チェック（35列が一般的）
col_counts = set(len(r) for r in epw_rows)
if len(col_counts) != 1:
    raise ValueError(f"EPWの列数が行によって不揃いです: {sorted(col_counts)}")
ncols = list(col_counts)[0]
if ncols < 30:
    raise ValueError(f"EPWの列数が少なすぎます: {ncols}")

print("EPW data rows:", len(epw_rows), "cols:", ncols)

# ⑮ EPWの月日時間キーを作成（Yearは一致不要で、月日時間で突合）
#    EPW列: 1=Year, 2=Month, 3=Day, 4=Hour（一般的）
epw_keys = []
for r in epw_rows:
    m = int(float(r[1]))
    d = int(float(r[2]))
    h = int(float(r[3]))
    epw_keys.append((m, d, h))

# ⑯ Excel側を辞書化（高速突合）
#    キー=(月,日,時間)
excel_map = {}
for i in range(len(df_key)):
    k = (int(df_key.loc[i, "月"]), int(df_key.loc[i, "日"]), int(df_key.loc[i, "時間"]))
    excel_map[k] = df_key.loc[i]

# ⑰ 列限定で上書き（EPW列番号は1始まりの説明 → コードは0始まり）
#    - EPW第6列(インデックス5): Data Source Flag → 0固定（最重要）
#    - EPW第7列(6): DryBulb
#    - EPW第8列(7): DewPoint
#    - EPW第9列(8): RH
#    - EPW第10列(9): Station Pressure
#    - EPW第21列(20): Wind Speed
#    - EPW第22列(21): Wind Direction
updated = 0
for idx, r in enumerate(epw_rows):
    k = epw_keys[idx]
    if k not in excel_map:
        continue

    row = excel_map[k]

    # ⑰-1 年を2023に統一したい場合は有効化（不要ならコメントアウトのまま）
    # r[0] = "2023"

    # ⑰-2 Data Source Flag を 0 固定
    r[5] = "0"

    # ⑰-3 乾球/露点/湿度
    r[6] = f"{row['DryBulb_C']:.1f}"
    r[7] = f"{row['DewPoint_C']:.1f}"
    r[8] = f"{row['RH_pct']:.0f}"

    # ⑰-4 気圧（Pa）
    r[9] = f"{row['StationP_Pa']:.0f}"

    # ⑰-5 風速/風向
    r[20] = f"{row['WindSpd_mps']:.1f}"
    r[21] = f"{row['WindDir_deg']:.0f}"

    updated += 1

# ⑱ 全行について Data Source Flag を念押しで 0 固定（安全策）
for r in epw_rows:
    r[5] = "0"

print("Updated rows:", updated)

# ⑲ 書き出し
out_name = "EPW_2023_Kanagawa_overwrite.epw"
with open(out_name, "w", encoding="utf-8", newline="\n") as f:
    for h in header:
        f.write(h + "\n")
    for r in epw_rows:
        f.write(",".join(r) + "\n")

# ⑳ ダウンロード
files.download(out_name)
print("Done ->", out_name)


Saving 2023年神奈川県気象情報まとめ.xlsx to 2023年神奈川県気象情報まとめ (1).xlsx
Saving JPN_Kanagawa.yokohama.477150_IWEC.epw to JPN_Kanagawa.yokohama.477150_IWEC.epw
Excel: 2023年神奈川県気象情報まとめ (1).xlsx
EPW  : JPN_Kanagawa.yokohama.477150_IWEC.epw
EPW data rows: 8760 cols: 35
Updated rows: 8760


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Done -> EPW_2023_Kanagawa_overwrite.epw
