In [None]:
from xml.etree import ElementTree as ET
import os
import csv

In [None]:
# 日付・時間帯とレートを取得

# フォルダパスを指定
folder_path = "xml_files/2023"  # 必要に応じて変更

# 時間帯とレートのセットを記録するリスト
time_rate_pairs = []

# フォルダ内のすべてのXMLファイルを処理
for filename in os.listdir(folder_path):
    if filename.endswith(".xml"):
        # ファイル名から年月日と時間帯を抽出（例: 2015010422gm-... → 2015/01/04/22時）
        time_part = filename[0:10]  # 1文字目から10文字を取得
        hour = int(time_part)  # 数値に変換

        # ファイルを読み込む
        file_path = os.path.join(folder_path, filename)
        with open(file_path, "r", encoding="utf-8") as file:
            data = file.read()

        # XMLをパース
        root = ET.fromstring(data)

        # UNタグからレートを取得
        for un in root.findall(".//UN"):
            rate = un.get("rate")
            if rate:   # UNタグ自体は何度か出現することがあるので、rate属性が存在するものだけ参照
                rate_values = [float(r) for r in rate.split(",")]
                # 時間帯とレートをペアで保存
                for rate_value in rate_values:
                    time_rate_pairs.append((hour, rate_value))

# 結果の確認
print("時間帯とレートのペア:")
for pair in time_rate_pairs[:10]:  # 最初の10個だけ表示
    print(pair)

In [None]:
# 出力するCSVファイル名
output_file = "output/2023.csv"

# CSVファイルに書き込む
with open(output_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    # ヘッダー行を追加
    writer.writerow(["Time", "Rate"])
    # データ行を追加
    writer.writerows(time_rate_pairs)