In [1]:
import os
import pandas as pd
from datetime import datetime
import pytz

In [2]:
# 本地文件夹路径
folder_path = r"\\prdeqs01\QlikData\Jira_\raw"

# 输出文件路径（必须是文件，不是目录）
out_path = r"\\prdeqs01\QlikData\Jira_\input\merged_jira.csv"

# 悉尼时区
sydney_tz = pytz.timezone("Australia/Sydney")

# 找到所有 CSV 文件，并按修改时间排序（旧→新）
csv_files = sorted(
    [
        os.path.join(folder_path, f)
        for f in os.listdir(folder_path)
        if f.endswith(".csv")
    ],
    key=lambda x: os.path.getmtime(x)
)

merged_df = pd.DataFrame()

for file in csv_files:
    df = pd.read_csv(file)

    filename = os.path.basename(file)
    mtime = os.path.getmtime(file)
    dt_sydney = datetime.fromtimestamp(mtime, tz=sydney_tz)

    source_str = f"{filename}_{dt_sydney.strftime('%Y-%m-%d_%H%M%S')}"
    df["source"] = source_str

    merged_df = (
        pd.concat([merged_df, df])
        .drop_duplicates(subset="Key", keep="last")
    )




In [3]:
# 保存合并后的文件
merged_df.to_csv(out_path, index=False, encoding="utf-8-sig")

print(f"合并完成，共 {len(merged_df)} 条记录。")
print(f"输出文件：{out_path}")

合并完成，共 732 条记录。
输出文件：\\prdeqs01\QlikData\Jira_\input\merged_jira.csv
