In [None]:
import pandas as pd
import numpy as np
import os

# 定义根目录路径
root_directory = 'C:/Users/Admin/Desktop/test2/backtest_results'  # 替换为你的实际目录路径

# 遍历根目录中的所有文件夹和文件
for foldername, subfolders, filenames in os.walk(root_directory):
    # 检查文件夹中是否有以 'cointegration_daily' 开头的 Excel 文件
    if any(filename.startswith("Backtest_") and filename.endswith(".xlsx") for filename in filenames):
        # 定义输出文件路径为当前文件夹下的 Excel 文件
        output_file = os.path.join(foldername, 'monthly_returns_summary.xlsx')

        # 创建一个 Pandas ExcelWriter 对象用于保存每个文件夹的结果
        with pd.ExcelWriter(output_file) as writer:
            for filename in filenames:
                # 只处理以 'cointegration_daily' 开头的 Excel 文件
                if filename.startswith("Backtest_") and filename.endswith(".xlsx"):
                    file_path = os.path.join(foldername, filename)

                    try:
                        # 读取 Excel 数据，指定引擎为 'openpyxl'
                        df = pd.read_excel(file_path, engine='openpyxl')

                        # 确保 'Date' 列存在，并且 'Total_Daily_Return' 列存在
                        if 'Date' not in df.columns or 'Total_Return' not in df.columns:
                            print(f"文件 {filename} 中缺少 'Date' 或 'Total_Daily_Return' 列。")
                            continue

                        # 替换 inf 和 -inf 为 0
                        df.replace([np.inf, -np.inf], 0, inplace=True)

                        # 确保日期列是日期类型
                        df['Date'] = pd.to_datetime(df['Date'], errors='coerce')
                        
                        # 丢弃无效的日期数据行
                        df.dropna(subset=['Date'], inplace=True)

                        # 设置日期为索引
                        df.set_index('Date', inplace=True)

                        # 只保留 'Total_Daily_Return' 列
                        total_daily_return = df[['Total_Return']]

                        # 计算每个月的累计收益率，通过逐日累乘 (1 + 每天的收益)
                        monthly_return = total_daily_return.resample('M').agg(lambda x: (1 + x).prod() - 1)

                        # 去除文件名中的前缀 "cointegration_daily_"
                        short_filename = filename.replace("Backtest_", "")

                        # 确保文件名长度不超过 31 个字符
                        sheet_name = short_filename[:31]

                        # 如果文件名仍然重复，加一个唯一编号避免冲突
                        while sheet_name in writer.sheets:
                            sheet_name += "_1"
                            sheet_name = sheet_name[:31]  # 再次确保截取不会超过31个字符

                        # 将结果写入到 Excel 文件中
                        monthly_return.to_excel(writer, sheet_name=sheet_name)

                    except Exception as e:
                        print(f"Error processing file {filename} in folder {foldername}: {e}")

        print(f"Monthly returns for folder {foldername} have been saved to {output_file}.")
