In [2]:
import pandas as pd
import os

def merge_excel_data_in_folder(folder_path, output_file_name, start_row, end_row, start_col, end_col, folder_path_out=None):
    """
    遍历指定文件夹中的所有Excel文件，对每个文件从指定的开始行列到结束行列的数据进行合并处理，
    然后将所有合并后的数据保存到指定文件夹下的新Excel文件中。

    参数:
    folder_path: 包含Excel文件的文件夹路径。
    output_file_name: 输出文件的名称。
    start_row: 数据开始的行号（从0开始计数）。
    end_row: 数据结束的行号。
    start_col: 数据开始的列标（如'A', 'B'等）。
    end_col: 数据结束的列标。
    folder_path_out: 输出文件的文件夹路径。如果为None，则使用输入文件的文件夹路径。
    """
    # 初始化一个空的DataFrame用于存放所有合并后的数据
    all_merged_data = pd.DataFrame()

    # 使用提供的输出文件夹路径，如果没有提供，则使用输入文件的文件夹路径
    if folder_path_out is None:
        folder_path_out = folder_path
    
    # 遍历文件夹中的所有文件
    for file_name in os.listdir(folder_path):
        # 构造完整的文件路径
        file_path = os.path.join(folder_path, file_name)
        # 确保是Excel文件
        if file_path.endswith('.xlsx'):
            # 读取指定范围的数据
            usecols = f"{start_col}:{end_col}"
            skiprows = start_row
            nrows = end_row - start_row + 1
            df = pd.read_excel(file_path, usecols=usecols, skiprows=skiprows, nrows=nrows)
            # 初始化一个空的列表用于存放合并后的数据
            merged_data = []
            # 从倒数第一列开始，逐列向前合并数据
            for column in reversed(df.columns):
                # 将当前列的数据添加到合并列表中
                merged_data.extend(df[column].dropna().values)
            # 将合并后的数据添加到总的DataFrame中
            all_merged_data = pd.concat([all_merged_data, pd.DataFrame(merged_data, columns=[file_name])], axis=1)

    # 定义新Excel文件的路径
    new_excel_path = os.path.join(folder_path_out, output_file_name)

    # 将合并后的数据保存到新的Excel文件中
    all_merged_data.to_excel(new_excel_path, index=False)

    print(f"合并后的数据已保存到 {new_excel_path}")

In [4]:
#test_数字经济、市场结构与创新绩效
folder_path = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/控制变量'
output_file_name = 'test_数字经济、市场结构与创新绩效_控制变量_面板数据.xlsx'
folder_path_out = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/test_数字经济、市场结构与创新绩效'  # 可选，如果您想输出到不同的文件夹

merge_excel_data_in_folder(folder_path, output_file_name,3 , 33,'H','R',folder_path_out)

合并后的数据已保存到 /Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/test_数字经济、市场结构与创新绩效/test_数字经济、市场结构与创新绩效_控制变量_面板数据.xlsx


In [3]:
folder_path = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/控制变量'
output_file_name = 'test_咸鱼3_控制变量_面板数据.xlsx'
folder_path_out = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/test_咸鱼3'  # 可选，如果您想输出到不同的文件夹

merge_excel_data_in_folder(folder_path, output_file_name,3 , 33,'D','S',folder_path_out)

合并后的数据已保存到 /Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/test_咸鱼3/test_咸鱼3_控制变量_面板数据.xlsx


In [7]:
#test_数字经济、市场结构与创新绩效
folder_path = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/控制变量'
output_file_name = '技术创新_面板数据.xlsx'
folder_path_out = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/面板数据'  # 可选，如果您想输出到不同的文件夹

merge_excel_data_in_folder(folder_path, output_file_name,3 , 33,'D','S',folder_path_out)

合并后的数据已保存到 /Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/面板数据/技术创新_面板数据.xlsx


In [7]:
#test_数字经济、市场结构与创新绩效
folder_path = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/temp'
output_file_name = 'tec4_面板数据1.xlsx'
folder_path_out = '/Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/面板数据'  # 可选，如果您想输出到不同的文件夹

merge_excel_data_in_folder(folder_path, output_file_name,3 , 33,'D','O',folder_path_out)

合并后的数据已保存到 /Users/yaoyuyang/Desktop/保研相关/科研日记/数据/处理数据/面板数据/tec4_面板数据1.xlsx
