In [None]:
import pandas as pd
import os

# 1. 设置输入文件路径
# 高压数据文件（10kV以上）
file_path = r"E:\A智网\业扩分析\8月分析\7月业扩月度报告\25年7月业扩报告_新装增容业扩.xlsx" 

# 2. 设置输出文件路径和名称
output_file_path = r"E:\A智网\业扩分析\8月分析\7月业扩月度报告\8.15\新装增容业扩数据_7月业扩月底电量报告全行业.xlsx"

# 3. 设置需要筛选的序号列表
# 您可以随时修改这个列表来筛选不同的行，例如 [10, 22, 33, 44, 55] 或 [1, 2, 3]
# 注意：序号必须是数字格式
# target_serial_numbers = [41,46,53,58,61,65,71,77,79,109,113,118,125]
target_serial_numbers = 'all'

# --- 代码主逻辑 ---
# 一般情况下，您不需要修改下面的代码

def filter_and_save_data():
    """
    主函数，用于读取、筛选和保存数据。
    """
    print("--- 开始处理数据 ---")

    # 定义处理任务列表
    # 每个任务包含：输入文件路径、输入sheet名、输出sheet名
    tasks = [
        {'input_file': file_path, 'input_sheet': '高压完成新装_容量', 'output_sheet': '高压新装'},
        {'input_file': file_path, 'input_sheet': '高压完成增容_容量', 'output_sheet': '高压增容'},
        {'input_file': file_path,  'input_sheet': '低压完成新装_容量', 'output_sheet': '低压新装'},
        {'input_file': file_path,  'input_sheet': '低压完成增容_容量', 'output_sheet': '低压增容'}
    ]

    # 检查输出目录是否存在，如果不存在则创建
    output_dir = os.path.dirname(output_file_path)
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
        print(f"已创建输出目录: {output_dir}")

    # 使用ExcelWriter可以在同一个Excel文件中写入多个sheet
    try:
        with pd.ExcelWriter(output_file_path, engine='openpyxl') as writer:
            # 遍历所有任务
            for task in tasks:
                input_file = task['input_file']
                input_sheet = task['input_sheet']
                output_sheet = task['output_sheet']
                
                print(f"\n正在处理: \n  - 文件: {os.path.basename(input_file)}\n  - Sheet: '{input_sheet}'")

                try:
                    # 1. 读取指定的Excel文件和sheet
                    # 使用dtype={'序号': 'Int64'}确保'序号'列被当作整数处理，即使有空值
                    df = pd.read_excel(input_file, sheet_name=input_sheet)
                    
                    # 检查'序号'列是否存在
                    if '序号' not in df.columns:
                        print(f"  [错误] 在文件 '{input_file}' 的 sheet '{input_sheet}' 中未找到'序号'列，已跳过。")
                        continue

                    # 2. 根据'序号'列进行筛选
                    # 检查是否需要筛选，如果 target_serial_numbers 是 'all'，则不筛选
                    if target_serial_numbers == 'all':
                        # 如果是'all'，直接复制整个数据框，相当于选择了所有行
                        filtered_df = df.copy()
                        print("  检测到 'all'，将选择此sheet中的所有数据。")
                    else:
                        # 如果是具体的列表，则按列表进行筛选
                        filtered_df = df[df['序号'].isin(target_serial_numbers)].copy()
                    
                    if filtered_df.empty:
                        print(f"  [警告] 未找到任何匹配的序号 {target_serial_numbers}。将创建一个空的sheet '{output_sheet}'。")
                    else:
                        print(f"  成功筛选出 {len(filtered_df)} 行数据。")

                    # 3. 将筛选后的数据写入到新的Excel文件的指定sheet中
                    # index=False 表示在写入Excel时不要包含DataFrame的行索引（0, 1, 2...）
                    filtered_df.to_excel(writer, sheet_name=output_sheet, index=False)
                    print(f"  已将数据写入到输出文件的 '{output_sheet}' sheet。")

                except FileNotFoundError:
                    print(f"  [错误] 文件未找到: {input_file}，已跳过此任务。")
                except Exception as e:
                    # 捕获其他可能的错误，例如sheet不存在
                    print(f"  [错误] 处理文件 '{input_file}' 的 sheet '{input_sheet}' 时发生错误: {e}")

        print(f"\n--- 处理完成！---\n所有数据已成功保存到: {output_file_path}")

    except Exception as e:
        print(f"\n[致命错误] 无法创建或写入输出文件 '{output_file_path}'。请检查文件路径或权限。错误详情: {e}")


if __name__ == "__main__":
    filter_and_save_data()

--- 开始处理数据 ---

正在处理: 
  - 文件: 25年7月业扩报告_新装增容业扩.xlsx
  - Sheet: '高压完成新装_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '高压新装' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_新装增容业扩.xlsx
  - Sheet: '高压完成增容_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '高压增容' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_新装增容业扩.xlsx
  - Sheet: '低压完成新装_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '低压新装' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_新装增容业扩.xlsx
  - Sheet: '低压完成增容_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '低压增容' sheet。

--- 处理完成！---
所有数据已成功保存到: E:\A智网\业扩分析\8月分析\7月业扩月度报告\8.15\新装增容业扩数据_7月业扩月底电量报告全行业_test.xlsx


In [None]:
import pandas as pd
import os

# 1. 设置输入文件路径
file_path = r"E:\A智网\业扩分析\8月分析\7月业扩月度报告\25年7月业扩报告_减容销户业扩.xlsx" 

# 2. 设置输出文件路径和名称
output_file_path = r"E:\A智网\业扩分析\8月分析\7月业扩月度报告\8.15\减容销户业扩数据_7月业扩月底电量报告全行业.xlsx"

# 3. 设置需要筛选的序号列表
# target_serial_numbers = [41,46,53,58,61,65,71,77,79,109,113,118,125]   #筛选行业
target_serial_numbers = 'all'

# --- 代码主逻辑 ---
# 一般情况下，您不需要修改下面的代码

def filter_and_save_data():
    """
    主函数，用于读取、筛选和保存数据。
    """
    print("--- 开始处理数据 ---")

    # 定义处理任务列表
    # 每个任务包含：输入文件路径、输入sheet名、输出sheet名
    tasks = [
        {'input_file': file_path, 'input_sheet': '高压完成销户_容量', 'output_sheet': '高压销户'},
        {'input_file': file_path, 'input_sheet': '高压完成减容_容量', 'output_sheet': '高压减容'},
        {'input_file': file_path,  'input_sheet': '低压完成销户_容量', 'output_sheet': '低压销户'},
        {'input_file': file_path,  'input_sheet': '低压完成减容_容量', 'output_sheet': '低压减容'}
    ]

    # 检查输出目录是否存在，如果不存在则创建
    output_dir = os.path.dirname(output_file_path)
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
        print(f"已创建输出目录: {output_dir}")

    # 使用ExcelWriter可以在同一个Excel文件中写入多个sheet
    try:
        with pd.ExcelWriter(output_file_path, engine='openpyxl') as writer:
            # 遍历所有任务
            for task in tasks:
                input_file = task['input_file']
                input_sheet = task['input_sheet']
                output_sheet = task['output_sheet']
                
                print(f"\n正在处理: \n  - 文件: {os.path.basename(input_file)}\n  - Sheet: '{input_sheet}'")

                try:
                    # 1. 读取指定的Excel文件和sheet
                    # 使用dtype={'序号': 'Int64'}确保'序号'列被当作整数处理，即使有空值
                    df = pd.read_excel(input_file, sheet_name=input_sheet)
                    
                    # 检查'序号'列是否存在
                    if '序号' not in df.columns:
                        print(f"  [错误] 在文件 '{input_file}' 的 sheet '{input_sheet}' 中未找到'序号'列，已跳过。")
                        continue

                    # 2. 根据'序号'列进行筛选
                    # 检查是否需要筛选，如果 target_serial_numbers 是 'all'，则不筛选
                    if target_serial_numbers == 'all':
                        # 如果是'all'，直接复制整个数据框，相当于选择了所有行
                        filtered_df = df.copy()
                        print("  检测到 'all'，将选择此sheet中的所有数据。")
                    else:
                        # 如果是具体的列表，则按列表进行筛选
                        filtered_df = df[df['序号'].isin(target_serial_numbers)].copy()
                    
                    if filtered_df.empty:
                        print(f"  [警告] 未找到任何匹配的序号 {target_serial_numbers}。将创建一个空的sheet '{output_sheet}'。")
                    else:
                        print(f"  成功筛选出 {len(filtered_df)} 行数据。")

                    # 3. 将筛选后的数据写入到新的Excel文件的指定sheet中
                    # index=False 表示在写入Excel时不要包含DataFrame的行索引（0, 1, 2...）
                    filtered_df.to_excel(writer, sheet_name=output_sheet, index=False)
                    print(f"  已将数据写入到输出文件的 '{output_sheet}' sheet。")

                except FileNotFoundError:
                    print(f"  [错误] 文件未找到: {input_file}，已跳过此任务。")
                except Exception as e:
                    # 捕获其他可能的错误，例如sheet不存在
                    print(f"  [错误] 处理文件 '{input_file}' 的 sheet '{input_sheet}' 时发生错误: {e}")

        print(f"\n--- 处理完成！---\n所有数据已成功保存到: {output_file_path}")

    except Exception as e:
        print(f"\n[致命错误] 无法创建或写入输出文件 '{output_file_path}'。请检查文件路径或权限。错误详情: {e}")


if __name__ == "__main__":
    filter_and_save_data()

--- 开始处理数据 ---

正在处理: 
  - 文件: 25年7月业扩报告_减容销户业扩.xlsx
  - Sheet: '高压完成销户_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '高压销户' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_减容销户业扩.xlsx
  - Sheet: '高压完成减容_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '高压减容' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_减容销户业扩.xlsx
  - Sheet: '低压完成销户_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '低压销户' sheet。

正在处理: 
  - 文件: 25年7月业扩报告_减容销户业扩.xlsx
  - Sheet: '低压完成减容_容量'
  检测到 'all'，将选择此sheet中的所有数据。
  成功筛选出 133 行数据。
  已将数据写入到输出文件的 '低压减容' sheet。

--- 处理完成！---
所有数据已成功保存到: E:\A智网\业扩分析\8月分析\7月业扩月度报告\8.15\减容销户业扩数据_7月业扩月底电量报告全行业_test.xlsx
