In [1]:
import pandas as pd
from pathlib import Path
import openpyxl
from openpyxl.styles import Alignment, Font
from openpyxl.utils import get_column_letter
import sys

In [2]:
def process_pm_order(file_path):
    """
    处理PM订单Excel文件的主函数
    实现两个功能：
    1. 根据GE Asset Location分组保存到单独Excel文件
    2. 生成设备型号汇总表
    并确保输出文件格式美观
    """
    try:
        print(f"正在读取文件: {file_path}")
        # 读取Excel文件
        df = pd.read_excel(file_path, sheet_name='datalist')
        print(f"成功读取文件: 共 {len(df)} 条记录")

        # 打印列名用于调试
        print("\n文件列名:")
        for i, col in enumerate(df.columns):
            print(f"{i + 1}. {col}")
        print()

    except Exception as e:
        print(f"读取文件失败: {e}")
        return None

    # 标准化列名（去除空格和大小写差异）
    df.columns = [col.strip().replace(' ', '_') for col in df.columns]

    # 检查必要列是否存在
    required_columns = ['GE_Asset_Location', 'Model', 'Model_Description']
    missing_columns = [col for col in required_columns if col not in df.columns]

    if missing_columns:
        print(f"错误: 缺少必要列 - {', '.join(missing_columns)}")
        print("请检查Excel文件列名是否匹配以下名称:")
        print(" - GE Asset Location (或类似名称)")
        print(" - Model (或类似名称)")
        print(" - Model Description (或类似名称)")
        return None

    # 创建输出目录
    output_dir = Path('PMOrder_Output')
    locations_dir = output_dir / '地点分组'
    locations_dir.mkdir(parents=True, exist_ok=True)

    # 功能1: 按GE Asset Location分组 =================================
    print("\n开始处理地点分组...")

    # 创建一个新列用于存储位置前缀
    df['位置前缀'] = df['GE_Asset_Location'].apply(extract_location_prefix)

    # 获取所有唯一的位置前缀
    unique_prefixes = [p for p in df['位置前缀'].unique() if pd.notna(p)]
    print(f"找到 {len(unique_prefixes)} 个不同的位置前缀")

    # 保存分组结果到单独文件
    for prefix in unique_prefixes:
        # 过滤出当前前缀的数据
        group_df = df[df['位置前缀'] == prefix].copy()

        # 按照GE_Asset_Location和Model排序
        group_df = group_df.sort_values(
            by=['GE_Asset_Location', 'Model'],
            ascending=[True, True]
        ).reset_index(drop=True)


        # 生成安全的文件名
        safe_prefix = str(prefix).replace('/', '_').replace('\\', '_')
        output_path = locations_dir / f'{safe_prefix}.xlsx'

        # 保存到Excel并应用格式美化
        save_with_formatting(group_df, output_path)
        print(f"已创建: {output_path}")

    # 功能2: 按Model生成型号汇总表 ================================
    print("\n开始生成设备型号汇总表...")

    # 选择需要的列并去重
    model_summary = df[['Model', 'Model_Description']].copy()
    model_summary = model_summary.drop_duplicates()

    # 按型号排序
    model_summary = model_summary.sort_values('Model').reset_index(drop=True)

    # 保存汇总表
    model_summary_path = output_dir / '设备型号汇总.xlsx'
    save_with_formatting(model_summary, model_summary_path)
    print(f"已创建设备型号汇总表: {model_summary_path}")

    print("\n处理完成!")
    print(f"总处理记录数: {len(df)}")
    print(f"输出目录: {output_dir.resolve()}")
    return True

In [3]:
def extract_location_prefix(location):
    """
    从完整位置字符串中提取前缀（前三级）
    例如: KH-MB-01-1045 -> KH-MB-01
          KH-WWLB-04-A -> KH-WWLB-04
    """
    if not isinstance(location, str):
        return None

    parts = location.split('-')
    if len(parts) >= 3:
        # 取前三个部分作为前缀
        return '-'.join(parts[:3])
    # 如果不足三部分，返回原始值
    return location

In [4]:
def save_with_formatting(df, file_path):
    """
    保存DataFrame到Excel文件并应用格式美化
    1. 自动调整列宽
    2. 设置文本自动换行
    3. 冻结首行
    4. 设置标题行加粗
    """
    try:
        # 先保存到Excel文件
        df.to_excel(file_path, index=False)

        # 使用openpyxl加载工作簿进行格式设置
        wb = openpyxl.load_workbook(file_path)
        ws = wb.active

        # 设置标题行加粗和自动换行
        for cell in ws[1]:
            cell.font = Font(bold=True)
            cell.alignment = Alignment(wrap_text=True, vertical='top')

        # 设置数据行自动换行和对齐
        for row_idx in range(2, ws.max_row + 1):
            for cell in ws[row_idx]:
                cell.alignment = Alignment(wrap_text=True, vertical='top')

        # 自动调整列宽
        for col_idx in range(1, ws.max_column + 1):
            max_length = 0
            col_letter = openpyxl.utils.get_column_letter(col_idx)

            # 计算每列的最大宽度
            for cell in ws[col_letter]:
                try:
                    value = str(cell.value) if cell.value is not None else ""
                    if len(value) > max_length:
                        max_length = len(value)
                except:
                    pass

            # 设置列宽，限制最大宽度为50
            adjusted_width = min(max_length + 2, 50)
            ws.column_dimensions[col_letter].width = adjusted_width

        # 冻结首行
        ws.freeze_panes = 'A2'

        # 保存
        wb.save(file_path)
        return True

    except Exception as e:
        print(f"格式化文件时出错: {e}")
        # 如果格式化失败，至少保存原始数据
        df.to_excel(file_path, index=False)
        return False

In [5]:
def find_excel_file():
    """在当前目录查找可能的Excel文件"""
    current_dir = Path.cwd()
    print(f"当前工作目录: {current_dir}")

    # 可能的文件名模式
    patterns = [
        'PmOrder_*.xls*',
        '*Order*.xls*',
        '*export*.xls*',
        '*.xlsx',
        '*.xls'
    ]

    for pattern in patterns:
        excel_files = list(current_dir.glob(pattern))
        if excel_files:
            return excel_files[0]

    return None

In [6]:
if __name__ == "__main__":
    print("PM订单处理脚本 - 增强版")
    print("=" * 60)
    print("确保输出Excel文件格式美观，文本完整显示")
    print("自动检测并处理列名差异")
    print("-" * 60)

    # 查找Excel文件
    target_file = find_excel_file()

    if not target_file:
        print("错误: 未找到Excel文件")
        print("请将Excel文件放在当前目录下，并确保文件名包含 'Order' 或 'export'")
        print("支持的扩展名: .xls, .xlsx")
        sys.exit(1)

    print(f"找到Excel文件: {target_file.name}")
    result = process_pm_order(target_file)

    if not result:
        print("\n处理过程中遇到错误，请检查以上信息")
        sys.exit(1)

    print("\n操作说明:")
    print("1. 确保已安装依赖: pip install pandas openpyxl")
    print("2. 将Excel文件放在脚本同一目录下")
    print("3. 运行脚本: python3 本脚本名称.py")
    print("4. 输出文件在 PMOrder_Output 文件夹中")

PM订单处理脚本 - 增强版
确保输出Excel文件格式美观，文本完整显示
自动检测并处理列名差异
------------------------------------------------------------
当前工作目录: /Volumes/SSD 1TB/code/GEpmTool/excel_preprocess
找到Excel文件: PmOrder_export.xls
正在读取文件: /Volumes/SSD 1TB/code/GEpmTool/excel_preprocess/PmOrder_export.xls
成功读取文件: 共 67 条记录

文件列名:
1. SR Reference
2. HA WO No
3. EAM Type
4. Asset ID
5. HA Asset Location
6. GE Asset Location
7. Schedule Date/Time
8. Serial No
9. Hospital
10. Model 
11. Model Description
12. Type Code
13. Status
14. Engineer
15. RFID Tag
16. WO Sending Status


开始处理地点分组...
找到 5 个不同的位置前缀
已创建: PMOrder_Output/地点分组/KH-MB-01.xlsx
已创建: PMOrder_Output/地点分组/KH-WWLB-04.xlsx
已创建: PMOrder_Output/地点分组/KH-MB-03.xlsx
已创建: PMOrder_Output/地点分组/KH-RB-M.xlsx
已创建: PMOrder_Output/地点分组/KH-RB-G.xlsx

开始生成设备型号汇总表...
已创建设备型号汇总表: PMOrder_Output/设备型号汇总.xlsx

处理完成!
总处理记录数: 67
输出目录: /Volumes/SSD 1TB/code/GEpmTool/excel_preprocess/PMOrder_Output

操作说明:
1. 确保已安装依赖: pip install pandas openpyxl
2. 将Excel文件放在脚本同一目录下
3. 运行脚本: python3 本脚本名称.p