# 스케줄링 결과 비교 분석
Level 4 전략과 기존 방식(main.py) 간의 스케줄링 결과 차이점 분석

In [4]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# 한글 폰트 설정
plt.rcParams['font.family'] = ['Malgun Gothic', 'DejaVu Sans']
plt.rcParams['axes.unicode_minus'] = False

## 1. 데이터 로딩

In [5]:
# Level 4 결과 로딩
level4_summary = pd.read_excel('level4_스케줄링결과.xlsx', sheet_name='주문_생산_요약본')
level4_info = pd.read_excel('level4_스케줄링결과.xlsx', sheet_name='주문_생산_정보')
level4_machine = pd.read_excel('level4_스케줄링결과.xlsx', sheet_name='호기_정보')

# 기존 방식 결과 로딩
main_summary = pd.read_excel('0821스케줄링결과.xlsx', sheet_name='주문_생산_요약본')
main_info = pd.read_excel('0821스케줄링결과.xlsx', sheet_name='주문_생산_정보')
main_machine = pd.read_excel('0821스케줄링결과.xlsx', sheet_name='호기_정보')

print("데이터 로딩 완료!")
print(f"Level 4 - 주문 수: {len(level4_summary)}, 작업 수: {len(level4_machine)}")
print(f"Main.py - 주문 수: {len(main_summary)}, 작업 수: {len(main_machine)}")

데이터 로딩 완료!
Level 4 - 주문 수: 173, 작업 수: 474
Main.py - 주문 수: 173, 작업 수: 474


## 3. 작업 순서 비교

In [7]:
# 작업 순서 비교를 위한 데이터 정리
def compare_work_sequences():
    # 각 기계별 작업 순서 추출
    def get_machine_sequences(machine_df):
        sequences = {}
        machine_col = '기계코드' if '기계코드' in machine_df.columns else ('호기' if '호기' in machine_df.columns else '기계인덱스')
        
        for machine in machine_df[machine_col].unique():
            if pd.isna(machine):
                continue
            machine_jobs = machine_df[machine_df[machine_col] == machine].sort_values('작업 시작 시간')
            sequences[machine] = machine_jobs['ID'].tolist()
        return sequences
    
    level4_sequences = get_machine_sequences(level4_machine)
    main_sequences = get_machine_sequences(main_machine)
    
    # 공통 기계들에 대해 순서 차이 분석
    common_machines = set(level4_sequences.keys()) & set(main_sequences.keys())
    
    sequence_diff = {}
    for machine in common_machines:
        level4_seq = level4_sequences[machine]
        main_seq = main_sequences[machine]
        
        # 순서가 다른지 확인
        if level4_seq != main_seq:
            sequence_diff[machine] = {
                'level4': level4_seq,
                'main': main_seq,
                'level4_count': len(level4_seq),
                'main_count': len(main_seq)
            }
    
    print(f"=== 작업 순서 차이 분석 ===")
    print(f"전체 기계 수 - Level4: {len(level4_sequences)}, Main: {len(main_sequences)}")
    print(f"공통 기계 수: {len(common_machines)}")
    print(f"순서가 다른 기계 수: {len(sequence_diff)}")
    
    return sequence_diff

sequence_differences = compare_work_sequences()

=== 작업 순서 차이 분석 ===
전체 기계 수 - Level4: 0, Main: 5
공통 기계 수: 0
순서가 다른 기계 수: 0


## 4. 기계별 작업량 비교

In [None]:
# 기계별 작업량 분석
def analyze_machine_workload():
    def get_machine_workload(machine_df):
        machine_col = '기계코드' if '기계코드' in machine_df.columns else ('호기' if '호기' in machine_df.columns else '기계인덱스')
        
        workload = machine_df.groupby(machine_col).agg({
            'ID': 'count',  # 작업 개수
            '작업시간': 'sum' if '작업시간' in machine_df.columns else 'count',  # 총 작업시간
            '생산길이': 'sum' if '생산길이' in machine_df.columns else 'count'  # 총 생산길이
        }).rename(columns={'ID': '작업_개수'})
        
        return workload
    
    level4_workload = get_machine_workload(level4_machine)
    main_workload = get_machine_workload(main_machine)
    
    # 작업량 비교
    workload_comparison = pd.merge(level4_workload, main_workload, 
                                 left_index=True, right_index=True, 
                                 suffixes=('_level4', '_main'), how='outer')
    
    # 차이 계산
    workload_comparison['작업개수_차이'] = workload_comparison['작업_개수_level4'] - workload_comparison['작업_개수_main']
    if '작업시간_level4' in workload_comparison.columns:
        workload_comparison['작업시간_차이'] = workload_comparison['작업시간_level4'] - workload_comparison['작업시간_main']
    
    print("=== 기계별 작업량 비교 ===")
    print(workload_comparison.fillna(0))
    
    return workload_comparison

workload_comparison = analyze_machine_workload()

## 5. 특정 주문의 스케줄링 차이 분석

In [None]:
# 특정 주문들의 완료시간 비교
def compare_order_completion():
    # 주문별 완료시간 비교
    def get_completion_times(summary_df):
        completion_col = '종료날짜' if '종료날짜' in summary_df.columns else '종료시각'
        return summary_df.set_index('P/O NO')[completion_col]
    
    level4_completion = get_completion_times(level4_summary)
    main_completion = get_completion_times(main_summary)
    
    # 공통 주문들 비교
    common_orders = set(level4_completion.index) & set(main_completion.index)
    
    completion_comparison = pd.DataFrame({
        'Level4_완료시간': level4_completion,
        'Main_완료시간': main_completion
    })
    
    # 완료시간 차이 계산 (시간 단위)
    completion_comparison['시간차이'] = (
        pd.to_datetime(completion_comparison['Level4_완료시간']) - 
        pd.to_datetime(completion_comparison['Main_완료시간'])
    ).dt.total_seconds() / 3600  # 시간 단위로 변환
    
    # 차이가 큰 주문들 찾기
    significant_diff = completion_comparison[abs(completion_comparison['시간차이']) > 1]  # 1시간 이상 차이
    
    print("=== 주문별 완료시간 비교 ===")
    print(f"공통 주문 수: {len(common_orders)}")
    print(f"1시간 이상 차이나는 주문 수: {len(significant_diff)}")
    print("\n차이가 큰 주문들 (상위 10개):")
    print(significant_diff.nlargest(10, '시간차이')[['시간차이']])
    
    return completion_comparison

completion_comparison = compare_order_completion()

## 6. 시각화

In [None]:
# 6.1 전체 성능 지표 시각화
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Makespan 비교
if 'makespan' in comparison_df.index:
    makespan_data = comparison_df.loc['makespan', ['Level 4', 'Main.py']]
    axes[0,0].bar(makespan_data.index, makespan_data.values, color=['skyblue', 'lightcoral'])
    axes[0,0].set_title('Makespan 비교')
    axes[0,0].set_ylabel('시간')

# 지각 주문 수 비교
if 'late_orders' in comparison_df.index:
    late_data = comparison_df.loc['late_orders', ['Level 4', 'Main.py']]
    axes[0,1].bar(late_data.index, late_data.values, color=['lightgreen', 'salmon'])
    axes[0,1].set_title('지각 주문 수 비교')
    axes[0,1].set_ylabel('주문 수')

# 완료시간 차이 분포
if 'time_diff' in completion_comparison.columns or '시간차이' in completion_comparison.columns:
    time_diff_col = '시간차이' if '시간차이' in completion_comparison.columns else 'time_diff'
    axes[1,0].hist(completion_comparison[time_diff_col].dropna(), bins=30, alpha=0.7, color='purple')
    axes[1,0].set_title('주문별 완료시간 차이 분포')
    axes[1,0].set_xlabel('시간 차이 (시간)')
    axes[1,0].set_ylabel('주문 수')

# 기계별 작업량 차이
if '작업개수_차이' in workload_comparison.columns:
    workload_comparison['작업개수_차이'].plot(kind='bar', ax=axes[1,1], color='orange')
    axes[1,1].set_title('기계별 작업 개수 차이')
    axes[1,1].set_xlabel('기계')
    axes[1,1].set_ylabel('작업 개수 차이')
    axes[1,1].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

## 7. 상세 차이점 분석

In [None]:
# 가장 큰 차이를 보이는 부분들 분석
print("=== 주요 차이점 요약 ===")

# 1. 전체 성능 차이
if 'makespan' in comparison_df.index:
    makespan_diff = comparison_df.loc['makespan', '차이']
    makespan_pct = comparison_df.loc['makespan', '차이율(%)']
    print(f"1. Makespan 차이: {makespan_diff:.1f} ({makespan_pct:.1f}%)")

# 2. 지각 관련
if 'late_orders' in comparison_df.index:
    late_diff = comparison_df.loc['late_orders', '차이']
    print(f"2. 지각 주문 수 차이: {late_diff:.0f}개")

# 3. 순서가 가장 많이 바뀐 기계
if sequence_differences:
    print(f"3. 작업 순서가 다른 기계: {len(sequence_differences)}개")
    for machine, diff in list(sequence_differences.items())[:3]:  # 상위 3개만 표시
        print(f"   - {machine}: Level4({diff['level4_count']}개) vs Main({diff['main_count']}개)")

# 4. 작업량 차이가 큰 기계
if '작업개수_차이' in workload_comparison.columns:
    max_diff_machine = workload_comparison['작업개수_차이'].abs().idxmax()
    max_diff_value = workload_comparison.loc[max_diff_machine, '작업개수_차이']
    print(f"4. 작업량 차이가 가장 큰 기계: {max_diff_machine} ({max_diff_value:.0f}개 차이)")

# 5. 완료시간 차이 통계
if '시간차이' in completion_comparison.columns:
    time_diff_stats = completion_comparison['시간차이'].describe()
    print(f"5. 완료시간 차이 통계:")
    print(f"   - 평균: {time_diff_stats['mean']:.2f}시간")
    print(f"   - 최대: {time_diff_stats['max']:.2f}시간")
    print(f"   - 최소: {time_diff_stats['min']:.2f}시간")

## 8. 결론 및 개선점

In [None]:
print("=== 분석 결론 ===")
print("")
print("1. 성능 측면:")
if 'makespan' in comparison_df.index:
    makespan_pct = comparison_df.loc['makespan', '차이율(%)']
    if makespan_pct > 0:
        print(f"   - Level 4가 Main.py보다 {makespan_pct:.1f}% 더 오래 걸림")
    else:
        print(f"   - Level 4가 Main.py보다 {-makespan_pct:.1f}% 더 빠름")

print("")
print("2. 스케줄링 방식 차이:")
print(f"   - 작업 순서가 다른 기계: {len(sequence_differences)}개")
print(f"   - 이는 Level 4의 다른 우선순위 로직 때문으로 추정")

print("")
print("3. 개선 방향:")
if 'makespan' in comparison_df.index and comparison_df.loc['makespan', '차이율(%)'] > 0:
    print("   - Level 4 전략의 Setup 최소화 로직 재검토 필요")
    print("   - Window 크기나 우선순위 계산 방식 조정 고려")
else:
    print("   - Level 4 전략이 더 효율적인 결과를 보임")
    print("   - 추가 최적화를 통해 더 나은 성능 기대 가능")

print("")
print("4. 다음 단계:")
print("   - 차이가 큰 기계들의 작업 패턴 상세 분석")
print("   - Setup time 계산 로직 검증")
print("   - 다양한 파라미터 조합 실험")