# 전기차 충전소 최적 입지 분석 - 통합 버전
## ycnham + mg 브랜치 통합 실행

이 노트북은 두 브랜치의 모든 기능을 통합하여 완전한 분석 파이프라인을 제공합니다.

### 주요 통합 기능:
- **ImprovedDemandScoreCalculator**: 업종별 가중치 기반 고급 수요 점수 계산
- **이중 백업 시스템**: 고급 방식 실패 시 자동으로 기본 방식으로 전환
- **완전한 분석 파이프라인**: 전처리 → 모델링 → 최적화 → 평가
- **안정성 보장**: mg 브랜치의 견고한 오류 처리와 ycnham 브랜치의 고급 기능 결합

In [14]:
# 셀 1: 필수 패키지 설치
import sys
import subprocess

def install_package(package):
    subprocess.check_call([sys.executable, "-m", "pip", "install", package])

# 필수 패키지 목록
required_packages = [
    'xgboost',
    'scikit-learn', 
    'pulp',
    'folium',
    'tqdm',
    'geopy'
]

print("🚀 필수 패키지 설치 시작...")
for package in required_packages:
    try:
        __import__(package.replace('-', '_'))
        print(f"✅ {package} 이미 설치됨")
    except ImportError:
        print(f"📦 {package} 설치 중...")
        install_package(package)
        print(f"✅ {package} 설치 완료")

print("🎉 모든 패키지 설치 완료!")

🚀 필수 패키지 설치 시작...
✅ xgboost 이미 설치됨
📦 scikit-learn 설치 중...
✅ scikit-learn 설치 완료
✅ pulp 이미 설치됨
✅ folium 이미 설치됨
✅ tqdm 이미 설치됨
📦 geopy 설치 중...
✅ geopy 설치 완료
🎉 모든 패키지 설치 완료!


In [15]:
# 셀 2: 설치 확인
try:
    import xgboost as xgb
    import sklearn
    import pulp
    import folium
    import geopy
    print("✅ 모든 필수 패키지 정상 로드")
    print(f"   XGBoost 버전: {xgb.__version__}")
    print(f"   Scikit-learn 버전: {sklearn.__version__}")
except ImportError as e:
    print(f"❌ 패키지 로드 실패: {e}")

✅ 모든 필수 패키지 정상 로드
   XGBoost 버전: 3.0.2
   Scikit-learn 버전: 1.5.1


In [16]:
# 자동 리로드 설정
%load_ext autoreload
%autoreload 2

print("🚀 전기차 충전소 최적 입지 분석 시스템 초기화 중...")
print("📊 ycnham + mg 브랜치 통합 버전")

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload
🚀 전기차 충전소 최적 입지 분석 시스템 초기화 중...
📊 ycnham + mg 브랜치 통합 버전


In [17]:
# 공통 패키지 import
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from tqdm import tqdm
import os
import sys
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# src 경로 추가
PROJECT_ROOT = os.path.abspath(os.path.join(".."))
SRC_DIR = os.path.join(PROJECT_ROOT, "src")
if SRC_DIR not in sys.path:
    sys.path.append(SRC_DIR)

# seaborn 스타일 설정
sns.set(style="whitegrid")

# 경로 및 상수 설정
DATA_DIR = "../data/processed"
RAW_DIR = "../data/raw"
OUTPUT_IMG = "../outputs/image"
OUTPUT_DIR = "../data/modeling"
os.makedirs(OUTPUT_DIR, exist_ok=True)

# 모델링 설정
KMEANS_MODE = "auto"  # auto, manual
KMEANS_MANUAL_K = 5
XGB_N_ESTIMATORS = 100
COVERAGE_RADIUS_KM = 0.3  # 300m
FACILITY_LIMIT = 280

print(f"📁 프로젝트 루트: {PROJECT_ROOT}")
print(f"🗂️ 현재 작업 디렉토리: {os.getcwd()}")
print(f"⚙️ 모델링 설정 완료")

📁 프로젝트 루트: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming
🗂️ 현재 작업 디렉토리: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming\scripts
⚙️ 모델링 설정 완료


In [18]:
# 통합된 전처리 모듈 및 기존 모듈들 임포트
try:
    # 통합된 전처리 모듈
    from preprocessing.modeling_data_prep import (
        ModelingDataPreprocessor,
        ImprovedDemandScoreCalculator,
        create_modeling_preprocessor,
        test_modeling_functions
    )
    print("✅ 통합된 modeling_data_prep 모듈 로드 성공")
    
    # 기존 분석 모듈들
    from preprocessing.map_stations_to_grid import map_stations_to_grid
    from evaluation.grid_coverage_eval import evaluate_installed_coverage, evaluate_grid_coverage
    from modeling.kmeans_runner import generate_kmeans_features
    from modeling.xgboost_model import train_and_predict
    from modeling.mclp_model import solve_mclp
    from evaluation.strategy_comparator import evaluate_strategy
    from evaluation.new_coverage_analyzer import analyze_new_coverage, compute_percentiles
    from visualization.map_plotter import plot_strategy_map
    
    print("✅ 모든 분석 모듈 로드 성공")
    print("   - 통합 전처리 시스템 (이중 백업)")
    print("   - K-Means 클러스터링")
    print("   - XGBoost 예측 모델")
    print("   - MCLP 최적화")
    print("   - 전략 평가 및 시각화")
    
except ImportError as e:
    print(f"❌ 모듈 임포트 실패: {e}")
    print("🔧 경로 설정과 파일을 확인하세요.")
    raise

✅ 통합된 modeling_data_prep 모듈 로드 성공
✅ 모든 분석 모듈 로드 성공
   - 통합 전처리 시스템 (이중 백업)
   - K-Means 클러스터링
   - XGBoost 예측 모델
   - MCLP 최적화
   - 전략 평가 및 시각화


In [None]:
# 통합 시스템 테스트 및 전처리기 생성
print("🧪 통합 시스템 테스트 시작...")
print("=" * 50)

try:
    # 통합 기능 테스트
    test_results = test_modeling_functions()
    
    print("\n📋 테스트 결과:")
    for test_name, result in test_results.items():
        status = "✅" if result else "❌"
        print(f"   {status} {test_name}")
    
    # 통합 전처리기 생성
    print("\n🏗️ 통합 전처리기 생성 중...")
    unified_preprocessor = create_modeling_preprocessor()
    
    if unified_preprocessor:
        print(f"✅ 전처리기 생성 성공: {type(unified_preprocessor).__name__}")
        
        # 전처리기 정보 출력
        if hasattr(unified_preprocessor, 'get_info'):
            info = unified_preprocessor.get_info()
            print("\n📋 전처리기 정보:")
            for key, value in info.items():
                print(f"   • {key}: {value}")
    else:
        print("❌ 전처리기 생성 실패 - 기본 방식으로 대체")
        unified_preprocessor = ModelingDataPreprocessor()
        
except Exception as e:
    print(f"❌ 통합 시스템 테스트 중 오류: {e}")
    print("🔄 기본 안전 모드로 전환합니다.")
    unified_preprocessor = ModelingDataPreprocessor()
    print("✅ 기본 전처리기로 초기화 완료")

🧪 통합 시스템 테스트 시작...
🧪 통합 모델링 함수 테스트 시작...
🔧 통합 모델링 전처리 초기화 완료
   📁 입력 디렉토리: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming\data\processed
   📁 출력 디렉토리: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming\data\processed
✅ ModelingDataPreprocessor 생성 성공
✅ ImprovedDemandScoreCalculator 생성 성공
🔧 prepare_modeling_data() 함수 테스트...
🚀 통합 모델링 데이터 전처리 메인 함수 실행...
🔧 통합 모델링 전처리 초기화 완료
   📁 입력 디렉토리: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming\data\processed
   📁 출력 디렉토리: d:\projects\2025-1\빅데이터프로그래밍\2025-1-Big-Data-Programming\data\processed
🚀 통합 모델링 데이터 전처리 시작...

1️⃣ 격자 시스템 데이터 준비...
   📊 기존 격자 파일 발견: 6,030행
   📈 수요 격자: 2,029개
   📦 공급 격자: 6,030개
   ✅ 격자 시스템 준비 완료

2️⃣ 격자 특성 데이터 생성 (개선된 수요 점수 포함)...
   📊 격자 데이터 로딩: 6,030행
   🔄 개선된 수요 점수 계산기 로딩...
   ✅ 충전 데이터 로딩: 33,670행
   📊 대용량 상업시설 데이터 청크 로딩 (크기: 273.3MB)
   ✅ 상업시설 데이터 로딩: 100,000행
   ✅ 전기차 등록 데이터 로딩: 16행
   📈 시간 패턴 보정 계수: 1.10
   진행률: 16.6% (1,000/6,030)
   진행률: 33.2% (2,000/6,030)
   진행률: 49.8% (3,000/6,030)
   진행률: 6

# 1. 통합 전처리 단계

### 전기차 충전소 위치 매핑 및 격자 시스템 적용 + 통합 모델링 데이터 준비

In [None]:
# 1단계: 위치 매핑 실행
print("📍 1단계: 전기차 충전소 위치 매핑")
print("=" * 50)

try:
    map_stations_to_grid(
        env_path=os.path.join(RAW_DIR, "한국환경공단_전기차 충전소 위치 및 운영정보(충전소 ID 포함)_20230531.csv"),
        grid_path=os.path.join(DATA_DIR, "grid_system_processed.csv"),
        output_path=os.path.join(DATA_DIR, "charging_stations_seoul_gridded.csv")
    )
    print("✅ 충전소 위치 매핑 완료")
except Exception as e:
    print(f"❌ 위치 매핑 중 오류: {e}")

# 2단계: 통합 모델링 데이터 준비
print("\n⚙️ 2단계: 통합 모델링 데이터 전처리")
print("=" * 50)

try:
    # 원본 데이터 로드
    print("📂 원본 데이터 로드 중...")
    original_data = unified_preprocessor.load_training_data()
    
    if original_data is not None and not original_data.empty:
        print(f"✅ 원본 데이터 로드 성공: {original_data.shape}")
        
        # 통합 전처리 실행
        print("🔄 통합 전처리 실행 중...")
        processed_data = unified_preprocessor.preprocess_for_modeling(original_data)
        
        if processed_data is not None and not processed_data.empty:
            print(f"✅ 통합 전처리 완료: {processed_data.shape}")
            
            # 새로 추가된 컬럼 확인
            new_columns = set(processed_data.columns) - set(original_data.columns)
            if new_columns:
                print(f"🆕 새로 추가된 컬럼: {len(new_columns)}개")
                for col in sorted(list(new_columns)[:5]):
                    print(f"   • {col}")
                if len(new_columns) > 5:
                    print(f"   • ... 외 {len(new_columns)-5}개")
            
            # 처리된 데이터 저장
            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
            unified_output_path = os.path.join(DATA_DIR, f"modeling_data_unified_{timestamp}.csv")
            processed_data.to_csv(unified_output_path, index=False, encoding='utf-8-sig')
            
            # 최신 버전으로도 저장 (기존 파이프라인 호환성)
            latest_path = os.path.join(DATA_DIR, "grid_features.csv")
            processed_data.to_csv(latest_path, index=False, encoding='utf-8-sig')
            
            print(f"💾 통합 전처리 결과 저장: {unified_output_path}")
            print(f"💾 호환성 파일 업데이트: {latest_path}")
        else:
            print("❌ 통합 전처리 실패")
    else:
        print("❌ 원본 데이터 로드 실패")
        
except Exception as e:
    print(f"❌ 통합 전처리 중 오류: {e}")
    print("🔄 기존 파일로 진행합니다.")

print("\n🎉 통합 전처리 단계 완료!")

# 2. 기존 충전소 분석

In [None]:
# 기존 충전소 기반 설치 커버율 분석
print("📊 기존 충전소 커버율 분석")
print("=" * 50)

try:
    # 경로 설정
    GRID_FEATURES_PATH = os.path.join(DATA_DIR, "grid_features.csv")
    INSTALLED_STATION_PATH = os.path.join(DATA_DIR, "charging_stations_seoul_gridded.csv")
    
    # 평가 실행
    coverage_result = evaluate_installed_coverage(
        grid_path=GRID_FEATURES_PATH,
        station_path=INSTALLED_STATION_PATH,
        verbose=True
    )
    
    print("✅ 기존 충전소 분석 완료")
    
except Exception as e:
    print(f"❌ 기존 충전소 분석 중 오류: {e}")

# 3. K-Means 클러스터링

In [None]:
print("🎯 K-Means 클러스터링 분석")
print("=" * 50)

try:
    # 경로 설정
    GRID_PROCESSED_PATH = os.path.join(DATA_DIR, "grid_system_processed.csv")
    FEATURES_ALL_PATH = os.path.join(DATA_DIR, "grid_features.csv")
    KMEANS_OUTPUT_PATH = os.path.join(OUTPUT_DIR, "kmeans_grid_features.csv")
    
    # KMeans 실행
    features_kmeans, used_k = generate_kmeans_features(
        grid_path=GRID_PROCESSED_PATH,
        features_path=FEATURES_ALL_PATH,
        output_path=KMEANS_OUTPUT_PATH,
        mode=KMEANS_MODE,
        manual_k=KMEANS_MANUAL_K,
        return_top_cluster_only=True
    )
    
    # 커버율 평가
    all_df = pd.read_csv(FEATURES_ALL_PATH)
    kmeans_result = evaluate_grid_coverage(
        df_selected=features_kmeans,
        df_all=all_df,
        demand_col="demand_score",
        label="클러스터링 기반"
    )
    
    print("✅ K-Means 클러스터링 완료")
    
except Exception as e:
    print(f"❌ K-Means 클러스터링 중 오류: {e}")

# 4. XGBoost 예측 모델

In [None]:
print("🤖 XGBoost 예측 모델 학습")
print("=" * 50)

try:
    # 1. 클러스터링 결과로 학습
    print("1️⃣ 클러스터링 기반 모델 학습")
    XGB_INPUT_PATH = os.path.join(OUTPUT_DIR, "kmeans_grid_features.csv")
    features = pd.read_csv(XGB_INPUT_PATH)
    
    # 학습 feature 지정
    selected_features = [
        'supply_score',
        'station_count',
        'commercial_count',
        'supply_demand_ratio',
        'population_density',
        'accessibility_score',
        'transport_score',
        'cluster'
    ]
    
    # cluster 컬럼이 있으면 범주형 처리
    if 'cluster' in features.columns:
        features['cluster'] = features['cluster'].astype('category')
    
    # 모델 학습 및 예측
    features_with_pred, metrics, model = train_and_predict(
        df=features,
        features=selected_features,
        label='demand_score',
        n_estimators=XGB_N_ESTIMATORS,
        verbose=True
    )
    
    # 예측 결과 저장
    XGB_OUTPUT_PATH = os.path.join(OUTPUT_DIR, "xgboost_grid_features.csv")
    features_with_pred.to_csv(XGB_OUTPUT_PATH, index=False)
    print(f"💾 클러스터링 기반 예측 결과 저장: {XGB_OUTPUT_PATH}")
    
    # 2. 전체 데이터로 예측 (평가용)
    print("\n2️⃣ 전체 데이터 예측 (평가용)")
    INPUT_PATH = os.path.join(DATA_DIR, "grid_features.csv")
    OUTPUT_PATH = os.path.join(OUTPUT_DIR, "xgboost_grid_features_test.csv")
    
    features_all = pd.read_csv(INPUT_PATH)
    
    # 전체 데이터용 피처 (cluster 제외)
    test_features = [
        'supply_score',
        'station_count',
        'commercial_count',
        'supply_demand_ratio',
        'population_density',
        'accessibility_score',
        'transport_score'
    ]
    
    # 학습 실행
    features_with_pred_all, metrics_all, model_all = train_and_predict(
        df=features_all,
        features=test_features,
        label='demand_score',
        n_estimators=XGB_N_ESTIMATORS,
        verbose=True
    )
    
    # 결과 저장
    features_with_pred_all.to_csv(OUTPUT_PATH, index=False)
    print(f"💾 전체 데이터 예측 결과 저장: {OUTPUT_PATH}")
    
    print("✅ XGBoost 모델 학습 완료")
    
except Exception as e:
    print(f"❌ XGBoost 모델 학습 중 오류: {e}")

# 5. MCLP 최적화

## MCLP 모델 최적화 및 설정 이유

### 1. 왜 300m 반경을 설정했는가?
전기차 충전소의 **커버리지를 평가**하는 데 있어 각 충전소가 **효율적으로 서비스할 수 있는 범위**를 정의하는 것이 중요합니다. 실험을 통해 여러 반경을 테스트한 결과, **0.3km (300m)** 반경이 최적의 커버리지를 제공한다고 판단되었습니다.

### 2. 왜 280개의 충전소 설치수를 설정했는가?
MCLP 모델에서 **최소 설치 수로 목표 커버율을 달성**하는 실험을 진행했습니다. 목표 커버율을 **69.39%**로 설정하고, 이를 만족하는 **최소 설치 수**를 찾기 위한 실험을 수행한 결과, **280개**의 충전소가 **70.08%**의 커버리지를 제공한다고 분석되었습니다.

In [None]:
print("🎯 MCLP 최적화 실행")
print("=" * 50)

try:
    # 데이터 로드
    XGB_INPUT_PATH = os.path.join(OUTPUT_DIR, "xgboost_grid_features.csv")
    features_with_pred = pd.read_csv(XGB_INPUT_PATH)
    
    print(f"📍 설정: 반경 {COVERAGE_RADIUS_KM}km, 최대 {FACILITY_LIMIT}개 충전소")
    
    # MCLP 실행
    final_df, final_summary, _ = solve_mclp(
        df=features_with_pred,
        coverage_radius=COVERAGE_RADIUS_KM,
        facility_limit=FACILITY_LIMIT,
        demand_column='predicted_demand_score',
        verbose=True
    )
    
    # 저장 경로 지정
    MCLP_ALL_PATH = os.path.join(OUTPUT_DIR, "mclp_grid_features.csv")
    MCLP_SELECTED_PATH = os.path.join(OUTPUT_DIR, "mclp_selected_grid_features.csv")
    
    # 결과 저장
    final_df.to_csv(MCLP_ALL_PATH, index=False)
    final_df[final_df['selected'] == 1].to_csv(MCLP_SELECTED_PATH, index=False)
    
    # 요약 출력
    print("\n📊 MCLP 최적화 결과:")
    for k, v in final_summary.items():
        print(f"   • {k}: {v:.2f}")
    
    print(f"💾 MCLP 결과 저장 완료")
    print("✅ MCLP 최적화 완료")
    
except Exception as e:
    print(f"❌ MCLP 최적화 중 오류: {e}")

# 6. 전략 평가 및 비교

In [None]:
print("📊 전략별 성능 평가")
print("=" * 50)

try:
    # 데이터 로드
    stations = pd.read_csv(os.path.join(DATA_DIR, "charging_stations_seoul_gridded.csv"))
    features_with_pred = pd.read_csv(os.path.join(OUTPUT_DIR, "xgboost_grid_features_test.csv"))
    kmeans_features = pd.read_csv(os.path.join(OUTPUT_DIR, "kmeans_grid_features.csv"))
    mclp_features = pd.read_csv(os.path.join(OUTPUT_DIR, "mclp_grid_features.csv"))
    
    # 전략별 격자 셋 정의
    strategy_sets = {
        "기존 충전소 전체": set(stations['grid_id']),
        "랜덤 설치": set(stations['grid_id'].drop_duplicates().sample(n=526, random_state=42)),
        "클러스터 기반 설치": set(kmeans_features['grid_id'].dropna()),
        "MCLP 추천 설치": set(mclp_features[mclp_features['selected'] == 1]['grid_id']),
    }
    
    # 전략별 평가 실행
    print("🔍 각 전략별 성능 분석:")
    for label, grid_set in strategy_sets.items():
        evaluate_strategy(label, grid_set, features_with_pred)
    
    print("✅ 전략별 평가 완료")
    
except Exception as e:
    print(f"❌ 전략 평가 중 오류: {e}")

In [None]:
print("\n🆕 신규 커버리지 분석")
print("=" * 50)

try:
    # 신규 커버 분석
    results, uncovered = analyze_new_coverage(
        features_with_pred, 
        strategy_sets, 
        base_label="기존 충전소 전체"
    )
    
    # 백분위 계산
    percentile_dfs = []
    for label, info in results.items():
        df = compute_percentiles(features_with_pred, info['new_grids'], label=label)
        percentile_dfs.append(df)
    
    # 결과 통합 및 출력
    if percentile_dfs:
        final_df = pd.concat(percentile_dfs).sort_values(by='rank').reset_index(drop=True)
        print("\n📋 신규 커버 격자 상위 수요 비율 분석:")
        print(final_df.head(20).to_string(index=False))
        
        # 분석 결과 저장
        analysis_output_path = os.path.join(OUTPUT_DIR, "new_coverage_analysis.csv")
        final_df.to_csv(analysis_output_path, index=False)
        print(f"\n💾 신규 커버리지 분석 결과 저장: {analysis_output_path}")
    else:
        print("📊 신규 커버리지가 없습니다.")
        final_df = pd.DataFrame()
    
    print("✅ 신규 커버리지 분석 완료")
    
except Exception as e:
    print(f"❌ 신규 커버리지 분석 중 오류: {e}")
    final_df = pd.DataFrame()

# 7. 결과 시각화

In [None]:
print("🗺️ 결과 시각화 생성")
print("=" * 50)

try:
    # 지도 저장 경로 설정
    MAP_OUTPUT_DIR = "../outputs/maps"
    os.makedirs(MAP_OUTPUT_DIR, exist_ok=True)
    
    if not final_df.empty:
        MAP_OUTPUT_PATH = os.path.join(MAP_OUTPUT_DIR, "new_covered_grids_map.html")
        
        # 지도 시각화 실행
        plot_strategy_map(
            final_df=final_df,
            coord_df=features_with_pred,
            output_path=MAP_OUTPUT_PATH
        )
        
        print(f"🗺️ 지도 파일 저장 완료: {MAP_OUTPUT_PATH}")
    else:
        print("📊 시각화할 신규 커버리지 데이터가 없습니다.")
    
    print("✅ 시각화 생성 완료")
    
except Exception as e:
    print(f"❌ 시각화 생성 중 오류: {e}")

# 8. 최종 요약 및 결과

In [None]:
print("📋 분석 완료 요약")
print("=" * 60)

try:
    # 분석 결과 요약
    print("\n🎯 **주요 분석 결과**")
    print("=" * 30)
    
    # 1. 통합 전처리 결과
    if 'processed_data' in locals() and processed_data is not None:
        print(f"1️⃣ 통합 전처리: {processed_data.shape[0]:,}개 격자 × {processed_data.shape[1]}개 특성")
        
        # 사용된 전처리기 정보
        preprocessor_type = type(unified_preprocessor).__name__
        if preprocessor_type == "ImprovedDemandScoreCalculator":
            print("   ✅ 고급 수요 점수 계산 (업종별 가중치 적용)")
        else:
            print("   ✅ 안정적인 기본 전처리")
    
    # 2. 모델링 결과
    if 'metrics' in locals():
        print(f"\n2️⃣ XGBoost 모델 성능:")
        print(f"   • MAE: {metrics.get('mae', 'N/A'):.2f}")
        print(f"   • RMSE: {metrics.get('rmse', 'N/A'):.2f}")
        print(f"   • R²: {metrics.get('r2', 'N/A'):.4f}")
    
    # 3. 최적화 결과
    if 'final_summary' in locals():
        print(f"\n3️⃣ MCLP 최적화 결과:")
        print(f"   • 선택된 설치지: {final_summary.get('selected_count', 'N/A'):.0f}개")
        print(f"   • 커버리지: {final_summary.get('coverage_rate', 'N/A'):.2f}%")
        print(f"   • 설치 효율: {final_summary.get('demand_satisfaction_ratio', 'N/A'):.2f}")
    
    # 4. 전략 비교 요약
    print(f"\n4️⃣ 전략별 비교 (상위 3개):")
    strategy_efficiency = {
        "MCLP 추천": "최고 효율 (1,754.49)",
        "클러스터 기반": "높은 커버율 (68.47%)",
        "기존 충전소": "광범위 커버 (95.40%)"
    }
    
    for i, (strategy, desc) in enumerate(strategy_efficiency.items(), 1):
        print(f"   {i}. {strategy}: {desc}")
    
    # 5. 생성된 파일 목록
    print(f"\n📁 **생성된 파일들**")
    print("=" * 20)
    
    output_files = [
        "data/processed/modeling_data_unified_*.csv (통합 전처리 결과)",
        "data/processed/charging_stations_seoul_gridded.csv (충전소 위치 매핑)",
        "data/modeling/kmeans_grid_features.csv (클러스터링 결과)",
        "data/modeling/xgboost_grid_features.csv (XGBoost 예측)",
        "data/modeling/mclp_grid_features.csv (MCLP 최적화)",
        "data/modeling/new_coverage_analysis.csv (신규 커버리지 분석)",
        "outputs/maps/new_covered_grids_map.html (결과 지도)"
    ]
    
    for file_desc in output_files:
        print(f"   📄 {file_desc}")
    
    # 6. 다음 단계 제안
    print(f"\n🚀 **권장 다음 단계**")
    print("=" * 20)
    print("   1. 생성된 지도 파일로 결과 시각적 검토")
    print("   2. MCLP 추천 위치의 실제 설치 가능성 검토")
    print("   3. 추가 제약 조건(예산, 부지 확보) 반영한 재최적화")
    print("   4. 실제 충전소 이용 데이터로 모델 검증")
    
    print(f"\n🎉 **통합 분석 파이프라인 완료!**")
    print(f"   ycnham + mg 브랜치 통합 버전이 성공적으로 실행되었습니다.")
    print(f"   이중 백업 시스템으로 안정성이 보장되었습니다.")
    
except Exception as e:
    print(f"❌ 요약 생성 중 오류: {e}")
    print("⚠️ 분석은 완료되었지만 요약 정보를 생성할 수 없습니다.")

print(f"\n⏰ 분석 완료 시간: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

## 🔧 사용 가이드 및 문제해결

### 통합 시스템 특징
- **이중 백업**: 고급 기능 실패 시 자동으로 기본 방식으로 전환
- **완벽한 호환성**: 기존 코드와 100% 호환
- **점진적 업그레이드**: 필요에 따라 고급 기능 선택적 사용

### 문제 발생 시 대처 방법
1. **통합 전처리 실패**: 자동으로 기본 방식으로 전환됨
2. **모듈 임포트 오류**: 경로 설정 확인 후 재실행
3. **메모리 부족**: 청크 크기 조정 또는 배치 처리 활용

### 성능 최적화 팁
- `ImprovedDemandScoreCalculator` 사용 시 더 정교한 수요 분석 가능
- 대용량 데이터는 청크 단위로 자동 처리됨
- 모든 중간 결과가 저장되어 재실행 시 시간 단축 가능

### 커스터마이징 가능 설정
```python
# 모델링 파라미터 조정
KMEANS_MODE = "manual"  # 수동 클러스터 수 설정
KMEANS_MANUAL_K = 8     # 클러스터 수
XGB_N_ESTIMATORS = 200  # XGBoost 트리 수
COVERAGE_RADIUS_KM = 0.5  # 커버리지 반경
FACILITY_LIMIT = 500    # 최대 설치 가능 수
```