# 🚀 KLOOK 통합 크롤러 시스템

## 📋 지원하는 모든 시나리오:
1. **기본 크롤링**: 도시 선택 → 탭별 순차 크롤링 (전체→투어→티켓→교통→기타)
2. **랭킹 기반 수집**: 각 탭별 사용자 설정 순위까지 수집, 중복 자동 건너뛰기
3. **세션 연속성**: 중간 중단 후 이어서 계속 가능
4. **hashlib 고속 중복 체크**: 이미 크롤링한 URL 초고속 검사
5. **페이지네이션**: KLOOK 15개/페이지 구조 완벽 대응
6. **CSV 자동 저장**: 10개마다 자동 저장
7. **🆕 사용자 설정 가능한 수집 제한**: 1개~500개까지 원하는 개수만큼 수집
8. **🎪 개별 탭 선택**: 전체/투어/티켓/교통/기타 탭을 True/False로 개별 선택

---

## 🎛️ 1. 크롤링 설정 (먼저 설정하세요!)

In [None]:
# 🚀 KLOOK 크롤러 설정 (페이지네이션 순위 시스템)
print("🚀 KLOOK 크롤러 설정 - 페이지네이션 순위 시스템")
print("=" * 50)

# 🎯 크롤링 설정 (직접 수정하세요!)
CURRENT_CITY = "구마모토"           #🔥🔥도시 입력 🔥🔥#

# 🆕 페이지네이션 설정 (새로운 방식)
PAGINATION_MODE = True         # 페이지네이션 모드 활성화
TARGET_PRODUCTS = 15          # 수집할 상품 수 (1위부터 순차적으로)
MAX_PAGES = 5                 # 최대 페이지 수
RANKING_CONTINUITY = True     # 페이지 간 순위 연속성 유지

# 기존 순위 기반 설정 (호환성용 - PAGINATION_MODE=False일 때만 사용)
START_RANK = 1
END_RANK = 15
COLLECT_COUNT = 15

# 📊 데이터 분리 저장 설정
SEPARATE_RANKING_DATA = True   # 랭킹 정보 별도 저장
MAINTAIN_CSV_CONTINUITY = True # CSV 번호 연속성 유지
MAINTAIN_IMAGE_CONTINUITY = True # 이미지 번호 연속성 유지

# 🎪 탭 설정 (페이지네이션은 전체 탭만 지원)
TAB_전체 = True               # 전체 탭 (페이지네이션 전용)
TAB_투어액티비티 = False      # 투어&액티비티 탭 (비활성화)
TAB_티켓입장권 = False         # 티켓&입장권 탭 (비활성화)
TAB_교통 = False             # 교통 탭 (비활성화)
TAB_기타 = False             # 기타 탭 (비활성화)

# 🎮 크롤링 모드 선택
MODE_PAGINATION = True        # 🆕 페이지네이션 순위 모드 (추천)
MODE_CLASSIC = False          # 기존 방식
MODE_RESUME = False           # 이어서 계속

# 고급 옵션
AUTO_SAVE = True              # 10개마다 자동 저장
DOWNLOAD_IMAGES = True        # 이미지 다운로드 활성화
SAVE_SESSION = True           # 세션 상태 저장
VALIDATION_MODE = True        # 크롤링 후 검증 실행

# 모드 처리
if MODE_PAGINATION:
    CRAWLING_MODE = "pagination"
    mode_desc = f"📄 페이지네이션 순위 모드 ({TARGET_PRODUCTS}개 상품, {MAX_PAGES}페이지)"
    SELECTED_TABS = ["전체"]
elif MODE_CLASSIC:
    CRAWLING_MODE = "classic"
    mode_desc = f"🎯 기존 순위 모드 ({START_RANK}-{END_RANK}위)"
    SELECTED_TABS = ["전체"] if TAB_전체 else []
elif MODE_RESUME:
    CRAWLING_MODE = "resume"
    mode_desc = "🔄 이어서 계속"
else:
    CRAWLING_MODE = "pagination"  # 기본값
    mode_desc = f"📄 페이지네이션 순위 모드 (기본값)"
    SELECTED_TABS = ["전체"]

print("✅ 설정 완료!")
print(f"   🌍 도시: {CURRENT_CITY}")
if MODE_PAGINATION:
    print(f"   📄 페이지네이션: {TARGET_PRODUCTS}개 상품 (1위부터 순차)")
    print(f"   📖 최대 페이지: {MAX_PAGES}페이지")
    print(f"   🔄 순위 연속성: {'✅ 보장' if RANKING_CONTINUITY else '❌ 비보장'}")
    print(f"   📊 데이터 분리: {'✅ 랭킹별도저장' if SEPARATE_RANKING_DATA else '❌ 통합저장'}")
else:
    print(f"   📊 순위 기반: {START_RANK}위 ~ {END_RANK}위")
print(f"   {mode_desc}")
print(f"   💾 자동저장: {AUTO_SAVE}")
print(f"   📸 이미지: {DOWNLOAD_IMAGES}")
print(f"   🔍 검증모드: {VALIDATION_MODE}")

# 설정을 딕셔너리로 정리
CRAWLING_SETTINGS = {
    'city': CURRENT_CITY,
    'mode': CRAWLING_MODE,
    'pagination_mode': PAGINATION_MODE,
    'target_products': TARGET_PRODUCTS if PAGINATION_MODE else END_RANK - START_RANK + 1,
    'max_pages': MAX_PAGES,
    'ranking_continuity': RANKING_CONTINUITY,
    'separate_ranking_data': SEPARATE_RANKING_DATA,
    'maintain_continuity': {
        'csv': MAINTAIN_CSV_CONTINUITY,
        'image': MAINTAIN_IMAGE_CONTINUITY
    },
    'start_rank': START_RANK,
    'end_rank': END_RANK,
    'selected_tabs': SELECTED_TABS,
    'skip_duplicates': True,
    'auto_save': AUTO_SAVE,
    'download_images': DOWNLOAD_IMAGES,
    'save_session': SAVE_SESSION,
    'validation_mode': VALIDATION_MODE
}

# 예상 작업량 계산
if MODE_PAGINATION:
    total_text = f"{TARGET_PRODUCTS}개 상품 (페이지네이션)"
    print(f"   📊 예상 작업량: {total_text}")
    print(f"   🏆 순위 보장: 1위 ~ {TARGET_PRODUCTS}위 정확한 순서")
else:
    expected = END_RANK - START_RANK + 1
    total_text = f"{expected}개 상품 (기존방식)"
    print(f"   📊 예상 작업량: {total_text}")

print("\n📋 페이지네이션 순위 시스템 특징:")
print("🔹 페이지를 넘어가면서 순위 연속성 유지 (1위→2위→3위→...)")
print("🔹 랭킹 정보와 크롤링 데이터 분리 저장")
print("🔹 CSV 순서와 실제 순위는 독립적 (데이터 가공 시 매핑)")
print("🔹 이미지, CSV, 랭킹 번호의 연속성 자동 보장")
print("🔹 추후 데이터 가공 시 랭킹 정보 활용 가능")

print("\n⏭️ 다음 셀들이 자동으로 실행됩니다!")

CRAWLING_READY = True

# 설정 확인 함수
def get_current_settings():
    return CRAWLING_SETTINGS

## 🔧 2. 시스템 초기화 및 설정

In [None]:
# 필수 라이브러리 import 및 시스템 체크 (페이지네이션 시스템 포함)
import os
import sys
import time
from datetime import datetime

# 모듈 import
try:
    from klook_modules.control_system import KlookMasterController
    from klook_modules.system_utils import setup_driver, check_dependencies, get_system_info
    from klook_modules.config import UNIFIED_CITY_INFO, CONFIG
    from klook_modules.url_manager import is_url_already_processed, mark_url_as_processed
    from klook_modules.tab_selector import execute_integrated_tab_selector_system
    from klook_modules.url_collection import collect_urls_with_pagination
    from klook_modules.crawler_engine import KlookCrawlerEngine
    from klook_modules.ranking_manager import ranking_manager
    
    # 🆕 페이지네이션 시스템 모듈
    from klook_modules.pagination_ranking_system import (
        pagination_ranking_system, ranking_data_matcher, continuity_manager
    )
    from klook_modules.integrated_pagination_crawler import (
        IntegratedPaginationCrawler, pagination_crawler_validator
    )
    
    print("✅ 모든 모듈 로드 성공!")
    print("   🆕 페이지네이션 시스템: ✅ 로드됨")
except ImportError as e:
    print(f"❌ 모듈 로드 실패: {e}")
    print("klook_modules 폴더가 현재 디렉토리에 있는지 확인하세요.")

# 시스템 상태 체크
print("\n🔍 시스템 상태 체크...")
dependencies = check_dependencies()
missing_deps = [lib for lib, available in dependencies.items() if not available]

if missing_deps:
    print(f"❌ 누락된 라이브러리: {', '.join(missing_deps)}")
    print("다음 명령으로 설치하세요: pip install selenium chromedriver-autoinstaller pandas requests beautifulsoup4")
else:
    print("✅ 모든 의존성 준비 완료!")

print(f"\n🌍 지원 도시: {len(UNIFIED_CITY_INFO)}개")
print(f"📊 설정 상태: hashlib={CONFIG.get('USE_HASH_SYSTEM', True)}, V2_URL={CONFIG.get('USE_V2_URL_SYSTEM', True)}")
print(f"🏆 랭킹 매니저: {'✅ 로드됨' if 'ranking_manager' in locals() else '❌ 로드 실패'}")
print(f"📄 페이지네이션 시스템: {'✅ 로드됨' if 'pagination_ranking_system' in locals() else '❌ 로드 실패'}")
print(f"💾 32개 컬럼 구조: ✅ 적용됨")
print(f"📸 듀얼 이미지 시스템: ✅ 적용됨")

# 페이지네이션 시스템 특징 안내
print(f"\n📄 페이지네이션 순위 시스템 특징:")
print(f"   🔹 페이지 간 순위 연속성 자동 보장 (1위→2위→3위→...)")
print(f"   🔹 '>' 버튼으로 다음 페이지 자동 이동")
print(f"   🔹 랭킹 정보 별도 저장 (추후 데이터 가공용)")
print(f"   🔹 CSV, 이미지, 랭킹 번호의 연속성 유지")
print(f"   🔹 크롤링 후 자동 검증 시스템")

print("\n✅ 시스템 초기화 완료!")
print("🔽 다음 셀에서 페이지네이션 크롤링을 시작합니다.")

## 🚀 3. 설정 적용 및 크롤링 시작

In [None]:
# 설정 적용 및 드라이버 준비
print("📊 크롤링 설정 적용 중...")

# 1번 셀에서 설정한 값 가져오기
try:
    settings = get_current_settings()
    
    print("✅ 설정 확인:")
    print(f"   🌍 도시: {settings['city']}")
    print(f"   📊 순위: {settings['start_rank']}위 ~ {settings['end_rank']}위")
    print(f"   📊 최대 수집 제한: {settings['max_collect_limit']}개")
    print(f"   🎮 모드: {settings['mode']}")
    if settings['mode'] == 'tab_select':
        print(f"   🎪 선택된 탭: {', '.join(settings['selected_tabs'])}")
    
    # 드라이버 설정
    print("\n🔧 크롬 드라이버 설정 중...")
    driver = setup_driver()
    
    # 글로벌 변수 설정 (다른 셀에서 사용)
    CURRENT_CITY = settings['city']
    START_RANK = settings['start_rank']
    END_RANK = settings['end_rank']
    MAX_COLLECT_LIMIT = settings['max_collect_limit']
    CRAWLING_MODE = settings['mode']
    SELECTED_TABS = settings['selected_tabs']
    
    print(f"🎯 '{CURRENT_CITY}' 크롤링 준비 완료!")
    print(f"📊 순위 범위: {START_RANK}위 ~ {END_RANK}위")
    print(f"📊 최대 수집 제한: {MAX_COLLECT_LIMIT}개")
    if CRAWLING_MODE == 'tab_select':
        print(f"🎪 탭 선택 모드: {len(SELECTED_TABS)}개 탭 ({', '.join(SELECTED_TABS)})")
    print(f"🏆 랭킹 매니저: 중복 URL 자동 처리")
    print(f"💾 32개 컬럼 구조: 자동 적용")
    print(f"📸 듀얼 이미지: 메인+썸네일 자동 다운로드")
    print("✅ 다음 셀에서 URL 수집을 시작합니다!")
    
    # 크롤링 준비 완료 플래그
    DRIVER_READY = True
    
except RuntimeError as e:
    print(f"❌ {e}")
    print("💡 1번 셀에서 '🚀 크롤링 시작' 버튼을 먼저 눌러주세요.")
    DRIVER_READY = False
except Exception as e:
    print(f"❌ 예상치 못한 오류: {e}")
    DRIVER_READY = False

## 📋 4. 탭별 랭킹 수집 (URL 수집)

In [None]:
# 🆕 페이지네이션 순위 기반 크롤링 실행
print(f"📄 '{CURRENT_CITY}' 페이지네이션 순위 크롤링 시작!")
print("=" * 70)

# 드라이버 준비 상태 확인
try:
    if not DRIVER_READY:
        print("❌ 드라이버가 준비되지 않았습니다.")
        print("💡 이전 셀들을 순서대로 실행해주세요.")
    else:
        settings = get_current_settings()
        
        if settings['pagination_mode']:
            # 🆕 페이지네이션 모드
            print(f"📄 페이지네이션 순위 모드 실행")
            print(f"🎯 목표: {settings['target_products']}개 상품 (1위부터 순차)")
            print(f"📖 최대 페이지: {settings['max_pages']}페이지")
            
            # 1. KLOOK 메인 페이지 이동
            from klook_modules.driver_manager import go_to_main_page, find_and_fill_search, click_search_button
            
            print("\n🌐 KLOOK 메인 페이지 이동...")
            go_to_main_page(driver)
            
            print(f"🔍 '{CURRENT_CITY}' 검색 중...")
            find_and_fill_search(driver, CURRENT_CITY)
            click_search_button(driver)
            
            time.sleep(5)  # 검색 결과 로딩 충분히 대기
            
            # 2. 페이지네이션 크롤러 초기화
            pagination_crawler = IntegratedPaginationCrawler(driver)
            
            # 3. 페이지네이션 크롤링 실행
            print(f"\n📄 페이지네이션 크롤링 시작...")
            success = pagination_crawler.execute_pagination_crawling(
                city_name=CURRENT_CITY,
                target_count=settings['target_products'],
                max_pages=settings['max_pages']
            )
            
            if success:
                print(f"\n✅ 페이지네이션 크롤링 성공!")
                
                # 4. 검증 실행 (설정에 따라)
                if settings.get('validation_mode', False):
                    print(f"\n🔍 크롤링 결과 검증 중...")
                    
                    # 순위 연속성 검증
                    ranking_ok = pagination_crawler_validator.validate_ranking_continuity(CURRENT_CITY)
                    
                    # 데이터 일관성 검증
                    data_ok = pagination_crawler_validator.validate_data_consistency(CURRENT_CITY)
                    
                    # 종합 리포트 생성
                    report_file = pagination_crawler_validator.generate_pagination_report(CURRENT_CITY)
                    
                    print(f"\n📊 검증 결과:")
                    print(f"   🏆 순위 연속성: {'✅ 완벽' if ranking_ok else '⚠️ 문제 발견'}")
                    print(f"   📋 데이터 일관성: {'✅ 완벽' if data_ok else '⚠️ 문제 발견'}")
                    print(f"   📄 리포트: {report_file}")
                
                CRAWLING_SUCCESS = True
                
            else:
                print(f"\n❌ 페이지네이션 크롤링 실패")
                CRAWLING_SUCCESS = False
        
        else:
            # 기존 방식 (호환성용)
            print(f"🎯 기존 순위 모드 실행")
            print(f"📊 설정된 범위: {settings['start_rank']}위 ~ {settings['end_rank']}위")
            
            # 기존 코드 실행...
            # (여기에 기존의 탭 선택 및 URL 수집 로직)
            print("⚠️ 기존 방식은 별도 구현 필요")
            CRAWLING_SUCCESS = False

except NameError:
    print("❌ 필요한 변수가 설정되지 않았습니다.")
    print("💡 이전 셀들을 순서대로 실행해주세요.")
    CRAWLING_SUCCESS = False
except Exception as e:
    print(f"❌ 페이지네이션 크롤링 중 오류: {e}")
    import traceback
    traceback.print_exc()
    CRAWLING_SUCCESS = False

# 크롤링 결과 요약
if 'CRAWLING_SUCCESS' in locals() and CRAWLING_SUCCESS:
    print(f"\n🎉 '{CURRENT_CITY}' 크롤링 완료!")
    print("=" * 50)
    print("📊 페이지네이션 순위 시스템 성과:")
    print("   ✅ 순위 연속성 보장 (1위부터 순차적)")
    print("   ✅ 페이지 간 이동 자동화")
    print("   ✅ 랭킹 정보 별도 저장")
    print("   ✅ CSV, 이미지, 랭킹 번호 연속성 유지")
    print("   ✅ 자동 검증 및 리포트 생성")
    
    # 동적으로 파일 경로 생성
    from klook_modules.config import get_city_info
    continent, country = get_city_info(CURRENT_CITY)
    
    print(f"\n📁 생성된 파일:")
    print(f"   📊 CSV 데이터: data/{continent}/{country}/")
    print(f"   🏆 랭킹 정보: ranking_data/")
    print(f"   📄 페이지네이션 로그: url_collected/")
    print(f"   🔍 검증 리포트: reports/")
    
else:
    print(f"\n❌ 크롤링 실패 또는 미실행")
    print("💡 설정을 확인하고 다시 실행해주세요.")

In [None]:
# 🧪 페이지네이션 시스템 테스트 실행
print("🧪 페이지네이션 크롤링 시스템 테스트")
print("=" * 60)

# 테스트용 설정 - 첫 번째 셀의 CURRENT_CITY 사용
TEST_CITY = CURRENT_CITY  # 첫 번째 셀의 설정 사용
TEST_TARGET_PRODUCTS = 5  # 테스트용으로 5개만 수집
TEST_MAX_PAGES = 2

print(f"🎯 테스트 설정:")
print(f"   🌍 도시: {TEST_CITY}")
print(f"   📊 목표 상품: {TEST_TARGET_PRODUCTS}개")
print(f"   📄 최대 페이지: {TEST_MAX_PAGES}페이지")
print(f"   🏆 순위: 1위부터 {TEST_TARGET_PRODUCTS}위까지")

try:
    # 드라이버 설정
    if 'driver' not in locals() or driver is None:
        print("\n🔧 드라이버 설정 중...")
        driver = setup_driver()
    
    # KLOOK 메인 페이지 이동
    from klook_modules.driver_manager import go_to_main_page, find_and_fill_search, click_search_button
    
    print(f"\n🌐 KLOOK 메인 페이지 이동...")
    go_to_main_page(driver)
    time.sleep(3)
    
    print(f"🔍 '{TEST_CITY}' 검색 중...")
    find_and_fill_search(driver, TEST_CITY)
    click_search_button(driver)
    time.sleep(5)  # 검색 결과 로딩 대기
    
    # 페이지네이션 크롤러 초기화
    print(f"\n🚀 페이지네이션 크롤러 초기화...")
    pagination_crawler = IntegratedPaginationCrawler(driver)
    
    # 테스트 실행
    print(f"\n📄 페이지네이션 테스트 시작!")
    print(f"   🎯 {TEST_TARGET_PRODUCTS}개 상품 수집")
    print(f"   📖 최대 {TEST_MAX_PAGES}페이지 처리")
    print(f"   🏆 순위 연속성 보장")
    
    test_success = pagination_crawler.execute_pagination_crawling(
        city_name=TEST_CITY,
        target_count=TEST_TARGET_PRODUCTS,
        max_pages=TEST_MAX_PAGES
    )
    
    if test_success:
        print(f"\n✅ 페이지네이션 테스트 성공!")
        
        # 테스트 결과 검증
        print(f"\n🔍 테스트 결과 검증 중...")
        
        # 순위 연속성 검증
        ranking_ok = pagination_crawler_validator.validate_ranking_continuity(TEST_CITY)
        
        # 데이터 일관성 검증
        data_ok = pagination_crawler_validator.validate_data_consistency(TEST_CITY)
        
        # 종합 리포트 생성
        report_file = pagination_crawler_validator.generate_pagination_report(TEST_CITY)
        
        print(f"\n📊 테스트 검증 결과:")
        print(f"   🏆 순위 연속성: {'✅ 완벽' if ranking_ok else '⚠️ 문제 발견'}")
        print(f"   📋 데이터 일관성: {'✅ 완벽' if data_ok else '⚠️ 문제 발견'}")
        if report_file:
            print(f"   📄 검증 리포트: {report_file}")
        
        # 생성된 파일 확인
        print(f"\n📁 생성된 파일 확인:")
        
        # 동적으로 city_code 가져오기
        from klook_modules.config import get_city_code
        city_code = get_city_code(TEST_CITY)
        
        # 랭킹 데이터 파일
        ranking_files = [f for f in os.listdir("ranking_data") if f.startswith(f"{city_code}_") and "pagination" in f]
        if ranking_files:
            print(f"   🏆 랭킹 데이터: {len(ranking_files)}개 파일")
        
        # URL 수집 로그
        url_log_files = [f for f in os.listdir("url_collected") if f.startswith(f"{city_code}_")]
        if url_log_files:
            print(f"   📝 URL 로그: {len(url_log_files)}개 파일")
        
        # CSV 데이터 확인 - 동적으로 경로 구성
        from klook_modules.config import get_city_info
        continent, country = get_city_info(TEST_CITY)
        csv_path = f"data/{continent}/{country}/{TEST_CITY}_klook_products_all.csv"
        if os.path.exists(csv_path):
            with open(csv_path, 'r', encoding='utf-8-sig') as f:
                lines = f.readlines()
                data_rows = len(lines) - 1  # 헤더 제외
            print(f"   📋 CSV 데이터: {data_rows}개 상품")
        
        print(f"\n🎉 페이지네이션 시스템 테스트 완료!")
        print(f"   ✅ URL 수집: 정상 동작")
        print(f"   ✅ 순위 연속성: 보장됨")
        print(f"   ✅ 데이터 저장: 성공")
        print(f"   ✅ 검증 시스템: 정상 동작")
        
        # 다음 단계 안내
        print(f"\n⏭️ 다음 단계:")
        print(f"   1. 설정을 큰 값으로 변경 (예: TARGET_PRODUCTS = 15)")
        print(f"   2. 위의 설정 셀에서 PAGINATION_MODE = True로 설정")
        print(f"   3. 전체 크롤링 셀 실행하여 실제 크롤링 진행")
        
    else:
        print(f"\n❌ 페이지네이션 테스트 실패")
        print(f"   💡 로그를 확인하고 문제를 해결하세요")

except Exception as e:
    print(f"\n💥 테스트 중 오류: {e}")
    import traceback
    traceback.print_exc()
    print(f"\n💡 문제 해결 방안:")
    print(f"   1. 이전 셀들이 모두 실행되었는지 확인")
    print(f"   2. 모듈 로딩이 정상인지 확인")
    print(f"   3. 인터넷 연결 상태 확인")

## 🔥 5. 상세 크롤링 실행 (2단계: 데이터 수집)

In [1]:
# 상세 크롤링 시작
print(f"🔥 '{CURRENT_CITY}' 상세 크롤링 시작!")
print("=" * 70)

# 크롤링 엔진 초기화 (driver를 전달하고 통계 초기화)
crawler = KlookCrawlerEngine(driver)
crawler.reset_stats(CURRENT_CITY)

# 전체 진행 상황 추적
total_planned = sum(len(urls) for urls in collected_urls_by_tab.values())
total_completed = 0
total_duplicated = 0
total_failed = 0

# 배치 저장을 위한 데이터 수집
batch_data = []
batch_size = 10 if settings['auto_save'] else 50

start_time = time.time()

print(f"💾 32개 컬럼 구조: 자동 적용")
print(f"📸 듀얼 이미지 시스템: {'✅ 활성화' if settings.get('download_images', True) else '❌ 비활성화'}")
print(f"🏆 랭킹 매니저: 중복 URL 스마트 처리")
print(f"💾 세션 저장: {'✅ 활성화' if settings.get('save_session', True) else '❌ 비활성화'}")
print(f"💾 자동 백업: ✅ 20개마다 + 최종 백업")
print(f"🎯 순위 매퍼: 실제 순위와 URL 배열 인덱스 매핑")

try:
    # 탭별 순차 크롤링
    for tab_name, urls in collected_urls_by_tab.items():
        if not urls:
            continue
            
        print(f"\n🎪 '{tab_name}' 탭 크롤링 시작 ({len(urls)}개 URL)")
        print("-" * 50)
        
        tab_completed = 0
        tab_duplicated = 0
        tab_failed = 0
        
        # 🎯 실제 순위 매핑 시스템 사용
        from klook_modules.rank_mapper import rank_mapper
        
        # 실제 순위 범위에 해당하는 URL들만 매핑
        rank_mappings = rank_mapper.map_range_to_actual_ranks(urls, CURRENT_CITY, tab_name, START_RANK, END_RANK)
        
        print(f"📊 실제 순위 매핑: {len(rank_mappings)}개 URL")
        
        # URL별 순차 크롤링 (실제 순위 기준)
        for mapping in rank_mappings:
            url = mapping['url']
            actual_rank = mapping['actual_rank']
            current_progress = total_completed + tab_completed + 1
            
            print(f"\n📊 진행률: {current_progress}/{total_planned} | {tab_name} {actual_rank}위 (실제순위)")
            print(f"🔗 URL: {url[:60]}...")
            
            # 랭킹 매니저 중복 체크
            try:
                if not ranking_manager.should_crawl_url(url, CURRENT_CITY):
                    print(f"    🏆 랭킹 매니저: 중복 제외 (다른 탭에서 이미 크롤링됨)")
                    tab_duplicated += 1
                    continue
            except Exception as e:
                print(f"    ⚠️ 랭킹 매니저 확인 실패: {e}")
            
            # 기존 중복 체크 (hashlib 고속 검사)
            if is_url_already_processed(url, CURRENT_CITY):
                print(f"    🔄 이미 처리됨 - 중복 제외")
                tab_duplicated += 1
                continue
            
            # 상세 크롤링 실행 (32개 컬럼 + 듀얼 이미지)
            try:
                result = crawler.process_single_url(url, CURRENT_CITY, current_progress)
                
                if result.get('success') and not result.get('skipped'):
                    product_data = result.get('product_data', {})
                    product_name = product_data.get('상품명', 'N/A')[:30]
                    print(f"    ✅ 성공: {product_name}...")
                    
                    # 탭 및 랭킹 정보 추가 (실제 순위 사용)
                    product_data['탭명'] = tab_name
                    product_data['탭내_랭킹'] = actual_rank
                    
                    # 32개 컬럼 구조 확인
                    column_count = len(product_data.keys())
                    print(f"    📊 데이터 컬럼: {column_count}개")
                    
                    # 듀얼 이미지 확인
                    main_img = product_data.get('메인이미지_파일명', '정보 없음')
                    thumb_img = product_data.get('썸네일이미지_파일명', '정보 없음')
                    if main_img != '정보 없음' and thumb_img != '정보 없음':
                        print(f"    📸 듀얼 이미지: 메인 + 썸네일")
                    elif main_img != '정보 없음':
                        print(f"    📸 단일 이미지: 메인만")
                    else:
                        print(f"    📸 이미지: 없음")
                    
                    # 랭킹 매니저에 크롤링 완료 표시
                    try:
                        ranking_manager.mark_url_crawled(url, CURRENT_CITY)
                        print(f"    🏆 랭킹 매니저: 크롤링 완료 표시")
                    except Exception as e:
                        print(f"    ⚠️ 랭킹 완료 표시 실패: {e}")
                    
                    # 세션 상태 저장 (설정에 따라)
                    if settings.get('save_session', True):
                        try:
                            from klook_modules.system_utils import save_crawler_state
                            session_data = {
                                'city': CURRENT_CITY,
                                'start_rank': START_RANK,
                                'end_rank': END_RANK,
                                'current_tab': tab_name,
                                'current_rank': actual_rank,
                                'total_completed': total_completed + tab_completed + 1,
                                'settings': settings,
                                'timestamp': datetime.now().isoformat()
                            }
                            save_crawler_state(session_data, url)
                            print(f"    💾 세션 상태 저장 완료")
                        except Exception as e:
                            print(f"    ⚠️ 세션 저장 실패: {e}")
                    
                    tab_completed += 1
                    
                elif result.get('skipped'):
                    print(f"    🔄 중복 제외: {result.get('reason', 'unknown')}")
                    tab_duplicated += 1
                    
                else:
                    print(f"    ❌ 실패: {result.get('error', '알 수 없음')}")
                    tab_failed += 1
                    
            except Exception as e:
                print(f"    💥 예외 발생: {e}")
                tab_failed += 1
            
            # 진행 상황 표시
            elapsed = time.time() - start_time
            avg_time = elapsed / max(total_completed + tab_completed, 1)
            remaining = (total_planned - current_progress) * avg_time
            
            print(f"    ⏱️ 경과: {int(elapsed//60)}분 | 예상 남은 시간: {int(remaining//60)}분")
            
            # 자연스러운 대기
            time.sleep(2)
        
        # 탭 완료 정리
        total_completed += tab_completed
        total_duplicated += tab_duplicated
        total_failed += tab_failed
        
        print(f"\n✅ '{tab_name}' 탭 완료!")
        print(f"   성공: {tab_completed}개 | 중복 제외: {tab_duplicated}개 | 실패: {tab_failed}개")

except KeyboardInterrupt:
    print("\n⏹️ 사용자에 의해 중단되었습니다.")
    # 중단 시에도 세션 저장
    if settings.get('save_session', True):
        try:
            from klook_modules.system_utils import save_crawler_state
            interrupt_session_data = {
                'city': CURRENT_CITY,
                'start_rank': START_RANK,
                'end_rank': END_RANK,
                'total_completed': total_completed,
                'settings': settings,
                'interrupted': True,
                'timestamp': datetime.now().isoformat()
            }
            save_crawler_state(interrupt_session_data, "INTERRUPTED")
            print("💾 중단 상태 저장 완료 - Resume 기능으로 이어서 계속할 수 있습니다.")
        except Exception as e:
            print(f"⚠️ 중단 상태 저장 실패: {e}")
            
    # 중단 시에도 최종 백업 실행 (기존 자동 시스템 사용)
    try:
        print(f"💾 중단 시 백업 실행...")
        crawler.final_backup(CURRENT_CITY)
    except Exception as e:
        print(f"⚠️ 중단 시 백업 실패: {e}")
        
except Exception as e:
    print(f"\n💥 크롤링 중 오류: {e}")
    import traceback
    traceback.print_exc()

# 최종 백업 실행 (기존 자동 시스템만 사용)
try:
    print(f"\n💾 최종 백업 실행 중...")
    print(f"📊 크롤러 통계 확인: success_count={crawler.stats['success_count']}")
    crawler.final_backup(CURRENT_CITY)
except Exception as e:
    print(f"⚠️ 최종 백업 실패: {e}")
    import traceback
    traceback.print_exc()

# 최종 결과
end_time = time.time()
total_time = end_time - start_time

print("\n🎉 크롤링 완료!")
print("=" * 70)
print(f"📊 최종 결과:")
print(f"   ✅ 성공: {total_completed}개")
print(f"   🔄 중복 제외: {total_duplicated}개")
print(f"   ❌ 실패: {total_failed}개")
print(f"   📊 총계: {total_completed + total_duplicated + total_failed}개")
print(f"   ⏱️ 소요 시간: {int(total_time//60)}분 {int(total_time%60)}초")

# 성공률 계산
if total_completed + total_failed > 0:
    success_rate = (total_completed / (total_completed + total_failed)) * 100
    print(f"   📈 성공률: {success_rate:.1f}%")

# 32개 컬럼 구조 및 듀얼 이미지 확인
print(f"\n💾 32개 컬럼 구조: {'✅ 적용됨' if total_completed > 0 else '⚠️ 확인 필요'}")
print(f"📸 듀얼 이미지 시스템: {'✅ 적용됨' if settings.get('download_images', True) else '❌ 비활성화'}")

# 랭킹 매니저 최종 통계
try:
    ranking_stats = ranking_manager.get_city_ranking_stats(CURRENT_CITY)
    if ranking_stats:
        print(f"🏆 랭킹 매니저 최종 통계:")
        print(f"   총 URL: {ranking_stats.get('total_urls', 0)}개")
        print(f"   중복 제외: {ranking_stats.get('duplicate_urls', 0)}개")
        print(f"   처리된 탭: {len(ranking_stats.get('tabs_processed', []))}개")
except Exception as e:
    print(f"⚠️ 랭킹 통계 조회 실패: {e}")

print(f"\n📁 데이터 저장 위치:")
print(f"   - CSV: data/{CURRENT_CITY}/")
print(f"   - 이미지: klook_thumb_img/")
print(f"   - 랭킹 데이터: ranking_data/")
print(f"   - 세션 상태: crawler_state/")
print(f"   - 백업 파일: data/{CURRENT_CITY}/*_backup_*.csv")
print(f"   - 국가별 통합 CSV: 자동 생성됨")

NameError: name 'CURRENT_CITY' is not defined

## 🗺️ 6. Sitemap URL 추가 수집 (선택사항)

In [None]:
# Sitemap에서 추가 URL 수집 (자동 실행)
print("🗺️ Sitemap에서 추가 URL 수집 (자동 건너뛰기)")
print("=" * 50)

# Run All 호환을 위해 자동으로 건너뛰기
print("⏭️ Run All 모드: Sitemap 수집을 자동으로 건너뜁니다.")
print("💡 필요시 이 셀을 개별 실행하여 Sitemap 수집을 활성화할 수 있습니다.")

# 수동 실행 모드 (개별 셀 실행시에만 동작)
if False:  # 기본적으로 비활성화
    from klook_modules.url_collection import collect_urls_from_sitemap
    
    print(f"\n🗺️ '{CURRENT_CITY}' Sitemap URL 수집 중...")
    
    # Sitemap URL 수집
    sitemap_urls = collect_urls_from_sitemap(CURRENT_CITY, limit=500)
    
    if sitemap_urls:
        print(f"📊 Sitemap에서 {len(sitemap_urls)}개 URL 발견")
        
        # 중복 제거 (이미 크롤링한 URL 제외)
        new_urls = []
        for url in sitemap_urls:
            if not is_url_already_processed(url, CURRENT_CITY):
                new_urls.append(url)
        
        print(f"🆕 새로운 URL: {len(new_urls)}개")
        
        if new_urls:
            print(f"\n{len(new_urls)}개의 새로운 URL을 크롤링합니다...")
            
            sitemap_completed = 0
            sitemap_failed = 0
            
            for i, url in enumerate(new_urls, 1):
                print(f"\n📊 진행률: {i}/{len(new_urls)} | Sitemap URL")
                print(f"🔗 URL: {url[:60]}...")
                
                try:
                    # 수정된 함수 호출: process_single_url 사용
                    result = crawler.process_single_url(url, CURRENT_CITY, f"sitemap_{i}")
                    
                    if result.get('success') and not result.get('skipped'):
                        product_data = result.get('product_data', {})
                        product_name = product_data.get('상품명', 'N/A')[:30]
                        print(f"    ✅ 성공: {product_name}...")
                        
                        sitemap_completed += 1
                        
                    elif result.get('skipped'):
                        print(f"    ⏭️ 건너뛰기: {result.get('reason', 'unknown')}")
                    else:
                        print(f"    ❌ 실패: {result.get('error', '알 수 없음')}")
                        sitemap_failed += 1
                        
                except Exception as e:
                    print(f"    💥 예외: {e}")
                    sitemap_failed += 1
                
                time.sleep(1)
            
            print(f"\n✅ Sitemap 크롤링 완료!")
            print(f"   성공: {sitemap_completed}개 | 실패: {sitemap_failed}개")
        else:
            print("ℹ️ 새로운 URL이 없습니다.")
    else:
        print("❌ Sitemap에서 URL을 찾을 수 없습니다.")

## 📊 7. 크롤링 결과 분석 및 보고서

In [None]:
# 크롤링 결과 분석 및 보고서 생성
print("📊 크롤링 결과 분석 중...")
print("=" * 50)

try:
    from klook_modules.system_utils import get_hash_stats
    from klook_modules.url_manager import get_url_collection_stats
    import pandas as pd
    
    # 1. 해시 시스템 통계
    hash_stats = get_hash_stats(CURRENT_CITY)
    print(f"🔒 해시 시스템 통계:")
    print(f"   처리된 URL: {hash_stats.get('processed_count', 0)}개")
    
    # 2. URL 수집 통계
    url_stats = get_url_collection_stats(CURRENT_CITY)
    print(f"\n🔗 URL 수집 통계:")
    print(f"   수집 파일: {url_stats.get('total_files', 0)}개")
    print(f"   총 URL: {url_stats.get('total_urls', 0)}개")
    print(f"   최근 수집: {url_stats.get('latest_collection', 'N/A')}")
    
    # 3. CSV 데이터 분석 (새로운 32개 컬럼 구조)
    from klook_modules.config import get_city_info
    continent, country = get_city_info(CURRENT_CITY)
    
    # 새로운 파일명 형식 확인
    if CURRENT_CITY in ["마카오", "홍콩", "싱가포르"]:
        csv_path_new = f"data/{continent}/{CURRENT_CITY}_klook_products_all.csv"
        csv_path_old = f"data/{continent}/klook_{CURRENT_CITY}_products.csv"
    else:
        csv_path_new = f"data/{continent}/{country}/{CURRENT_CITY}/{CURRENT_CITY}_klook_products_all.csv"
        csv_path_old = f"data/{continent}/{country}/{CURRENT_CITY}/klook_{CURRENT_CITY}_products.csv"
    
    # 새 구조 CSV 확인
    csv_path = csv_path_new if os.path.exists(csv_path_new) else csv_path_old
    csv_structure = "32개 컬럼 (신규)" if os.path.exists(csv_path_new) else "13개 컬럼 (기존)"
    
    if os.path.exists(csv_path):
        df = pd.read_csv(csv_path, encoding='utf-8-sig')
        
        print(f"\n📋 CSV 데이터 분석:")
        print(f"   총 상품: {len(df)}개")
        print(f"   구조: {csv_structure}")
        print(f"   컬럼 수: {len(df.columns)}개")
        print(f"   파일 위치: {csv_path}")
        
        # 32개 컬럼 구조 상세 분석
        if len(df.columns) >= 30:  # 32개 컬럼 구조
            print(f"\n💾 32개 컬럼 구조 확인:")
            
            # 기본 정보 컬럼
            basic_cols = ['번호', '도시ID', '상품명', '가격_원본', '가격_정제']
            basic_present = [col for col in basic_cols if col in df.columns]
            print(f"   기본 정보: {len(basic_present)}/{len(basic_cols)}개")
            
            # 이미지 컬럼 (8개)
            image_cols = [col for col in df.columns if '이미지' in col]
            print(f"   이미지 정보: {len(image_cols)}개")
            
            # 랭킹 컬럼
            ranking_cols = ['탭명', '탭순서', '탭내_랭킹', 'URL_해시']
            ranking_present = [col for col in ranking_cols if col in df.columns]
            print(f"   랭킹 정보: {len(ranking_present)}/{len(ranking_cols)}개")
            
            # 듀얼 이미지 통계
            if '메인이미지_파일명' in df.columns and '썸네일이미지_파일명' in df.columns:
                main_images = df[df['메인이미지_파일명'] != '정보 없음']
                thumb_images = df[df['썸네일이미지_파일명'] != '정보 없음']
                dual_images = df[(df['메인이미지_파일명'] != '정보 없음') & 
                               (df['썸네일이미지_파일명'] != '정보 없음')]
                
                print(f"\n📸 듀얼 이미지 통계:")
                print(f"   메인 이미지: {len(main_images)}개")
                print(f"   썸네일 이미지: {len(thumb_images)}개")
                print(f"   듀얼 이미지: {len(dual_images)}개")
        
        # 탭별 분석
        tab_col = '탭명' if '탭명' in df.columns else None
        if tab_col:
            tab_counts = df[tab_col].value_counts()
            print(f"\n🎪 탭별 상품 수:")
            for tab, count in tab_counts.items():
                print(f"   {tab}: {count}개")
        
        # 가격 분석 (구 컬럼/신 컬럼 호환)
        price_col = '가격_정제' if '가격_정제' in df.columns else '가격'
        if price_col in df.columns:
            valid_prices = df[df[price_col] != '정보 없음'][price_col]
            print(f"\n💰 가격 정보:")
            print(f"   가격 있음: {len(valid_prices)}개")
            print(f"   가격 없음: {len(df) - len(valid_prices)}개")
        
        # 평점 분석 (구 컬럼/신 컬럼 호환)
        rating_col = '평점_정제' if '평점_정제' in df.columns else '평점'
        if rating_col in df.columns:
            valid_ratings = df[df[rating_col] != '정보 없음'][rating_col]
            print(f"\n⭐ 평점 정보:")
            print(f"   평점 있음: {len(valid_ratings)}개")
            print(f"   평점 없음: {len(df) - len(valid_ratings)}개")
        
        # 추가 정보 분석 (32개 컬럼 구조)
        if '하이라이트' in df.columns:
            highlights = df[df['하이라이트'] != '정보 없음']
            print(f"   하이라이트: {len(highlights)}개")
        
        if '언어' in df.columns:
            languages = df[df['언어'] != '정보 없음']
            print(f"   언어 정보: {len(languages)}개")
        
        # 최근 크롤링 시간
        time_col = '수집_시간' if '수집_시간' in df.columns else '수집일시'
        if time_col in df.columns:
            latest_crawl = df[time_col].max()
            print(f"\n⏰ 최근 크롤링: {latest_crawl}")
    
    else:
        print(f"\n⚠️ CSV 파일을 찾을 수 없습니다: {csv_path}")
    
    # 4. 랭킹 매니저 분석
    try:
        ranking_stats = ranking_manager.get_city_ranking_stats(CURRENT_CITY)
        if ranking_stats:
            print(f"\n🏆 랭킹 매니저 분석:")
            print(f"   총 관리 URL: {ranking_stats.get('total_urls', 0)}개")
            print(f"   중복 발견 URL: {ranking_stats.get('duplicate_urls', 0)}개")
            print(f"   처리된 탭: {ranking_stats.get('tabs_processed', [])}")
            print(f"   마지막 업데이트: {ranking_stats.get('last_updated', 'N/A')}")
    except Exception as e:
        print(f"⚠️ 랭킹 분석 실패: {e}")
    
    # 5. 이미지 폴더 분석
    try:
        img_base_folder = "klook_thumb_img"
        if os.path.exists(img_base_folder):
            if CURRENT_CITY in ["마카오", "홍콩", "싱가포르"]:
                img_folder = os.path.join(img_base_folder, continent)
            else:
                img_folder = os.path.join(img_base_folder, continent, country, CURRENT_CITY)
            
            if os.path.exists(img_folder):
                img_files = [f for f in os.listdir(img_folder) if f.endswith('.jpg')]
                main_imgs = [f for f in img_files if '_thumb' not in f and '_main' not in f]
                thumb_imgs = [f for f in img_files if '_thumb' in f]
                
                print(f"\n📸 이미지 폴더 분석:")
                print(f"   폴더 위치: {img_folder}")
                print(f"   총 이미지: {len(img_files)}개")
                print(f"   메인 이미지: {len(main_imgs)}개")
                print(f"   썸네일: {len(thumb_imgs)}개")
            else:
                print(f"\n📸 이미지 폴더 없음: {img_folder}")
    except Exception as e:
        print(f"⚠️ 이미지 분석 실패: {e}")

except Exception as e:
    print(f"❌ 분석 중 오류: {e}")

# 세션 보고서 생성 (업데이트된 정보 포함)
try:
    session_report = {
        "city": CURRENT_CITY,
        "mode": CRAWLING_MODE,
        "start_rank": START_RANK,
        "end_rank": END_RANK,
        "completed_at": datetime.now().isoformat(),
        "settings": settings,
        "total_time_minutes": int(total_time // 60),
        "results": {
            "completed": total_completed,
            "skipped": total_skipped,
            "failed": total_failed
        },
        "system_info": {
            "column_structure": "32개 컬럼",
            "dual_image_system": settings.get('download_images', True),
            "ranking_manager": True,
            "hashlib_system": CONFIG.get('USE_HASH_SYSTEM', True)
        }
    }
    
    # 보고서 저장
    os.makedirs("session_reports", exist_ok=True)
    report_filename = f"session_reports/klook_session_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
    
    import json
    with open(report_filename, 'w', encoding='utf-8') as f:
        json.dump(session_report, f, ensure_ascii=False, indent=2)
    
    print(f"\n📋 세션 보고서 저장: {report_filename}")

except Exception as e:
    print(f"⚠️ 보고서 저장 실패: {e}")

print("\n🎉 모든 작업이 완료되었습니다!")
print(f"💾 32개 컬럼 구조: {'✅ 적용됨' if csv_structure == '32개 컬럼 (신규)' else '⚠️ 기존 구조'}")
print(f"📸 듀얼 이미지: {'✅ 적용됨' if settings.get('download_images', True) else '❌ 비활성화'}")
print(f"🏆 랭킹 매니저: {'✅ 활성화' if 'ranking_manager' in locals() else '❌ 비활성화'}")

## 🧹 8. 시스템 정리 및 종료

In [None]:
# 시스템 정리 및 브라우저 종료
print("🧹 시스템 정리 중...")

try:
    # 크롤러 정리
    if 'crawler' in locals():
        crawler.cleanup()
        print("✅ 크롤러 정리 완료")
    
    # 드라이버 종료
    if 'driver' in locals():
        driver.quit()
        print("✅ 브라우저 종료 완료")
    
    # 마스터 컨트롤러 정리
    if 'controller' in locals():
        controller.cleanup_system()
        print("✅ 시스템 정리 완료")

except Exception as e:
    print(f"⚠️ 정리 중 오류: {e}")

print("\n👋 KLOOK 크롤러를 종료합니다.")
print("\n" + "="*70)
print("🎉 크롤링 세션이 성공적으로 완료되었습니다!")
print("📁 결과 파일들을 확인하세요:")
print(f"   - CSV 데이터: data/{CURRENT_CITY}/")
print(f"   - 세션 보고서: session_reports/")
print(f"   - URL 수집 로그: url_collected/")
print("="*70)

In [None]:
# 🔍 실제 URL 순서 확인 (수동 실행용)
print("🔍 실제 수집된 URL 순서 확인")
print("=" * 50)

# 동적으로 city_code 가져오기
try:
    from klook_modules.config import get_city_code
    city_code = get_city_code(CURRENT_CITY)
    
    # 동적으로 구성된 파일 경로로 URL 로그 확인
    url_log_file = f'url_collected/{city_code}_url_log.txt'
    
    with open(url_log_file, 'r', encoding='utf-8') as f:
        urls = f.readlines()
    
    print(f"📊 {CURRENT_CITY} 수집 결과: {len(urls)}개 URL")
    
    for i, line in enumerate(urls, 1):
        if '|' in line:
            timestamp, url = line.strip().split(' | ')
            # URL에서 상품명 추출
            product_name = url.split('/')[-1].replace('-', ' ')[:50]
            print(f"   {i}위: {product_name}")
    
    # 실제 KLOOK 페이지에서 1-3위와 비교 (동적 도시명 사용)
    print(f"\n💡 실제 KLOOK {CURRENT_CITY} 페이지와 비교해보세요:")
    if CURRENT_CITY == "로마":
        print(f"   1위: 바티칸 박물관 (Vatican Museums)")  
        print(f"   2위: 콜로세움 (Colosseum)")
        print(f"   3위: 바티칸 투어 또는 다른 인기 상품")
    elif CURRENT_CITY == "구마모토":
        print(f"   1위: 구마모토성 투어 (Kumamoto Castle Tour)")
        print(f"   2위: 아소산 투어 (Mount Aso Tour)")
        print(f"   3위: 구마모토 온천 체험")
    else:
        print(f"   해당 도시의 주요 관광 상품들과 비교해보세요")
    
    print(f"\n❓ 위 순서가 실제 KLOOK {CURRENT_CITY} 페이지 순서와 일치하나요?")
    
except FileNotFoundError:
    print(f"❌ {CURRENT_CITY} URL 로그 파일을 찾을 수 없습니다.")
    print(f"   파일 경로: {url_log_file}")
    print(f"   💡 먼저 URL 수집을 실행해주세요.")
except NameError:
    print("❌ CURRENT_CITY 변수가 정의되지 않았습니다.")
    print("💡 첫 번째 셀에서 설정을 먼저 실행해주세요.")
except Exception as e:
    print(f"❌ 오류: {e}")

print(f"\n🎯 다음 단계:")
print(f"   1. KLOOK {CURRENT_CITY} 페이지를 직접 확인")  
print(f"   2. 실제 1-3위 순서와 비교")
print(f"   3. 순서가 다르면 좌표 기반 정렬 구현")
print(f"   4. 순서가 맞다면 현재 방식 유지")

---

## 🔄 이어서 계속하기 (Resume 기능)

만약 크롤링이 중간에 중단되었다면, 다음 셀을 실행하여 이어서 계속할 수 있습니다:

In [None]:
# Resume 기능 - 중단된 지점부터 이어서 계속 (자동 건너뛰기)
print("🔄 이어서 계속하기 기능 (Run All 호환)")
print("=" * 40)

# Run All 호환을 위해 자동으로 건너뛰기
print("⏭️ Run All 모드: Resume 기능을 자동으로 건너뜁니다.")
print("💡 필요시 이 셀을 개별 실행하여 Resume 기능을 활성화할 수 있습니다.")

# 수동 실행 모드 (개별 셀 실행시에만 동작)
if False:  # 기본적으로 비활성화
    try:
        from klook_modules.system_utils import load_session_state
        
        # 사용자에게 도시명 입력 받기 (수동 모드에서만)
        resume_city = input("이어서 계속할 도시명을 입력하세요: ")
        
        # 이전 세션 상태 로드
        session_state = load_session_state(resume_city)
        
        if session_state:
            print(f"✅ '{resume_city}' 이전 세션 발견!")
            print(f"📊 이전 세션 정보: {session_state.get('timestamp', 'N/A')}")
            
            # 설정 복원 (수정된 변수명)
            CURRENT_CITY = resume_city
            START_RANK = session_state.get('start_rank', 1)
            END_RANK = session_state.get('end_rank', 50)
            CRAWLING_MODE = 'resume'
            
            # 설정 딕셔너리 복원
            settings = {
                'city': resume_city,
                'start_rank': START_RANK,
                'end_rank': END_RANK,
                'mode': 'resume',
                'skip_duplicates': True,
                'auto_save': session_state.get('auto_save', True),
                'download_images': session_state.get('download_images', True),
                'save_session': True
            }
            
            print(f"🔄 '{CURRENT_CITY}'에서 이어서 계속합니다...")
            print(f"📊 복원된 순위 범위: {START_RANK}위 ~ {END_RANK}위")
            print(f"💾 32개 컬럼 구조: ✅ 적용")
            print(f"🏆 랭킹 매니저: ✅ 활성화")
            print("위의 '3. 크롤링 실행' 셀부터 다시 실행하세요.")
        else:
            print(f"❌ '{resume_city}'의 이전 세션을 찾을 수 없습니다.")
            
    except Exception as e:
        print(f"❌ Resume 기능 오류: {e}")

print("✅ Resume 기능 셀 완료 - 다음 단계로 진행합니다.")