In [3]:
# 그룹 A: 초기 설정 (All-in-One Setup) - 한 번만 실행

import os, json, time, random, hashlib, warnings, shutil, urllib
import tkinter as tk
from tkinter import filedialog
import pandas as pd
import pyperclip

# Selenium 관련
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver import ActionChains
import chromedriver_autoinstaller
import undetected_chromedriver as uc
from user_agents import parse

warnings.filterwarnings(action='ignore')

print("🚀 그룹 A: 초기 설정 시작")
print("=" * 50)

def complete_setup():
    """환경준비 + 인증 + 작업환경 설정"""
    global driver, csv_file_path

    # Phase 1: 환경 준비
    print("📁 Phase 1: 환경 준비")

    # CSV 파일 선택
    root = tk.Tk()
    root.withdraw()
    print("📂 CSV 파일 선택 다이얼로그...")
    csv_file_path = filedialog.askopenfilename(
        title="CSV 파일을 선택하세요",
        filetypes=[("CSV files", "*.csv"), ("All files", "*.*")],
        initialdir=os.getcwd()
    )
    root.destroy()

    if not csv_file_path:
        raise ValueError("CSV 파일을 선택해주세요.")
    print(f"✅ CSV 파일: {os.path.basename(csv_file_path)}")

    # 설정 저장
    config = {"csv_path": csv_file_path}
    with open("config.json", "w", encoding='utf-8') as f:
        json.dump(config, f, ensure_ascii=False)

    # 브라우저 설정 및 시작
    chromedriver_autoinstaller.install()
    options = uc.ChromeOptions()
    UA = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/138.0.0.0 Whale/4.33.325.17 Safari/537.36"
    options.add_argument(f"--user-agent={UA}")
    options.add_argument("--disable-save-password-bubble")
    options.add_argument("--disable-infobars")
    options.add_argument("--disable-notifications")

    # 쿠키 폴더 설정
    rand_user_folder = random.randrange(1,100)
    raw_path = os.path.abspath("cookies")
    try:
        shutil.rmtree(raw_path)
    except:
        pass
    os.makedirs(raw_path, exist_ok=True)
    user_cookie_name = f"{raw_path}/{rand_user_folder}"
    os.makedirs(user_cookie_name, exist_ok=True)

    driver = uc.Chrome(user_data_dir=user_cookie_name, options=options)
    print("✅ 브라우저 시작 완료")

    # Phase 2: 인증
    print("\n🔑 Phase 2: 인증")
    driver.get("https://partner.myrealtrip.com/signin")
    time.sleep(3)

    # 로그인
    driver.find_element("xpath", "/html/body/div[1]/div[2]/div/form/div[2]/input").send_keys("allcrowd@naver.com")
    time.sleep(2)
    driver.find_element("xpath", "/html/body/div[1]/div[2]/div/form/div[4]/input").send_keys("osaka2002.")
    time.sleep(2)
    driver.find_element("xpath", "/html/body/div[1]/div[2]/div/form/label/input").click()
    time.sleep(2)
    driver.find_element("xpath", "/html/body/div[1]/div[2]/div/form/div[5]/button").click()
    time.sleep(5)
    print("✅ 로그인 완료")

    # 팝업 처리
    handle_all_popups()

    # Phase 3: 작업환경 설정
    print("\n⚙️ Phase 3: 작업환경 설정")
    try:
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[1]/div[1]/div/div[1]/div").click()
        time.sleep(3)
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[1]/div/div/span/input").click()
        time.sleep(2)
        print("✅ 작업환경 설정 완료")
    except Exception as e:
        print(f"⚠️ 작업환경 설정 중 오류: {e}")

    print("\n🎉 그룹 A 완료: 모든 초기 설정이 완료되었습니다!")
    return True

def handle_all_popups():
    """모든 팝업 처리 (7일간 보지 않기 우선)"""
    try:
        # 1. 7일간 보지 않기 버튼 우선
        seven_day_buttons = [
            "//button[contains(text(), '7일간 보지 않기')]",
            "//button[contains(text(), '7일간')]",
            "//span[contains(text(), '7일간 보지 않기')]",
            "//*[contains(text(), '7일간 보지 않기')]"
        ]

        for xpath in seven_day_buttons:
            try:
                elem = driver.find_element("xpath", xpath)
                if elem.is_displayed() and elem.is_enabled():
                    elem.click()
                    print("✅ '7일간 보지 않기' 클릭 완료")
                    time.sleep(2)
                    return
            except:
                continue

        # 2. 닫기 버튼
        close_buttons = [
            "//button[contains(text(), '닫기')]",
            "//button[contains(text(), '취소')]",
            "//span[contains(text(), '닫기')]",
            "//*[contains(@class, 'close')]"
        ]

        for xpath in close_buttons:
            try:
                elem = driver.find_element("xpath", xpath)
                if elem.is_displayed() and elem.is_enabled():
                    elem.click()
                    print("✅ '닫기' 버튼 클릭 완료")
                    time.sleep(2)
                    return
            except:
                continue

        # 3. ESC 키
        try:
            driver.find_element("tag name", "body").send_keys(Keys.ESCAPE)
            time.sleep(1)
            print("✅ ESC로 팝업 처리")
        except:
            print("⚠️ 팝업 처리 불가")

    except Exception as e:
        print(f"❌ 팝업 처리 중 오류: {e}")

# 실행
complete_setup()  # 주석 해제하여 실행

🚀 그룹 A: 초기 설정 시작
📁 Phase 1: 환경 준비
📂 CSV 파일 선택 다이얼로그...
✅ CSV 파일: 일본_myrealtrip_products_all.csv
✅ 브라우저 시작 완료

🔑 Phase 2: 인증
✅ 로그인 완료
✅ '7일간 보지 않기' 클릭 완료

⚙️ Phase 3: 작업환경 설정
✅ 작업환경 설정 완료

🎉 그룹 A 완료: 모든 초기 설정이 완료되었습니다!


True

In [9]:
# 그룹 B: 스마트 자동 처리 (Robust Auto Process) - 반복 실행 가능
def robust_auto_process(max_count, refresh_range):
    """안전장치 포함 자동 URL 처리"""

    print("🚀 그룹 B: 스마트 자동 처리 시작")
    print(f"📊 설정: 최대 {max_count or '무제한'}개, {refresh_range[0]}-{refresh_range[1]}개마다 새로고침")
    print("=" * 50)

    # 설정 로드
    try:
        with open("config.json", "r", encoding='utf-8') as f:
            config = json.load(f)
        csv_file_path = config['csv_path']
        print(f"✅ 설정 로드: {os.path.basename(csv_file_path)}")
    except:
        print("❌ 오류: config.json을 찾을 수 없습니다. 그룹 A를 먼저 실행해주세요.")
        return 0

    # 브라우저 상태 체크
    if not check_browser_ready():
        print("⚠️ 브라우저 상태 복구 중...")
        if not restore_environment():
            print("❌ 환경 복구 실패. 그룹 A를 다시 실행해주세요.")
            return 0

    # 항상 새로고침으로 시작
    print("🔄 새로고침으로 깔끔하게 시작...")
    if not perform_safe_refresh():
        print("❌ 초기 새로고침 실패")
        return 0

    processed = 0
    refresh_counter = 0
    next_refresh = random.randint(refresh_range[0], refresh_range[1])
    is_first_url = True

    print(f"🔄 첫 번째 새로고침까지: {next_refresh}개")

    while True:
        if max_count and processed >= max_count:
            print(f"🎯 목표 달성! {processed}개 처리 완료")
            break

        try:
            print(f"\n=== {processed + 1}번째 처리 (새로고침까지 {next_refresh - refresh_counter}개) ===")

            # CSV에서 다음 URL 찾기
            idx, url = find_next_unprocessed_url(csv_file_path)
            if idx is None:
                print("🎉 모든 URL 처리 완료!")
                break

            print(f"🎯 처리 대상 (행 {idx+1}): {url}")

            # URL 처리
            if process_single_url(url, idx, csv_file_path, is_first_url):
                processed += 1
                refresh_counter += 1
                is_first_url = False
                print(f"✅ {processed}번째 처리 성공!")
            else:
                print("❌ 처리 실패, 다음 URL로 건너뜀")
                continue

            # 새로고침 체크
            if refresh_counter >= next_refresh:
                print(f"\n🔄 {refresh_counter}개 처리 완료! 새로고침 중...")
                if perform_safe_refresh():
                    refresh_counter = 0
                    next_refresh = random.randint(refresh_range[0], refresh_range[1])
                    is_first_url = True
                    print(f"🔄 다음 새로고침까지: {next_refresh}개")
                else:
                    print("⚠️ 새로고침 실패, 계속 진행")

            time.sleep(random.uniform(3, 6))

        except KeyboardInterrupt:
            print(f"\n⏹️ 사용자 중단! {processed}개 처리됨")
            break
        except Exception as e:
            print(f"❌ 처리 중 오류: {e}")
            continue

    print(f"\n🎉 처리 완료! 총 {processed}개 처리됨")
    return processed

def initialize_for_next_url():
    """두 번째 URL부터 필요한 3단계 초기화"""
    try:
        print("  🔄 URL 처리 환경 초기화...")

        # 1. 링크 다시 만들기 클릭
        elem = driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/button/div/span")
        elem.click()
        time.sleep(random.uniform(3,5))
        print("  ✅ 링크 다시 만들기 클릭")

        # 2. URL 입력 박스 내용 clear
        elem = driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/div/div/span/input")
        elem.clear()
        time.sleep(random.uniform(3,5))
        print("  ✅ URL 입력박스 내용 클리어")

        # 3. URL생성 박스 클릭
        elem = driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[1]/div/div/span/input")
        elem.click()
        time.sleep(random.uniform(3,5))
        print("  ✅ URL생성 박스 클릭")

        return True
    except Exception as e:
        print(f"  ❌ 초기화 실패: {e}")
        return False

def process_single_url(url, idx, csv_path, is_first_url=False):
    """단일 URL 처리"""
    try:
        # 두 번째 URL부터는 초기화 필요
        if not is_first_url:
            if not initialize_for_next_url():
                return False

        print("  📝 URL 입력 시작...")

        # URL 입력
        pyperclip.copy(url)
        elem = WebDriverWait(driver, 10).until(
            EC.element_to_be_clickable(("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/div/div/span/input"))
        )
        elem.click()
        time.sleep(0.5)
        elem.clear()
        elem.send_keys(Keys.CONTROL + 'v')
        time.sleep(2)

        # 홍보 링크 생성
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/button").click()
        time.sleep(3)

        # 복사 버튼 클릭
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[2]/div/div/button").click()
        time.sleep(2)

        # 결과 저장
        partner_url = pyperclip.paste()
        if partner_url and partner_url.startswith('https://'):
            save_to_csv(csv_path, idx, url, partner_url)
            return True
        else:
            print(f"❌ 유효하지 않은 링크: {partner_url}")
            return False

    except Exception as e:
        print(f"❌ URL 처리 중 오류: {e}")
        return False

def check_browser_ready():
    """브라우저 준비 상태 확인"""
    try:
        if "partner.myrealtrip.com" not in driver.current_url:
            return False
        # URL 입력창이 있는지 확인
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[1]/div/div/span/input")
        return True
    except:
        return False

def restore_environment():
    """환경 복구"""
    try:
        print("🔧 환경 복구 시작...")

        # 세션 체크
        if "signin" in driver.current_url:
            print("⚠️ 로그아웃 상태 감지")
            return False

        # 파트너 페이지로 이동
        driver.get("https://partner.myrealtrip.com")
        time.sleep(3)

        # 팝업 처리
        handle_all_popups()

        # 모든 상품 클릭
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[1]/div[1]/div/div[1]/div").click()
        time.sleep(3)

        # URL 입력창 클릭
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[1]/div/div/span/input").click()
        time.sleep(2)

        print("✅ 환경 복구 완료")
        return True

    except Exception as e:
        print(f"❌ 환경 복구 실패: {e}")
        return False

def find_next_unprocessed_url(csv_path):
    """다음 처리할 URL 찾기"""
    try:
        # 다중 인코딩 시도
        for encoding in ['utf-8-sig', 'cp949', 'euc-kr', 'utf-8']:
            try:
                df = pd.read_csv(csv_path, encoding=encoding)
                break
            except:
                continue
        else:
            return None, None

        # 컬럼 생성 (없을 경우만)
        if 'ad_link' not in df.columns:
            df['ad_link'] = ''
        if 'processed_hash' not in df.columns:
            df['processed_hash'] = ''

        # 다음 처리 대상 찾기
        for idx, row in df.iterrows():
            if pd.notna(row['URL']) and str(row['URL']).strip():
                url = str(row['URL']).strip()
                url_hash = hashlib.md5(url.encode()).hexdigest()

                # 미처리 또는 불완전 처리 체크
                no_ad_link = pd.isna(row.get('ad_link')) or str(row.get('ad_link')).strip() == ''
                no_hash = pd.isna(row.get('processed_hash')) or str(row.get('processed_hash')).strip() == ''
                wrong_hash = str(row.get('processed_hash', '')) != url_hash

                if no_ad_link or no_hash or wrong_hash:
                    return idx, url

        return None, None

    except Exception as e:
        print(f"❌ URL 찾기 중 오류: {e}")
        return None, None

def process_single_url(url, idx, csv_path, is_first_url=False):
    """단일 URL 처리"""
    try:
        # 두 번째 URL부터는 초기화 필요
        if not is_first_url:
            if not initialize_for_next_url():
                return False

        print("  📝 URL 입력 시작...")

        # URL 입력
        pyperclip.copy(url)
        elem = WebDriverWait(driver, 10).until(
            EC.element_to_be_clickable(("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/div/div/span/input"))
        )
        elem.click()
        time.sleep(0.5)
        elem.clear()
        elem.send_keys(Keys.CONTROL + 'v')
        time.sleep(2)

        # 홍보 링크 생성
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div/section/div/div[1]/button").click()
        time.sleep(3)

        # 복사 버튼 클릭
        driver.find_element("xpath", "/html/body/div[1]/section/section/main/main/div[2]/div[2]/div/div[1]/section/div/div[2]/div/div/button").click()
        time.sleep(2)

        # 결과 저장
        partner_url = pyperclip.paste()
        if partner_url and partner_url.startswith('https://'):
            save_to_csv(csv_path, idx, url, partner_url)
            return True
        else:
            print(f"❌ 유효하지 않은 링크: {partner_url}")
            return False

    except Exception as e:
        print(f"❌ URL 처리 중 오류: {e}")
        return False

def save_to_csv(csv_path, idx, url, partner_url):
    """CSV에 안전하게 저장"""
    try:
        for encoding in ['utf-8-sig', 'cp949', 'euc-kr']:
            try:
                df = pd.read_csv(csv_path, encoding=encoding)
                break
            except:
                continue

        df.loc[idx, 'ad_link'] = partner_url
        df.loc[idx, 'processed_hash'] = hashlib.md5(url.encode()).hexdigest()
        df.to_csv(csv_path, index=False, encoding='utf-8-sig')
        print(f"💾 저장 완료: {partner_url}")

    except Exception as e:
        print(f"❌ 저장 실패: {e}")

def perform_safe_refresh():
    try:
        time.sleep(random.uniform(5, 8))
        return restore_environment()  # get()만 사용
    except:
        return False

# 사용 예시
print("✅ 그룹 B 함수 준비 완료!")
print("\n📋 사용법:")
print("robust_auto_process()                    # 전체 처리")
print("robust_auto_process(10)                  # 10개만 처리")
print("robust_auto_process(20, (3,5))           # 20개, 3-5개마다 새로고침")

✅ 그룹 B 함수 준비 완료!

📋 사용법:
robust_auto_process()                    # 전체 처리
robust_auto_process(10)                  # 10개만 처리
robust_auto_process(20, (3,5))           # 20개, 3-5개마다 새로고침


In [None]:
# 🎯 실행 설정 (여기서만 숫자 변경)
MAX_COUNT = 10          # 처리할 개수 (None이면 전체)
REFRESH_RANGE = (3, 5)  # 새로고침 주기

# 🚀 실행
print(f"🚀 자동 실행 시작! (최대 {MAX_COUNT}개)")
robust_auto_process(MAX_COUNT, REFRESH_RANGE)