In [25]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pandas as pd
import time

# WebDriver 설정 (예: Chrome)
driver = webdriver.Chrome()

# URL로 이동
url = "https://www.hyundai.com/kr/ko/service-membership/service-network/service-reservation-search"
driver.get(url)

# 첫 번째 팝업의 '차단' 버튼 클릭
popup_button = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.XPATH, "//button[contains(text(), '차단')]"))
)
popup_button.click()
print("첫 번째 팝업 닫기 성공")

# 두 번째 팝업의 '확인' 버튼 클릭
confirm_button = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.CLASS_NAME, "alert_confirm_btn"))
)
confirm_button.click()
print("확인 버튼 클릭 성공")

# 데이터 저장을 위한 리스트 초기화
all_data = []

# 페이지 번호를 추적하여 끝까지 이동
page_number = 1

while True:
    print(f"현재 페이지: {page_number}")
    
    try:
        # 현재 페이지의 모든 데이터 수집
        rows = WebDriverWait(driver, 10).until(
            EC.presence_of_all_elements_located((By.CSS_SELECTOR, "#listView tr"))
        )
        
        for row in rows:
            try:
                # 업체명
                try:
                    shop_name = row.find_element(By.CLASS_NAME, "link_line").text
                except:
                    shop_name = None

                # 종류
                try:
                    shop_type = row.find_element(By.CLASS_NAME, "wrap-word").text
                except:
                    shop_type = None

                # 주소
                try:
                    address = row.find_elements(By.TAG_NAME, "td")[1].text
                except:
                    address = None

                # 전화번호
                try:
                    phone = row.find_element(By.CSS_SELECTOR, "span.pc_only").text
                except:
                    phone = None

                # 특화서비스
                try:
                    services = "_".join([elem.text for elem in row.find_elements(By.CLASS_NAME, "wrap-word")][1:])
                except:
                    services = None
                
                # 수집한 데이터를 리스트에 추가
                all_data.append([shop_name, shop_type, address, phone, services])
            except Exception as e:
                print("데이터 수집 중 오류 발생:", e)

        # 다음 페이지 버튼 찾기 및 클릭
        next_button = driver.find_element(By.XPATH, "//button[@class='navi next']")
        driver.execute_script("arguments[0].click();", next_button) 
        page_number += 1
        time.sleep(2) 

    except Exception as e:
        print("마지막 페이지에 도달 또는 오류:", e)
        break

# 데이터프레임으로 변환
df = pd.DataFrame(all_data, columns=["업체명", "종류", "주소", "전화번호", "특화서비스"])

df['주소'] = df['주소'].str.replace('특별시|광역시|특별자치도|특별자치시', '', regex=True)
df['주소'] = df['주소'].str.replace('경기도', '경기', regex=False)
df['주소'] = df['주소'].str.replace('강원도', '강원', regex=False)
df['주소'] = df['주소'].str.replace('충청북도', '충북', regex=False)
df['주소'] = df['주소'].str.replace('충청남도', '충남', regex=False)
df['주소'] = df['주소'].str.replace('전라북도', '전북', regex=False)
df['주소'] = df['주소'].str.replace('전라남도', '전남', regex=False)
df['주소'] = df['주소'].str.replace('경상북도', '경북', regex=False)
df['주소'] = df['주소'].str.replace('경상남도', '경남', regex=False)

# '시도' 열에 주소 첫 두 글자 추가
df['시도'] = df['주소'].str[:2]

# '시군구' 열에 첫 번째와 두 번째 띄어쓰기 사이의 텍스트 추출
df['시군구'] = df['주소'].str.extract(r'^\S+\s(\S+)')[0]

df['시도+시군구'] = df['시도'] + df['시군구']

# 서비스 전처리
unique_services = set(service for services in df['특화서비스'] for service in services.split('_'))

for service in unique_services:
    df[service] = df['특화서비스'].apply(lambda x: 'O' if service in x else None)

df = df.drop(columns=[''])
df

# 엑셀로 저장
df.to_excel('블루핸즈 최종.xlsx')

첫 번째 팝업 닫기 성공
확인 버튼 클릭 성공
현재 페이지: 1
현재 페이지: 2
현재 페이지: 3
현재 페이지: 4
현재 페이지: 5
현재 페이지: 6
현재 페이지: 7
현재 페이지: 8
현재 페이지: 9
현재 페이지: 10
현재 페이지: 11
현재 페이지: 12
현재 페이지: 13
현재 페이지: 14
현재 페이지: 15
현재 페이지: 16
현재 페이지: 17
현재 페이지: 18
현재 페이지: 19
현재 페이지: 20
현재 페이지: 21
현재 페이지: 22
현재 페이지: 23
현재 페이지: 24
현재 페이지: 25
현재 페이지: 26
현재 페이지: 27
현재 페이지: 28
현재 페이지: 29
현재 페이지: 30
현재 페이지: 31
현재 페이지: 32
현재 페이지: 33
현재 페이지: 34
현재 페이지: 35
현재 페이지: 36
현재 페이지: 37
현재 페이지: 38
현재 페이지: 39
현재 페이지: 40
현재 페이지: 41
현재 페이지: 42
현재 페이지: 43
현재 페이지: 44
현재 페이지: 45
현재 페이지: 46
현재 페이지: 47
현재 페이지: 48
현재 페이지: 49
현재 페이지: 50
현재 페이지: 51
현재 페이지: 52
현재 페이지: 53
현재 페이지: 54
현재 페이지: 55
현재 페이지: 56
현재 페이지: 57
현재 페이지: 58
현재 페이지: 59
현재 페이지: 60
현재 페이지: 61
현재 페이지: 62
현재 페이지: 63
현재 페이지: 64
현재 페이지: 65
현재 페이지: 66
현재 페이지: 67
현재 페이지: 68
현재 페이지: 69
현재 페이지: 70
현재 페이지: 71
현재 페이지: 72
현재 페이지: 73
현재 페이지: 74
현재 페이지: 75
현재 페이지: 76
현재 페이지: 77
현재 페이지: 78
현재 페이지: 79
현재 페이지: 80
현재 페이지: 81
현재 페이지: 82
현재 페이지: 83
현재 페이지: 84
현재 페이지: 85
현재 페이지: 86
현재 페이지: 87
현재 페이지: 88
현재 페이지: 89
현재 페