In [53]:
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import pandas as pd
import time

driver = webdriver.Chrome()
driver.get("https://www.kccauto.co.kr/passengercars/about-us.html#introduce")

def scroll_until_component_loaded(driver):
    max_scroll_attempts = 10
    for _ in range(max_scroll_attempts):
        # 스크롤 내림
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        time.sleep(1)  

        if driver.execute_script("return typeof window.aemNamespace !== 'undefined' && typeof window.aemNamespace.componentData !== 'undefined'"):
            return True
    return False


if not scroll_until_component_loaded(driver):
    print("componentData를 찾을 수 없습니다.")
    driver.quit()
    exit()


script = """
return Object.values(window.aemNamespace.componentData).filter(item => item.headline && item.bullets);
"""
service_centers_data = driver.execute_script(script)


data = []


for center in service_centers_data:
    try:
        headline = center['headline']
        address = center['copy'].split('<br>')[0].strip()  
        phone = center['bullets'][0].replace("전화 : ", "").strip()
        hours = center['bullets'][1].replace("영업시간 : ", "").strip()
        
        
        data.append({"업체명": headline, "주소": address, "전화번호": phone, "영업시간": hours})
        
    except Exception as e:
        print(f"오류 발생: {e}")


df = pd.DataFrame(data)


print(df)

df1 = df

           업체명                                     주소          전화번호  \
0     강서목동 전시장        <p>서울시 강서구 공항대로 665 (염창동 260-4)  02-6355-0000   
1       강북 전시장         <p>서울시 강북구 도봉로 233 (미아동 203-2)  02-6678-7500   
2      영등포 전시장        <p>서울시 영등포구 여의대방로 113 (신길동4268)  02-6123-1400   
3       부천 전시장          <p>경기도 부천시 길주로 443 (춘의동 77-1)  032-713-4500   
4       마포 전시장       <p>서울시 마포구 마포대로 188 (공덕동 105-99)  02-6010-9000   
5       한남 전시장      <p>서울시 용산구 한남대로 142 (한남동 726-166)  02-6328-7700   
6       제주 전시장   <p>제주특별자치도 제주시 연삼로 101 (오라3동 2791번지)  064-800-9800   
7       금천 전시장        <p>서울시 금천구 시흥대로 173 (시흥동 987-6)  02-6139-0000   
8       김포 전시장  <p>경기도 김포시 유현로 237번길 100 (풍무동 820-15)  031-991-5000   
9   강서목동 서비스센터        <p>서울시 강서구 공항대로 665 (염창동 260-4)  02-6355-0100   
10    도봉 서비스센터       <p>서울시 도봉구 마들로 18길 9 (방학동 724-4)  02-6678-7575   
11    한남 서비스센터      <p>서울시 용산구 한남대로 142 (한남동 726-166)  02-6328-7500   
12    금천 서비스센터        <p>서울시 금천구 시흥대로 173 (시흥동 987-6)   02-807-2400   
13  용산

In [55]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pandas as pd

driver = webdriver.Chrome()

url = "https://mb.hansung.co.kr/service/network"
driver.get(url)

wait = WebDriverWait(driver, 10)
wait.until(EC.presence_of_element_located((By.CLASS_NAME, "mapWrapper")))


data = []

service_centers = driver.find_elements(By.CLASS_NAME, "mapWrapper")

for center in service_centers:
    name = center.get_attribute("data-name")
    address = center.get_attribute("data-address")
    phone = center.find_element(By.CSS_SELECTOR, "a[href^='tel']").text
    hours = center.find_element(By.CSS_SELECTOR, ".addrDetail li:nth-of-type(3) span").text.replace("<br>", " ")

    data.append({"업체명": name, "주소": address, "전화번호": phone, "영업시간": hours})

df = pd.DataFrame(data)

print(df)

df2 = df

                업체명                           주소                전화번호  \
0          수원 서비스센터   경기 용인시 기흥구 중부대로 23-2 (영덕동)   Tel. 031-740-5100   
1          율현 서비스센터      서울 강남구 헌릉로745길 10 (율현동)   Tel. 02-6005-8100   
2       분당 백현 서비스센터   경기 성남시 분당구 대왕판교로 364 (백현동)   Tel. 031-779-7000   
3    성동(구.용답) 서비스센터  서울 성동구 자동차시장1길 104-65 (용답동)   Tel. 02-2244-5578   
4       대전 유성 서비스센터       대전 유성구 북유성대로 352 (반석동)   Tel. 042-359-6100   
5          성남 서비스센터     경기 성남시 수정구 여수대로 36 (시흥동)   Tel. 031-600-1600   
6          안성 서비스센터   경기 안성시 공도읍 서동대로 3976 (진사리)  Tel. 031-8094-6100   
7          성산 서비스센터         서울 마포구 모래내로 17 (성산동)    Tel. 02-309-3421   
8          논현 서비스센터         서울 강남구 언주로 617 (논현동)    Tel. 02-550-2100   
9          성수 서비스센터        서울 성동구 동일로 55 (성수동2가)    Tel. 02-460-3421   
10      분당 판교 서비스센터     경기 성남시 분당구 판교로 182 (판교동)   Tel. 031-750-1900   
11      방배 내방 서비스센터         서울 서초구 방배로 137 (방배동)    Tel. 02-580-0810   
12         부평 서비스센터         인천 부평구 길주로 398 (산곡동)   Tel. 032-200-

In [57]:
# 두 DataFrame을 아래 방향으로 결합
df_combined = pd.concat([df1, df2], ignore_index=True)

In [67]:
df = df_combined

In [69]:
df['주소'] = df['주소'].str.replace('특별시|광역시|특별자치도|특별자치시|<p>', '', regex=True)
df['주소'] = df['주소'].str.replace('서울시', '서울', regex=False)
df['주소'] = df['주소'].str.replace('경기도', '경기', regex=False)
df['주소'] = df['주소'].str.replace('강원도', '강원', regex=False)
df['주소'] = df['주소'].str.replace('충청북도', '충북', regex=False)
df['주소'] = df['주소'].str.replace('충청남도', '충남', regex=False)
df['주소'] = df['주소'].str.replace('전라북도', '전북', regex=False)
df['주소'] = df['주소'].str.replace('전라남도', '전남', regex=False)
df['주소'] = df['주소'].str.replace('경상북도', '경북', regex=False)
df['주소'] = df['주소'].str.replace('경상남도', '경남', regex=False)

# '시도' 열에 주소 첫 두 글자 추가
df['시도'] = df['주소'].str[:2]

# '시군구' 열에 첫 번째와 두 번째 띄어쓰기 사이의 텍스트 추출
df['시군구'] = df['주소'].str.extract(r'^\S+\s(\S+)')[0]

df['시도+시군구'] = df['시도'] + df['시군구']

In [73]:
df.to_excel('벤츠_최종.xlsx')