In [None]:
import json
from selenium import webdriver
from selenium.webdriver.common.by import By

def extract_category_keywords(business_numbers):
    """
    주어진 사업자 번호 리스트를 사용하여 각 사업자 번호의 카테고리 키워드를 추출하는 함수.
    
    Args:
        business_numbers (list): 사업자 번호의 리스트.
    
    Returns:
        dict: 각 사업자 번호와 관련된 카테고리 키워드를 포함한 딕셔너리.
    """
    # Selenium driver 설정
    driver = webdriver.Chrome()
    
    # 카테고리 키워드를 저장할 딕셔너리
    category_keywords_dict = {}

    # 리스트에 있는 모든 사업자 번호에 대해 반복 실행
    for business_number in business_numbers:
        # 사업자 번호 형식에서 "-" 제거 (URL에 넣을 때는 숫자만 필요)
        business_number_clean = business_number.replace("-", "")
        
        # 동적으로 URL 생성
        address = 'https://bizno.net/article/' + business_number_clean
        print(f"접속 중인 URL: {address}")

        # URL로 이동
        driver.get(address)

        # category_keywords 추출
        try:
            category_keywords = driver.find_element(By.XPATH, '/html/body/section[2]/div/div/div[1]/div[1]/div/table/tbody/tr[4]/td/p[3]').text
            print(f"사업자 번호 {business_number}의 카테고리 키워드: {category_keywords}")
            category_keywords_dict[business_number] = category_keywords
        except Exception as e:
            print(f"사업자 번호 {business_number}에 대한 정보를 찾을 수 없습니다. 오류: {e}")
            category_keywords_dict[business_number] = None

    # 드라이버 종료
    driver.quit()

    # 결과 반환
    return category_keywords_dict

def save_to_json(data, file_path):
    """
    데이터를 JSON 파일로 저장하는 함수.
    
    Args:
        data (dict): 저장할 데이터.
        file_path (str): 저장할 JSON 파일 경로.
    """
    with open(file_path, 'w', encoding='utf-8') as json_file:
        json.dump(data, json_file, ensure_ascii=False, indent=4)
    print(f"데이터가 {file_path}에 JSON 형식으로 저장되었습니다.")
    

# 함수 호출 및 결과 출력
category_keywords = extract_category_keywords(business_numbers)

# 추출한 카테고리 키워드가 성공적으로 있으면 JSON 파일로 저장
if category_keywords:
    json_file_path = 'category_keywords.json'
    save_to_json(category_keywords, json_file_path)
else:
    print("카테고리 키워드가 추출되지 않아 JSON 파일로 저장되지 않았습니다.")
