# 네이버 데이터랩 인기 검색어 설정 프로그램

## 프로그램 설명
네이버 데이터랩에서 카테고리를 선택하고 인기 검색어를 수집하여 엑셀 파일로 저장하는 프로그램입니다.

## 주요 기능
- 네이버 데이터랩 카테고리 선택 (분야1, 분야2 등)
- 인기 검색어 자동 수집
- 엑셀 파일 자동 저장 (날짜 포함)
- 검색어 순위 정보 수집

## 사용 방법
1. 프로그램 실행
2. 저장할 엑셀 파일 기본 이름 입력
3. 브라우저에서 카테고리 선택
4. 자동으로 검색어 수집 및 엑셀 저장

## 필요 라이브러리
- selenium: 웹 자동화
- openpyxl: 엑셀 파일 처리
- requests: HTTP 요청

## 주의사항
- 네이버 데이터랩 페이지 구조 변경 시 수정이 필요할 수 있습니다
- 카테고리는 브라우저에서 수동으로 선택해야 합니다

In [13]:
import requests
import json
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from openpyxl import Workbook
import time
import os
from datetime import datetime

# 현재 날짜를 yyyymmdd 형식으로 얻기
current_date = datetime.now().strftime("%Y%m%d")

# 사용자로부터 저장할 Excel 파일 기본 이름 입력받기
base_file_name = input("저장할 Excel 파일의 기본 이름을 입력하세요 (확장자 제외): ")

# 입력받은 파일 이름에 오늘 날짜 추가
excel_file_name = f"{base_file_name}_{current_date}.xlsx"

# 현재 작업 중인 폴더의 경로를 얻기
current_working_directory = os.getcwd()
file_path = os.path.join(current_working_directory, excel_file_name)  # 파일 경로 결합

# WebDriver 설정(Chrome 사용)
driver = webdriver.Chrome()

# Excel 설정
wb = Workbook()
ws = wb.create_sheet('검색어순위')
wb.remove(wb['Sheet'])  # 기본 생성된 시트 제거
# 컬럼에 '순위', '인기검색어', '기간', '카테고리' 추가
ws.append(['순위', '인기검색어', '기간', '카테고리'])

# 네이버 데이터랩 쇼핑 인사이트 페이지로 이동
driver.get("https://datalab.naver.com/shoppingInsight/sCategory.naver")

# 필요한 요소가 로드될 때까지 대기하는 WebDriverWait 인스턴스 생성
wait = WebDriverWait(driver, 10)

# 분야1 선택 : 드롭다운 및 옵션 선택 예시 (1번 옵션 선택)
dropdown1 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[1]/span')))
dropdown1.click()

# 가구인테리어(5),패션잡화(2) 선택
option1 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[1]/ul/li[2]')))
option1.click()
time.sleep(0.1)  # 드롭다운 선택 후 대기


"""
# 분야2 선택 :
dropdown2 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[2]/span')))
dropdown2.click()

# 추가 옵션 선택 (수예(16),모자(9),양말(11))
option2 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[2]/ul/li[11]/a')))
option2.click()
time.sleep(0.1)  # 드롭다운 선택 후 대기
"""

# 분야3선택 :
# dropdown3 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[3]/span'))) 
# dropdown3.click() 

# 예) 뜨개질(1), 수예용품/부자재(5)
# option3 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[3]/ul/li[5]/a'))) 
# option3.click()
# time.sleep(0.1)  # 드롭다운 선택 후 대기


# 분야4택 :
# dropdown4 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[4]/span'))) 
# dropdown4.click() 

# 뜨개실
# option4 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[1]/div/div[4]/ul/li[1]/a'))) 
# option4.click()
# time.sleep(1)  # 드롭다운 선택 후 대기

"""
##################################################################

# 기간 설정에서 "월간" 선택
# WebDriverWait를 사용해 "월간" 선택 버튼이 클릭 가능할 때까지 기다림

dropdown_period = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[1]/div/span')))
dropdown_period.click()


# "월간" 옵션 선택 (예: 월간이 목록에서 3번째 옵션이라면)
option_monthly = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[1]/div/ul/li[3]')))
option_monthly.click()

time.sleep(0.5)  # 드롭다운 선택 후 약간의 대기



##################################################################

# 기간 설정에서 "시작년" 선택
# WebDriverWait를 사용해 "월간" 선택 버튼이 클릭 가능할 때까지 기다림
# 2023년 선택

dropdown_period2 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[2]/span[1]/div[1]/span')))
dropdown_period2.click()


# "시작년도" 옵션 선택 (예: 월간이 목록에서 3번째 옵션이라면) 현재 2023년 선택

option_start_year = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[2]/span[1]/div[1]/ul/li[7]')))
option_start_year.click()

##################################################################

# 기간 설정에서 "종료년" 선택
# WebDriverWait를 사용해 "월간" 선택 버튼이 클릭 가능할 때까지 기다림  
# 2023년 선택

dropdown_period3 = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[2]/span[3]/div[1]/span')))
dropdown_period3.click()

# "종료년도" 옵션 선택 (예: 종료년도가 목록에서 1번째 옵션이라면) 현재 2023년 선택

option_end_year = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/div/div[2]/div[2]/span[3]/div[1]/ul/li[1]')))
option_end_year.click()


time.sleep(0.5)  # 드롭다운 선택 후 약간의 대기

####################################################################

"""

# 기기별, 성별, 연령 전체 선택
driver.find_element(By.XPATH, '//*[@id="18_device_0"]').click()
driver.find_element(By.XPATH, '//*[@id="19_gender_0"]').click()

# 연령대 선택
age_checkbox = driver.find_element(By.XPATH, '//*[@id="20_age_0"]')
driver.execute_script("arguments[0].scrollIntoView(true);", age_checkbox)
age_checkbox.click()

# 자바스크립트로 최상단으로 이동
driver.execute_script("window.scrollTo(0, 0)")

# 사용자로부터 엔터키 입력 대기
input("엔터키를 누르면 검색을 시작합니다...")

# '조회하기' 버튼 클릭
search_button = wait.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="content"]/div[2]/div/div[1]/div/a')))
search_button.click()

# "기간"과 "카테고리" 정보 스크래핑
category = driver.find_element(By.CSS_SELECTOR, 'h4.insite_title strong').text
period = driver.find_element(By.CSS_SELECTOR, 'span.title_sub').text

# 결과 스크래핑 및 Excel 파일 저장
for i in range(25):  # 페이지 수 조정
    # 페이지 로딩 대기
    time.sleep(0.5)
    
    for j in range(1, 21):  # 한 페이지당 최대 20개 아이템
        try:
            path = f'//*[@id="content"]/div[2]/div/div[2]/div[2]/div/div/div[1]/ul/li[{j}]/a'
            result = driver.find_element(By.XPATH, path).text
            result_data = result.split('\n')
            result_data[0] = int(result_data[0])  # 순위를 숫자 형식으로 변환
            # 카테고리와 기간 정보 추가
            result_data.append(period)
            result_data.append(category)
            print(result_data)
            ws.append(result_data)
        except Exception as e:
            print(f"Error occurred while scraping data: {e}")
    
    # 다음 페이지로 넘어가는 버튼 클릭 로직
    try:
        next_button = driver.find_element(By.XPATH, '//*[@id="content"]/div[2]/div/div[2]/div[2]/div/div/div[2]/div/a[2]')
        next_button.click()
        time.sleep(1)  # 페이지 로딩 대기
    except Exception as e:
        print(f"Error occurred while clicking next button: {e}")
        break

# 파일 저장
wb.save(file_path)
wb.close()

# 작업 완료 후, 드라이버 종료
driver.quit()

# 저장된 파일 열기
os.startfile(file_path)

print(f"'{excel_file_name}' 파일이 현재 폴더에 저장되었습니다.")



저장할 Excel 파일의 기본 이름을 입력하세요 (확장자 제외): 1
엔터키를 누르면 검색을 시작합니다...1
[1, '크록스', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[2, '나이키운동화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[3, '어그슬리퍼', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[4, '뉴발란스운동화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[5, '운동화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[6, '캐리어', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[7, '백팩', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[8, '스케쳐스운동화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[9, '크로스백', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[10, '여성로퍼', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[11, '카드지갑', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[12, '아디다스운동화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[13, '안전화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[14, '런닝화', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[15, '아디다스삼바', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[16, '르무통', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[17, '양말', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[18, '에코백', '2024.09.20. ~ 2024.10.20.', '패션잡화']
[19, '뉴발란스530', '2024.09.20. ~ 2024.10.20.',