### 패키치 설치

In [None]:
!pip install numpy pandas selenium bs4 requests tqdm

### 라이브러리 임포트

In [40]:
import pandas as pd
import numpy as np

# chromedriver
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.service import Service
from selenium.common.exceptions import NoSuchElementException


import requests
import time
import re
from tqdm import tqdm
from bs4 import BeautifulSoup
import csv
from tqdm import tqdm
from datetime import datetime
import os

### 웹드라이버 창 열기

In [92]:
service = Service("/Users/bykwon/Downloads/chromedriver-mac-arm64 3/chromedriver") # 여러분의 chromedriver 경로로 수정해주세요!
driver = webdriver.Chrome(service=service)
driver.maximize_window()

In [93]:
# 대상 URL로 이동
url = "https://gift.kakao.com/page/code/life_funny"
driver.get(url)

In [None]:
# 무한 스크롤을 통한 데이터 로드
target_count = 100  # 크롤링하려는 상품 수
scroll_pause_time = 0.5

# 크롤링된 상품 링크를 저장할 리스트
product_links = set()

while len(product_links) < target_count:
    # 현재 페이지 HTML 파싱
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")

    # id가 "promotion_prdList_3"로 시작하는 섹션 탐색
    sections = soup.find_all("div", id=re.compile("^promotion_prdList_3"))
    for section in sections:
        items = section.find_all("a", class_="link_thumb")
        for item in items:
            link = item.get("href")
            if link not in product_links:
                product_links.add('https://gift.kakao.com'+link)

    # 목표 수량 도달 시 루프 종료
    if len(product_links) >= target_count:
        break

    # 스크롤 다운
    body = driver.find_element(By.TAG_NAME, 'body')
    body.send_keys(Keys.PAGE_DOWN)
    time.sleep(scroll_pause_time)

    # 상품 수 출력 (디버깅용)
    print(f"중복 없는 상품 수: {len(product_links)}")

# 결과 출력
print("수집된 상품 링크:")
for link in product_links:
    print(link)
print(f"총 {len(product_links)}개의 상품 링크 수집 완료")

### 필요한 함수 정의

In [9]:
def crawl_info(link):
    # 동적 크롤링을 위해 selenium으로 페이지를 엽니다.
    driver.get(link)
    time.sleep(2)

    # 페이지 소스를 읽어 BeautifulSoup으로 파싱합니다.
    html = driver.page_source
    soup = BeautifulSoup(html, 'html.parser')

    # 상품 정보를 담을 딕셔너리를 생성합니다.
    # product_info = {}

    # 상품 정보를 추출합니다.
    name = soup.select_one('h2.tit_subject').text.strip()
    num_review = soup.select_one('span.txt_desc').text.strip()
    num_review = re.sub(r'[^\d]', '', num_review)
    price = soup.select_one('span.txt_total').text.strip()
    price = re.sub(r'[^\d]', '', price)
    heart = soup.select_one('span.count_wishes').text.strip()
    heart = re.sub(r'[^\d]', '', heart)
    brand = soup.select_one('span.txt_shopname').text.strip()


    return {'name': name, 'num_review': num_review, 'price': price, 'heart': heart, 'brand': brand}

In [14]:
def crawl_review(link):
    cutoff = datetime.strptime("2024-09-30", "%Y-%m-%d")

    reviews = []

    if driver.current_url != link:
        driver.get(link)

    time.sleep(1)
    
    driver.find_element(value="/html/body/app-root/app-view-wrapper/div/div/main/article/app-home/div/div[1]/app-contents/app-product-detail-tab/div/ul/li[2]/a/span", by=By.XPATH).click()
    time.sleep(1)
    try:
        driver.find_element(value="/html/body/app-root/app-view-wrapper/div/div/main/article/app-home/div/div[1]/app-contents/app-product-detail-tab/div/app-info-review/div/div/div[1]/ul/li[1]/a", by=By.XPATH).click()
        time.sleep(1)
    except:
        print("리뷰 없음")
        return None, reviews
    html = driver.page_source
    soup = BeautifulSoup(html, 'html.parser')

    # 만족도 정보 크롤링
    try:
        satisfaction = soup.select_one('em.txt_point span.txt_percent').text.strip()
    except:
        satisfaction = None

    # 리뷰 정보 크롤링
    reviews = []
    cnt = 0
    flag = 0

    while True:
        # 페이지 HTML 가져오기
        html = driver.page_source
        time.sleep(1)
        soup = BeautifulSoup(html, 'html.parser')

        # 리뷰 항목 선택
        review_items = soup.select('app-view-review-item')  # 각 리뷰를 감싸는 요소
        if review_items == []:
            return satisfaction, reviews
        review_items = review_items[cnt:]
        

        for review in review_items:
            date_text = review.select('.txt_reviewinfo')[1].text.strip()
            review_date = datetime.strptime(date_text, "%Y.%m.%d")

            # 날짜 기준 확인
            if review_date < cutoff:
                flag = 1
                break

            # 별점 추출
            rating_text = review.select_one('.area_score').text.strip()
            rating = rating_text.split(' ')[-1]  # "별점 4점 만점 중 4점" -> "4점"

            # 내용 추출
            content = review.select_one('.txt_review').text.strip()

            who = review.select('.txt_hash')[0].text.strip()
            what = review.select('.txt_hash')[1].text.strip()

            # 리뷰 데이터 저장
            reviews.append({
                "datetime": review_date,
                "rating": rating,
                "content": content,
                "who": who,
                "what": what
            })

        # 다음 페이지 이동 전 저장된 리뷰 수 확인 > 다음에 새로 로딩될 때에는 이전 페이지의 리뷰가 중복되지 않도록
        print(f"리뷰 수: {len(reviews)}")
        cnt = len(reviews)
        if flag == 1 or reviews[-1]['datetime'] <= cutoff:
            break
        print(reviews[-1]['datetime'], cutoff)


        # 다음 페이지로 이동
        try:
            driver.find_element(value="/html/body/app-root/app-view-wrapper/div/div/main/article/app-home/div/div[1]/app-contents/app-product-detail-tab/div/app-info-review/div/div/div[2]/button", by=By.XPATH).click()
        except:
            print("리뷰 페이지 마지막")
            break

    return satisfaction, reviews
    
    # <span class="txt_gage">90%</span>
    # /html/body/app-root/app-view-wrapper/div/div/main/article/app-home/div/div[1]/app-contents/app-product-detail-tab/div/app-info-review/div/div/div[2]/button
    # /html/body/app-root/app-view-wrapper/div/div/main/article/app-home/div/div[1]/app-contents/app-product-detail-tab/div/app-info-review/div/div/div[2]/button

### 폴더 생성

In [87]:
os.makedirs("./웃긴선물", exist_ok=True)

### 실행

In [88]:
info_dic = {}
i = 0
for link in tqdm(product_links):
    time.sleep(2)
    # info 
    try:
        info = crawl_info(link) 
    except Exception as e:
        print(e)
        # i += 1
        continue
    time.sleep(1)
    # review
    satisfaction, review = crawl_review(link)

    # 데이터 저장
    info['satisfaction'] = satisfaction
    info['link'] = link


    # 리뷰가 없는 상품은 건너뜁니다.
    if info['num_review'] == '0' or info['num_review'] == 0:
        # i += 1
        continue


    # info_dic에 상품 정보 저장
    info_dic[info['name']] = info

    # 각 상품별로 리뷰 모음 딕셔너리가 생성됩니다.
    # 저장 -> csv
    review_df = pd.DataFrame(review)
    review_df['product'] = info['name']

    review_df.to_csv(f"./웃긴선물/{i}.csv", index=False)
    i += 1

    # 100개 크롤링 후 종료
    if len(info_dic) >= 100:
        break

info_df = pd.DataFrame(info_dic).T
info_df.to_csv("./웃긴선물/metadata.csv", index=False)

  1%|          | 1/94 [00:09<15:14,  9.83s/it]

리뷰 수: 4
리뷰 수: 20
2024-12-30 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-30 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-11-20 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-10-25 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-10-08 00:00:00 2024-09-30 00:00:00


  2%|▏         | 2/94 [00:27<22:31, 14.70s/it]

리뷰 수: 110


  3%|▎         | 3/94 [00:37<18:50, 12.42s/it]

리뷰 수: 3


  4%|▍         | 4/94 [00:48<17:32, 11.69s/it]

리뷰 수: 5


  5%|▌         | 5/94 [00:58<16:25, 11.08s/it]

리뷰 수: 17
2024-10-23 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


  6%|▋         | 6/94 [01:08<15:41, 10.69s/it]

리뷰 수: 17


  7%|▋         | 7/94 [01:18<15:12, 10.48s/it]

리뷰 수: 7


  9%|▊         | 8/94 [01:28<14:48, 10.33s/it]

리뷰 수: 11
리뷰 수: 20
2024-10-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-09 00:00:00 2024-09-30 00:00:00


 10%|▉         | 9/94 [01:40<15:38, 11.04s/it]

리뷰 수: 20
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00


 11%|█         | 10/94 [01:53<16:05, 11.50s/it]

리뷰 수: 40
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 12%|█▏        | 11/94 [02:03<15:13, 11.01s/it]

리뷰 수: 7


 13%|█▎        | 12/94 [02:13<14:39, 10.73s/it]

리뷰 수: 14


 14%|█▍        | 13/94 [02:23<14:07, 10.47s/it]

리뷰 수: 10


 15%|█▍        | 14/94 [02:33<13:47, 10.34s/it]

리뷰 수: 3
리뷰 수: 20
2024-12-05 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-05 00:00:00 2024-09-30 00:00:00


 16%|█▌        | 15/94 [02:45<14:33, 11.05s/it]

리뷰 수: 36
리뷰 수: 20
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2025-01-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2025-01-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2025-01-02 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2025-01-02 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-12-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2024-12-24 00:00:00 2024-09-30 00:00:00
리뷰 수: 220
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 240
2024-12-20 00:00:00 2024-09-30 00:00:00
리뷰 수: 260
2024-12-18 00:00:00 2024-09-30 00:00:00
리뷰 수: 280
2024-12-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 300
2024-12-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 320
2024-12-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 340
2024-12-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 360
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 380
2024-11-30 00:00:00 2024-09-30 00:00

 17%|█▋        | 16/94 [05:03<1:04:01, 49.25s/it]

리뷰 수: 869


 18%|█▊        | 17/94 [05:13<48:00, 37.41s/it]  

리뷰 수: 12


 19%|█▉        | 18/94 [05:23<36:54, 29.14s/it]

리뷰 수: 1
리뷰 수: 20
2024-11-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-04 00:00:00 2024-09-30 00:00:00


 20%|██        | 19/94 [05:35<30:06, 24.08s/it]

리뷰 수: 29
리뷰 수: 20
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-21 00:00:00 2024-09-30 00:00:00


 21%|██▏       | 20/94 [05:48<25:21, 20.56s/it]

리뷰 수: 33


 22%|██▏       | 21/94 [05:58<21:05, 17.33s/it]

리뷰 수: 5


 23%|██▎       | 22/94 [06:08<18:13, 15.18s/it]

리뷰 수: 8
리뷰 수: 20
2025-01-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-11-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-10-29 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-10-09 00:00:00 2024-09-30 00:00:00


 24%|██▍       | 23/94 [06:26<18:58, 16.04s/it]

리뷰 수: 103
리뷰 수: 20
2024-11-28 00:00:00 2024-09-30 00:00:00


 26%|██▌       | 24/94 [06:37<17:01, 14.59s/it]

리뷰 수: 20
2024-11-28 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 27%|██▋       | 25/94 [06:47<15:08, 13.17s/it]

리뷰 수: 7


 28%|██▊       | 26/94 [06:51<11:56, 10.54s/it]

Alert Text: 로그인이 필요한 메뉴입니다.
로그인하시겠습니까?
Message: unexpected alert open: {Alert text : 로그인이 필요한 메뉴입니다.
로그인하시겠습니까?}
  (Session info: chrome=132.0.6834.83)
Stacktrace:
0   chromedriver                        0x000000010099e138 cxxbridge1$str$ptr + 3653888
1   chromedriver                        0x0000000100996988 cxxbridge1$str$ptr + 3623248
2   chromedriver                        0x00000001003fc968 cxxbridge1$string$len + 89228
3   chromedriver                        0x000000010047a230 cxxbridge1$string$len + 603476
4   chromedriver                        0x0000000100435564 cxxbridge1$string$len + 321672
5   chromedriver                        0x00000001004361b4 cxxbridge1$string$len + 324824
6   chromedriver                        0x0000000100968fc0 cxxbridge1$str$ptr + 3436424
7   chromedriver                        0x000000010096c2dc cxxbridge1$str$ptr + 3449508
8   chromedriver                        0x000000010094fe60 cxxbridge1$str$ptr + 3333672
9   chromedriver                     

 29%|██▊       | 27/94 [07:01<11:30, 10.31s/it]

리뷰 수: 15


 30%|██▉       | 28/94 [07:11<11:09, 10.14s/it]

리뷰 수: 3
2024-11-17 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 31%|███       | 29/94 [07:21<10:51, 10.03s/it]

리뷰 수: 4
2024-11-25 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막
리뷰 수: 20
2024-12-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-22 00:00:00 2024-09-30 00:00:00


 32%|███▏      | 30/94 [07:34<11:54, 11.16s/it]

리뷰 수: 58


 33%|███▎      | 31/94 [07:44<11:20, 10.80s/it]

리뷰 수: 18
리뷰 수: 20
2024-11-29 00:00:00 2024-09-30 00:00:00


 34%|███▍      | 32/94 [07:55<11:13, 10.86s/it]

리뷰 수: 20
2024-11-29 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 35%|███▌      | 33/94 [08:05<10:47, 10.62s/it]

리뷰 수: 11


 36%|███▌      | 34/94 [08:15<10:26, 10.44s/it]

리뷰 수: 6


 37%|███▋      | 35/94 [08:25<10:07, 10.29s/it]

리뷰 수: 17


 38%|███▊      | 36/94 [08:35<09:47, 10.14s/it]

리뷰 수: 1
2025-01-04 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막
리뷰 수: 20
2024-10-25 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-25 00:00:00 2024-09-30 00:00:00


 39%|███▉      | 37/94 [08:48<10:16, 10.81s/it]

리뷰 수: 28


 40%|████      | 38/94 [08:57<09:47, 10.50s/it]

리뷰 수: 3


 41%|████▏     | 39/94 [09:05<08:50,  9.64s/it]

리뷰 없음


 43%|████▎     | 40/94 [09:15<08:42,  9.67s/it]

리뷰 수: 0


 44%|████▎     | 41/94 [09:25<08:35,  9.73s/it]

리뷰 수: 1
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 45%|████▍     | 42/94 [09:34<08:29,  9.79s/it]

리뷰 수: 12
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 46%|████▌     | 43/94 [09:44<08:21,  9.83s/it]

리뷰 수: 13
리뷰 수: 20
2024-12-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-10 00:00:00 2024-09-30 00:00:00


 47%|████▋     | 44/94 [09:57<08:48, 10.57s/it]

리뷰 수: 39
리뷰 수: 20
2024-12-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-11-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-10-10 00:00:00 2024-09-30 00:00:00


 48%|████▊     | 45/94 [10:15<10:31, 12.88s/it]

리뷰 수: 108


 49%|████▉     | 46/94 [10:25<09:34, 11.97s/it]

리뷰 수: 14
2024-10-29 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 50%|█████     | 47/94 [10:35<08:54, 11.37s/it]

리뷰 수: 16
2024-11-13 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 51%|█████     | 48/94 [10:45<08:24, 10.97s/it]

리뷰 수: 0
리뷰 수: 20
2024-11-23 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-23 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-10-18 00:00:00 2024-09-30 00:00:00


 52%|█████▏    | 49/94 [10:59<08:52, 11.83s/it]

리뷰 수: 43
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2025-01-13 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2025-01-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2025-01-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2025-01-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 220
2025-01-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 240
2025-01-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 260
2025-01-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 280
2025-01-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 300
2025-01-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 320
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 340
2025-01-06 00:00:00 2024-09-30 00:00:00
리뷰 수: 360
2025-01-05 00:00:00 2024-09-30 00:00:00
리뷰 수: 380
2025-01-04 00:00:00 2024-09-30 00:00

 53%|█████▎    | 50/94 [13:51<43:58, 59.97s/it]

리뷰 수: 1000
2024-12-09 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 54%|█████▍    | 51/94 [14:01<32:13, 44.97s/it]

리뷰 수: 3


 55%|█████▌    | 52/94 [14:11<24:06, 34.44s/it]

리뷰 수: 13
리뷰 수: 20
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2025-01-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2025-01-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2025-01-01 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2024-12-30 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-12-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-12-27 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2024-12-25 00:00:00 2024-09-30 00:00:00
리뷰 수: 220
2024-12-24 00:00:00 2024-09-30 00:00:00
리뷰 수: 240
2024-12-22 00:00:00 2024-09-30 00:00:00
리뷰 수: 260
2024-12-20 00:00:00 2024-09-30 00:00:00
리뷰 수: 280
2024-12-18 00:00:00 2024-09-30 00:00:00
리뷰 수: 300
2024-12-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 320
2024-12-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 340
2024-12-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 360
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 380
2024-12-10 00:00:00 2024-09-30 00:00

 56%|█████▋    | 53/94 [16:33<45:36, 66.76s/it]

리뷰 수: 809
2024-10-08 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 57%|█████▋    | 54/94 [16:43<33:07, 49.69s/it]

리뷰 수: 4


 59%|█████▊    | 55/94 [16:53<24:31, 37.73s/it]

리뷰 수: 12


 60%|█████▉    | 56/94 [17:02<18:34, 29.34s/it]

리뷰 수: 4


 61%|██████    | 57/94 [17:12<14:29, 23.49s/it]

리뷰 수: 5


 62%|██████▏   | 58/94 [17:22<11:39, 19.42s/it]

리뷰 수: 4


 63%|██████▎   | 59/94 [17:32<09:40, 16.58s/it]

리뷰 수: 9


 64%|██████▍   | 60/94 [17:42<08:16, 14.61s/it]

리뷰 수: 7
리뷰 수: 20
2024-12-05 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-05 00:00:00 2024-09-30 00:00:00


 65%|██████▍   | 61/94 [17:55<07:42, 14.03s/it]

리뷰 수: 33


 66%|██████▌   | 62/94 [18:05<06:53, 12.91s/it]

리뷰 수: 14
2024-11-29 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 67%|██████▋   | 63/94 [18:15<06:12, 12.01s/it]

리뷰 수: 19
리뷰 수: 20
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-21 00:00:00 2024-09-30 00:00:00


 68%|██████▊   | 64/94 [18:28<06:07, 12.24s/it]

리뷰 수: 39


 69%|██████▉   | 65/94 [18:38<05:34, 11.53s/it]

리뷰 수: 5
리뷰 수: 20
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-11-18 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-10-24 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-10-08 00:00:00 2024-09-30 00:00:00


 70%|███████   | 66/94 [18:56<06:20, 13.58s/it]

리뷰 수: 118
리뷰 수: 20
2024-12-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-10-30 00:00:00 2024-09-30 00:00:00


 71%|███████▏  | 67/94 [19:10<06:08, 13.65s/it]

리뷰 수: 57
리뷰 수: 20
2024-10-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-11 00:00:00 2024-09-30 00:00:00


 72%|███████▏  | 68/94 [19:22<05:44, 13.26s/it]

리뷰 수: 22
리뷰 수: 20
2024-11-19 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-19 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-10-11 00:00:00 2024-09-30 00:00:00


 73%|███████▎  | 69/94 [19:36<05:34, 13.39s/it]

리뷰 수: 46


 74%|███████▍  | 70/94 [19:46<04:57, 12.38s/it]

리뷰 수: 4


 76%|███████▌  | 71/94 [19:56<04:27, 11.62s/it]

리뷰 수: 12
리뷰 수: 20
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-01 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-12-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-11-21 00:00:00 2024-09-30 00:00:00


 77%|███████▋  | 72/94 [20:15<05:02, 13.75s/it]

리뷰 수: 120
2024-11-09 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 78%|███████▊  | 73/94 [20:24<04:24, 12.59s/it]

리뷰 수: 12


 79%|███████▊  | 74/94 [20:34<03:55, 11.80s/it]

리뷰 수: 5


 80%|███████▉  | 75/94 [20:42<03:20, 10.53s/it]

리뷰 없음


 81%|████████  | 76/94 [20:52<03:06, 10.34s/it]

리뷰 수: 16
2024-11-13 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 82%|████████▏ | 77/94 [21:02<02:54, 10.24s/it]

리뷰 수: 15


 83%|████████▎ | 78/94 [21:12<02:41, 10.12s/it]

리뷰 수: 19


 84%|████████▍ | 79/94 [21:22<02:32, 10.14s/it]

리뷰 수: 1


 85%|████████▌ | 80/94 [21:32<02:20, 10.07s/it]

리뷰 수: 18


 86%|████████▌ | 81/94 [21:42<02:10, 10.04s/it]

리뷰 수: 6


 87%|████████▋ | 82/94 [21:52<02:00, 10.03s/it]

리뷰 수: 2
리뷰 수: 20
2024-12-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-10-07 00:00:00 2024-09-30 00:00:00


 88%|████████▊ | 83/94 [22:07<02:06, 11.53s/it]

리뷰 수: 62
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2025-01-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2025-01-06 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2024-12-30 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2024-12-27 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-12-27 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-12-23 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 220
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 240
2024-12-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 260
2024-12-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 280
2024-12-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 300
2024-12-05 00:00:00 2024-09-30 00:00:00
리뷰 수: 320
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 340
2024-11-30 00:00:00 2024-09-30 00:00:00
리뷰 수: 360
2024-11-27 00:00:00 2024-09-30 00:00:00
리뷰 수: 380
2024-11-25 00:00:00 2024-09-30 00:00

 89%|████████▉ | 84/94 [24:17<07:51, 47.16s/it]

리뷰 수: 859


 90%|█████████ | 85/94 [24:27<05:23, 35.97s/it]

리뷰 수: 10
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 91%|█████████▏| 86/94 [24:37<03:45, 28.14s/it]

리뷰 수: 13
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-12-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-12-21 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-11-20 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2024-11-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2024-11-13 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-11-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-11-06 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2024-11-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 220
2024-11-01 00:00:00 2024-09-30 00:00:00
리뷰 수: 240
2024-10-29 00:00:00 2024-09-30 00:00:00
리뷰 수: 260
2024-10-23 00:00:00 2024-09-30 00:00:00
리뷰 수: 280
2024-10-18 00:00:00 2024-09-30 00:00:00
리뷰 수: 300
2024-10-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 320
2024-10-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 340
2024-10-08 00:00:00 2024-09-30 00:00:00
리뷰 수: 360
2024-10-03 00:00:00 2024-09-30 00:00:00


 93%|█████████▎| 87/94 [25:23<03:54, 33.50s/it]

리뷰 수: 374
리뷰 수: 20
2024-10-12 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-12 00:00:00 2024-09-30 00:00:00


 94%|█████████▎| 88/94 [25:35<02:42, 27.14s/it]

리뷰 수: 21


 95%|█████████▍| 89/94 [25:45<01:49, 21.96s/it]

리뷰 수: 10


 96%|█████████▌| 90/94 [25:55<01:13, 18.45s/it]

리뷰 수: 1
리뷰 수: 20
2024-10-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-26 00:00:00 2024-09-30 00:00:00


 97%|█████████▋| 91/94 [26:07<00:49, 16.58s/it]

리뷰 수: 28


 98%|█████████▊| 92/94 [26:17<00:29, 14.59s/it]

리뷰 수: 16
리뷰 수: 20
2024-11-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-07 00:00:00 2024-09-30 00:00:00


 99%|█████████▉| 93/94 [26:30<00:13, 13.90s/it]

리뷰 수: 25


100%|██████████| 94/94 [26:40<00:00, 17.02s/it]

리뷰 수: 6





### (탭별로)

In [110]:
# 링크 수집
# 무한 스크롤을 통한 데이터 로드
target_count = 30 # 크롤링하려는 상품 수
scroll_pause_time = 0.5

# 크롤링된 상품 링크를 저장할 리스트
product_links = set()

while len(product_links) < target_count:
    # 현재 페이지 HTML 파싱
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")

    # id가 "promotion_prdList_5"로 시작하는 섹션 탐색
    sections = soup.find_all("div", id=re.compile("^promotion_prdList_210"))
    for section in sections:
        items = section.find_all("a", class_="link_thumb")
        for item in items:
            link = item.get("href")
            if link not in product_links:
                product_links.add('https://gift.kakao.com'+link)

    # 목표 수량 도달 시 루프 종료
    if len(product_links) >= target_count:
        break

    # 스크롤 다운
    body = driver.find_element(By.TAG_NAME, 'body')
    body.send_keys(Keys.PAGE_DOWN)
    time.sleep(scroll_pause_time)

    # 상품 수 출력 (디버깅용)
    print(f"중복 없는 상품 수: {len(product_links)}")

# 결과 출력
print("수집된 상품 링크:")
for link in product_links:
    print(link)
print(f"총 {len(product_links)}개의 상품 링크 수집 완료")

# 저장할 폴더
os.makedirs(f"./연인/기념일", exist_ok=True)

info_dic = {}
i = 0

for link in tqdm(product_links):
    time.sleep(2)
        # info 
    try:
        info = crawl_info(link) 
    except Exception as e:
        print(e)
        # i += 1
        continue
    time.sleep(1)
    # review
    satisfaction, review = crawl_review(link)

    # 데이터 저장
    info['satisfaction'] = satisfaction
    info['link'] = link


    # 리뷰가 없는 상품은 건너뜁니다.
    if info['num_review'] == '0' or info['num_review'] == 0:
        # i += 1
        continue


    # info_dic에 상품 정보 저장
    info_dic[info['name']] = info

    # 각 상품별로 리뷰 모음 딕셔너리가 생성됩니다.
    # 저장 -> csv
    review_df = pd.DataFrame(review)
    review_df['product'] = info['name']
    review_df['link'] = info['link']

    review_df.to_csv(f"연인/기념일/{i}.csv", index=False)
    i += 1

    # 100개 크롤링 후 종료
    if len(info_dic) >= 40:
        break

info_df = pd.DataFrame(info_dic).T
info_df.to_csv(f"연인/기념일/metadata.csv", index=False)

중복 없는 상품 수: 20
중복 없는 상품 수: 20
중복 없는 상품 수: 20
중복 없는 상품 수: 20
중복 없는 상품 수: 20
수집된 상품 링크:
https://gift.kakao.com/product/749180?banner_id=747&campaign_code=null
https://gift.kakao.com/product/6376669?banner_id=747&campaign_code=null
https://gift.kakao.com/product/7462331?banner_id=747&campaign_code=null
https://gift.kakao.com/product/37794?banner_id=747&campaign_code=null
https://gift.kakao.com/product/5827254?banner_id=747&campaign_code=null
https://gift.kakao.com/product/10483683?banner_id=747&campaign_code=null
https://gift.kakao.com/product/2324542?banner_id=747&campaign_code=null
https://gift.kakao.com/product/9457951?banner_id=747&campaign_code=null
https://gift.kakao.com/product/10777533?banner_id=747&campaign_code=null
https://gift.kakao.com/product/10669211?banner_id=747&campaign_code=null
https://gift.kakao.com/product/10969889?banner_id=747&campaign_code=null
https://gift.kakao.com/product/10674544?banner_id=747&campaign_code=null
https://gift.kakao.com/product/9664955?banner_id

  2%|▎         | 1/40 [00:09<06:26,  9.92s/it]

리뷰 수: 5


  5%|▌         | 2/40 [00:19<06:14,  9.86s/it]

리뷰 수: 5


  8%|▊         | 3/40 [00:29<06:05,  9.88s/it]

리뷰 수: 3
리뷰 수: 20
2024-10-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-09 00:00:00 2024-09-30 00:00:00


 10%|█         | 4/40 [00:41<06:29, 10.83s/it]

리뷰 수: 20


 12%|█▎        | 5/40 [00:51<06:08, 10.51s/it]

리뷰 수: 2
리뷰 수: 20
2025-01-02 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-02 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-28 00:00:00 2024-09-30 00:00:00


 15%|█▌        | 6/40 [01:05<06:35, 11.63s/it]

리뷰 수: 60
2024-10-23 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 18%|█▊        | 7/40 [01:15<06:04, 11.04s/it]

리뷰 수: 0
리뷰 수: 20
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-06 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-10-15 00:00:00 2024-09-30 00:00:00


 20%|██        | 8/40 [01:30<06:35, 12.35s/it]

리뷰 수: 71


 22%|██▎       | 9/40 [01:40<05:58, 11.56s/it]

리뷰 수: 12
2024-11-22 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막
리뷰 수: 20
2025-01-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-10 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-12-25 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2024-12-19 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2024-12-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-12-11 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-12-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 200
2024-12-04 00:00:00 2024-09-30 00:00:00


 25%|██▌       | 10/40 [02:07<08:14, 16.48s/it]

리뷰 수: 220
2024-11-26 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-17 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2025-01-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2025-01-11 00:00:00 2024-09-30 00:00:00


 28%|██▊       | 11/40 [02:23<07:47, 16.13s/it]

리뷰 수: 80
2025-01-07 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막
리뷰 수: 20
2024-11-29 00:00:00 2024-09-30 00:00:00


 30%|███       | 12/40 [02:34<06:48, 14.60s/it]

리뷰 수: 20
2024-11-29 00:00:00 2024-09-30 00:00:00
리뷰 페이지 마지막


 32%|███▎      | 13/40 [02:44<05:55, 13.18s/it]

리뷰 수: 2
리뷰 수: 20
2024-11-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-10-14 00:00:00 2024-09-30 00:00:00


 35%|███▌      | 14/40 [02:58<05:48, 13.40s/it]

리뷰 수: 50


 38%|███▊      | 15/40 [03:08<05:07, 12.31s/it]

리뷰 수: 0
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-31 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-13 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-12-09 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-12-06 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-12-05 00:00:00 2024-09-30 00:00:00
리뷰 수: 120
2024-12-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 140
2024-12-03 00:00:00 2024-09-30 00:00:00
리뷰 수: 160
2024-11-29 00:00:00 2024-09-30 00:00:00
리뷰 수: 180
2024-11-14 00:00:00 2024-09-30 00:00:00


 40%|████      | 16/40 [03:33<06:31, 16.31s/it]

리뷰 수: 192


 42%|████▎     | 17/40 [03:43<05:31, 14.40s/it]

리뷰 수: 9


 45%|████▌     | 18/40 [03:53<04:47, 13.05s/it]

리뷰 수: 5
리뷰 수: 20
2024-10-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-26 00:00:00 2024-09-30 00:00:00


 48%|████▊     | 19/40 [04:05<04:30, 12.87s/it]

리뷰 수: 27


 50%|█████     | 20/40 [04:15<03:58, 11.93s/it]

리뷰 수: 1
리뷰 수: 20
2024-12-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-07 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-10-23 00:00:00 2024-09-30 00:00:00


 52%|█████▎    | 21/40 [04:29<03:57, 12.49s/it]

리뷰 수: 55


 55%|█████▌    | 22/40 [04:39<03:30, 11.69s/it]

리뷰 수: 1


 57%|█████▊    | 23/40 [04:49<03:09, 11.15s/it]

리뷰 수: 10


 60%|██████    | 24/40 [04:59<02:52, 10.79s/it]

리뷰 수: 3


 62%|██████▎   | 25/40 [05:09<02:38, 10.59s/it]

리뷰 수: 17


 65%|██████▌   | 26/40 [05:19<02:25, 10.40s/it]

리뷰 수: 10
리뷰 수: 20
2024-12-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-28 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-26 00:00:00 2024-09-30 00:00:00


 68%|██████▊   | 27/40 [05:32<02:28, 11.39s/it]

리뷰 수: 53


 70%|███████   | 28/40 [05:42<02:10, 10.92s/it]

리뷰 수: 10
리뷰 수: 20
2025-01-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2025-01-04 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-12-13 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-11-27 00:00:00 2024-09-30 00:00:00
리뷰 수: 80
2024-10-26 00:00:00 2024-09-30 00:00:00
리뷰 수: 100
2024-10-02 00:00:00 2024-09-30 00:00:00


 72%|███████▎  | 29/40 [06:01<02:24, 13.17s/it]

리뷰 수: 101
리뷰 수: 20
2024-11-13 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-13 00:00:00 2024-09-30 00:00:00


 75%|███████▌  | 30/40 [06:13<02:08, 12.89s/it]

리뷰 수: 27


 78%|███████▊  | 31/40 [06:23<01:47, 11.98s/it]

리뷰 수: 8
리뷰 수: 20
2024-12-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-15 00:00:00 2024-09-30 00:00:00
리뷰 수: 60
2024-10-22 00:00:00 2024-09-30 00:00:00


 80%|████████  | 32/40 [06:38<01:43, 12.96s/it]

리뷰 수: 73


 82%|████████▎ | 33/40 [06:48<01:23, 11.98s/it]

리뷰 수: 0


 85%|████████▌ | 34/40 [06:58<01:08, 11.34s/it]

리뷰 수: 5
리뷰 수: 20
2024-12-19 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-12-19 00:00:00 2024-09-30 00:00:00
리뷰 수: 40
2024-11-08 00:00:00 2024-09-30 00:00:00


 88%|████████▊ | 35/40 [07:11<01:00, 12.05s/it]

리뷰 수: 57


 90%|█████████ | 36/40 [07:21<00:45, 11.44s/it]

리뷰 수: 8
리뷰 수: 20
2024-11-16 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-11-16 00:00:00 2024-09-30 00:00:00


 92%|█████████▎| 37/40 [07:34<00:35, 11.74s/it]

리뷰 수: 38
리뷰 수: 20
2024-10-14 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-14 00:00:00 2024-09-30 00:00:00


 95%|█████████▌| 38/40 [07:46<00:23, 11.97s/it]

리뷰 수: 22


 98%|█████████▊| 39/40 [07:56<00:11, 11.32s/it]

리뷰 수: 1
리뷰 수: 20
2024-10-18 00:00:00 2024-09-30 00:00:00
리뷰 수: 20
2024-10-18 00:00:00 2024-09-30 00:00:00


 98%|█████████▊| 39/40 [08:08<00:12, 12.54s/it]

리뷰 수: 21



