In [19]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

headers = {'User-Agent': 'Mozilla/5.0'}
base_url = "https://www.yes24.com/product/category/bestseller"

def get_last_page():
    url = f"{base_url}?categoryNumber=001&pageNumber=1&pageSize=24"
    res = requests.get(url, headers=headers)
    soup = BeautifulSoup(res.text, 'html.parser')
    pages = soup.select('a.bgYUI.end')
    return int(pages[0]['title']) if pages else 1

def parse_book_info(item):
    def extract(selector):
        tag = item.select_one(selector)
        return tag.text.strip() if tag else "-"

    return {
        '순위': extract('em.ico.rank'),
        '책제목': extract('a.gd_name'),
        '저자': extract('span.authPub.info_auth a'),
        '출판사': extract('span.authPub.info_pub a')
    }

def get_page_data(page):
    url = f"{base_url}?categoryNumber=001&pageNumber={page}&pageSize=24"
    res = requests.get(url, headers=headers)
    soup = BeautifulSoup(res.text, 'html.parser')
    return soup.select("li[data-goods-no]")

books = []
last_page = get_last_page()

for page in range(1, last_page + 1):
    items = get_page_data(page)
    for idx, item in enumerate(items):
        info = parse_book_info(item)
        books.append(info)
        print(f"[{page:02}-{idx+1:02}] {info['순위']} | {info['책제목']} | {info['저자']} | {info['출판사']}")

df = pd.DataFrame(books)
df.to_csv("yes24_bestseller_final_unique.csv", index=False, encoding="utf-8-sig")
df


[01-01] 1 | 혼모노 | 성해나 | 창비
[01-02] 2 | 첫 여름, 완주 | 김금희 | 무제
[01-03] 3 | 청춘의 독서 | 유시민 | 웅진지식하우스
[01-04] 4 | 안녕이라 그랬어 | 김애란 | 문학동네
[01-05] 5 | 단 한 번의 삶 | 김영하 | 복복서가
[01-06] 6 | 우리의 낙원에서 만나자 | 하태완 | 북로망스
[01-07] 7 | 어른의 품격을 채우는 100일 필사 노트 | 김종원 | 청림Life
[01-08] 8 | 소년이 온다 | 한강 | 창비
[01-09] 9 | 모순 | 양귀자 | 쓰다
[01-10] 10 | 어른의 행복은 조용하다 | 태수 | 페이지2북스
[01-11] 11 | 2025 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 상 | 최태성 | 이투스북
[01-12] 12 | 이재명 자서전 | 이재명 | 아시아
[01-13] 13 | 원피스 ONE PIECE 111 | 오다 에이이치로 | 대원
[01-14] 14 | 작은 땅의 야수들 | 김주혜 | 다산책방
[01-15] 15 | 2025 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 하 | 최태성 | 이투스북
[01-16] 16 | 워런 버핏 웨이 | 로버트 해그스트롬 | 상상스퀘어
[01-17] 17 | ETS 토익 정기시험 기출문제집 1000 Vol. 4 RC | ETS | YBM(와이비엠)
[01-18] 18 | 미술관에 간 할미 | 할미 | 더퀘스트
[01-19] 19 | 세계 경제 지각 변동 | 박종훈 | 글로퍼스
[01-20] 20 | 혹시, 돈 얘기해도 될까요? | 주언규 | 필름
[01-21] 21 | 마침내 특이점이 시작된다 | 레이 커즈와일 | 비즈니스북스
[01-22] 22 | 위버멘쉬 | 프리드리히 니체 | 떠오름
[01-23] 23 | ETS 토익 정기시험 기출문제집 1000 Vol. 4 LC | ETS | YBM(와이비엠)
[01-24] 24 | 처음 읽는 그리스 로마 신화 13 | 최설희

Unnamed: 0,순위,책제목,저자,출판사
0,1,혼모노,성해나,창비
1,2,"첫 여름, 완주",김금희,무제
2,3,청춘의 독서,유시민,웅진지식하우스
3,4,안녕이라 그랬어,김애란,문학동네
4,5,단 한 번의 삶,김영하,복복서가
...,...,...,...,...
994,995,오백 년째 열다섯 3,김혜정,위즈덤하우스
995,996,읽으면서 바로 써먹는 어린이 감정 표현,한날,파란정원
996,997,가시고기,조창인,산지
997,998,그대는 나의 여름이 되세요,서덕준,위즈덤하우스
