In [17]:
import re
import requests
import lxml.html
import time

In [18]:
def main():
    session = requests.Session()
    response = session.get("http://www.hanbit.co.kr/store/books/new_book_list.html")
    urls = scrape_list_page(response)
    
    for url in urls:
        time.sleep(2)
        response = session.get(url)
        ebook = scrape_detail_page(response)
        print(ebook)

In [19]:
def scrape_list_page(response):
    root = lxml.html.fromstring(response.content)
    root.make_links_absolute(response.url)
    
    for a in root.cssselect(".view_box .book_tit a"):
        url = a.get("href")
        yield url

In [20]:
def scrape_detail_page(response):
    """
    상세 페이지의 Response에서 책 정보를 dict로 추출
    """
    root = lxml.html.fromstring(response.content)
    ebook = {
        "url": response.url,
        "title": root.cssselect(".store_product_info_box h3")[0].text_content(),
        "price": root.cssselect(".pbr strong")[0].text_content(),
        "content": [normalize_spaces(p.text_content())
                   for p in root.cssselect("#tabs_3 .hanbit_edit_view p")
                   if normalize_spaces(p.text_content()) != ""]
    }
    
    return ebook

In [21]:
def normalize_spaces(s):
    """
    연결돼 있는 공백을 하나의 공백으로 변경합니다.
    """
    return re.sub(r"\s+", " ", s).strip()

In [22]:
if __name__ == "__main__":
    main()

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B4354575770', 'title': '똑똑한 두뇌 연습 : 첫 숨은그림찾기', 'price': '6,300', 'content': []}
{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B9597680767', 'title': 'IT CookBook, 파이썬 데이터 분석 for Beginner', 'price': '25,200', 'content': ['PART 01 파이썬 리부트', 'CHAPTER 01 파이썬 데이터 분석 입문', 'SECTION 01 프로그래밍 언어 소개', '1.1 프로그래밍 언어란?', '1.2 다양한 프로그래밍 언어', 'SECTION 02 파이썬 소개', '2.1 파이썬의 역사', '2.2 파이썬의 특징', 'SECTION 03데이터 분석 소개', '3.1 데이터 분석의 개념', '3.2 데이터 분석 언어 및 라이브러리', 'SECTION 04 프로그래밍 환경 구축', '4.1 파이썬 설치', '4.2 파이썬 실행', '요약', '연습문제', 'CHAPTER 02 미리 만드는 쓸 만한 프로그램', 'SECTION 01 이 장에서 만들 프로그램', '1.1 [프로그램 1] 간이 계산기', '1.2 [프로그램 2] 터틀 그래픽', 'SECTION 02 계산기 프로그램 기반 구축', '2.1 변수 준비', '2.2 사칙연산 기능 구현', 'SECTION 03 계산기 프로그램 저장', '3.1 파일 저장의 필요성', '3.2 파일 저장 방법', '3.3 파일 실행과 결과 확인', 'SECTION 04 계산기 프로그램 확장', '4.1 프로그램 생성', '4.2 input() 함수와 값 입력', '4.3 int() 함수와 정수 변환', 'SECTION 05 터틀 그래픽 프로그램 작성', '5.1 기본 구성 설정', '5.2 구현할 기능 계획', '5.3 변수 준비'

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B2119731751', 'title': '오늘부터 팀장입니다', 'price': '16,020', 'content': ['서문: 팀장이 알아야 할 경영관리의 모든 것', '제1장 성과관리', '제1강 성과에 대한 기대치를 명확하게 제시하라', '제2강 지속적이고 체계적으로 피드백을 제공하라', '제3강 팀원이 자기 성장의 책임자가 되도록 하라', '[부록] 팀원들의 성과 관리를 위한 개별성장계획표', '제4강 코칭으로 능동적인 문제해결력을 키워주어라', '제5강 성과를 측정하고 실적 부진을 관리하라', '[부록] 성과개선계획', '제2장 동기부여', '제6강 개인의 욕구에 초점을 맞춰 동기를 부여하라', '제7강 유연한 목표를 세우고 결과에 집착하지 마라', '제8강 보상의 기준과 근거를 투명하게 공유하라', '제9강 승진 절차와 직함을 가볍게 다루지 마라', '제3장 일의 의미', '제10강 자기 업무에 대한 인식을 변화시켜라', '제11강 감정을 억누르지 말고 현명하게 관리하라', '제12강 의사소통은 빠르고 충분할수록 좋다', '제13강 아름다운 질문으로 생각의 확장을 도와라', '제4장 채용 및 해고', '제14강 효과적인 채용을 위한 면접 절차를 수립하라', '[부록] 행동 중심의 면접질문지', '[부록] 면접 절차 단계별 구성', '제15강 면접 질문은 실제 행동에 초점을 맞춰라', '제16강 신규 입사자의 조직 적응을 체계적으로 도와라', '[부록] 신규 입사자를 위한 체크리스트', '제17강 퇴사 문제는 최대한 관대하면서 신속하게 처리하라', '제5장 팀 역학', '제18강 탁월한 팀을 만드는 세 가지 핵심 요건을 관리하라', '[부록] 심리적 안전감 질문지', '제19강 자유롭게 자기 목소리를 내는 문화를 만들어라', '제20강 갈등을 생산적인 상호작용으로 전환하라', '제21강 회의 참석자를 신중하게 선정하라', '제6장 자기경영'

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B9503831552', 'title': '이그노벨상 읽어드립니다', 'price': '15,750', 'content': ['프롤로그', '이그노벨상이란?', '욕도 잘 쓰면 약이 된다', '저주인형, 정말 효과가 있을까?', '더 나은 의사결정을 하려면 소변을 참으라고?', '거짓말을 잘하고 많이 하는 시기가 따로 있다?', '정말 싼 게 비지떡일까?', '우리는 왜 설명서를 안 읽을까?', '사랑과 강박장애는 구분하기 어렵다?!', '수면이 우리의 성격에 미치는 영향', '눈썹을 보면 나르시시스트인지 알 수 있다?!', '내 이웃에 사이코패스가 산다?!']}
{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B2835837863', 'title': '초등 공부 습관 바이블: 똑같이 하는데 탁월한 결과를 내는 아이는 무엇이 다를까?', 'price': '16,200', 'content': ['프롤로그 ‘똑같이 하는데 탁월한 결과를 내는 아이들’은 무엇이 달랐을까', '선천적 지능의 함정:', '우리는 아이의 IQ가 아니라 비인지능력에 주목해야 한다', '01 IQ가 알려주는 것, 알려주지 않는 것', '승후의 빛나던 지능은 어디로 사라진 걸까? | 아연이의 높은 성적은 어디서 비롯된 걸까?', 'IQ는 아이의 잠재력 중 극히 일부일 뿐이다 | 근희를 전교 1등으로 만든 건 IQ가 아니다', '지능이 개선된다고 믿으면 성적이 올라간다 | 성공한 삶은 태도와 습관으로 결정된다', '02 영재라는 굴레와 허상', '영재교육원에서는 어떤 아이를 선발할까? | 완벽해 보이는 아이에게도 일탈은 찾아온다', '아이는 아직 모양이 빚어지고 있는 그릇이다', '03 우리가 아이들에게 물려줘야 하는 것들', '공부 잘하는 아이들은 태도와 습관이 다르다 | 학업 성취를 예측하는 건 비인지능력이다', '기대되

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B9102351881', 'title': '기업의 성공을 이끄는 Developer Relations', 'price': '20,700', 'content': ['PART 01 기술 커뮤니티의 가치', 'CHAPTER 01 커뮤니티란', '유연한 경계 세우기', '커뮤니티를 원하는 이유는 무엇인가요?', '커뮤니티를 통해 이루고 싶은 것은 무엇인가요?', '어떤 사람들이 커뮤니티 멤버가 되었으면 하나요?', '커뮤니티에서 어떤 사람들에게 먼저 집중하고 싶나요?', '그래서, 데브렐 팀이 필요한가요?', '변화를 만들고자 하는 의지', 'CHAPTER 02 커뮤니티를 회사에 어필하기', '이해관계자 모으기', '나만의 방법 찾기', '기대치 설정하기', '문제에 대비하기', '모두와 함께하세요', 'CHAPTER 03 커뮤니티를 활발하게 유지하기', '커뮤니티 구축에서 소셜 미디어의 역할', '톤 앤 매너 확립하기', '플랫폼 선정하기', '함께 일하기', '기술에 대해 말하기', '개발자에게 집중하기', '끌어올리고 퍼뜨리기', '개인 브랜드 vs. 회사 브랜드', 'CHAPTER 04 성공을 측정하기', '스토리텔링은 직무 역량의 일부', '체크하고 균형 잡기', '정성적 측정 + 정량적 측정 = 달콤한 성공!', '일화 vs. 사실', '가치 실현 기간', '빠른 성공과 주간 리포트', '리비박스를 통해 구체적인 지표 찾기', '월드 클래스 데브렐 팀 만들기', 'CHAPTER 05 데브렐 팀 구성하기', '팀을 위한 안내도 그리기', '직함은 어떻게 지어야 할까요?', '누구를 먼저 채용해야 할까요?', '가장 중요한 질문: 어디에 팀을 배치해야 할까요?', '성공을 위한 팀 세팅', 'PART 02 커뮤니티 구축과 관계 맺기', 'CHAPTER 06 커뮤니티 찾기', 'Relationship 101: 관계 맺기의 첫걸음', '맨땅에 헤딩하지 말기

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B7422209817', 'title': '변화하는 세계 질서', 'price': '34,200', 'content': ['제1부 세상의 작동 원리', '1장. 빅 사이클 개요', '2장. 결정 요인', '. 부록', '3장. 통화, 신용, 부채, 경제 활동의 빅 사이클', '4장. 통화 가치의 변화', '5장. 내부 질서와 혼란의 빅 사이클', '6장. 국제 질서와 혼란의 빅 사이클', '7장. 빅 사이클로 판단하는 투자', '제2부 지난 500년간 세상의 작동 원리', '8장. 지난 500년의 요약', '9장. 빅 사이클로 본 네덜란드제국과 길더화의 부상과 쇠퇴', '10장. 빅 사이클로 본 대영제국과 파운드화의 부상과 쇠퇴', '11장. 빅 사이클로 본 미국과 달러화의 부상과 쇠퇴', '12장. 빅 사이클로 본 중국과 위안화의 부상', '13장. 미·중 관계와 전쟁', '제3부 미래', '14장. 미래', '부록: 세계 강대국의 현 상황과 미래 전망에 대한 컴퓨터 분석 자료']}
{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B1355665429', 'title': '아이주도이유식 레시피북(개정판)', 'price': '15,750', 'content': ['프롤로그_개정판', '프롤로그', '이 책을 보는 방법', 'Chapter 1 아이주도이유식이 궁금해', '01 아이주도이유식은 어떤 이유식인가?', '02 죽이유식과 아이주도이유식, 언제 시작해야 할까?', '03 이유식 기간의 수유와 영양', '04 아이주도이유식과 아이의 신체 발달', '05 아이주도이유식의 장점', '06 아이주도이유식을 진행할 때 주의할 점', '07 아이주도이유식에 필요한 도구', 'Chapter 2 아이주도이유식의 기본_채소 스틱', '01 쪄서 먹는 채소 스틱과 과일, 육류', '02 조리하지 않고

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B6562895528', 'title': '리얼 호주 [2022~2023 최신판]', 'price': '19,800', 'content': ['작가의 말', '일러두기', 'PART 01 스텝 바이 스텝 호주', 'STEP 01 기초 정보', 'STEP 02 밑줄 쫙 호주', 'STEP 03 모델 루트 & 베스트 코스', 'COURSE 01 동부 단기 루트', 'COURSE 02 동부 일주 루트', 'COURSE 03 남부 루트', 'COURSE 04 아웃백과 남부 루트', 'COURSE 05 아웃백과 동부해안 루트', 'COURSE 06 아웃백과 동북부 루트', 'COURSE 07 동서 대륙 횡단 루트', 'COURSE 08 대륙 반 바퀴 루트', 'COURSE 09 대륙 일주 루트', 'STEP 04 호주 국내 교통', 'PART 02 한발 더 들어간 정보', '호주의 기후CLIMATE', '호주의 역사HISTORY', '호주의 세계유산NATIONAL HERITAGE', '호주의 동물ANIMAL', '호주의 축제FESTIVAL', '호주의 와인WINE', '호주의 맥주BEER', '호주의 교육EDUCATION', '오지 잉글리시AUSSIE ENGLISH', '호주의 주말시장MARKETS', '호주에서 한 달 살기ONE MONTH', '호주의 숙소ACCOMMODATION', '<THEME BOOK IN BOOK 01> 호주에서 이건 꼭!', 'MUST DO!', 'MUST EAT & DRINK!', 'MUST BUY!', 'PART 03 진짜 호주를 만나는 시간_동부해안', '뉴사우스웨일스 주', '시드니 / 록스 & 서큘러, 센트럴 시드니, 달링 하버, 시드니 동부 해안, 시드니 북부', '블루 마운틴', '<REAL INTER CITY>', '① 뉴캐슬', '② 홀리데이 코스트(콥스 하버, 포트 스티븐스)', '③ 바이런 베이', '④ 울런공',