In [37]:
import requests
import lxml.html

In [42]:
def main():
    # 여러 페이지에서 크롤링을 위해 Session 사용
    session = requests.Session()  
    # scrape_list_page() 함수를 호출해서 제너레이터를 추출
    response = session.get('http://www.hanbit.co.kr/store/books/new_book_list.html')
    urls = scrape_list_page(response)
    for url in urls:
        response = session.get(url)    # Session을 사용해 상세 페이지를 추출
        ebook = scrape_detail_page(response)    # 상세 페이지에서 상세 정보를 추출
        print(ebook)    # 상세 정보 출력

In [43]:
def scrape_list_page(response):
    root = lxml.html.fromstring(response.content)
    root.make_links_absolute(response.url)
    for a in root.cssselect('.view_box .book_tit a'):
        url = a.get('href')
        yield url

In [44]:
def scrape_detail_page(response):
    """
    상세 페이지의 Response에서 책 정보를 dict로 추출
    """
    root = lxml.html.fromstring(response.content)
    ebook = {
        'url': response.url,
        'title': root.cssselect('.store_product_info_box h3')[0].text_content(),
        'price': root.cssselect('.pbr strong')[0].text_content(),
        'content': [p.text_content()\
            for p in root.cssselect('#tabs_3 .hanbit_edit_view p')]
    }
    return ebook

In [45]:
if __name__ == '__main__':
    main()

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B7623190015', 'title': '최신 관리회계', 'price': '28,000', 'content': ['', '\r\n\t\t\t\t1부 관리회계시스템\r\n', '1장 관리회계', '1절 관리회계의 개념', '2절 경영과 관리회계', '3절 회계정보시스템', '2장 관리회계시스템(MAS)', '1절 관리회계와 의사결정', '2절 관리회계시스템의 특성', '3절 관리회계시스템의 활용', '3장 원가관리', '1절 원가 분류', '2절 회계모형의 가격결정', '3절 대체가격', '\xa0', '\r\n\t\t\t\t2부 원가분석\r\n', '4장 이익계획', '1절 원가기획', '2절 원가추정', '3절 이익계획과 손익분기점', '5장 원가－조업도－이익분석(CVP분석)', '1절 CVP분석 개념', '2절 CVP분석 방법', '3절 CVP분석 활용', '보론 매출배합분석', '6장 관리원가', '1절 목표원가계산', '2절 품질원가계산', '3절 수명주기원가계산', '7장 예산관리', '1절 변동원가계산', '2절 종합예산', '3절 종합예산편성 사례', '\xa0', '\r\n\t\t\t\t3부 의사결정\r\n', '8장 균형성과표', '1절 균형성과표의 본질', '2절 핵심성과지표(KPI)', '3절 균형성과표 적용 사례', '9장 단기의사결정', '1절 관련원가', '2절 의사결정 방법', '3절 유형별 단기의사결정', '10장 자본예산', '1절 자본예산분석', '2절 자본예산모형', '3절 순현재가치법과 내부수익률법', '11장 불확실성 하의 의사결정', '1절 의사결정과 불확실성', '2절 불확실성 하의 의사결정기준', '3절 정보의 가치평가', '\xa0', '\r\n\t\t\t\t4부 전략적 관리회계\r\n', '12장 경제적 부가가치(EVA)', '1절 기업가치', '2절 기업가치평가', '3절 EVA 경영', '13장 책

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B3148701816', 'title': 'IT CookBook, 처음 만나는 회로이론(2판)', 'price': '23,000', 'content': ['', '\r\n\t\t\t\t\t\tCHAPTER 01 회로의 기초\r\n', 'SECTION 1.1 회로 소자\xa0 \xa0 \xa0\xa0', 'SECTION 1.2 회로 설계의 이해\xa0 \xa0 \xa0 \xa0 \xa0\xa0', 'SECTION 1.3 등가 저항과 개방/단락 회로\xa0 \xa0', '연습문제\xa0 \xa0 \xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 02 회로 해석의 다양한 방법\r\n', 'SECTION 2.1 전압과 전류 분할 법칙\xa0 \xa0 \xa0\xa0', 'SECTION 2.2 핵심 회로 해석 방법\xa0 \xa0 \xa0 \xa0 \xa0', 'SECTION 2.3 테브난과 노턴 등가 회로\xa0 \xa0\xa0', '연습문제\xa0 \xa0 \xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 03 커패시터와 인덕터\r\n', 'SECTION 3.1 커패시터', 'SECTION 3.2 커패시터의 연결\xa0 \xa0 \xa0\xa0', 'SECTION 3.3 인덕터', 'SECTION 3.4 인덕터의 연결\xa0 \xa0 \xa0', '연습문제\xa0 \xa0 \xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 04 회로 해석을 위한 기본 수학\r\n', 'SECTION 4.1 선형방정식\xa0 \xa0 \xa0', 'SECTION 4.2 미분방정식\xa0 \xa0 \xa0', 'SECTION 4.3 복소수\xa0 \xa0 \xa0', '연습문제\xa0 \xa0 \xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 05 1차 회로와 2차 회로\r\n', 'SECTI

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B9354330938', 'title': '업무에 바로 쓰는 SQL 튜닝', 'price': '19,800', 'content': ['', '\r\n\t\t\t\t\t\t\t1장. MySQL과 MariaDB 개요\r\n', '1.1 현황', '1.2 상용 RDBMS와의 차이점', '1.3 MySQL과 MariaDB 튜닝의 중요성', '1.4 마치며', '\xa0', '\r\n\t\t\t\t\t\t\t2장. SQL 튜닝 용어를 직관적으로 이해하기\r\n', '2.1 물리 엔진과 오브젝트 용어', '2.2 논리적인 SQL\xa0 개념 용어', '2.3 개념적인 튜닝 용어', '2.4 마치며', '\xa0', '\r\n\t\t\t\t\t\t\t3장. SQL 튜닝의 실행 계획 파헤치기\r\n', '3.1 실습 환경 구성하기', '3.2 실행 계획 수행', '3.3 프로파일링', '3.4 마치며', '\xa0', '\r\n\t\t\t\t\t\t\t4장. 악성 SQL 튜닝으로 초보자 탈출하기\r\n', '4.1 SQL 튜닝 준비하기', '4.2 SQL 문 단순 수정으로 착한 쿼리 만들기', '4.3 테이블 조인 설정 변경으로 착한 쿼리 만들기', '4.4 마치며', '\xa0', '\r\n\t\t\t\t\t\t\t5장. 악성 SQL 튜닝으로 전문가 되기\r\n', '5.1 SQL 문 재작성으로 착한 쿼리 만들', '5.2 인덱스 조정으로 착한 쿼리 만들기', '5.3 적절한 테이블 및 열 속성 설정으로 착한 쿼리 만들기', '5.4 마치며']}
{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B3006151946', 'title': 'IT CookBook, C로 배우는 쉬운 자료구조 4판', 'price': '29,000', 'content': ['', '\r\n\t\t\t\t\t\t\t\t\tCha

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B6918140228', 'title': '찾아도 찾아도 끝판왕 1000개 숨은그림찾기 우리 동네', 'price': '7,200', 'content': ['', '\xa0']}
{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B3573121629', 'title': '처음 배우는 네트워크 보안', 'price': '25,200', 'content': ['', '\r\n\t\t\t\t\t\tCHAPTER 1 네트워크 보안 시작\xa0\r\n', '1.1 네트워크 보안과 보안 관제 필요성\xa0', '1.2 보안 조직 구성\xa0', '1.3 보안 관제 센터 구축\xa0', '1.4 보안 관제 실무\xa0', '1.5 마치며\xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 2 네트워크 보안 배경지식\xa0\r\n', '2.1 네트워크 기본 이론\xa0', '2.2 네트워크 장비\xa0', '2.3 네트워크 보안 시스템\xa0', '2.4 마치며\xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 3 네트워크 보안 실습 환경 구축\xa0\r\n', '3.1 네트워크 구축\xa0', '3.2 가상 머신 환경 구축\xa0', '3.3 네트워크 시뮬레이터를 이용한 네트워크 구성\xa0', '3.4 마치며\xa0', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 4 방화벽\xa0\r\n', '4.1 방화벽 장비 제작\xa0', '4.2 방화벽 설치 및 설정\xa0', '4.3 방화벽 운영\xa0', '4.4 마치며', '\xa0', '\r\n\t\t\t\t\t\tCHAPTER 5 네트워크 침입 탐지/차단 시스템\xa0\r\n', '5.1 NIDS/NIPS 장비 제작\xa0', '5.2 NIDS/NIPS 네트워크 구성\xa0', '5.3 Suricat