In [45]:
import requests
from bs4 import BeautifulSoup
import time

import random

def generate_isbn13():
    # 生成前12位数字，通常以978或979开头
    isbn = [9, 7, 8] + [random.randint(0, 9) for _ in range(9)]

    # 计算校验位
    checksum = sum((3 if i % 2 else 1) * num for i, num in enumerate(isbn)) % 10
    checksum = (10 - checksum) % 10

    # 添加校验位
    isbn.append(checksum)

    return ''.join(map(str, isbn))


def generate_books(url,category,encoding='utf-8'):
    # 发送HTTP请求
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)

    response.encoding = 'GBK'
    # 解析网页
    soup = BeautifulSoup(response.content, 'html.parser')
    books_d = []

    # 查找书籍信息
    lines = soup.find_all('ul', class_='product_ul')
    for line in lines:
        for i in range(4):
            book = line.find('li', class_=f'line{i+1}')
            if book:
                book_d = {}
                a_tag = book.find('a', class_='img')
                book_d['description'] = a_tag.get('title')
                book_d['imagelink'] = a_tag.find('img').get('src')
                book_d['author'] = book.find('p', class_='author').get_text().strip()
                book_d['title'] = book.find('p', class_='name').get_text().strip().split('（')[0]
                # 按照"¥"分割字符串
                parts = book.find('p', class_='price').get_text().strip().split("¥")
                # 过滤掉空字符串，并获取第一个价格
                first_price = next(part for part in parts if part)
                book_d['price'] = first_price
                book_d['isbn'] = generate_isbn13()
                book_d['category'] = category
                books_d.append(book_d)
    return books_d


In [46]:
def print_to_file(books):
    # 打开文件
    with open('books.txt', 'w', encoding='utf-8') as file:
        # 写入文件,每本书一行，i
        for i, book in enumerate(books):
            file.write(f"Book book{i} = new Book(\"{book['title']}\",\"{book['author']}\",\"{book['isbn']}\",\"{book['description']}\",\"{book['imagelink']}\",\"{book['category']}\",{book['price']})" + ';\n')
            file.write(f"bookRepository.save(book{i})" + ';\n')

In [47]:
books=generate_books('https://book.dangdang.com/01.03.htm?ref=book-01-A', '小说')
print(books)

Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.


[{'description': '张嘉佳十年文集限定礼盒（当当专享张嘉佳亲笔签名纪念信+手写寄语明信片+30*60cm精美桌垫+书签+护照册+旅行地图折页）', 'imagelink': '//img3m3.ddimg.cn/36/9/29413233-1_l_16.jpg', 'author': '张嘉佳 著,博集天卷 出品', 'title': '张嘉佳十年文集限定礼盒', 'price': '100.00', 'isbn': '9785818373270', 'category': '小说'}, {'description': '生而为人', 'imagelink': '//img3m0.ddimg.cn/59/24/29520770-1_l_1702361665.jpg', 'author': '毕啸南 著,博集天卷 出品', 'title': '生而为人', 'price': '24.90', 'isbn': '9780179708686', 'category': '小说'}, {'description': '尘埃落定：限量签章版（荣获茅盾文学奖20周年纪念版！特别加赠阿来故乡风景卡片三幅！)', 'imagelink': '//img3m1.ddimg.cn/2/2/29131841-1_l_1702950256.jpg', 'author': '阿来', 'title': '尘埃落定：限量签章版', 'price': '24.50', 'isbn': '9783478461672', 'category': '小说'}, {'description': '欢迎来到人间（毕飞宇新作，当当专享签名本）', 'imagelink': '//img3m0.ddimg.cn/92/13/29599310-1_l_1693880977.jpg', 'author': '毕飞宇', 'title': '欢迎来到人间', 'price': '46.60', 'isbn': '9783453099593', 'category': '小说'}, {'description': '告别的年代（当当专享签名本。《亚洲*周刊》2010年度十大小说！王德威、止庵、蒋韵、杨照、黄锦树、骆以军联袂推荐）', 'imagelink': '//img3m8.ddimg.cn/72

In [48]:
book_temp=generate_books('https://book.dangdang.com/01.05.htm', '文学')
print(book_temp)
books.extend(book_temp)

[{'description': 'ÈË¼äºÃÍæ', 'imagelink': '//img3m9.ddimg.cn/55/30/29197729-1_l_1688454884.jpg', 'author': '²ÌÀ½ Öø,²©¼¯Ìì¾í ³öÆ·', 'title': 'ÈË¼äºÃÍæ', 'price': '24.00', 'isbn': '9786223891335', 'category': '文学'}, {'description': 'ñöÌý¸¸Ç×£¨Ç©ÕÂ±¾£©', 'imagelink': '//img3m0.ddimg.cn/64/15/29630170-1_l_1696992658.jpg', 'author': 'ÕÅ´ó´º  Öø £¬ÐÂ¾\xadµä  ³öÆ·', 'title': 'ñöÌý¸¸Ç×£¨Ç©ÕÂ±¾£©', 'price': '32.40', 'isbn': '9781251848351', 'category': '文学'}, {'description': 'ÓÅÑÅ×ªÉí', 'imagelink': '//img3m8.ddimg.cn/13/7/29628238-1_l_1696998702.jpg', 'author': 'ÏþÑ© Öø', 'title': 'ÓÅÑÅ×ªÉí', 'price': '29.50', 'isbn': '9788050325427', 'category': '文学'}, {'description': 'Éò´ÓÎÄ£ºµ½ÈÕ¹âÏÂÈ¥Éú»î£¨½ñÌìÒ²ÒªºÃºÃ¹ý¡£µ½ÈÕ¹âÏÂÈ¥£¬È¥ÕÒµ½ÄãµÄÌð¡£Éò´ÓÎÄÏÈÉúµ®³½120ÖÜÄêÈ«²Ê¼ÍÄî°æ£¡Ò»±¾ÊéÔÄ¾¡Éò´ÓÎÄ×÷Æ·¾«»ª¡£ÍôÔøì÷¡¢¼¾ÏÛÁÖ¡¢¼ÖÆ½°¼¡¢²ÜÎÄÐù¡¢¶\xadÇäµÈ¼«Á¦ÍÆ³ç¡££©', 'imagelink': '//img3m2.ddimg.cn/39/13/29278002-1_l_27.jpg', 'author': 'Éò´ÓÎÄ', 'title': 'Éò´ÓÎÄ£ºµ½ÈÕ¹âÏÂÈ¥Éú»î£¨½ñÌìÒ²Òª', 'price': '20.20', 'isb

In [49]:
book_temp=generate_books('https://book.dangdang.com/01.01.htm', '青春文学')
print(book_temp)
books.extend(book_temp)

Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.


[{'description': '坤宁终章（共2册）白鹿、张凌赫主演电视剧《宁安如梦》原著小说', 'imagelink': '//img3m8.ddimg.cn/69/34/29286348-1_l_6.jpg', 'author': '时镜 著，酷威文化 出品', 'title': '坤宁终章', 'price': '44.00', 'isbn': '9784902643251', 'category': '青春文学'}, {'description': '天官赐福：全三册【印特签版】(五层瓦楞纸加厚纸箱（外包装）+5丝气柱袋（内包装）+葫芦膜填充，三重保护包装)', 'imagelink': '//img3m2.ddimg.cn/60/31/29570172-1_l_1697848491.jpg', 'author': '墨香铜臭 著，磨铁文化 出品', 'title': '天官赐福：全三册【印特签版】(五', 'price': '199.00', 'isbn': '9786591016064', 'category': '青春文学'}, {'description': '如此尔尔（全二册）【亲签版+当当定制大婚海报】风流书呆著网络原名：爱谁谁', 'imagelink': '//img3m9.ddimg.cn/64/9/29654029-1_l_1700197185.jpg', 'author': '风流书呆 著，酷威文化 出品', 'title': '如此尔尔', 'price': '49.80', 'isbn': '9781444404388', 'category': '青春文学'}, {'description': '和离（当当亲签版，人气玄幻作家九鹭非香甜虐交织的救赎之作）', 'imagelink': '//img3m5.ddimg.cn/53/17/29652335-1_l_1701936145.jpg', 'author': '九鹭非香 著,博集天卷 出品', 'title': '和离', 'price': '29.00', 'isbn': '9782639222633', 'category': '青春文学'}, {'description': '这么多年 （全3册）', 'imagelink': '//img3m9.ddimg.cn/6

In [50]:
book_temp=generate_books('https://book.dangdang.com/01.07.htm', '艺术')
print(book_temp)
books.extend(book_temp)

Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.


[{'description': '岳飞篆刻', 'imagelink': '//img3m1.ddimg.cn/51/20/29657481-1_l_1701421942.jpg', 'author': '肖勇', 'title': '岳飞篆刻', 'price': '33.80', 'isbn': '9788330842965', 'category': '艺术'}, {'description': '大话中国艺术史', 'imagelink': '//img3m5.ddimg.cn/7/10/29374495-1_l_14.jpg', 'author': '意公子；读客文化 出品', 'title': '大话中国艺术史', 'price': '59.00', 'isbn': '9788815923417', 'category': '艺术'}, {'description': '光的共鸣', 'imagelink': '//img3m8.ddimg.cn/70/11/29641858-1_l_1699351946.jpg', 'author': '徐尤点 著', 'title': '光的共鸣', 'price': '103.10', 'isbn': '9789042394599', 'category': '艺术'}, {'description': '有书', 'imagelink': '//img3m1.ddimg.cn/28/36/29485891-1_l_12.jpg', 'author': '[意] 西尔维亚・马拉古齐 等', 'title': '有书', 'price': '245.00', 'isbn': '9789321334797', 'category': '艺术'}, {'description': '迷墙（侯登科奖得主、著名摄影师严明彩色摄影集，百余幅新作集结面世！黑白到彩色，是不愿复制自己的一次转身、突破和超越！）', 'imagelink': '//img3m8.ddimg.cn/18/33/29656458-1_l_1701320668.jpg', 'author': '严明 著', 'title': '迷墙', 'price': '102.70', 'isbn': '9782165534415', 'category': '艺术

In [51]:
book_temp=generate_books('https://book.dangdang.com/01.21.htm', '成功励志')
print(book_temp)
books.extend(book_temp)

[{'description': 'ÁÄÁÄ', 'imagelink': '//img3m5.ddimg.cn/72/26/29638395-1_l_1698993886.jpg', 'author': 'ÄßÆ¼', 'title': 'ÁÄÁÄ', 'price': '49.00', 'isbn': '9789093133123', 'category': '成功励志'}, {'description': 'Èí¼¼ÄÜ', 'imagelink': '//img3m5.ddimg.cn/32/0/29583905-1_l_1690174818.jpg', 'author': 'ÁõÇæ µÈÖø; µÃµ½Í¼Êé ³öÆ·', 'title': 'Èí¼¼ÄÜ', 'price': '49.00', 'isbn': '9783434015239', 'category': '成功励志'}, {'description': 'Ä§Êõ¼ÇÒä 30·ÖÖÓÊÍ·Å¼ÇÒäÁ¦Ç±ÄÜ', 'imagelink': '//img3m8.ddimg.cn/94/23/29638318-1_l_1698736622.jpg', 'author': '£¨ÃÀ£©¿\xadÎÄ?ÌØÂ³¶à', 'title': 'Ä§Êõ¼ÇÒä\xa030·ÖÖÓÊÍ·Å¼ÇÒäÁ¦Ç±ÄÜ', 'price': '29.50', 'isbn': '9785710994764', 'category': '成功励志'}, {'description': '±¦¹óµÄÈËÉú½¨Òé£ºÎÒÏ£ÍûÔçµãÖªµÀµÄÖÇ»Û£¨¡¶Ê§¿Ø¡·×÷Õß¿\xadÎÄ¡¤¿\xadÀûÈ«ÐÂ×÷Æ·£©', 'imagelink': '//img3m1.ddimg.cn/39/23/29621631-1_l_1693904066.jpg', 'author': '¿\xadÎÄ¡¤¿\xadÀû    Kevin Kelly', 'title': '±¦¹óµÄÈËÉú½¨Òé£ºÎÒÏ£ÍûÔçµãÖªµÀµÄ', 'price': '49.00', 'isbn': '9789085652755', 'category': '成功励志'}, {'description': 

In [52]:
book_temp=generate_books('https://book.dangdang.com/01.05.htm', '管理')
print(book_temp)
books.extend(book_temp)

[{'description': 'ÈË¼äºÃÍæ', 'imagelink': '//img3m9.ddimg.cn/55/30/29197729-1_l_1688454884.jpg', 'author': '²ÌÀ½ Öø,²©¼¯Ìì¾í ³öÆ·', 'title': 'ÈË¼äºÃÍæ', 'price': '24.00', 'isbn': '9782304531589', 'category': '管理'}, {'description': 'ñöÌý¸¸Ç×£¨Ç©ÕÂ±¾£©', 'imagelink': '//img3m0.ddimg.cn/64/15/29630170-1_l_1696992658.jpg', 'author': 'ÕÅ´ó´º  Öø £¬ÐÂ¾\xadµä  ³öÆ·', 'title': 'ñöÌý¸¸Ç×£¨Ç©ÕÂ±¾£©', 'price': '32.40', 'isbn': '9789018719081', 'category': '管理'}, {'description': 'ÓÅÑÅ×ªÉí', 'imagelink': '//img3m8.ddimg.cn/13/7/29628238-1_l_1696998702.jpg', 'author': 'ÏþÑ© Öø', 'title': 'ÓÅÑÅ×ªÉí', 'price': '29.50', 'isbn': '9784467085077', 'category': '管理'}, {'description': 'Éò´ÓÎÄ£ºµ½ÈÕ¹âÏÂÈ¥Éú»î£¨½ñÌìÒ²ÒªºÃºÃ¹ý¡£µ½ÈÕ¹âÏÂÈ¥£¬È¥ÕÒµ½ÄãµÄÌð¡£Éò´ÓÎÄÏÈÉúµ®³½120ÖÜÄêÈ«²Ê¼ÍÄî°æ£¡Ò»±¾ÊéÔÄ¾¡Éò´ÓÎÄ×÷Æ·¾«»ª¡£ÍôÔøì÷¡¢¼¾ÏÛÁÖ¡¢¼ÖÆ½°¼¡¢²ÜÎÄÐù¡¢¶\xadÇäµÈ¼«Á¦ÍÆ³ç¡££©', 'imagelink': '//img3m2.ddimg.cn/39/13/29278002-1_l_27.jpg', 'author': 'Éò´ÓÎÄ', 'title': 'Éò´ÓÎÄ£ºµ½ÈÕ¹âÏÂÈ¥Éú»î£¨½ñÌìÒ²Òª', 'price': '20.20', 'isb

In [53]:
book_temp=generate_books('https://book.dangdang.com/01.28.htm', '哲学宗教')
print(book_temp)
books.extend(book_temp)

[{'description': 'Î÷·½´ó¹ÛÄî', 'imagelink': '//img3m2.ddimg.cn/19/18/29523502-1_l_2.jpg', 'author': '³Â¼ÎÓ³  Ö÷±à', 'title': 'Î÷·½´ó¹ÛÄî', 'price': '298.00', 'isbn': '9787091482854', 'category': '哲学宗教'}, {'description': '¹ÅÏ£À°Ë¼ÏëÍ¨Ê¶¿Î£ºÐÞÎôµ×µÂÆª', 'imagelink': '//img3m0.ddimg.cn/70/17/29533750-1_l_3.jpg', 'author': 'ÕÅÐÂ¸Õ Öø', 'title': '¹ÅÏ£À°Ë¼ÏëÍ¨Ê¶¿Î£ºÐÞÎôµ×µÂÆª', 'price': '34.00', 'isbn': '9783267469476', 'category': '哲学宗教'}, {'description': '»î³öÉúÃüµÄÖÕ¼«ÒâÒå', 'imagelink': '//img3m5.ddimg.cn/15/4/29553495-1_l_5.jpg', 'author': '£¨ÃÀ£©Î¬¿Ë¶à¡¤E.¸¥À¼¿Ë¶û£¨Viktor E. Frankl£©', 'title': '»î³öÉúÃüµÄÖÕ¼«ÒâÒå', 'price': '59.30', 'isbn': '9784890979325', 'category': '哲学宗教'}, {'description': 'ÀíÏë¹ú£¨ÉÌÎñÓ¡Êé¹ÝººÒëÃûÖøÈ¨ÍþÈ«Òë±¾£¬¾«×°µä²Ø°æ£©', 'imagelink': '//img3m8.ddimg.cn/49/13/28989328-1_l_4.jpg', 'author': '°ØÀ\xadÍ¼ Öø£»¹ù±óºÍ ÕÅÖñÃ÷ Òë', 'title': 'ÀíÏë¹ú£¨ÉÌÎñÓ¡Êé¹ÝººÒëÃûÖøÈ¨ÍþÈ«', 'price': '34.00', 'isbn': '9789199787718', 'category': '哲学宗教'}, {'description': '¼°¸ñ¼ÒÐûÑÔ', 

In [54]:
book_temp=generate_books('https://book.dangdang.com/01.15.htm', '亲子家教')
print(book_temp)
books.extend(book_temp)

[{'description': '²»ºð²»½ÐµÄ¸¸Ä¸»°Êõ', 'imagelink': '//img3m5.ddimg.cn/36/23/29629845-1_l_1700100635.jpg', 'author': 'ÕÅ»¨ÑÞ Öø£»Ä¥ÌúÎÄ»¯ ³öÆ·', 'title': '²»ºð²»½ÐµÄ¸¸Ä¸»°Êõ', 'price': '38.40', 'isbn': '9780275900243', 'category': '亲子家教'}, {'description': 'Ð¡ÈÕ³£', 'imagelink': '//img3m2.ddimg.cn/90/31/29634552-1_l_1698634369.jpg', 'author': 'Íõ äì Öø; µÃµ½Í¼Êé ³öÆ·', 'title': 'Ð¡ÈÕ³£', 'price': '49.00', 'isbn': '9785643175100', 'category': '亲子家教'}, {'description': 'ÕÆ¿Ø', 'imagelink': '//img3m2.ddimg.cn/79/7/29645332-1_l_1698825511.jpg', 'author': 'Áõ·å', 'title': 'ÕÆ¿Ø', 'price': '31.90', 'isbn': '9786625113400', 'category': '亲子家教'}, {'description': 'ÒÀ·¨´øÍÞ', 'imagelink': '//img3m0.ddimg.cn/26/10/29636270-1_l_1697509199.jpg', 'author': 'Âí·¼', 'title': 'ÒÀ·¨´øÍÞ', 'price': '26.00', 'isbn': '9784348596784', 'category': '亲子家教'}, {'description': 'ÕýÃæ¹Ü½Ì(ÐÞ¶©°æ)', 'imagelink': '//img3m0.ddimg.cn/64/6/23990140-1_l_46.jpg', 'author': '[ÃÀ] ¼ò¡¤Äá¶ûÉ\xad', 'title': 'ÕýÃæ¹Ü½Ì(ÐÞ¶©°æ)', '

In [55]:
book_temp=generate_books('https://book.dangdang.com/01.15.htm', '保健养生')
print(book_temp)
books.extend(book_temp)

[{'description': '²»ºð²»½ÐµÄ¸¸Ä¸»°Êõ', 'imagelink': '//img3m5.ddimg.cn/36/23/29629845-1_l_1700100635.jpg', 'author': 'ÕÅ»¨ÑÞ Öø£»Ä¥ÌúÎÄ»¯ ³öÆ·', 'title': '²»ºð²»½ÐµÄ¸¸Ä¸»°Êõ', 'price': '38.40', 'isbn': '9789399449256', 'category': '保健养生'}, {'description': 'Ð¡ÈÕ³£', 'imagelink': '//img3m2.ddimg.cn/90/31/29634552-1_l_1698634369.jpg', 'author': 'Íõ äì Öø; µÃµ½Í¼Êé ³öÆ·', 'title': 'Ð¡ÈÕ³£', 'price': '49.00', 'isbn': '9784742909258', 'category': '保健养生'}, {'description': 'ÕÆ¿Ø', 'imagelink': '//img3m2.ddimg.cn/79/7/29645332-1_l_1698825511.jpg', 'author': 'Áõ·å', 'title': 'ÕÆ¿Ø', 'price': '31.90', 'isbn': '9784028610557', 'category': '保健养生'}, {'description': 'ÒÀ·¨´øÍÞ', 'imagelink': '//img3m0.ddimg.cn/26/10/29636270-1_l_1697509199.jpg', 'author': 'Âí·¼', 'title': 'ÒÀ·¨´øÍÞ', 'price': '26.00', 'isbn': '9784565706836', 'category': '保健养生'}, {'description': 'ÕýÃæ¹Ü½Ì(ÐÞ¶©°æ)', 'imagelink': '//img3m0.ddimg.cn/64/6/23990140-1_l_46.jpg', 'author': '[ÃÀ] ¼ò¡¤Äá¶ûÉ\xad', 'title': 'ÕýÃæ¹Ü½Ì(ÐÞ¶©°æ)', '

In [56]:
book_temp=generate_books('https://book.dangdang.com/tech?ref=book-01-A', '科技',encoding='gb2312')
print(book_temp)
books.extend(book_temp)

[{'description': '°ëÐ¡Ê±Âþ»\xadÖÐ¹úµØÀí£¨´Ó³¤½\xad³¤³Çµ½»ÆÉ½»ÆºÓ£¬°ëÐ¡Ê±¾¡ÀÀ×æ¹ú´óºÃºÓÉ½£¡£©', 'imagelink': '//img3m8.ddimg.cn/94/18/29618518-1_l_1692948250.jpg', 'author': '³ÂÀÚ¡¤°ëÐ¡Ê±Âþ»\xadÍÅ¶Ó£»¶Á¿ÍÎÄ»¯ ³öÆ·', 'title': '°ëÐ¡Ê±Âþ»\xadÖÐ¹úµØÀí£¨´Ó³¤½\xad³¤³Çµ½', 'price': '24.90', 'isbn': '9786809663240', 'category': '科技'}, {'description': 'ÉúÃüÃÜÂë3£ºÎÁÒß´«£¬ÒüìÇÖø', 'imagelink': '//img3m6.ddimg.cn/18/4/29380446-1_l_4.jpg', 'author': 'ÒüìÇ', 'title': 'ÉúÃüÃÜÂë3£ºÎÁÒß´«£¬ÒüìÇÖø', 'price': '50.70', 'isbn': '9787216483896', 'category': '科技'}, {'description': 'À¥³æ£º¹ÅÀÏµÄµØÇòÖ®Íõ', 'imagelink': '//img3m3.ddimg.cn/54/23/29521953-1_l_3.jpg', 'author': '[Ó¢] ÂêÀö°²¡¤Ì©ÀÕ Öø£»ÑîÑ© Òë£»ÖÐ¹ú¹ú¼ÒµØÀí¡¤Í¼Êé  ³öÆ·', 'title': 'À¥³æ£º¹ÅÀÏµÄµØÇòÖ®Íõ', 'price': '39.00', 'isbn': '9784138944269', 'category': '科技'}, {'description': 'Ð»¶ú¶äÂþ»\xad.ÎïÀí´ó±¬Õ¨.»ù´¡Æª£¨È«7²á£©', 'imagelink': '//img3m7.ddimg.cn/75/28/29572167-1_l_1701774233.jpg', 'author': 'Àî½£Áú', 'title': 'Ð»¶ú¶äÂþ»\xad.ÎïÀí´ó±¬Õ¨.»ù´¡Æ

In [57]:
print_to_file(books)