In [1]:
import requests as req
from bs4 import BeautifulSoup as bs
import os
import random
import re

# 建立下載資料夾（修正：判斷 project_gutenberg）
folder_path = 'project_gutenberg'
os.makedirs(folder_path, exist_ok=True)

# 檢查是否包含中文字的函數
def has_chinese(text: str) -> bool:
    pattern = re.compile(r'[\u4e00-\u9fff]+')
    return bool(pattern.search(text))

# 中文書籍頁面
url = "https://www.gutenberg.org/browse/languages/zh"
res = req.get(url)
soup = bs(res.text, "lxml")

# 收集所有中文書籍連結
book_links = []
for link in soup.find_all('a'):
    if '/ebooks/' in str(link.get('href')):
        title = link.text.strip()
        if has_chinese(title):
            book_links.append({
                'id': link.get('href').split('/')[-1],
                'title': title
            })

print(f"找到 {len(book_links)} 本中文書籍")

# 下載所有中文書籍
selected_books = book_links

for book in selected_books:
    try:
        # 構建下載連結
        download_url = f'https://www.gutenberg.org/files/{book["id"]}/{book["id"]}-0.txt'
        
        # 下載內容
        book_content = req.get(download_url)
        book_content.encoding = 'utf-8'
        
        # 儲存檔案（移除檔名中的特殊字元）
        safe_title = ''.join(c for c in book['title'] if c.isalnum() or c in (' ', '-', '_'))
        file_path = os.path.join(folder_path, f'{safe_title}.txt')
        
        with open(file_path, 'w', encoding='utf-8') as f:
            f.write(book_content.text)
        print(f'✅ 成功下載: {book["title"]}')
        
    except Exception as e:
        print(f'❌ 下載 {book["title"]} 失敗: {str(e)}')

print('\n🎉 下載完成！')


找到 478 本中文書籍
✅ 成功下載: 豆棚閒話
✅ 成功下載: 戲中戲
✅ 成功下載: 比目魚
✅ 成功下載: 比目魚
✅ 成功下載: 三字經
✅ 成功下載: 山水情
✅ 成功下載: 山海經
✅ 成功下載: 施公案
✅ 成功下載: 施公案
✅ 成功下載: 易經
✅ 成功下載: 木蘭奇女傳
✅ 成功下載: 海公案
✅ 成功下載: 燕丹子
✅ 成功下載: 狄公案
✅ 成功下載: 百家姓
✅ 成功下載: 禮記
✅ 成功下載: 綠牡丹
✅ 成功下載: 詩經
✅ 成功下載: 麟兒報
✅ 成功下載: 天豹圖
❌ 下載 梁公九諫 失敗: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
✅ 成功下載: 長恨歌
✅ 成功下載: 李娃傳
✅ 成功下載: 玉樓春
✅ 成功下載: 漢書
✅ 成功下載: 引鳳蕭
✅ 成功下載: 今古奇觀
✅ 成功下載: 後西游記
✅ 成功下載: 飛跎全傳
✅ 成功下載: 佛說四十二章經
✅ 成功下載: 紅樓夢
✅ 成功下載: 洛神賦
✅ 成功下載: 晁氏儒言 一卷
✅ 成功下載: 水滸後傳
✅ 成功下載: 幼學瓊林
✅ 成功下載: 治世餘聞
✅ 成功下載: 琵琶記
✅ 成功下載: 雪月梅傳
✅ 成功下載: 龍川詞
✅ 成功下載: 三國志
✅ 成功下載: 隋唐演義
✅ 成功下載: 論語
✅ 成功下載: 滬語開路 = Conversational Exercises in the Shanghai Dialect
✅ 成功下載: 白圭志
✅ 成功下載: 孟子字義疏證
✅ 成功下載: 安樂集
✅ 成功下載: 鄧析子
✅ 成功下載: 醉醒石
✅ 成功下載: 唐鍾馗平鬼傳
✅ 成功下載: 春秋繁露
✅ 成功下載: 虬髯客傳
✅ 成功下載: 吳船錄
✅ 成功下載: 星槎勝覽
✅ 成功下載: 星槎勝覽
✅ 成功下載: 喻世明言
✅ 成功下載: 平妖傳
✅ 成功下載: 東周列國志
✅ 成功下載: 警世通言
✅ 成功下載: 醒世恆言
✅ 成功下載: 封氏聞見記
✅ 成功下載: 白圭志
✅ 成功下載: 搜神記
✅ 成功下載: 搜神記 volume 11-14
✅ 成功下載: 搜神記 volume 1-3
✅ 成功下載: 搜神記 volum

KeyboardInterrupt: 