In [19]:
import pdfkit
from pathlib import Path
from bs4 import BeautifulSoup

# 指定 wkhtmltopdf 的路徑
path_to_wkhtmltopdf = r'/usr/local/bin/wkhtmltopdf'
config = pdfkit.configuration(wkhtmltopdf=path_to_wkhtmltopdf)

# 指定 HTML 檔案路徑
html_path = Path(r"/Users/xieweizhe/Desktop/MacCode/Python-Technical-Manual/Self-Try/test.html")

# 打開 HTML 檔案並讀取內容
with open(html_path, 'r', encoding='utf-8') as html_file:
    html_content = html_file.read()

# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(html_content, 'html.parser')

# 選擇具有特定類名的元素
elements = soup.find_all('img')

# 提取選定元素的 HTML 並拼接
content = ''
for element in elements:
    # 將每個元素轉換為字串並拼接
    content += str(element)
    content += '<br>'  # 加上換行符或其他分隔符來分隔元素

# 包裝 HTML 內容，添加 CSS 樣式讓內容適應 A4 寬度
output_html = '''
<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8">
<style>
    /* 設置頁面寬度為 A4 大小，並保持每個元素的寬度為 100% */
    @page {
        size: A4;
        margin: 20mm;
    }
    body {
        width: 100%;
        margin: 0;
        padding: 0;
        box-sizing: border-box;
    }
    img {
        max-width: 100%; /* 確保圖片寬度不超過頁面 */
        height: auto;
    }
    .element {
        width: 100%; /* 讓每個元素寬度適應頁面 */
        max-width: 100%;
    }
</style>
</head>
<body>
'''

# 插入 HTML 內容
output_html += content
output_html += '</body></html>'



# 指定輸出 PDF 檔案的路徑
output_file_path = html_path.parent / html_path.stem

# 設定 PDF 生成選項，指定較高的 DPI
options = {
    'dpi': 300,  # 設定圖片的 DPI 解析度為 300，這是一個比較高的標準解析度
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
    'encoding': "UTF-8"
}

# 使用 pdfkit 生成 PDF
pdfkit.from_string(output_html, f'{output_file_path}.pdf', configuration=config, options=options)

print(f'PDF 檔案已生成: {output_file_path}.pdf')

PDF 檔案已生成: /Users/xieweizhe/Desktop/MacCode/Python-Technical-Manual/Self-Try/test.pdf


In [18]:
with open('/Users/xieweizhe/Desktop/MacCode/Python-Technical-Manual/Self-Try/test1.html', 'w', encoding='utf-8') as html_file:
    html_file.write(output_html)

In [8]:
import asyncio
from pyppeteer import launch
from pathlib import Path
import nest_asyncio

# 允許嵌套事件循環
nest_asyncio.apply()

# 定義生成 PDF 的函數
async def generate_pdf():
    # 打開瀏覽器
    browser = await launch()
    page = await browser.newPage()
    
    # 打開本地 HTML 檔案
    html_path = Path(r'/Users/xieweizhe/Desktop/MacCode/Python-Technical-Manual/Self-Try/test1.html')
    await page.goto(f'file://{html_path}', {'waitUntil': 'load'})
    
    # 儲存為 PDF，設定無壓縮、高質量
    await page.pdf({
        'path': f'{html_path.parent}/{html_path.stem}.pdf',
    })
    
    await browser.close()
    print(f'PDF 已生成: {html_path.stem}.pdf')

# 執行生成 PDF 的函數
asyncio.get_event_loop().run_until_complete(generate_pdf())

PDF 已生成: test1.pdf
