In [1]:
import os
import re
import pypandoc

def convert_md_links_in_text_to_pdf(text_file_path):
    # 讀取 txt 檔案內容
    with open(text_file_path, 'r', encoding='utf-8') as file:
        content = file.read()

    # 取得 ## 後的標題，用作檔案的主要名稱
    title_match = re.search(r'##\s*([\u4e00-\u9fff\w]+)', content)
    if not title_match:
        print("未找到標題，請確認文件格式。")
        return
    title = title_match.group(1)

    # 尋找所有 Markdown 路徑
    md_links = re.findall(r'\[.*?\]\((.*?)\.md\)', content)
    if not md_links:
        print("未找到任何 .md 檔案路徑。")
        return

    # 逐一轉換 Markdown 檔案為 PDF
    for idx, md_link in enumerate(md_links, start=1):
        md_file_path = f"{md_link}.md"
        output_pdf_name = f"./pdf/{title}_{idx}.pdf"
        
        if os.path.exists(md_file_path):
            # 使用 pandoc 將 .md 轉為 A4 大小的 PDF
            pypandoc.convert_file(
                md_file_path, 'pdf', outputfile=output_pdf_name,
                extra_args=['-V', 'papersize=A4']
            )
            print(f'已將 {md_file_path} 轉換並儲存為 {output_pdf_name}')
        else:
            print(f"找不到 Markdown 文件: {md_file_path}")

# 輸入 text 檔案路徑
text_file_path = './copy.txt'
convert_md_links_in_text_to_pdf(text_file_path)
