In [2]:
import os
import glob
from pathlib import Path

def convert_gedit_txt_to_md(directory):
    """
    将指定目录下的所有无后缀Gedit文本文件转换为Markdown文件(.md)
    保持文件名和内容不变，只是添加.md扩展名
    
    参数:
        directory (str): 要处理的目录路径
    """
    # 获取目录下所有无后缀文件
    all_files = glob.glob(os.path.join(directory, '*'))
    txt_files = [f for f in all_files if not os.path.splitext(f)[1] and os.path.isfile(f)]
    
    if not txt_files:
        print(f"在目录 {directory} 中没有找到任何无后缀文件")
        return
    
    # 创建md目录（如果不存在）
    md_dir = os.path.join(directory, 'md')
    os.makedirs(md_dir, exist_ok=True)
    
    # 遍历每个无后缀文件
    for txt_file in txt_files:
        # 获取文件名（不带路径）
        file_name = os.path.basename(txt_file)
        # 构造对应的.md文件名（放在md子目录中）
        md_file = os.path.join(md_dir, file_name + '.md')
        
        try:
            # 读取原文件内容
            with open(txt_file, 'r', encoding='utf-8') as f:
                content = f.read()
            
            # 写入到新文件
            with open(md_file, 'w', encoding='utf-8') as f:
                f.write(content)
            
            print(f"已转换: {file_name} -> md/{file_name}.md")
            
        except Exception as e:
            print(f"处理文件 {file_name} 时出错: {str(e)}")

# 指定目标目录
target_directory = '/home/luany/桌面/laogao/txt'

# 检查目录是否存在
if not os.path.exists(target_directory):
    print(f"目录不存在: {target_directory}")
else:
    convert_gedit_txt_to_md(target_directory)
    print("转换完成！所有Markdown文件已保存到md子目录中")

已转换: 25_YouTube的核心推荐算法，2025 -> md/25_YouTube的核心推荐算法，2025.md
已转换: 06_第三次回答问题，关于播放量和后台数据等 -> md/06_第三次回答问题，关于播放量和后台数据等.md
已转换: 02_第一次Q&A，回答各位的问题 -> md/02_第一次Q&A，回答各位的问题.md
已转换: 18_新年快乐！祝大家新的一年蜕变成长更上一层楼！ -> md/18_新年快乐！祝大家新的一年蜕变成长更上一层楼！.md
已转换: 10_回答问题第五期，关于频道拆分，吃播，流量不稳定，失败的经验和冷门主题等 -> md/10_回答问题第五期，关于频道拆分，吃播，流量不稳定，失败的经验和冷门主题等.md
已转换: 26_第十二次回答问题，做中文内容的大问题，宠物频道和儿童频道，测评和种草，如何判断影片做的好不好，chatGPT做的东西能用吗，个人还是法人 -> md/26_第十二次回答问题，做中文内容的大问题，宠物频道和儿童频道，测评和种草，如何判断影片做的好不好，chatGPT做的东西能用吗，个人还是法人.md
已转换: 03_如果从头再来，我将会从这里开始 -> md/03_如果从头再来，我将会从这里开始.md
已转换: 12_团员频道Review-1，这个频道已经做的很好，感觉就差一点点了 -> md/12_团员频道Review-1，这个频道已经做的很好，感觉就差一点点了.md
已转换: 05_如何选择频道内容 -> md/05_如何选择频道内容.md
已转换: 15_回答你的问题7 -> md/15_回答你的问题7.md
已转换: 28_规律 -> md/28_规律.md
已转换: 23_YouTube的一个大调整和一个新的盈利模式，机会来了一定要抓住啊 -> md/23_YouTube的一个大调整和一个新的盈利模式，机会来了一定要抓住啊.md
已转换: 11_怎样才能做出“有播放量”的影片 -> md/11_怎样才能做出“有播放量”的影片.md
已转换: 17_频道Review，这位团员的频道正在经历暴涨 -> md/17_频道Review，这位团员的频道正在经历暴涨.md
已转换: 04_第二次Q&A，回答各位的问题，大家的问题已经开始接近核心了 -> md/04_第二次Q&A，回答各位的问题，大家的问题已经开

In [3]:
import os
import glob
import re

def merge_md_files(md_directory, output_file):
    """
    合并md目录下的所有Markdown文件
    
    参数:
        md_directory (str): 包含md文件的目录路径
        output_file (str): 合并后的输出文件路径
    """
    # 获取所有md文件并按名称排序
    md_files = sorted(glob.glob(os.path.join(md_directory, '*.md')))
    
    if not md_files:
        print(f"在目录 {md_directory} 中没有找到任何.md文件")
        return
    
    # 存储目录结构和内容
    toc = ["# 目录\n"]  # 目录表
    chapters = []      # 章节内容
    book_title = ""    # 书名
    
    # 处理第一个文件获取书名
    first_file = md_files[0]
    with open(first_file, 'r', encoding='utf-8') as f:
        first_content = f.read()
        # 提取第一个一级标题作为书名
        match = re.search(r'^#\s+(.+)$', first_content, re.MULTILINE)
        if match:
            book_title = match.group(1)
    
    # 处理所有文件
    for i, md_file in enumerate(md_files):
        with open(md_file, 'r', encoding='utf-8') as f:
            content = f.read()
        
        # 获取文件名作为默认章节名
        chapter_name = os.path.splitext(os.path.basename(md_file))[0]
        
        # 尝试从内容中提取第一个标题
        match = re.search(r'^#+\s+(.+)$', content, re.MULTILINE)
        if match:
            chapter_name = match.group(1)
            heading_level = match.group(0).count('#')
            
            # 如果是二级标题，提升为一级
            if heading_level > 1:
                content = content.replace(match.group(0), f"# {chapter_name}", 1)
        
        # 添加到目录
        toc.append(f"1. [{chapter_name}](#{slugify(chapter_name)})")
        
        # 添加到章节内容
        chapters.append(f"\n# {chapter_name}\n\n{content}")

    # 生成合并后的内容
    merged_content = f"# {book_title}\n\n" + "\n".join(toc) + "\n" + "\n".join(chapters)
    
    # 写入输出文件
    with open(output_file, 'w', encoding='utf-8') as f:
        f.write(merged_content)
    
    print(f"合并完成！结果已保存到 {output_file}")
    print(f"共合并了 {len(md_files)} 个章节")

def slugify(text):
    """
    将标题文本转换为适合作为锚点的slug
    
    参数:
        text (str): 要转换的文本
        
    返回:
        str: 适合作为锚点的slug
    """
    # 转换为小写，替换空格为-
    slug = text.lower().replace(' ', '-')
    # 移除特殊字符
    slug = re.sub(r'[^\w\-]', '', slug)
    return slug

# 指定目录和输出文件
md_directory = '/home/luany/桌面/laogao/md'
output_file = '/home/luany/桌面/laogao/merged_book.md'

# 检查目录是否存在
if not os.path.exists(md_directory):
    print(f"目录不存在: {md_directory}")
else:
    merge_md_files(md_directory, output_file)

合并完成！结果已保存到 /home/luany/桌面/laogao/merged_book.md
共合并了 28 个章节
