In [2]:
import os

def search_pre_in_files(directory, search_term="pre ", context_length=20):
    """
    搜索指定目录下所有文件中包含特定字符串的文件，并返回文件路径、文件名及匹配后面的字符。
    
    :param directory: 要搜索的根目录路径。
    :param search_term: 要搜索的字符串（默认是 "pre"）。
    :param context_length: 要提取的匹配字符串后面的字符数（默认是 20）。
    :return: 无返回值，直接打印结果。
    """
    # 遍历目录树
    for root, dirs, files in os.walk(directory):
        for file in files:
            file_path = os.path.join(root, file)
            try:
                # 以二进制模式读取文件，避免编码问题
                with open(file_path, 'rb') as f:
                    content = f.read()
                
                # 将二进制内容转换为字符串，忽略无法解码的字节
                content_str = content.decode('utf-8', errors='ignore')
                
                # 查找所有匹配项
                start = 0
                while True:
                    index = content_str.find(search_term, start)
                    if index == -1:
                        break
                    # 计算匹配后面的结束位置
                    end = index + len(search_term) + context_length
                    # 提取匹配后面的字符
                    snippet = content_str[index:index + len(search_term) + context_length]
                    # 打印结果
                    print(f"文件路径: {file_path}")
                    print(f"文件名: {file}")
                    print(f"匹配内容及后续 {context_length} 个字符: {snippet}")
                    print("-" * 80)
                    # 更新搜索起始位置
                    start = index + len(search_term)
            except (IOError, OSError) as e:
                # 如果文件无法读取，打印错误并继续
                print(f"无法读取文件: {file_path}. 错误: {e}")
                continue

if __name__ == "__main__":
    # 设置要搜索的根目录路径
    # 例如：D:/Blog/themes/keep/source/
    root_directory = input("请输入要搜索的根目录路径: ").strip()
    
    # 检查输入路径是否存在
    if not os.path.isdir(root_directory):
        print(f"错误: 目录 '{root_directory}' 不存在。")
    else:
        # 调用搜索函数
        search_pre_in_files(root_directory)


文件路径: .\search.ipynb
文件名: search.ipynb
匹配内容及后续 20 个字符: pre \", context_length=2
--------------------------------------------------------------------------------
文件路径: .\source\css\common\codeblock\highlight.styl
文件名: highlight.styl
匹配内容及后续 20 个字符: pre {
  @extend $code-b
--------------------------------------------------------------------------------
文件路径: .\source\css\common\codeblock\highlight.styl
文件名: highlight.styl
匹配内容及后续 20 个字符: pre {
    border: none;
--------------------------------------------------------------------------------
文件路径: .\source\css\common\codeblock\highlight.styl
文件名: highlight.styl
匹配内容及后续 20 个字符: pre {
    padding-left:
--------------------------------------------------------------------------------
文件路径: .\source\css\common\codeblock\highlight.styl
文件名: highlight.styl
匹配内容及后续 20 个字符: pre {
    width: 100%;
--------------------------------------------------------------------------------
文件路径: .\source\css\common\codeblock\highlight.styl
文件名: highlight.styl
匹