In [3]:
import re
import os

def split_markdown_notes(notefilepath_md, begin_filename=34, part_ranges=None, output_folder=None):
    """
    Chia file ghi chú Markdown thành các file nhỏ hơn dựa trên các khoảng được chỉ định
    và lưu chúng vào một thư mục output.

    Args:
        notefilepath_md (str): Đường dẫn đến file ghi chú Markdown tổng.
        begin_filename (int): Số bắt đầu cho tên file output (ví dụ: 1 sẽ tạo 01.md, 02.md...).
        part_ranges (list): Danh sách các chuỗi định nghĩa khoảng, ví dụ: ["1-10", "11-23"].
                           Mặc định là None, sẽ không làm gì cả.
        output_folder (str, optional): Đường dẫn đến thư mục để lưu các file kết quả.
                                       Nếu None hoặc rỗng, các file sẽ được lưu vào thư mục hiện tại.
                                       Thư mục sẽ được tạo nếu chưa tồn tại.
    """
    if part_ranges is None:
        part_ranges = []
    if not os.path.exists(notefilepath_md):
        print(f"Lỗi: File ghi chú '{notefilepath_md}' không tồn tại.")
        return

    # Xử lý thư mục output
    if not output_folder: # Nếu output_folder là None hoặc chuỗi rỗng
        output_folder = "." # Mặc định là thư mục hiện tại

    # Tạo thư mục output nếu nó chưa tồn tại
    try:
        os.makedirs(output_folder, exist_ok=True)
        print(f"Các file output sẽ được lưu vào thư mục: '{os.path.abspath(output_folder)}'")
    except OSError as e:
        print(f"Lỗi: Không thể tạo thư mục output '{output_folder}': {e}")
        return

    # Bước 1: Đọc và phân tích toàn bộ file ghi chú gốc
    all_notes_content = {}
    current_note_id = None
    current_note_lines = []

    try:
        with open(notefilepath_md, 'r', encoding='utf-8') as f_in:
            for line in f_in:
                match = re.match(r'\[\^(\d+)\]:', line)
                if match:
                    if current_note_id is not None and current_note_lines:
                        all_notes_content[current_note_id] = "".join(current_note_lines)
                    current_note_id = int(match.group(1))
                    current_note_lines = [line]
                elif current_note_id is not None:
                    current_note_lines.append(line)

        if current_note_id is not None and current_note_lines:
            all_notes_content[current_note_id] = "".join(current_note_lines)

    except Exception as e:
        print(f"Lỗi khi đọc hoặc phân tích file ghi chú: {e}")
        return

    if not all_notes_content:
        print("Không tìm thấy ghi chú nào trong file đầu vào.")
        return

    # Bước 2: Lặp qua các khoảng (part) và tạo file output
    print('???',begin_filename)
    output_file_counter = begin_filename
    for part_range_str in part_ranges:
        try:
            start_str, end_str = part_range_str.split('-')
            start_num = int(start_str)
            end_num = int(end_str)
        except ValueError:
            print(f"Cảnh báo: Định dạng khoảng không hợp lệ '{part_range_str}'. Bỏ qua.")
            continue

        # Tạo tên file output (ví dụ: 01.md, 02.md,...)
        base_filename = f"{output_file_counter:02d}.md"
        print(f"{base_filename}; {output_file_counter}")
        # Kết hợp với output_folder để có đường dẫn đầy đủ
        output_filepath = os.path.join(output_folder, base_filename)

        print(f"Đang tạo file: {output_filepath} cho các ghi chú từ {start_num} đến {end_num}")

        with open(output_filepath, 'w', encoding='utf-8') as f_out:
            notes_for_this_part = []
            for note_id in range(start_num, end_num + 1):
                if note_id in all_notes_content:
                    notes_for_this_part.append(all_notes_content[note_id])

            if notes_for_this_part:
                f_out.write("".join(notes_for_this_part))
            else:
                print(f"  Không tìm thấy ghi chú nào cho khoảng {start_num}-{end_num} để ghi vào {output_filepath}.")

        output_file_counter += 1

    print("Hoàn tất việc chia file.")

part = ["1-28", "29-45", "46-97", "98-159", "160-189", "190-220", "221-257", "258-275", "276-317", "308-359", "360-455", "456-583"]
split_markdown_notes('../.docsource/kinhtruongbo/sujato/3.nodes.md', 24, part, "../.docsource/kinhtruongbo/sujato/notes")

Các file output sẽ được lưu vào thư mục: '/Users/ng/projects/n5/.docsource/kinhtruongbo/sujato/notes'
??? 24
24.md; 24
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/24.md cho các ghi chú từ 1 đến 28
25.md; 25
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/25.md cho các ghi chú từ 29 đến 45
26.md; 26
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/26.md cho các ghi chú từ 46 đến 97
27.md; 27
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/27.md cho các ghi chú từ 98 đến 159
28.md; 28
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/28.md cho các ghi chú từ 160 đến 189
29.md; 29
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/29.md cho các ghi chú từ 190 đến 220
30.md; 30
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/30.md cho các ghi chú từ 221 đến 257
31.md; 31
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/31.md cho các ghi chú từ 258 đến 275
32.md; 32
Đang tạo file: ../.docsource/kinhtruongbo/sujato/notes/32.md cho các ghi 