In [2]:
from docx import Document

def parse_docx1(file_path: str) -> dict:
    """
    Парсит таблицы и списки из docx-файла, представляя каждый список как отдельный Python list.
    
    :param file_path: Путь к файлу .docx
    :return: Словарь с таблицами и списками
    """
    doc = Document(file_path)
    
    parsed_data = {
        "tables": [[
            [cell.text.strip() for cell in row.cells]
            for row in table.rows
        ] for table in doc.tables],
        "numbered_lists": [],
        "bullet_lists": [],
    }

    current_list, current_type = [], None
    
    for paragraph in doc.paragraphs:
        text = paragraph.text.strip()
        if not text:
            continue

        style_name = paragraph.style.name.lower()
        is_numbered = "list number" in style_name
        is_bullet = "list bullet" in style_name

        if is_numbered or is_bullet:
            new_type = "numbered" if is_numbered else "bullet"
            if current_type != new_type:
                if current_list:
                    parsed_data[f"{current_type}_lists"].append(current_list)
                current_list, current_type = [], new_type
            current_list.append(text)
        else:
            if current_list:
                parsed_data[f"{current_type}_lists"].append(current_list)
                current_list, current_type = [], None

    if current_list:
        parsed_data[f"{current_type}_lists"].append(current_list)
    
    return parsed_data

In [5]:
file_path = "123.docx"

parsed_data = parse_docx1(file_path)

print("Таблицы:")
for table in parsed_data["tables"]:
    print(table)

print("\nНумерованные списки:")
for item in parsed_data["numbered_lists"]:
    print(item)

print("\nБуллет-списки:")
for item in parsed_data["bullet_lists"]:
    print(item)

Таблицы:
[['123', '', '111'], ['123', 'Ghb', 'AAAAA'], ['Я', 'Кто даун?', 'Кто даун?']]

Нумерованные списки:

Буллет-списки:
