In [None]:
from docx import Document
from copy import deepcopy

def copy_paragraph(paragraph, document):
    # Kopiuje paragraf z formatowaniem
    new_paragraph = document.add_paragraph()
    for run in paragraph.runs:
        new_run = new_paragraph.add_run(run.text)
        # Kopiowanie formatowania tekstu
        new_run.bold = run.bold
        new_run.italic = run.italic
        new_run.underline = run.underline
        new_run.font.size = run.font.size
        new_run.font.name = run.font.name
        new_run.font.color.rgb = run.font.color.rgb
    new_paragraph.style = paragraph.style

def copy_table(source_table, target_document):
    # Kopiuje tabelę z jednego dokumentu do drugiego
    target_table = target_document.add_table(rows=len(source_table.rows), cols=len(source_table.columns))

    # Kopiowanie zawartości komórek tabeli
    for row_idx, row in enumerate(source_table.rows):
        for col_idx, cell in enumerate(row.cells):
            target_table.cell(row_idx, col_idx).text = cell.text

    # Kopiowanie stylu tabeli (opcjonalne, wymaga bardziej zaawansowanej implementacji)
    target_table.style = source_table.style

def extract_sections(input_docx_path, output_docx_path, sections_to_extract):
    # Otwórz plik wejściowy DOCX
    doc = Document(input_docx_path)

    # Utwórz nowy dokument
    new_doc = Document()

    # Flaga, która kontroluje, czy kopiujemy zawartość
    copy_content = False

    # Iteracja po elementach w dokumencie
    for block in doc.element.body:
        if block.tag.endswith('p'):
            # Kopiowanie paragrafów
            paragraph = doc.paragraphs[doc.element.body.index(block)]
            if paragraph.style.name in ['Heading 1', 'Heading 2', 'Heading 3']:
                if paragraph.text in sections_to_extract:
                    copy_content = True
                else:
                    copy_content = False
            if copy_content:
                copy_paragraph(paragraph, new_doc)

        elif block.tag.endswith('tbl'):
            # Kopiowanie tabel
            table = doc.tables[doc.element.body.index(block)]
            if copy_content:
                copy_table(table, new_doc)

    # Zapisz nowy dokument
    new_doc.save(output_docx_path)
    print(f"Nowy plik został zapisany jako: {output_docx_path}")

# Przykład użycia:
input_path = "dokument_wejsciowy.docx"
output_path = "wybrane_sekcje.docx"
sections = ["Wstęp", "Rozdział 1", "Podrozdział 1.1"]  # Wybierz sekcje do wyodrębnienia

extract_sections(input_path, output_path, sections)
