# Configuring

In [1]:
import pandas as pd
from docx import Document
from typing import List, Tuple, Dict
import os
import datetime
import time

In [21]:
data_path = r"info.xlsx"
template_path = r"format.docx"
output_folder = r"results/"

# Fill template

In [89]:
def fill_invitations(template_path: str, data, debug: bool = False) -> Document:
    doc = Document(template_path)
    for paragraph in doc.paragraphs:
        if debug:
            print("-" * 10)
            print(paragraph.text)
            print("-" * 10)
        for key, value in data.items():
            # if debug:
            #     print(f"Key: {key}\nValue: {value}")
            if key in paragraph.text:
                if debug:
                    print(f"Replaced: [{key.replace(' ', '_')}] with {str(value)}")
                for run in paragraph.runs:
                    run.text = run.text.replace(f"[{key.replace(' ', '_')}]", str(value))
    return doc

# Get data

In [90]:
def get_data(data_path: str) -> Tuple[int, pd.DataFrame, List[str]]:
    df = pd.read_excel(data_path, engine='openpyxl')
    return len(df), df, df.columns.tolist()


In [153]:
iterations, df, columns = get_data(data_path)

In [154]:
df.head(1)

Unnamed: 0,STT,Họ và tên chủ sử dụng,Địa chỉ,Địa chỉ thửa đất,Số tờ bản đồ,Số thửa,Diện tích,Số Thông báo,Ngày ban hành,NGÀY,THÁNG,NĂM,Họ và tên chủ sử dụng.1,Địa chỉ mới,Địa chỉ thửa đất mới,Số tờ bản đồ mới,Số thửa mới,Diện tích mới,số bản vẽ mới,ngày tháng năm
0,1,Lê Thị Nha,"ấp Trung, xã Tân Thông Hội, huyện Củ Chi, Tp.HCM",xã Tân Phú Trung,11,127,266.6,5960,06-02-2023,6,2,2023,Phạm Thành,"27/4T ấp Đông Lân, xã Bà Điểm, huyện Hóc Môn, ...",xã Tân Phú Trung,11,127,266.6,61 BS,02/01/2024


In [155]:
print(columns)

['STT', 'Họ và tên chủ sử dụng', 'Địa chỉ ', 'Địa chỉ thửa đất', 'Số tờ bản đồ', 'Số thửa ', 'Diện tích', 'Số Thông báo', 'Ngày ban hành ', 'NGÀY', 'THÁNG ', 'NĂM', 'Họ và tên chủ sử dụng.1', 'Địa chỉ mới', 'Địa chỉ thửa đất mới', 'Số tờ bản đồ mới', 'Số thửa mới', 'Diện tích mới', 'số bản vẽ mới', 'ngày tháng năm ']


In [94]:
iterations

95

# Running

In [102]:
def run(data_path: str,
        template_path: str,
        output_folder: str,
        data: Dict[str, str],
        isMerged: bool = False,
        debug: bool = False) -> None:

    iterations, df, columns = get_data(data_path)

    iterations = 1
    if debug:
        print(f"Iterations: {iterations}")
        print(f"Columns: {columns}")

    documents = []
    for iteration in range(iterations):
        row = df.iloc[iteration, :]
        if debug:
            # print(row)
            pass
        for column in columns:
            data[column] = row.loc[column]

        if debug:
            print(f"Iter {iteration}")
            print("Data:\n", data)

        # Fill the invitation and get the document
        doc = fill_invitations(template_path, data, debug)

        if not isMerged:
            file_path = os.path.join(output_folder, f"THÔNG BÁO {row.loc['STT']}.docx")
            doc.save(file_path)
            print(f"Document saved as: {file_path}")
        else:
            documents.append(doc)

In [103]:
data = {
}

In [104]:
run(
    data_path=data_path,
    template_path=template_path,
    output_folder=output_folder,
    data=data,
    debug=True
)

Iterations: 1
Columns: ['STT', 'Họ và tên chủ sử dụng', 'Địa chỉ ', 'Địa chỉ thửa đất', 'Số tờ bản đồ', 'Số thửa ', 'Diện tích', 'Số Thông báo', 'Ngày ban hành ', 'NGÀY', 'THÁNG ', 'NĂM', 'Họ và tên chủ sử dụng.1', 'Địa chỉ .1', 'Địa chỉ thửa đất.1', 'Số tờ bản đồ.1', 'Số thửa .1', 'Diện tích.1', 'số bản vẽ', 'ngày tháng năm ']
Iter 0
Data:
 {'STT': np.int64(1), 'Họ và tên chủ sử dụng': 'Lê Thị Nha', 'Địa chỉ ': 'ấp Trung, xã Tân Thông Hội, huyện Củ Chi, Tp.HCM', 'Địa chỉ thửa đất': 'xã Tân Phú Trung', 'Số tờ bản đồ': 11, 'Số thửa ': 127, 'Diện tích': 266.6, 'Số Thông báo': np.int64(5960), 'Ngày ban hành ': '06-02-2023', 'NGÀY': np.int64(6), 'THÁNG ': np.int64(2), 'NĂM': np.int64(2023), 'Họ và tên chủ sử dụng.1': 'Phạm Thành', 'Địa chỉ .1': '27/4T ấp Đông Lân, xã Bà Điểm, huyện Hóc Môn, Tp.HCM', 'Địa chỉ thửa đất.1': 'xã Tân Phú Trung', 'Số tờ bản đồ.1': 11, 'Số thửa .1': 127, 'Diện tích.1': np.float64(266.6), 'số bản vẽ': '61 BS', 'ngày tháng năm ': '02/01/2024'}
----------
THÔNG BÁO


In [152]:
doc = Document("format1.docx")

In [66]:
for i in range(5):
    print(doc.paragraphs[i].text)
    paragraph = doc.paragraphs[i]
    if f"[Số Thông báo]" in paragraph.text:
        print("Replacing")
        for run in paragraph.runs:
            run.text = run.text.replace(f"[Số Thông báo]", str(123847))
    print(doc.paragraphs[i].text)

THÔNG BÁO
THÔNG BÁO
V/v điều chỉnh Thông báo số [Số_Thông_báo]/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi
V/v điều chỉnh Thông báo số [Số_Thông_báo]/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi


Căn cứ Luật Tổ chức chính quyền địa phương ngày 19 tháng 6 năm 2015;
Căn cứ Luật Tổ chức chính quyền địa phương ngày 19 tháng 6 năm 2015;
Căn cứ Luật sửa đổi, bổ sung một số điều của Luật tổ chức Chính phủ và Luật Tổ chức chính quyền địa phương ngày 22 tháng 11 năm 2019;
Căn cứ Luật sửa đổi, bổ sung một số điều của Luật tổ chức Chính phủ và Luật Tổ chức chính quyền địa phương ngày 22 tháng 11 năm 2019;


In [116]:
paragraph = doc.paragraphs[1]
paragraph.text

'V/v điều chỉnh Thông báo số [Số_Thông_báo]/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi'

In [117]:
paragraph.text = paragraph.text.replace("_", " ")
paragraph.text

'V/v điều chỉnh Thông báo số [Số Thông báo]/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi'

In [118]:
f"[Số Thông báo]" in paragraph.text

True

In [119]:
for run in paragraph.runs:
    print(run.text)
    run.text = run.text.replace(f"[Số Thông báo]", str(123847))
    print(run.text)

V/v điều chỉnh Thông báo số [Số Thông báo]/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi
V/v điều chỉnh Thông báo số 123847/TB-UBND ngày 02 tháng 06 năm [NĂM] của Ủy ban nhân dân huyện Củ Chi về thu hồi đất để thực hiện dự án Nâng cấp, mở rộng và nạo vét kênh trục tiêu thoát nước rạch Láng The, kênh Địa phận tại huyện Củ Chi


In [141]:
paragraph = doc.paragraphs[-3]
paragraph.text

'Nay Ủy ban nhân dân huyện Củ Chi thông báo cho Văn phòng Hội đồng nhân dân và Ủy ban nhân dân huyện, Phòng Tài nguyên và Môi trường huyện, Ban Bồi thường - Giải phóng mặt bằng huyện, Phòng Quản lý Đô thị huyện, Ủy ban nhân dân xã «Địa_chỉ_thửa_đất», Ban Quản lý Dự án đầu tư xây dựng các công trình nông nghiệp và phát triển nông thôn Thành phố (Chủ đầu tư dự án) và ông (bà) «Họ_và_tên_chủ_sử_dụng» được biết.'

In [142]:
f"«Địa_chỉ_thửa_đất»" in paragraph.text

True

In [144]:
for run in paragraph.runs:
    print(run.text)
    run.text = run.text.replace(f"«Địa_chỉ_thửa_đất»", str(1312312))
    print(run.text)

Nay 
Nay 
Ủy ban nhân dân huyện 
Ủy ban nhân dân huyện 
Củ Chi 
Củ Chi 
thông báo cho 
thông báo cho 
Văn phòng Hội đồng nhân dân và Ủy ban nhân dân huyện, Phòng Tài nguyên và Môi trường huyện, Ban Bồi thường - Giải phóng mặt bằng huyện, Phòng Quản lý Đô thị huyện
Văn phòng Hội đồng nhân dân và Ủy ban nhân dân huyện, Phòng Tài nguyên và Môi trường huyện, Ban Bồi thường - Giải phóng mặt bằng huyện, Phòng Quản lý Đô thị huyện
, Ủy ban nhân dân xã
, Ủy ban nhân dân xã
 
 






«Địa_chỉ_thửa_đất»
1312312


, 
, 
Ban 
Ban 
Quản lý Dự án đầu tư xây dựng các công trình 
Quản lý Dự án đầu tư xây dựng các công trình 
nông nghiệp và phát triển nông thôn Thành phố (Chủ đầu tư dự án)
nông nghiệp và phát triển nông thôn Thành phố (Chủ đầu tư dự án)
 và ông
 và ông
 (bà)
 (bà)
 
 






«Họ_và_tên_chủ_sử_dụng»
«Họ_và_tên_chủ_sử_dụng»


 
 
được biết
được biết
.
.


In [148]:
# Process tables
for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
            combined_text = cell.text
            for key, value in data.items():
                key = key.replace(' ', '_')
                key = f"«{key}»"
                if key in combined_text:
                    if False:
                        print(f"Found {key} in table cell")
                        print(f"Replacing: {key} with {str(value)}")

                    combined_text = combined_text.replace(key, str(value))
                    cell.text = combined_text

In [145]:
print(len(doc.tables))

2


In [150]:
print(doc.tables[0].rows[0].cells[0].text)

ỦY BAN NHÂN DÂN 


In [156]:
columns

['STT',
 'Họ và tên chủ sử dụng',
 'Địa chỉ ',
 'Địa chỉ thửa đất',
 'Số tờ bản đồ',
 'Số thửa ',
 'Diện tích',
 'Số Thông báo',
 'Ngày ban hành ',
 'NGÀY',
 'THÁNG ',
 'NĂM',
 'Họ và tên chủ sử dụng.1',
 'Địa chỉ mới',
 'Địa chỉ thửa đất mới',
 'Số tờ bản đồ mới',
 'Số thửa mới',
 'Diện tích mới',
 'số bản vẽ mới',
 'ngày tháng năm ']