In [1]:
import json
from openai import OpenAI
from groq import Groq
import os
from sentence_transformers import SentenceTransformer
from tqdm.auto import tqdm
import pickle
from requests.exceptions import HTTPError
import time
# from groq.exceptions import RateLimitError
from concurrent.futures import ThreadPoolExecutor

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
client =  Groq(api_key = os.environ['GROQ_API_KEY'])

In [3]:
model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")



In [4]:
with open('../data/vietnamese_rag/documents-with-ids1.json', 'rt') as f_in:
    documents1 = json.load(f_in)

In [30]:
len(documents1)

1217

In [14]:
documents1[0].keys()

dict_keys(['group', 'context', 'question', 'answer', 'id'])

In [3]:
prompt_template = """
You emulate my assistant who works with me in a Q and A project .
Formulate 5 questions people might ask based on the record. The record
should contain the answer to the questions, and the questions should be complete and not too short.
If possible, use as fewer words as possible from the record. Make sure the questions should be in Vietnamese

The record:

question: {question}
answer: {answer}

Provide the output in parsable JSON without using code blocks:

["question1", "question2", ..., "question5"]
""".strip()

In [4]:
def generate_questions(doc):
    # Create a new dictionary excluding the first key-value pair
    doc_items = list(doc.items())[1:]  # Skip the first item
    doc_filtered = dict(doc_items)

    prompt = prompt_template.format(**doc_filtered)

    retries = 5
    for i in range(retries):
        try:
            response = client.chat.completions.create(
                model='Gemma2-9b-It',
                messages=[{"role": "user", "content": prompt}]
            )
            json_response = response.choices[0].message.content
            return json_response
        except HTTPError as e:
            if e.response.status_code == 429:  # Rate limit error
                retry_after = float(e.response.json()['error']['message'].split('in ')[-1].split('s')[0])
                time.sleep(retry_after)
            else:
                raise
        except Exception as e:
            if i < retries - 1:
                time.sleep(2 ** i)  # Exponential backoff
            else:
                raise

In [5]:
def map_progress(pool, seq, f):
    results = []

    with tqdm(total=len(seq)) as progress:
        futures = []

        for el in seq:
            future = pool.submit(f, el)
            future.add_done_callback(lambda p: progress.update())
            futures.append(future)

        for future in futures:
            result = future.result()
            results.append(result)

    return results

In [6]:

# Initialize ThreadPoolExecutor
pool = ThreadPoolExecutor(max_workers=6)

# Process documents in parallel
results = {}

In [7]:
def process_document(doc):
    doc_id = doc['id']
    if doc_id in results:
        return None

    questions = generate_questions(doc)
    return (doc_id, questions)

In [20]:
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[:30], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions


100%|█████████████████████████| 30/30 [00:36<00:00,  1.21s/it]
  2%|█▏                                               | 28/1127 [00:20<35:37,  1.94s/it]████████████████████████████████████████████████████████████████▍          | 28/30 [00:02<00:00, 10.40it/s]

In [21]:

# Print or save the results as needed
print(results)

{'75fafd29': '[\n"Minh Tú đã gặp khó khăn gì trong thử thách đi catwalk tại Asia\'s Next Top Model mùa 5?",\n"Điểm đến nào là thử thách khó khăn nhất đối với Minh Tú trong buổi thử thách đi catwalk?",\n"Vị trí của Minh Tú trong đêm chung kết Asia\'s Next Top Model mùa 5 là gì?",\n"Minh Tú đã thể hiện kỹ năng gì khi thực hiện thử thách đi catwalk trên tòa nhà cao tầng?",\n"Những thử thách nào đã giúp Minh Tú gặt hái thành công trong Asia\'s Next Top Model mùa 5?"\n] \n', '7adda7d7': '["Tại sao TP HCM có sương mù dày đặc vào sáng hôm nay?",\n"Những yếu tố nào dẫn đến sương mù dày đặc ở TP HCM?",\n"Tại sao sương mù lại xuất hiện vào ban đêm?",\n"Có sự liên quan giữa mưa lớn và hiện tượng sương mù\xa0không?",\n"Mức độ ô nhiễm không khí có ảnh hưởng đến sương mù\xa0không?"] \n\n\n', 'de6e7aa5': '{"question1":"Vụ nổ tại nhà máy hóa dầu xảy ra ở tỉnh nào ở Trung Quốc?" , "question2":"Ảnh hưởng ban đầu của vụ nổ là bao nhiêu người bị thương?" , "question3":"Vụ nổ xảy ra vào thời gian nào theo 

In [22]:
len(processed_results)

30

In [23]:

# from collections import defaultdict

# hashes = defaultdict(list)

# for doc in documents1:
#     doc_id = doc['id']
#     hashes[doc_id].append(doc)
# # hashes['75fafd29']

In [24]:
# len = 0
# for hash in hashes:
#     print(hash)
#     len += 1
#     if len == 30:
#         break
    

In [25]:
# for result in results:
#     print(result)

In [26]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth1.pkl', 'wb') as file:
    pickle.dump(results, file)

In [27]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth1.pkl', 'rb') as file:
    test = pickle.load(file)

In [29]:
type(test)

dict

In [31]:
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30:30*2], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions


100%|█████████████████████████| 30/30 [00:03<00:00,  9.56it/s]


In [35]:
def get_last_n_items(d, n):
    # Convert dictionary items to a list
    items = list(d.items())
    # Slice the list to get the last n items
    last_n_items = items[-n:]
    # Convert the sliced list back to a dictionary
    return dict(last_n_items)

In [36]:
last_30_items = get_last_n_items(results, 30)
len(last_30_items)

30

In [37]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth2.pkl', 'wb') as file:
    pickle.dump(last_30_items, file)

In [43]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth2.pkl', 'rb') as file:
    test = pickle.load(file)

In [44]:
test

{'1549e29b': '{"questions":["Lexus NX mới có lưới tản nhiệt dạng nào?","Lexus NX mới được trang bị màn hình thông tin và giải trí có kích thước bao nhiêu inch?","NX 300h và NX 300 F Sport có điểm khác biệt nào về phần đầu xe?","Có những thay đổi ở phần đuôi xe Lexus NX mới?","Lexus NX mới sử dụng động cơ loại nào?"]}  \n',
 'f55ad056': '["Huỳnh Thị Thuỳ Dung đại diện nước nào tham dự cuộc thi nào?", "Huỳnh Thị Thuỳ Dung đạt giải gì ở cuộc thi Hoa hậu Việt Nam 2016?", "Ngoài vị trí Á hậu 2, Huỳnh Thị Thuỳ Dung còn nhận giải gì?", "Năm Huỳnh Thị Thuỳ Dung đại diện Việt Nam tham dự Miss International?", "Huỳnh Thị Thuỳ Dung là người đẹp tài năng trong cuộc thi Hoa hậu Việt Nam nào?"] \n\n\n',
 '326bd715': '["Sở dĩ Tuấn Anh không thể tham gia buổi tập đội tuyển U22 Việt Nam là do lý do gì?", "Trường hợp Đức Huy không góp mặt trong buổi tập là do chấn thương gì?", "Chuyên gia vật lý trị liệu nào đang điều trị cho Tuấn Anh?", "Cầu thủ Tuấn Anh bị chấn thương gì?", "Được biết Đức Huy bị chấn 

In [45]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*2:30*3], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:02<00:00, 10.34it/s]


In [50]:
len(results)

30

In [51]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth3.pkl', 'wb') as file:
    pickle.dump(results, file)

In [10]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*3:30*4], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions

100%|███████████████████████████████████████████████████| 30/30 [00:38<00:00,  1.29s/it]
 40%|████████████████████▍                              | 12/30 [00:12<00:27,  1.53s/it]

In [11]:
with open('../data/vietnamese_rag/ground_truth_data/ground_truth4.pkl', 'wb') as file:
    pickle.dump(results, file)

In [10]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*4:30*5], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth5.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|███████████████████████████████████████████████████| 30/30 [00:50<00:00,  1.68s/it]
 17%|████████▋                                           | 5/30 [00:04<00:30,  1.20s/it]

In [11]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*5:30*6], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth6.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:13<00:00,  2.16it/s]


In [10]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*6:30*7], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth7.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|███████████████████████████████████████████████████| 30/30 [00:52<00:00,  1.75s/it]
100%|█████████████████████████| 17/17 [00:02<00:00,  7.52it/s]0 [00:03<00:00,  9.59it/s]

In [11]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*7:30*8], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth8.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:49<00:00,  1.66s/it]


In [12]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*8:30*9], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth9.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:44<00:00,  1.49s/it]


In [13]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*9:30*10], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth10.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:03<00:00,  7.54it/s]


In [14]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*10:30*11], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth11.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|███████████████████████████████████████████████████| 30/30 [00:11<00:00,  2.53it/s]


In [15]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*11:30*12], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth12.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:37<00:00,  1.25s/it]


In [16]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[30*12:30*13], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth13.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 30/30 [00:23<00:00,  1.26it/s]


In [27]:
# Process documents in chunks of 30
chunk_size = 30
start_chunk = 13  # Starting chunk index
end_chunk = (len(documents1) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    chunk = documents1[chunk_start:chunk_end]
    print(chunk_start, chunk_end)

#     # Use map_progress to process documents
#     processed_results = map_progress(pool, chunk, process_document)

#     # Store the results incrementally
#     for result in processed_results:
#         if result is not None:
#             doc_id, questions = result
#             results[doc_id] = questions

#     # Save the results to a file
#     file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i}.pkl'
#     with open(file_name, 'wb') as file:
#         pickle.dump(results, file)

#     # Print out the results
#     print(f"Chunk {i} processed and saved to {file_name}")
#     print(results)

#     # Wait for 1 minute to reset rate limit
#     time.sleep(120)

40
390 420
420 450
450 480
480 510
510 540
540 570
570 600
600 630
630 660
660 690
690 720
720 750
750 780
780 810
810 840
840 870
870 900
900 930
930 960
960 990
990 1020
1020 1050
1050 1080
1080 1110
1110 1140
1140 1170
1170 1200


In [30]:
# Process documents in chunks of 30
chunk_size = 30
start_chunk = 14  # Starting chunk index
end_chunk = (len(documents1) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    chunk = documents1[chunk_start:chunk_end]

    # Use map_progress to process documents
    processed_results = map_progress(pool, chunk, process_document)

    # Store the results incrementally
    for result in processed_results:
        if result is not None:
            doc_id, questions = result
            results[doc_id] = questions

    # Save the results to a file
    file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 1}.pkl'
    with open(file_name, 'wb') as file:
        pickle.dump(results, file)

    # Print out the results
    print(f"Chunk {i} processed and saved to {file_name}")
    print(results)

    # Wait for 1 minute to reset rate limit
    time.sleep(60)

40


100%|█████████████████████████| 30/30 [00:03<00:00,  9.24it/s]


Chunk 14 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth15.pkl
{'96911e78': '[\n"Mũ bucket trở thành xu hướng thời trang đường phố vào những năm nào?",\n"Ai là nghệ sĩ  đã làm cho mũ bucket trở nên nổi tiếng?",\n"LL Cool J có liên quan gì đến mũ bucket?",\n"Năm 1980 ấn tượng với giới trẻ thế nào qua mũ bucket?",\n"Mũ bucket có một vai trò quan trọng trong phong cách thời trang như thế nào?" \n] \n', 'f3f96cd5': '["Renee hoạt động nghề nghiệp gì ở thành phố St Kilda?",\n"Renee được nổi tiếng như thế nào ở thành phố St Kilda?",\n"Theo ghi nhận, ai là người được xem là gái đẹp nhất tại St Kilda?",\n"Thành phố nào là nơi Renee làm việc?",\n"Nơi nào Renee được công nhận là gái đẹp nhất?"] \n', '11b044a1': '["Số bàn thắng MU ghi được trong trận đấu với Basel năm 2017/2018?", "Điểm số của trận đấu MU vs Basel vòng đấu đầu tiên Champions League 2017/2018?", "Tỷ số trận đấu đầu tiên MU gặp Basel tại Champions League  là bao nhiêu?", "Kết quả trận đấu giữa MU và Base

100%|█████████████████████████| 30/30 [00:03<00:00,  8.30it/s]


Chunk 15 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth16.pkl
{'4952f80b': '["M.U đã thi đấu với những đội bóng nào trong vòng bảng Champions League mùa 2017/18?", "M.U nằm ở bảng nào của vòng bảng Champions League mùa 2017/18?", "Quels sont les adversaires de M.U au cours de la phase de groupes de la Ligue des Champions 2017/18?", "M.U đã có những đối thủ nào ở Cúp C1 mùa 2017/18?",] \n', '57fcd2eb': '[\n"Chính sách \'ở nguyên tại chỗ\' trong trường hợp hỏa hoạn được xem xét lại sau vụ cháy nào?",\n"Theo ông Darren Baird, đối tượng nào cần được xem xét sát sao về chính sách \'ở nguyên tại chỗ\'?",\n"Tại sao lời khuyên \'ở yên tại chỗ\' có thể trở nên phản tác dụng trong trường hợp hỏa hoạn?",\n"Ông Darren Baird là ai?",\n"Vai trò của ông Darren Baird trong lĩnh vực an toàn cháy nổ là gì?"\n] \n', 'e0b32951': '["Thực chất một đối tượng đã làm gì khi bị cảnh sát áp phục ?", \n"Bagaimana cara seorang tersangka menghindari penangkapan dari polisi?", \n"¿Qué h

100%|█████████████████████████| 30/30 [00:03<00:00,  7.53it/s]


Chunk 16 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth17.pkl
{'c735ce83': '["Nằm ở đâu trang trại có bể bơi nước nóng miễn phí ?", \n"Các trang trại nào ở Mỹ có bể bơi nước nóng xanh tự nhiên ?",\n"Có trang trại nào ở nước ngoài có bể bơi nước nóng miễn phí không ?",\n"Trang trại ở đâu có bể bơi nước nóng tự nhiên đẹp?",\n"Vị trí của trang trại có bể bơi nước nóng xanh biếc là gì?"] \n', '224b8025': '["Chiếc vòng ngọc bị vỡ vào lúc nào?", "Sự việc xảy ra ở đâu?", "Ai làm rơi chiếc vòng ngọc?", "Tại sao chiếc vòng ngọc lại bị vỡ làm đôi?", "Chiếc vòng ngọc đắt tiền vỡ làm đôi là sự cố gì?"] \n\n\n', '601c770c': '["Trận đấu UCL cuối cùng ở Vicente Calderon diễn ra vào ngày tháng nào?", "CLub nào là đối thủ của Atletico Madrid trong trận đấu UCL cuối cùng ở Vicente Calderon?", "Trận đấu UCL cuối cùng ở Vicente Calderon thuộc giải đấu gì?", "Atletico Madrid có thi đấu giải La Liga cùng thời điểm với trận đấu UCL cuối cùng ở Vicente Calderon?", "Đối thủ của At

100%|█████████████████████████| 30/30 [00:03<00:00,  9.33it/s]


Chunk 17 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth18.pkl
{'a2b6ecc0': '["Đức, Ba Lan và Anh đã đứng đầu bảng nào để giành vé vào vòng chung kết World Cup 2018?", "Ngoài Đức, Ba Lan và Anh, những đội nào còn có cơ hội dự World Cup 2018?", "Ai là ba đội dẫn đầu bảng E, F và C?", "Các đội nào có khả năng dự play-off vòng loại World Cup 2018 khu vực châu Âu?", "World Cup 2018 diễn ra ở đâu?" ] \n', '172cba0c': '[\n"VMCS 2017 bao gồm những trò chơi nào?",\n"Người chơi có thể nhận được những phần quà gì khi tham gia VMCS 2017?",\n"Giải thưởng dành cho người chiến thắng trò chơi \'Chinh phục tầm cao\' là gì?",\n"Bên cạnh chiếc xe tay ga, còn có những phần quà nào khác được phát?",\n"Hãng Total tham gia tặng quà gì tại VMCS 2017?",\n] \n', 'da4fd699': '[\n"Tốc độ tăng trưởng kinh tế của Hải Phòng trong 8 tháng qua cao bao nhiêu?",\n"So với mức tăng trưởng trung bình cả nước, tốc độ tăng trưởng của Hải Phòng trong 8 tháng qua cao gấp mấy lần?",\n"Chỉ số sản xu

100%|█████████████████████████| 30/30 [00:03<00:00,  8.74it/s]


Chunk 18 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth19.pkl
{'38724820': '["Nguyễn Thị Ánh Viên giành được bao nhiêu huy chương vàng tại SEA Games 29?", "Bạn có thể kể tên tất cả các huy chương mà Nguyễn Thị Ánh Viên đã giành được tại SEA Games 29?", "Nguyễn Thị Ánh Viên đã lập bao nhiêu kỷ lục tại SEA Games 29?", "Vào SEA Games 29, Nguyễn Thị Ánh Viên đã giành bao nhiêu huy chương bạc?", "Ngoài huy chương vàng, Nguyễn Thị Ánh Viên còn giành được những hạng mục nào tại SEA Games 29?" ] \n', '1ea15be2': '["Từ ngày nào TP.HCM bắt đầu thực hiện tem kiểm soát xăng dầu?", "Ngày 1/8/2017 là ngày bắt đầu quy định gì ở TP.HCM?", "TP.HCM áp dụng tem chống gian lận xăng dầu từ năm nào?", "Quy định về tem kiểm soát xăng dầu chống gian lận xuất hiện ở TP.HCM vào thời gian nào?", "Lý do TP.HCM áp dụng tem kiểm soát xăng dầu chống gian lận là gì? "] \n', 'cadf023f': '["Tại sao phố lồng đèn Sài Gòn lại đông đúc vào đêm Trung thu ?", \n"Họp đông người tại phố lồng đèn S

100%|█████████████████████████| 30/30 [00:05<00:00,  5.63it/s]


Chunk 19 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth20.pkl
{'4ec81a3f': '{"question1":"Sanna Khánh Hòa đã có những thành tích nào tại giải futsal các CLB Đông Nam Á 2017?",\n"question2":"Điều gì đã đem lại ấn tượng mạnh cho Sanna Khánh Hòa tại giải đấu này?",\n"question3":"Sự tham gia của những cầu thủ từ đâu đã tác động đến Sanna Khánh Hòa?",\n"question4":"HLV Đặng Đình Khang có những lời tuyên bố gì trước khi tham dự giải đấu?",\n"question5":"Sanna Khánh Hòa muốn thể hiện điều gì qua giải đấu này?"}\n', 'cfed5815': '["Tàu cá QNa-94097 bị phá nước cách đảo Lý Sơn bao xa về phía Đông Bắc?", "Vị trí bị phá nước của tàu cá QNa-94097 là ở đâu?", "Tàu cá QNa-94097 gặp sự cố khi ở cách đảo Lý Sơn bao nhiêu hải lý?", "Xác định vị trí cụ thể của vụ việc xảy ra với tàu cá QNa-94097", "Khi nào tàu cá QNa-94097 bị phá nước?" ] \n', '8dea19d9': '[\n"Hyundai Tucson 2017 có thay đổi gì về ngoại thất so với phiên bản cũ?",\n"Nội thất của Hyundai Tucson 2017 được tran

100%|█████████████████████████| 30/30 [00:02<00:00, 10.23it/s]


Chunk 20 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth21.pkl
{'c7c272f0': '```json\n["Redmi 4X có màn hình kích thước bao nhiêu inch?", \n"Redmi 4X có độ dày là bao nhiêu?", \n"Redmi 4X được làm bằng vật liệu gì?", \n"Redmi 4X nặng khoảng bao nhiêu gram?",\n"Vị trí cảm biến vân tay trên Redmi 4X là ở đâu?"]\n```\n', 'd996d14a': '[\n"Bugatti Chiron \'Zero-400-Zero\' có thể tăng tốc từ 0 lên bao nhiêu km/h trong bao lâu?",\n"Xe sử dụng động cơ loại gì?",\n"Tốc độ tối đa của Bugatti Chiron \'Zero-400-Zero\' là bao nhiêu?",\n"Cabin của Bugatti Chiron \'Zero-400-Zero\' được bọc da màu gì?",\n"Bao nhiêu chiếc Bugatti Chiron \'Zero-400-Zero\' được sản xuất?"\n] \n', '5a1de402': '["Diễn viên hài nào đã qua đời ở tuổi 52?", "Khánh Nam đã bao nhiêu tuổi khi mất?", "Diễn viên hài Khánh Nam mất vì nguyên nhân gì?", "Diễn viên hài Khánh Nam được biết đến là ai?", "Thời gian Khánh Nam chống chọi bệnh tật kéo dài bao lâu?"] \n', '6d652393': '["Giải bóng đá Doanh nhân tr

100%|█████████████████████████| 30/30 [00:04<00:00,  6.38it/s]


Chunk 21 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth22.pkl
{'b4f67cd7': '[\n"Tìm hiểu về nguyên nhân tai nạn hi hữu xảy ra tại trường mầm non Nam Kim?",\n"Tại sao 3 trẻ mầm non ở trường Nam Kim đã ăn phải bột thông tắc bồn cầu?",\n"Có bao nhiêu gói bột thông tắc bồn cầu bị cho vào lớp học?",\n"Ngài nhà trường đã thực hiện giải pháp gì để tránh tai nạn tương tự?" ,\n"Cô giáo đã làm gì sau khi nhận được hai gói bột thông tắc bồn cầu?"\n] \n', 'aa6a8901': '[\n"Sau khi ăn trứng, không nên uống thứ gì?",\n"Người ta có nên ăn hồng sau khi ăn trứng không?",\n"Những loại thực phẩm nào không nên ăn kèm với trứng?",\n"Có nên ăn trứng đã chín để qua đêm không?",\n"Ngoài việc không nên ăn quá nhiều trứng, điều gì khác cũng nên tránh khi ăn trứng?"\n] \n', 'ea2e9ce4': '[\n"Tại Đà Nẵng, những người nào đã bị bắt quả tang liên quan đến hoạt động mua bán ma túy?",\n"Họ tên của những người bị bắt quả tang trong vụ mua bán ma túy ở Đà Nẵng là gì?",\n"Có bao nhiêu người b

100%|█████████████████████████| 30/30 [00:04<00:00,  6.44it/s]


Chunk 22 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth23.pkl
{'dbb19f68': '["Những thực phẩm nào có thể tạo ra độc tố nếu không được chế biến kỹ?","Mật ong thuộc loại thực phẩm nào chỉ an toàn khi được chế biến đúng cách?","Loại đậu nào có thể nguy hiểm nếu không được chế biến thỏa đáng?","Ngoài khoai tây và đậu đỏ, thực phẩm nào khác cần lưu ý về việc chế biến?","Sắn có thể gây độc hại nếu như thế nào?",] \n', '4a07937e': '["Thành phần nào là những ngôi sao tấn công của đội Hà Nội?", "Ai là những cầu thủ tấn công nổi tiếng của đội Hà Nội?", "Quang Hải, Văn Quyết, Thành Lương và ai là các ngôi sao tấn công của đội Hà Nội?", "Ngoài Quang Hải, Văn Quyết và Thành Lương, cầu thủ nào khác được coi là ngôi sao tấn công của đội Hà Nội?", "Ai là những sao tấn công hiện tại của đội Hà Nội?"] \n\n\n', 'f31723ca': '[\n"Công bố kết luận thanh tra bị hoãn lại, nguyên nhân là gì?",\n"Huyện Mù Cang Chải gặp phải khó khăn gì khiến việc công bố kết luận thanh tra phải lùi

100%|█████████████████████████| 30/30 [00:03<00:00,  8.84it/s]


Chunk 23 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth24.pkl
{'83eb5a17': '["Triều Tiên đã thu được bao nhiêu dữ liệu quân sự từ Mỹ và Hàn Quốc?", "Hàn Quốc và Mỹ đã mất bao nhiêu gigabyte dữ liệu cho Triều Tiên?", "Tỷ lệ dữ liệu quân sự được xác định nội dung là bao nhiêu?", "Triều Tiên đã lấy được bao nhiêu gigabyte dữ liệu quân sự?", "Nội dung của gần 80% dữ liệu quân sự mà Triều Tiên thu được là gì?"] \n', '3f25a870': '[\n"Triều Tiên có lý do gì tuyên bố sẽ tiếp tục phát triển vũ khí hạt nhân ?",\n"Triều Tiên muốn có khả năng tấn công như thế nào trên thế giới ?",\n"Theo Triều Tiên, trong những trường hợp nào họ sẽ tiến hành tấn công ?",\n"Triều Tiên đang trong tiến trình phát triển loại vũ khí nào ?",\n"Triều Tiên muốn đạt được mục tiêu gì với việc phát triển vũ khí hạt nhân ?"\n] \n', '5fe98d90': '[\n"SEA Games 29 diễn ra ở đâu?",\n"Thái Lan giành huy chương vàng bóng đá nữ ở SEA Games nào?",\n"Việt Nam thi đấu kém thế nào tại SEA Games 29?",\n"Mục 

100%|█████████████████████████| 30/30 [00:03<00:00,  7.68it/s]


Chunk 24 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth25.pkl
{'a7789225': '["Những loại khí tài quân sự nào đã được Mỹ triển khai đến khu vực bán đảo Triều Tiên?",\n"Mỹ đã tập trung quân sự ở khu vực bán đảo Triều Tiên như thế nào trước Olympic 2018?",\n"Máy bay ném bom tàng hình nào được Mỹ triển khai đến khu vực bán đảo Triều Tiên?",\n"Những loại tàu bao gồm trong lực lượng quân sự Mỹ được triển khai?",\n"Tàu sân bay nào của Mỹ được tung ra vùng biển gần Triều Tiên?"] \n', '30c430bc': '[\n"Hệ thống kiểm soát độ bám đường hoạt động như thế nào?",\n"Lợi ích chính của hệ thống kiểm soát độ bám đường đối với người lái là gì?",\n"Hệ thống kiểm soát độ bám đường khác biệt với hệ thống ổn định thân xe điện tử như thế nào?",\n"Tại sao hệ thống kiểm soát độ bám đường được cho là góp phần tăng an toàn cho người lái?",\n"Theo báo cáo năm 2015 của Cơ quan quản trị An toàn lưu thông đường bộ M, công nghệ nào đã được xác nhận cứu sống 6169 người?"\n] \n\n\n', '54eff2

100%|█████████████████████████| 30/30 [00:03<00:00,  8.27it/s]


Chunk 25 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth26.pkl
{'fb231567': '[\n"Real Madrid đã vượt qua đội nào trong trận bán kết FIFA Club World Cup 2017?",\n"Tỉ số trận bán kết FIFA Club World Cup 2017 giữa Real Madrid và đội chủ nhà là bao nhiêu?",\n"Real Madrid muốn giành danh hiệu gì ở FIFA Club World Cup 2017?",\n"Giành chiến thắng tại FIFA Club World Cup 2017 đem lại điều gì cho Real Madrid?",\n"Real Madrid có mục tiêu gì khi tham gia FIFA Club World Cup 2017 về mặt thành tích?"\n] \n', 'aa7f1e29': '["Lý do ban giám khảo Hoa hậu Hoàn vũ Việt Nam 2017 không thích sở thích shopping?", "Ban giám khảo cuộc thi Hoa hậu Hoàn vũ Việt Nam 2017 tìm kiếm những gì trong thí sinh?", "MC Phan Anh có bình luận gì về sở thích shopping của thí sinh?", "Theo Hoa hậu Hương Giang, ban giám khảo cuộc thi năm đó như thế nào?", "Ban giám khảo Hoa hậu Hoàn vũ Việt Nam 2017 đã đặt ra những câu hỏi gì cho các thí sinh có sở thích shopping?"] \n\n\n', '88a752ae': '["Nissan 

100%|█████████████████████████| 30/30 [00:04<00:00,  6.79it/s]


Chunk 26 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth27.pkl
{'c3a278ac': '["Triển lãm tranh của thiếu nhi nào được tổ chức tại Hà Nội vào tháng 8 năm 2017?", \n"Địa điểm diễn ra triển lãm trưng bày tranh thiếu nhi về chủ đề khoa học là gì?",\n"Tháng nào năm 2017, triển lãm sách và tranh về  "Chắp cánh ước mơ khoa học" diễn ra?",\n"Tại triển lãm "Chắp cánh ước mơ khoa học", bao nhiêu bức tranh của thiếu nhi được trưng bày?",\n"Chủ đề chính của các bức tranh được trưng bày tại triển lãm "Chắp cánh ước mơ khoa học" là gì?"] \n\n\n', '0be67b87': '[\n"Công nghệ UltraFlex trong dầu nhớt Petronas Sprinta có tác dụng như thế nào đối với động cơ?",\n"Dầu nhờn Petronas Sprinta có những lợi ích gì cho trải nghiệm lái xe của người dùng?",\n"Petronas Sprinta có khả năng cải thiện tuổi thọ xe như thế nào?",\n"Độ bền màng dầu của Petronas Sprinta so với các tiêu chuẩn ngành như thế nào?",\n"Petronas Sprinta với công nghệ UltraFlex giúp động cơ có khả năng chịu đựng tác

100%|█████████████████████████| 30/30 [00:03<00:00,  9.87it/s]


Chunk 27 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth28.pkl
{'ea6c0364': '[\n"Diplomatic relations between Turkey and Germany are strained due to what specific reasons?",\n"What incident involving a German journalist contributed to the tension between Ankara and Berlin?",\n"What action taken by the German government contributed to the worsening relations with Turkey?",\n"Besides the journalist\'s arrest, what other event caused friction between Turkey and Germany?",\n"What military event in Turkey led to the German government granting refugee status to some Turkish soldiers?"\n] \n', '06a38707': '["Ai là người được cho là kẻ đánh bom liều chết ở Manchester vào đêm 22/5?", "Năm bao nhiêu tuổi của kẻ đánh bom liều chết ở Manchester?", "Ngày tháng nào có vụ đánh bom liều chết ở Manchester?", "Tên gì được cho là kẻ đánh bom liều chết ở Manchester?", "Sự việc đánh bom liều chết ở Manchester diễn ra ở đâu?"] \n\n', '07686ecd': '[\n"Trong 6 tháng đầu năm 2017, 

100%|█████████████████████████| 30/30 [00:02<00:00, 10.23it/s]


Chunk 28 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth29.pkl
{'3ab77670': '["Vụ nổ xảy ra vào ngày nào ở Ninh Ba?", "Ninh Ba thuộc tỉnh nào?", "Nơi xảy ra vụ nổ ở Trung Quốc là ở đâu?", "Có vụ nổ ở Trung Quốc vào ngày 26.11 không?", "Sự kiện gì xảy ra ở Ninh Ba vào sáng 26.11?"] \n', '58e3f5af': '["LG sẽ ra mắt bộ đôi điện thoại nào tại Hàn Quốc?", "Ngày LG ra mắt bộ đôi điện thoại mới là khi nào?", "Địa điểm ra mắt bộ đôi G6 Pro và G6 Plus là?", "Mẫu điện thoại nào được LG lên kế hoạch trình làng?", "Lịch trình ra mắt của LG G6 Pro và G6 Plus có cập nhật mới không?"] \n', 'deb6c574': '["Tại sao nhiệm vụ cuối cùng của tàu vũ trụ Cassini được coi là đáng kinh ngạc?", "Tàu Cassini đã bay qua khu vực nào chưa từng có?", "Cuộc thám hiểm của Cassini giúp chúng ta hiểu gì về các hành tinh khổng lồ?", "Mục tiêu chính của nhiệm vụ cuối cùng của Cassini là gì?", "Tại sao nhiệm vụ cuối cùng của Cassini được gọi là \'đến phút chót\'?"] \n', 'f0f786a7': '["Bầu Đức đã

100%|█████████████████████████| 30/30 [00:03<00:00,  9.92it/s]


Chunk 29 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth30.pkl
{'5bc0f22b': '[\n"Câu hỏi:  Tiền vệ trẻ nào mới được gọi lên tuyển U22 Việt Nam?",\n"Câu hỏi:  Có bao nhiêu cầu thủ mới được triệu tập vào U22 Việt Nam?",\n"Câu hỏi:  Hậu vệ nào được HLV triệu tập vào U22 Việt Nam?",\n"Câu hỏi:  Ngoài tiền vệ, vị trí cầu thủ nào khác được bổ sung cho U22 Việt Nam?",\n"Câu hỏi:  Tên đầy đủ của cầu thủ Châu Ngọc Quang là gì?" \n] \n\n\n', '45f4558c': '["Buổi sinh hoạt Câu lạc bộ cán bộ nữ công kỳ thứ 14 đã trang bị cho cán bộ nữ công những kiến thức gì?", \n"Ngoài kiến thức về sức khỏe, buổi sinh hoạt của Câu lạc bộ cán bộ nữ công kỳ thứ 14 còn bao gồm các thông tin gì?",\n"Nội dung nào được quan tâm trong buổi sinh hoạt Câu lạc bộ cán bộ nữ công kỳ thứ 14?",\n"Cán bộ nữ công Công đoàn Viên chức Việt Nam đã học được những kiến thức về sức khỏe sinh sản trong buổi sinh hoạt Câu lạc bộ cán bộ nữ công kỳ thứ 14?",\n"Buổi sinh hoạt Câu lạc bộ cán bộ nữ công kỳ thứ 14 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.42it/s]


Chunk 30 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth31.pkl
{'400dc67d': '["Dự án xây dựng tàu biển tự lái do Nhật Bản thực hiện nhằm mục đích gì? ","Dự án này sẽ giảm thiểu tai nạn trên biển trong những trường hợp nào?","Việc xây dựng tàu biển tự lái tại Nhật Bản nhằm mục tiêu gì trong bối cảnh an toàn hiện nay?","Tính khả thi của dự án xây dựng tàu tự lái trên biển ở Nhật Bản ra sao?","Các sự cố phổ biến trên biển mà dự án này muốn khắc phục là gì? "] \n', 'a8f2510c': '["Nguyễn Thiện Như đã sử dụng phương pháp nào để hỗ trợ người nước ngoài trong việc học tiếng Việt?", "Nguyễn Thiện Như có sử dụng những từ tiếng Anh nào trong phương pháp giảng dạy tiếng Việt của mình?", "Mục đích của việc Nguyễn Thiện Như sử dụng những từ tiếng Anh có âm gần với tên động vật là gì?", "Tài liệu nào của Nguyễn Thiện Như thể hiện việc sử dụng từ ngữ tiếng Anh để dạy tiếng Việt?", "Phương pháp của Nguyễn Thiện Như có hiệu quả trong việc giúp người nước ngoài học tiếng Việt

100%|█████████████████████████| 30/30 [00:04<00:00,  6.87it/s]


Chunk 31 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth32.pkl
{'36c58fee': '["Diệp Uyên làm gì?", "Kích thước thiệp Giáng sinh Diệp Uyên tạo ra là bao nhiêu?", "Chất liệu nào được sử dụng để tạo thiệp Giáng sinh?", "Bạc kim được sử dụng như thế nào trong công nghệ tạo thiệp Giáng sinh?", "Silicon nitric được sử dụng để làm gì trong quá trình tạo thiệp Giáng sinh? "] \n', 'c5d7d377': '[\n"Theo kết quả khảo sát, ai được kỳ vọng chiến thắng cách biệt trong vòng 2 bầu cử Tổng thống Pháp?", \n"Bà Le Pen và ông Macron đều tham gia vòng 2 bầu cử Tổng thống Pháp, đúng không?",\n"Ai là người được dự đoán sẽ thắng cuộc bầu cử Tổng thống Pháp?",\n"Kết quả khảo sát vòng 1 bầu cử Tổng thống Pháp cho thấy điều gì?",\n"Cuộc bầu cử Tổng thống Pháp diễn ra bao nhiêu vòng?" \n]\n\n\n\n\n\n', '6fb6c53a': '[\n"Lê Văn Thọ bị bắt ở tỉnh nào?",\n"Tình trạng hiện tại của Lê Văn Thọ là gì?",\n"Trại tạm giam nào đang tạm giữ Lê Văn Thọ?",\n"Tên tử tù nào cũng trốn khỏi trại tạm gia

100%|█████████████████████████| 30/30 [00:03<00:00,  9.50it/s]


Chunk 32 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth33.pkl
{'b9a9689f': '["Cơ sở kinh doanh Lê Quang Long có hoạt động trái pháp luật không?", \n"Cơ sở kinh doanh Lê Quang Long bị bắt cầm cố số lượng tạp chất arga bao nhiêu?",\n"Giai đoạn nào cơ sở kinh doanh Lê Quang Long bắt đầu bơm tạp chất vào tôm?",\n"Sản phẩm đầu ra của cơ sở kinh doanh Lê Quang Long là gì?", \n"Kế hoạch điều tra của cơ quan chức năng đối với Nguyễn Văn A là gì?" ] \n\n\n', '8525b0ac': '[\n"VPBank áp dụng hình thức gì đối với nhân viên phạm vi phạm nội bộ?",\n"Khi phát hiện trường hợp nhân viên sai phạm, VPBank  sử dụng kênh nào để triển khai xử lý?",\n"VPBank xử lý thông tin về nhân viên sai phạm như thế nào?",\n"VPBank có cách nào để phòng tránh việc nhân viên sai phạm trong tương lai?",\n"VPBank đưa những nhân viên vi phạm vào danh sách đen để làm gì?"\n] \n\n\n\n\n', '8687b41f': '["Các quan chức Đài Loan có thái độ như thế nào về việc Mỹ cung cấp vũ khí cho họ?", "Việc Mỹ bán 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.18it/s]


Chunk 33 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth34.pkl
{'edbfb48f': '["HLV Ludovic Batelli nhận định thế nào về tiềm năng của U20 Việt Nam tại U20 World Cup 2017?", "U20 Việt Nam được đánh giá như thế nào so với các đối thủ khác trong bảng E?", "HLV Batelli có xem U20 Việt Nam là đối thủ khó chịu ?", "Theo HLV Batelli, U20 Việt Nam còn nhiều điểm yếu gì khiến chưa thể ngang hàng U20 Pháp?", "Tại sao HLV Batelli gọi U20 Việt Nam là ẩn số? "] \n', '0082b1da': '["Bảo Anh có phản ứng thế nào khi một khán giả nam lao lên ôm?", "Khi một fan nam chạm vào, Bảo Anh cảm thấy như thế nào?", "Bảo Anh đối xử với tình cảm của fan nam trên sân khấu như thế nào?", "Lần cuối Bảo Anh bị fan nam ôm ở đâu?", "Bảo Anh có tỏ ra khó chịu khi một fan nam lao lên không?"] \n\n\n\n\n\n', '38f0d4de': '[\n"Cao Ngân bị tấn công bởi hai thanh niên theo cách nào?",\n"Các thương tích mà Cao Ngân gặp phải là gì?",\n"Cơ quan nào được giao nhiệm vụ điều tra vụ việc?",\n"Sự việc xảy r

100%|█████████████████████████| 30/30 [00:03<00:00,  7.98it/s]


Chunk 34 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth35.pkl
{'39af4ebf': '["Tại sao fan thích thú với teaser MV What\'s My Name của T-ara?", \n "Teaser MV What\'s My Name có những hình ảnh gì đặc biệt?", \n "Trong teaser tiếng Hàn, sản phẩm nào liên quan đến Boram và Soyeon?", \n "Teaser tiếng Trung sử dụng sản phẩm nào để ám chỉ Boram và Soyeon?",\n "Teaser MV What\'s My Name gợi nhớ điều gì về Boram và Soyeon? "] \n', '39ec764a': '[\n"Theo Tổng thống Donald Trump, áp lực nào đang tác động lên các chương trình hạt nhân và tên lửa của Triều Tiên?", \n"Có điều gì khiến Tổng thống Donald Trump tin rằng các cuộc đàm phán giữa Triều Tiên và Hàn Quốc có tiềm năng?",\n"Ngoài áp lực kinh tế, Tổng thống Donald Trump còn nhận thấy điều gì cho thấy sự hòa giải giữa Triều Tiên và Hàn Quốc là khả thể?",\n"Tổng thống Donald Trump cho rằng những biện pháp nào đang bắt đầu gây áp lực lên Bình Nhưỡng?",\n"Dữ liệu nào cho thấy nhiều người lính Triều Tiên đang chạy sang H

100%|█████████████████████████| 30/30 [00:03<00:00,  9.60it/s]


Chunk 35 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth36.pkl
{'bb414fc3': '[\n"Cuộc gặp giữa Tổng thống Mỹ Donald Trump và Tổng thống Nga Vladimir Putin diễn ra vào dịp nào?",\n"Người phát ngôn Nhà Trắng có tiết lộ chi tiết về cuộc đối thoại thứ hai giữa hai Tổng thống không?",\n"Nga làm lãnh đạo trong Hội nghị G20?",\n"Hai nhà lãnh đạo bàn tới những vấn đề gì cụ thể trong cuộc đối thoại?",\n"Cuộc đối thoại giữa Tổng thống Mỹ Donald Trump và Tổng thống Nga Vladimir Putin diễn ra ở đâu?"\n] \n', '4f4d1967': '["Giá bán của Morning GT-Line 2018 cao cấp là bao nhiêu?", "Biến thể cao cấp Morning GT-Line 2018 có giá khoảng bao nhiêu tiền?", "Morning GT-Line 2018 có bao nhiêu AED?", "Giá niêm yết của Morning GT-Line 2018 theo đồng Việt là bao nhiêu?", "Giá xe Morning GT-Line 2018 cao cấp được niêm yết là bao nhiêu?"]  \t\n', '2c3c2983': '{"questions": ["Triều Tiên có kế hoạch tấn công Guam bằng loại vũ khí nào?", "Triều Tiên dự định phóng tên lửa vào tháng nào?"

100%|█████████████████████████| 30/30 [00:03<00:00,  9.58it/s]


Chunk 36 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth37.pkl
{'a8fb9198': '[\n"Tác giả \'Dạy trẻ bằng cả trái tim\' là ai?", \n"Sách \'Dạy trẻ bằng cả trái tim\' đề cập đến bao nhiêu cấp độ phát triển tư duy của trẻ?",\n"Sách \'Dạy trẻ bằng cả trái tim\' khuyên hỗ trợ trẻ như thế nào trong giáo dục?",\n"Sách \'Dạy trẻ bằng cả trái tim\' có ý nghĩa gì đối với trẻ em nghèo khó?",\n"Ngoài kiến thức, \'Dạy trẻ bằng cả trái tim\' còn nhấn mạnh điều gì trong việc dạy dỗ?"\n] \n', '8dbad53e': '{"questions":["Sư đoàn Không quân 372 đã tổ chức những hoạt động gì trong thời gian từ tháng 9 năm 2016 đến tháng 6 năm 2017?", "Kế hoạch huấn luyện bay của Sư đoàn Không quân 372 trong năm 2017 như thế nào?", "Ngoài huấn luyện bay, Sư đoàn Không quân 372 còn tập trung vào những công tác gì?", "Những điều kiện khí tượng nào được chú trọng trong quá trình huấn luyện bay của Sư đoàn?", "Sư đoàn Không quân 372 đã làm những việc gì để đảm bảo an toàn bay?", ]}\n', 'f4f0c08d': 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.45it/s]


Chunk 37 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth38.pkl
{'bc84d744': '["Trận chung kết U23 châu Á diễn ra giữa U23 Việt Nam và đội tuyển nào?", \n"Bùi Tiến Dũng đã có màn trình diễn như thế nào trong trận chung kết U23 châu Á?",\n"Thành tích cụ thể nào mà Bùi Tiến Dũng đã giúp U23 Việt Nam đạt được?",\n"Tại sao U23 Việt Nam tiến thẳng vào vòng chung kết U23 châu Á?",\n"Những đóng góp quan trọng của Bùi Tiến Dũng bao gồm những gì?"] \n', 'c083b599': '["Những quyền lợi thể chế nào Anh quốc sẽ mất sau Brexite?", "EU có thể yêu cầu Anh tuân thủ luật pháp của EU như thế nào sau Brexit?", "Anh quốc sẽ có vai trò như thế nào trong các tổ chức EU sau Brexit?", "Liệu Anh quốc có được quyền biểu quyết khi EU ban hành luật mới cho các nước thành viên?", "EU có thể cung cấp những điều kiện tài chính thuận lợi nào cho Anh sau Brexit?"]  \n', 'ddeccc5b': '[\n"Trong 6 tháng đầu năm, nước nào có tổng vốn đầu tư vào Việt Nam cao nhất?",\n"Hàn Quốc đã đầu tư bao nhiêu

100%|█████████████████████████| 30/30 [00:03<00:00,  8.62it/s]


Chunk 38 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth39.pkl
{'4b124b46': '["Số lượng đối tượng bị bắt liên quan đến hoạt động kinh doanh cờ bạc trá hình trong trung tâm game bắn cá là bao nhiêu?", "Ngoài những người bị bắt, còn có bao nhiêu con bạc tham gia vào hoạt động này?", "Theo thông tin, đã có bao nhiêu người bị bắt vì tội kinh doanh cờ bạc trá hình trong lĩnh vực game bắn cá?", "Có bao nhiêu con bạc được xác định có liên quan đến vụ việc kinh doanh cờ bạc trá hình?", "Vụ việc kinh doanh cờ bạc trá hình tại trung tâm game bắn cá đã bắt giữ bao nhiêu người?"]   \n', '86471ba9': '{"questions": [\n"Vi phạm giao thông nào mà Công an xã được phép xử lý?",\n"Ngoài việc xử phạt không mang bằng lái, các hành vi giao thông nào Công an xã có thẩm quyền xử lý?",\n"Những trường hợp nào cho phép Công an xã xử phạt hành vi vi phạm an toàn giao thông?",\n"Công an xã có quyền xử phạt hành vi nào liên quan đến mó tô, xe gắn máy?",\n"Hành vi nào dưới lòng đường sẽ 

100%|█████████████████████████| 30/30 [00:03<00:00,  8.24it/s]


Chunk 39 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth40.pkl
{'3619358f': '["Vi phạm sử dụng vốn công ty nhà nước có thể bị phạt bao nhiêu?", "Linh vực phạt tiền đối với hành vi lãng phí  vốn công ty nhà nước là gì?", "Bộ luật nào quy định về phạt tiền cho hành vi lãng phí vốn công ty nhà nước?", "Hạn mức nào được áp dụng với hành vi lãng phí vốn công ty nhà nước?", "Mức phạt tiền tối đa cho hành vi lãng phí vốn công ty nhà nước là bao nhiêu?"] \n', '924427ec': '["Hội đồng đạo đức cấp cơ sở cần phải gửi hồ sơ đề nghị cập nhật thông tin đến cơ quan nào?", "Thời hạn gửi hồ sơ đề nghị cập nhật thông tin đến cơ quan liên quan là bao nhiêu ngày?", "Cục Khoa học Công nghệ và Đào tạo có trách nhiệm đối với hồ sơ đề nghị cập nhật thông tin của Hội đồng đạo đức trong thời hạn bao nhiêu ngày?", "Điều kiện để Cục Khoa học Công nghệ và Đào tạo cập nhật thông tin của Hội đồng đạo đức trên Trang thông tin điện tử của mình là gì?", "Hội đồng đạo đức cấp cơ sở cần làm gì

In [32]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents1[1200:], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth41.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 17/17 [00:02<00:00,  7.63it/s]


In [33]:
with open('../data/vietnamese_rag/documents-with-ids2.json', 'rt') as f_in:
    documents2 = json.load(f_in)

In [34]:
len(documents2)

1217

In [39]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents2) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    print(i + 42, chunk_start, chunk_end)
    # chunk = documents1[chunk_start:chunk_end]

40
42 0 30
43 30 60
44 60 90
45 90 120
46 120 150
47 150 180
48 180 210
49 210 240
50 240 270
51 270 300
52 300 330
53 330 360
54 360 390
55 390 420
56 420 450
57 450 480
58 480 510
59 510 540
60 540 570
61 570 600
62 600 630
63 630 660
64 660 690
65 690 720
66 720 750
67 750 780
68 780 810
69 810 840
70 840 870
71 870 900
72 900 930
73 930 960
74 960 990
75 990 1020
76 1020 1050
77 1050 1080
78 1080 1110
79 1110 1140
80 1140 1170
81 1170 1200


In [40]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents2) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    # print(i + 42, chunk_start, chunk_end)
    chunk = documents2[chunk_start:chunk_end]

    # Use map_progress to process documents
    processed_results = map_progress(pool, chunk, process_document)

    # Store the results incrementally
    for result in processed_results:
        if result is not None:
            doc_id, questions = result
            results[doc_id] = questions

    # Save the results to a file
    file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 42}.pkl'
    with open(file_name, 'wb') as file:
        pickle.dump(results, file)

    # Print out the results
    print(f"Chunk {i} processed and saved to {file_name}")
    print(results)

    # Wait for 1 minute to reset rate limit
    time.sleep(60)

40


100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.24it/s]


Chunk 0 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth42.pkl
{'a37a1821': '["Hành vi điều khiển xe ô tô với giấy đăng ký hết hạn, phạt bao nhiêu tiền?",\n"Tại sao lại bị phạt khi điều khiển ô tô với giấy đăng ký xe hết hạn?",\n"Có mức phạt cụ thể nào cho lỗi sử dụng giấy đăng ký xe hết hạn?",\n"Những trường hợp nào bị phạt tiền từ 2 đến 3 triệu đồng khi lái xe?",\n"Mức phạt tiền cho việc sử dụng giấy đăng ký xe hết hạn nhiều hơn bao nhiêu?"] \n', '3e81d992': '["Sau 18 tháng làm việc tại bệnh viện, ở đâu bác sĩ có thể hành nghề?", "Thời gian thực hành tại bệnh viện để được cấp chứng chỉ hành nghề bao nhiêu tháng?", "Yêu cầu về thời gian thực hành để được cấp chứng chỉ hành nghề cho bác sĩ là gì?", "Bác sĩ có thể nhận được giấy chứng nhận hành nghề khám chữa bệnh nếu thực hành tại phòng khám tư không?", "Đối với bác sĩ mới tốt nghiệp, điều kiện để được cấp chứng chỉ hành nghề là gì?"] \n', '981d0211': '["Hình thức kỷ luật nào được áp dụng đối với quân nhân v

100%|█████████████████████████| 30/30 [00:03<00:00,  9.19it/s]


Chunk 1 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth43.pkl
{'641489d8': '[\n"Hội đồng định giá được gửi Quyết định định giá tài sản và các tài liệu liên quan theo thời hạn bao lâu?",\n"Tòa án gửi Quyết định định giá tài sản và tài liệu liên quan đến ai?",\n"Trong trường hợp nào, Ủy ban nhân dân xã, phường, thị trấn được mời tham gia chứng kiến việc định giá?",\n"Tòa án gửi Quyết định định giá tài sản và các tài liệu liên quan cho các bên tham gia định giá bao gồm ai?",\n"Kể từ ngày ra Quyết định định giá tài sản, Tòa án gửi Quyết định định giá và các tài liệu liên quan trong bao lâu?"\n]\n\n\n\n\n', '1200a38b': '[\n"Hồ sơ kết quả pháp điển hệ thống quy phạm pháp luật gửi thẩm định bao gồm những gì?",\n"Ai là người ký xác thực kết quả pháp điển theo đề mục?",\n"Khi nào cơ quan thực hiện pháp điển bổ sung kết quả pháp điển và gửi hồ sơ bổ sung đến Bộ Tư pháp?",\n"Theo văn bản nào khung thời hạn để gửi hồ sơ kết quả pháp điển?",\n"Nếu có văn bản được ban hà

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  9.52it/s]


Chunk 2 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth44.pkl
{'5f341e81': '{"questions":["Thành viên hợp danh cần thông báo trước khi rút vốn bao lâu?","Thành viên hợp danh có thể rút vốn vào thời điểm nào?","Với điều kiện nào thành viên hợp danh được phép rút vốn?","Hội đồng thành viên có vai trò gì trong việc rút vốn của thành viên hợp danh?","Điều khoản rút vốn của thành viên hợp danh được áp dụng vào thời điểm nào?"],"record":"","answers": [ ... ]} \n', '62b20cf6': '{"questions":["Nghiệp vụ và cơ sở được phép rút gọn theo quy định như thế nào?","Mẫu số nào được sử dụng để đề nghị rút nghiệp vụ và đóng cửa chi nhánh?","Quyết định về rút bớt nghiệp vụ, đóng cửa chi nhánh nằm trong trách nhiệm của ai?","Phương án xử lý hợp đồng với khách hàng cần phải có nội dung gì khi rút ngắn nghiệp vụ?","Thời gian tối thiểu cho việc tất toán tài khoản khách hàng là bao nhiêu?"]} \n', '01e4714d': '[\n"Luật Chứng khoán nêu rõ hành vi nào là vi phạm khi sử dụng thông tin

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.33it/s]


Chunk 3 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth45.pkl
{'30bfe39c': '["Người đã mất chứng chỉ xây dựng có cần thi lại không?", "Điều kiện để cấp lại chứng chỉ xây dựng bị mất là gì?", "Có thể cấp lại chứng chỉ xây dựng bị thất lạc được không?", "Quy trình cấp lại chứng chỉ xây dựng bị mất như thế nào?", "Chứng chỉ xây dựng bị mất được cấp lại với tổ chức nào?"] \n', '29fbedad': '[\n"Điều kiện để người tạm đình chỉ chấp hành án phạt tù được đề nghị tha tù trước thời hạn là gì?",\n"Có thể được xem xét đề nghị tha tù trước thời hạn cho người tạm đình chỉ chấp hành án phạt tù không?",\n"Ủy ban nhân dân cấp xã có vai trò gì trong việc xem xét đề nghị tha tù trước thời hạn cho người tạm đình chỉ?",\n"Ngoài Ủy ban nhân dân cấp xã, cơ quan nào khác có thể xác nhận về việc chấp hành nghiêm chỉnh các quy định của pháp luật đối với người tạm đình chỉ?",\n"Người tạm đình chỉ chấp hành án phạt tù được phép được đề nghị tha tù trước thời hạn trong trường hợp nào?"

100%|█████████████████████████| 30/30 [00:03<00:00,  9.44it/s]


Chunk 4 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth46.pkl
{'a557f211': '["Mức phạt tiền cho hành vi lái xe ô tô trên phần lề đường cao tốc là bao nhiêu?", "Hành vi lái xe ô tô trên lề đường cao tốc có thể bị phạt bao nhiêu tiền?", "Yêu cầu về hành vi lái xe trên đường cao tốc là gì?", "Người vi phạm luật lệ khi điều khiển xe ô tô trên lề đường cao tốc sẽ chịu hình phạt thế nào?", "Liên quan đến việc di chuyển xe ô tô trên lề đường cao tốc, có quy định nào về mức phạt?"] \n', '025285d1': '["Trường hợp Quốc hội không họp thì ai có quyền đồng ý bắt giam đại biểu quốc hội?", "Điều kiện bắt giam đại biểu quốc hội là gì?", "Ủy ban thường vụ Quốc hội có vai trò như thế nào trong việc bắt giam đại biểu quốc hội?", "Có nên thu hồi quyền miễn trừ của đại biểu quốc hội trong trường hợp bị bắt giam không?", "Nếu Quốc hội đồng ý bắt giam đại biểu quốc hội, thì có thời hạn không?"] \n', '3eb2b8ba': '{\n"questions": [\n"Theo Luật Giám định Tư pháp, quy định nào liên q

100%|█████████████████████████| 30/30 [00:03<00:00,  8.24it/s]


Chunk 5 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth47.pkl
{'22994b2a': '["Cơ sở dữ liệu về thi hành án hình sự được xây dựng theo tiêu chuẩn như thế nào?", "Việc xây dựng cơ sở dữ liệu về thi hành án hình sự có đảm bảo tính an toàn thông tin không?", "Cơ sở dữ liệu về thi hành án hình sự có tính năng tích hợp dữ liệu với các cơ sở dữ liệu khác không?", "Cấu trúc cơ sở dữ liệu về thi hành án hình sự có tính tương thích để mở rộng trong tương lai không?", "Cơ sở dữ liệu về thi hành án hình sự được dùng chung ở phạm vi nào?"] \n\n\n', '647ac1ef': '["Hộ mức phạt tiền cho trường hợp tuyển sinh sai lệch đề án?");\n["Tìm hiểu mức phạt cho việc tuyển sinh không tuân theo đề án?",\n"Theo luật, mức phạt tiền là bao nhiêu nếu tuyển sinh không theo đúng đề án?",\n"Có mức phạt cụ thể nào cho các trường hợp tuyển sinh trái quy định?",\n"Những khoản phạt tiền có liên quan gì đến việc tuyển sinh không theo đề án đã công bố?"] \n\n\n', 'b0efbcce': '["Hành vi không khai 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.03it/s]


Chunk 6 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth48.pkl
{'b5c588c0': '[\n"Điều kiện nào được xem là đặc biệt để trở lại quốc tịch Việt Nam?",\n"Ai có thể trở lại quốc tịch Việt Nam nếu họ đóng góp lợi ích cho Nhà nước?",\n"Nghị định nào quy định điều kiện để trở lại quốc tịch Việt Nam?",\n"Linh vực đầu tư gì được phép để trở lại quốc tịch Việt Nam?",\n"Có thể lấy giấy tờ gì chứng minh việc đầu tư tại Việt Nam?"\n]\n', 'f8cdabba': '[\n"Hành vi vượt xe tại đường cấm vượt có thể bị phạt bao nhiêu tiền?",\n"Trường hợp vượt xe nơi cấm vượt theo luật, mức phạt cụ thể là gì?",\n"Mức phạt tài chính đối với hành vi vượt xe tại đoạn đường có biển báo cấm vượt là bao nhiêu?",\n"Xe ô tô vượt đoạn đường cấm vượt sẽ bị phạt tiền ở khoảng nào?",\n"Với hành vi vượt xe tại đoạn đường biển báo cấm vượt, mức phạt tiền tối đa là bao nhiêu?"\n] \n\n\n', 'b699e1a0': '[\n"Cục Đường thủy nội địa Việt Nam có vai trò gì trong việc lựa chọn nhà thầu và bàn giao mặt bằng?",\n"Cá

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.40it/s]


Chunk 7 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth49.pkl
{'6c4c15dd': '["Mức phạt cho vi phạm tốc độ từ 10km/h đến 20km/h là bao nhiêu?", "Xe máy di chuyển quá tốc độ 15km/h sẽ bị phạt bao nhiêu tiền?", "Độ chênh lệch vận tốc xe máy bị phạt từ 10km/h đến 20km/h là bao nhiêu?", "Biết tốc độ xe máy chạy quá tốc độ quy định từ 10 km/h đến 20 km/h có mức phạt bao nhiêu?" , "Vận tốc xe máy nào sẽ bị phạt từ 600.000 đến 1.000.000 đồng? "] \n', '23d550b7': '["Điều tra hiện trạng mỏ nhằm mục đích gì?","Một cuộc điều tra hiện trạng mỏ bao gồm những nội dung nào?","Kết quả điều tra hiện trạng mỏ có ý nghĩa như thế nào?","Tại sao điều tra hiện trạng mỏ lại cần thiết?","Các thông tin quan trọng nào được thu thập trong quá trình điều tra hiện trạng mỏ?"] \n', 'a46f94f4': '[\n"Văn phòng Ủy ban nhân dân cấp tỉnh có nhiệm vụ gì trong việc hướng dẫn nghiệp vụ cho Văn phòng các Sở?",\n"Ai là những đơn vị được Văn phòng Ủy ban nhân dân cấp tỉnh hướng dẫn chuyên môn, nghi

100%|█████████████████████████| 30/30 [00:03<00:00,  8.24it/s]


Chunk 8 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth50.pkl
{'9e4dfb14': '["Theo quy định pháp luật, bộ phận động vật, thực vật hoang dã nào được coi là nguy cấp?", "Bất kỳ thành phần nào thuộc động vật, thực vật hoang dã nguy cấp được coi là nguy hiểm?", "Pháp luật định nghĩa như thế nào về bộ phận động vật, thực vật hoang dã nguy cấp?", "Da, vỏ, rễ của động vật, thực vật hoang dã nguy cấp có nguy hiểm không?", "Ảnh hưởng pháp lý đến việc sơ chế bộ phận động vật, thực vật hoang dã nguy cấp là gì?"] \n', '7c86b816': '["Việc chuyển công tác của công an xã có được hưởng bất kỳ chế độ nào không?", "Pháp luật có quy định về trợ cấp cho công an xã khi chuyển công tác hay không?", "Đối với công an xã, có hình thức phúc lợi nào được hưởng khi chuyển công tác không?", "Bên cạnh trợ cấp, có những hỗ trợ nào khác dành cho công an xã khi chuyển công tác?", "Theo văn bản hiện hành có đề cập đến việc công an xã chuyển công tác và những quyền lợi liên quan không?"] \n'

100%|█████████████████████████| 30/30 [00:03<00:00,  8.76it/s]


Chunk 9 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth51.pkl
{'a1f5b196': '[\n"Ủy ban nhân dân các tỉnh, thành phố có trách nhiệm gì trong việc tiêu hủy thuốc lá?",\n"Các tổ chức nào có trách nhiệm xử lý thuốc lá lậu?",\n"Ban Chỉ đạo Quốc gia chống buôn lậu có liên quan đến việc tiêu hủy thuốc lá lậu?",\n"Nơi nào chịu trách nhiệm chính trong việc tiêu hủy hàng hóa lậu?",\n"Ngoài thuốc lá,  Ban Chỉ đạo Quốc gia chống buôn lậu, gian lận thương mại và hàng giả còn có trách nhiệm gì?"\n] \n', '584f607c': '{"question1":"Nếu tài san được thế chấp đang được cho thuê hoặc cho mượn thì người thế chấp cần làm gì?","question2":"Việc thế chấp tài sản ảnh hưởng đến hợp đồng thuê/mượn?",\n"question3":"Theo quy định,  thời hạn cho thuê/mượn sẽ như thế nào nếu tài sản được thế chấp?",\n"question4":"Có trường hợp nào hợp đồng thuê/mượn chấm dứt ngay theo hành động thế chấp không?",\n"question5":"Vốn quyền, nghĩa vụ giữa bên thế chấp và bên thuê/mượn được giải quyết như thế

100%|█████████████████████████| 30/30 [00:03<00:00,  8.31it/s]


Chunk 10 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth52.pkl
{'4d0410fa': '{"questions":["Bộ Công an phối hợp với cơ quan nào để đảm bảo trật tự an toàn giao thông đường thủy nội địa?","Bộ Công an có trách nhiệm gì đối với việc tuần tra, kiểm soát và xử lý hành vi vi phạm pháp luật trên đường thủy nội địa?","Lực lượng nào được Bộ Công an chỉ đạo tăng cường phối hợp bảo vệ hạ tầng đường thủy nội địa?","Bộ Công an có vai trò gì trong việc điều tra và thống kê tai nạn giao thông đường thủy nội địa?","Ủy ban nhân dân cấp tỉnh có liên quan đến hoạt động nào của Bộ Công an trong quản lý giao thông đường thủy nội địa?" ]} \n', 'e1bfcced': '["Xe máy chuyên dụng là gì?", "Những loại xe máy nào cần có chứng chỉ bồi dưỡng kiến thức pháp luật về giao thông đường bộ?", "Tiêu chuẩn điều khiển xe máy chuyên dùng là gì?", "Hình phạt khi điều khiển xe máy chuyên dụng mà không có chứng chỉ bồi dưỡng?", "Giá trị phạt nếu điều khiển xe máy chuyên dụng không có chứng chỉ bồi 

100%|█████████████████████████| 30/30 [00:04<00:00,  7.43it/s]


Chunk 11 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth53.pkl
{'7d65fe7a': '["Số tiền phạt tối đa khi dựng rạp, lều trái phép trong khu vực đô thị?", "Làm ơn cho biết mức phạt tài chính đối với cá nhân dựng công trình trái phép tại hầm đường bộ?", "Tổ chức vi phạm quy định tại hầm đường bộ sẽ bị phạt bao nhiêu tiền?", "Mức phạt thấp nhất đối với cá nhân dựng rạp, lều trái phép tại hầm đường bộ là bao nhiêu?", "Sự khác biệt về mức phạt giữa cá nhân và tổ chức khi vi phạm quy định tại hầm đường bộ là gì?"] \n', '6911db4a': '["Doanh nghiệp tư nhân có thể thay đổi số vốn họ đầu tư vào hoạt động kinh doanh?",\n"Những điều kiện nào cần được tuân thủ khi doanh nghiệp tư nhân muốn giảm vốn hoạt động?",\n"Việc giảm vốn hoạt động có ảnh hưởng đến việc đăng ký kinh doanh của doanh nghiệp tư nhân không?",\n"Vốn đầu tư đã đăng ký có phải là số vốn tối thiểu mà doanh nghiệp tư nhân phải duy trì hoạt động?",\n"Nơi nào doanh nghiệp tư nhân cần đăng ký lại nếu giảm vốn hoạ

100%|█████████████████████████| 30/30 [00:03<00:00,  8.99it/s]


Chunk 12 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth54.pkl
{'e266e606': '["Sẽ có bao nhiêu đại biểu HĐND nếu một xã có dân số 5000 người?", "Một xã với số dân 10 000 người sẽ bầu bao nhiêu đại biểu HĐND?", "Liệu phương thức bầu cử đại biểu HĐND có thay đổi khi dân số xã thay đổi?", "Nếu dân số xã tăng từ 7000 lên 8000 người, sẽ có bao nhiêu đại biểu được bầu thêm?", "Ngoài số dân, có yếu tố nào khác ảnh hưởng đến số đại biểu HĐND?"] \n\n\n\n\n', 'cd9402e5': '[\n"Việc làm việc trên tàu cá mà quên mang theo giấy tờ tùy thân có thể bị phạt bao nhiêu tiền?",\n"Có bị phạt khi làm việc trên tàu cá mà không có giấy tờ tùy thân?",\n"Giấy tờ tùy thân cần thiết khi làm việc trên tàu cá bao gồm những loại nào?",\n"Tội lỗi nào có thể xảy ra khi quên mang CMND khi làm việc trên tàu cá?",\n"Hạn chênh lệch mức phạt tiền cho việc quên mang CMND khi làm việc trên tàu cá là bao nhiêu?"\n]\n', 'c69a3eff': '[\n"Chức năng chính của Chỉ huy trưởng Chỉ huy quân sự bộ, ngành t

100%|█████████████████████████| 30/30 [00:03<00:00,  9.00it/s]


Chunk 13 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth55.pkl
{'8d2ad04c': '[\n"Phạm nhân được phép làm việc bao nhiêu giờ trong một ngày?",\n"Việc làm thêm của phạm nhân có vượt quá bao nhiêu giờ trong một ngày?",\n"Giới hạn thời gian làm việc của phạm nhân trong một ngày là bao nhiêu?",\n"Phạm nhân có thể lao động bao nhiêu giờ trong một ngày tối đa?",\n"Theo quy định, phạm nhân làm việc bao nhiêu giờ trong một ngày?"\n] \n\n\n', 'd7147874': '["Hành khách có bị phạt tiền khi mang hóa chất nguy hiểm lên xe bus không?", "Mức phạt tiền cho hành khách mang hóa chất độc hại lên xe là bao nhiêu?", "Có quy định phạt hành khách mang hóa chất lên xe không?", "Làm thế nào người ta kiểm soát hóa chất độc hại trên xe bus?", "Ngoài phạt tiền, có hình phạt nào khác đối với hành khách mang hóa chất độc hại lên xe không?"] \n', 'b81dbbce': '["Tổng cục Quản lý đất đai thực hiện những công việc gì để chuẩn bị cho việc kiểm kê đất đai và lập bản đồ hiện trạng sử dụng đất đ

100%|█████████████████████████| 30/30 [00:04<00:00,  6.88it/s]


Chunk 14 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth56.pkl
{'cf6b4620': '["Phân khu công nghiệp có ranh giới được xác định như thế nào?", "Mục đích của việc chia tách phân khu công nghiệp là gì?", "Sản xuất và dịch vụ nào được thực hiện tại phân khu công nghiệp?", "Phân khu công nghiệp được quy hoạch như thế nào?", "Khu công nghiệp và phân khu công nghiệp khác nhau như thế nào? "] \n', '14d538e9': '["Ai có quyền quyết định về cơ chế ngắt mạch thị trường?", \n"Ủy ban nào liên quan đến việc quyết định ngắt mạch thị trường?",\n"Sở giao dịch chứng khoán nào có vai trò trong việc quyết định ngắt mạch thị trường?",\n"Cơ chế ngắt mạch thị trường được áp dụng cho cổ phiếu niêm yết ở đâu?",\n"Việc ngắt mạch thị trường được quyết định bởi tổ chức nào ở Việt Nam?"] \n', 'a7bcc95b': '["Những điều kiện hồ sơ nào được xem là đầy đủ và hợp lệ khi tiếp nhận để chứng nhận lãnh sự?", "Địa điểm chuộng nhận hồ sơ để chứng nhận lãnh sự là đâu?", "Hồ sơ không đủ hoặc không h

100%|█████████████████████████| 30/30 [00:03<00:00,  8.23it/s]


Chunk 15 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth57.pkl
{'c5a9498e': '["Việc thay đổi biểu tượng kênh truyền hình cần sự chấp thuận của cơ quan nào?", "Làm thế nào để tránh bị phạt tiền khi thay đổi biểu tượng kênh truyền hình?", "Hạn mức phạt tiền cho việc thay đổi logo kênh truyền hình là bao nhiêu?", "Có quy định về việc thay đổi biểu tượng kênh truyền hình?", "Thay đổi biểu tượng kênh truyền hình tuỳ ý có vi phạm pháp luật không?"] \n\n\n\n\n\n', '222e8ce7': '["Hành vi chuyển mục đích sử dụng rừng phòng hộ sẽ bị phạt bao nhiêu tiền nếu diện tích dưới 600 m2 không đúng quy định?", "Lương phạt dành cho vi phạm chuyển mục đích rừng phòng hộ diện tích nhỏ tính như thế nào?", "Diện tích rừng phòng hộ nào sẽ bị phạt tiền từ 1.000.000 đến 5.000.000 đồng?", "Việc khai thác trái phép rừng phòng hộ diện tích hơn 600 m2 có bị phạt tiền không?", "Mức phạt tiền tối đa cho vi phạm chuyển mục đích sử dụng rừng phòng hộ diện tích dưới 600m2 là bao nhiêu?"] \n  \

100%|█████████████████████████| 30/30 [00:09<00:00,  3.11it/s]


Chunk 16 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth58.pkl
{'9f092fc6': '["Nhượng hành khách dọc đường cho xe khác, điều kiện nào bị phạt?", "Mức phạt cho hành khách bị nhượng bừa bãi là bao nhiêu?", "Xe nào có quyền nhượng hành khách dọc đường?", "Khi nào hành khách đồng ý nhượng chỗ cho xe khác?",  "Hành xe tự ý nhượng khách cho xe khác có vi phạm luật không?" ] \n', '534d879a': '{"questions":["Tiêu chuẩn trình độ đào tạo để trở thành giáo viên THPT hạng III bao gồm những yêu cầu gì?","Ngoài bằng cử nhân ngành giáo dục, giáo viên THPT hạng III còn cần điều gì nếu môn học thiếu giáo viên có bằng cử nhân ngành đào tạo giáo viên?","Có điều kiện gì về bằng cấp cho giáo viên THPT hạng III mới được tuyển dụng?","Làm thế nào để giáo viên mới được tuyển dụng vào giáo viên THPT hạng III có thể đáp ứng tiêu chuẩn về trình độ đào tạo?","Ai có thẩm quyền ban hành chương trình bồi dưỡng nghiệp vụ sư phạm dành cho giáo viên THPT?"]}\n', '08c625f8': '[\n"Bản sao chứ

100%|█████████████████████████| 30/30 [00:06<00:00,  4.87it/s]


Chunk 17 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth59.pkl
{'c1f3acb8': '```json\n["Người đứng đầu bộ, ngành, địa phương có quyền phê duyệt vị trí việc làm của công chức không?", "Quyền phê duyệt vị trí công chức thuộc về ai?", "Vị trí việc làm nào được người đứng đầu bộ, ngành, địa phương phê duyệt?", " ai có trách nhiệm phê duyệt vị trí việc làm của công chức?", "Những quyền hạn của người đứng đầu bộ, ngành, địa phương bao gồm việc phê duyệt vị trí công chức không?"] \n```', '860ac5ca': '["Gửi tiền tiết kiệm bao gồm những hoạt động nào?", "Để rút tiền tiết kiệm, ta cần thực hiện những bước nào?", "Tiền gửi tiết kiệm có thể được sử dụng làm gì?", "Một người có thể chuyển quyền sở hữu tiền gửi tiết kiệm như thế nào?", "Ngoài gửi và rút tiền, giao dịch tiền gửi tiết kiệm còn bao gồm những hoạt động khác?"] \n \n', '0845ac35': '["Hành vi nào sẽ bị phạt tiền từ 10.000.000 đồng đến 20.000.000 đồng?", "Những trường hợp nào phải công khai thông tin về tổ chức

100%|█████████████████████████| 30/30 [00:04<00:00,  6.74it/s]


Chunk 18 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth60.pkl
{'7bc0ca01': '[\n"Vụ Pháp chế có vai trò gì trong việc phổ biến văn bản quy phạm pháp luật mới?",\n"Không chỉ Vụ Pháp chế, ai khác cũng có trách nhiệm gì trong việc phổ biến văn bản quy phạm pháp luật?",\n"Ai là đơn vị chịu trách nhiệm chính trong việc soạn thảo kế hoạch phổ biến văn bản quy phạm pháp luật?",\n"Liên quan đến việc phổ biến văn bản quy phạm pháp luật mới, hai đơn vị này có vai trò phối hợp như thế nào?",\n"Theo quy định, ai có trách nhiệm chủ động phối hợp với Vụ Pháp chế để phổ biến văn bản quy phạm pháp luật?"\n] \n\n\n\n\n', '333b6430': '["Việc kiểm sát pháp luật trong phá sản được thực hiện bởi cơ quan nào?", "Viện kiểm sát nhân dân có những quyền gì trong quá trình giải quyết phá sản?", "Viện kiểm sát nhân dân tham gia vào những hoạt động gì trong việc xử lý phá sản?", "Theo luật, Viện kiểm sát nhân dân có quyền kiến nghị và kháng nghị gì?", "Việc kiểm sát quyết định giải quy

100%|█████████████████████████| 30/30 [00:03<00:00,  7.86it/s]


Chunk 19 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth61.pkl
{'0c926ab8': '{"question": [\n"Các hành vi vi phạm pháp luật nào được quy định trong việc cung cấp thông tin hộ tịch trực tuyến?",\n"Điều gì được coi là truy cập trái phép vào Cơ sở dữ liệu hộ tịch điện tử?",\n"Những hành động nào vi phạm luật khi thực hiện với dữ liệu trong Cơ sở dữ liệu hộ tịch điện tử?",\n"Mức độ nghiêm trọng của việc khai thác thông tin từ Cơ sở dữ liệu hộ tịch điện tử không đúng quy định là gì?",\n"Những hành vi nào có thể gây hại đến hoạt động của Cơ sở dữ liệu hộ tịch điện tử?"\n]\n}\n\n\n\n\n', 'f82db96e': '["Chiều dài dòng xe xếp hàng chờ trước trạm thu phí có thể gây ra phạt tiền bao nhiêu?",\n"Hệ quả tài chính của việc để dòng xe xếp hàng vượt quá 1.000 m đến 2.000 m là gì?",\n"Ngưỡng chiều dài dòng xe gây phạt tiền từ 10 đến 20 triệu là bao nhiêu?",\n"Mức phạt tiền đối với xe xếp hàng quá dài trước trạm thu phí, cụ thể 1.000 m đến 2.000 m, là bao nhiêu?",\n"Khi dòng 

100%|█████████████████████████| 30/30 [00:04<00:00,  6.07it/s]


Chunk 20 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth62.pkl
{'6f64bbe1': '[\n"Phạm vi tiếp nhận hồ sơ thủ tục hành chính của Bộ phận Một cửa cấp xã bao gồm những loại hồ sơ nào?",\n"Cấp xã có nhận hồ sơ thủ tục hành chính thuộc thẩm quyền của cấp huyện không?",\n"Bộ phận nào tại cấp xã chịu trách nhiệm tiếp nhận hồ sơ?",\n"Thủ tục hành chính nào được xử lý tại cấp xã?",\n"Hồ sơ được xử lý ở cấp xã sẽ được chuyển đến bộ phận nào để kết quả?"\n]\n\n\n\n\n', '2dafc335': '["Thời gian công tác để trở thành cán bộ kiểm tra phòng cháy, chữa cháy và cứu nạn, cứu hộ ở Cục Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ là bao nhiêu?", "Những yêu cầu về thời gian công tác là bao nhiêu để được bổ nhiệm làm cán bộ kiểm tra phòng cháy, chữa cháy và cứu nạn, cứu hộ tại cơ quan Công an tỉnh, thành phố trực thuộc trung ương?", "Tại Công an huyện, quận, thị xã, thành phố thuộc tỉnh, thời gian công tác tối thiểu để chức danh cán bộ kiểm tra phòng cháy, chữa cháy và cứu 

100%|█████████████████████████| 30/30 [00:10<00:00,  2.75it/s]


Chunk 21 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth63.pkl
{'14d3e678': '["Người chịu trách nhiệm phân bổ ngân sách cho dự trữ quốc gia năm 2019 là ai?", "Thủ tướng Chính phủ giao dự toán ngân sách cho dự trữ quốc gia theo cách nào?", "Bộ Tài chính đảm bảo điều gì khi phân bổ dự toán chi mua hàng dự trữ quốc gia?", "Luật nào quy định về phân bổ kế hoạch dự trữ quốc gia?", "Thủ trưởng các bộ, cơ quan trung ương có trách nhiệm gì khi phân bổ kế hoạch dự trữ cho đơn vị trực thuộc?"] \n', '0586e70f': '[\n"Bộ Tài chính có vai trò gì trong việc phát hành công cụ nợ của Chính phủ?",\n"Kho bạc Nhà nước có liên quan đến việc phát hành công cụ nợ của Chính phủ?",\n"Nghi định nào quy định về chủ thể phát hành công cụ nợ của Chính phủ?",\n"Ai tổ chức phát hành công cụ nợ của Chính phủ tại thị trường trong nước?",\n"Bộ Tài chính có thể ủy quyền cho ai tổ chức phát hành công cụ nợ của Chính phủ?"\n] \n', '7852e648': '[\n"Thông tin đăng ký tàu cá bao gồm những thông s

100%|█████████████████████████| 30/30 [00:03<00:00,  7.82it/s]


Chunk 22 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth64.pkl
{'b2cee75b': '["Người cảnh giới sử dụng loại thiết bị nào để thực hiện nhiệm vụ?", "Trang thiết bị nào được dùng để cảnh giới vị trí?", "Ngoài đèn tín hiệu, trường hợp nào cần sử dụng còi trong cảnh giới?", "Các loại biển báo nào thường được sử dụng trong các hoạt động cảnh giới?", "Công việc ghi chép lịch trình tàu được thực hiện bằng trang thiết bị gì?"]  \n', 'ab660f90': '[\n"Hồ sơ nhập khẩu thức ăn chăn nuôi cho nghiên cứu bao gồm những loại hồ sơ chính?",\n"Mẫu số nào được sử dụng cho đơn đề nghị nhập khẩu thức ăn chăn nuôi phục vụ nghiên cứu?",\n"Điều gì được nêu trong đề cương nghiên cứu hoặc khảo nghiệm?",\n"Theo Nghị định này, hồ sơ nhập khẩu bao gồm những gì?",\n"Đơn đề nghị nhập khẩu thức ăn chăn nuôi và đề cương nghiên cứu có được qui định mẫu số nào?"\n] \n', 'b17bdc95': '[\n" Kinh phí để rà soát, cập nhật và xây dựng, điều chỉnh định mức xây dựng được phân bổ từ đâu?",\n" Những hạn

100%|███████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Chunk 23 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth65.pkl
{'6783ebe1': '[\n"Số lao động tối đa tham gia bảo hiểm xã hội để được xếp loại doanh nghiệp siêu nhỏ trong nông nghiệp là bao nhiêu?",\n"Tổng doanh thu hoặc vốn của doanh nghiệp siêu nhỏ trong nông nghiệp không được vượt quá bao nhiêu?",\n"Một doanh nghiệp siêu nhỏ trong nông nghiệp phải tuân theo điều kiện gì về bảo hiểm xã hội?",\n"Ngoài điều kiện về số lao động, doanh nghiệp siêu nhỏ trong nông nghiệp còn phải đáp ứng điều kiện gì?",\n"Đơn vị tính của tổng doanh thu hoặc vốn tối đa cho doanh nghiệp siêu nhỏ trong lĩnh vực nông nghiệp là gì?"\n] \n', '688b5742': '["Số tiền phạt đối với trường hợp lái tàu khi chưa có tín hiệu an toàn là bao nhiêu?", "Vi phạm nào được phạt từ 2.000.000 đồng tới 3.000.000 đồng?", " mức phạt về việc lái tàu mà không đợi tín hiệu an toàn từ ga là bao nhiêu?", "Nếu lái tàu mà không đợi tín hiệu của trực ban chạy tàu ga thì có biện pháp gì?", " có phạt tiền khi lái t

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.53it/s]


Chunk 24 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth66.pkl
{'d0989523': '[\n"Giá phạt cho hành vi điều khiển ô tô đẩy xe khác là bao nhiêu?",\n"Người điều khiển ô tô đẩy xe khác sẽ bị phạt bao nhiêu tiền?",\n"Có phạt khi lái xe ô tô đẩy xe khác không?",\n"Hành vi điều khiển ô tô đẩy xe khác bị phạt bao nhiêu cho mỗi trường hợp?",\n"Khoảng tiền phạt theo luật giao thông khi điều khiển ô tô đẩy xe khác bao nhiêu?"\n] \n', 'd3c0c7c0': '["Người có mái tóc dài có thể được cấp CCCD không?",\n"Yều cầu gì về mái tóc khi chụp ảnh cho CCCD?",\n"Làm CCCD cần có mái tóc ngắn không?",\n"Cần phải đảm bảo điều gì khi chụp ảnh cho CCCD?",\n"Ảnh chân dung CCCD phải rõ ràng như thế nào?"] \n', '834cddf2': '["L规违限行罚款金额是多少？", "Xe ô tô vi phạm luật đường bộ, phạt bao nhiêu tiền?", "Khoảng phạt tiền lái xe lấn làn đường?", "Giới hạn mức phạt tiền đối với hành vi điều khiển xe ô tô không đi đúng làn đường là bao nhiêu?", "Trong trường hợp xe ô tô đi sai làn đường, người điều 

100%|█████████████████████████| 30/30 [00:08<00:00,  3.69it/s]


Chunk 25 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth67.pkl
{'536298c9': '[\n"Hội chợ, triển lãm thương mại tại Việt Nam phải tuân theo kích thước gian hàng chuẩn nào?",\n"Ngoài gian hàng, còn có những yêu cầu gì cho hội chợ, triển lãm thương mại ở Việt Nam?",\n"Hội chợ, triển lãm thương mại tại Việt Nam cần phải có dịch vụ nước? ",\n"Dịch vụ an ninh là điều kiện bắt buộc cho hội chợ, triển lãm thương mại tổ chức tại Việt Nam?",\n"Hội chợ, triển lãm thương mại được phép cung cấp các dịch vụ khác ngoài điện, nước, an ninh và vệ sinh?"\n]\n', '1a79ebd8': '["Người vi phạm luật dừng đỗ xe ô tô không đúng quy định sẽ bị phạt bao nhiêu tiền?", \n"Giới hạn mức phạt đối với hành vi dừng đỗ xe ô tô sai quy định là bao nhiêu?", \n"Bị phạt tiền bao nhiêu nếu dừng đỗ xe ô tô không đúng quy định?",\n"Cước phạt tiền cho hành vi dừng đỗ xe ô tô không đúng quy định là gì?",\n"Mức phạt cụ thể nào dành cho những trường hợp dừng, đỗ xe ô tô không đúng quy định?" ] \n', '76

100%|█████████████████████████| 30/30 [00:04<00:00,  7.32it/s]


Chunk 26 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth68.pkl
{'de17e26a': '[\n"NHÀ xưởng sản xuất thức ăn, sản phẩm xử lý môi trường nuôi trồng thủy sản cần phải có cấu trúc như thế nào?",\n"Bố cục của nhà xưởng có ảnh hưởng đến quy trình sản xuất?",\n"Thiết bị trong nhà xưởng cần đáp ứng những yêu cầu gì về an toàn sinh học?",\n"Làm sao để bảo đảm việc bảo quản nguyên liệu, vật liệu và thành phẩm trong nhà xưởng?",\n"Các trang thiết bị thu gom và xử lý chất thải phải có tính năng gì để bảo vệ môi trường?" \n]\n', '492d4ca8': '["Xe ô tô, xe máy kéo vi phạm luật giao thông bằng cách xả rác trái phép ra đường phố, phạt bao nhiêu tiền?", "Đối với hành vi phóng xả đất, cát, đá, chất thải ra đường phố bằng xe ô tô, xe máy kéo, mức phạt cụ thể là bao nhiêu?", "Mức phạt người điều khiển xe gây ô nhiễm môi trường bằng cách xả thải ra đường phố là bao nhiêu?", "Làm thế nào Pháp luật xử lý việc các phương tiện như ô tô, xe máy kéo xả vật liệu xây dựng trái phép ra 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.29it/s]


Chunk 27 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth69.pkl
{'cc141422': '["Xe khách vi phạm chạy ngoài tuyến đường, lịch trình vận tải, mức phạt bao nhiêu?",\n"Tài xế xe khách bị phạt bao nhiêu tiền nếu không đúng tuyến đường, lịch trình?",\n"Có quy định phạt tài xế xe khách nào khi chạy ngoài tuyến đường, lịch trình không?",\n"Hạng mục vi phạm chạy ngoài tuyến đường, lịch trình vận tải đối với xe khách sẽ bị phạt bao nhiêu?",\n"Mức phạt giao thông đối với tài xế xe khách chạy sai tuyến đường, lịch trình là bao nhiêu?"] \n', '02252e10': '["Hạn ngạch thuế quan nhập khẩu đường đấu giá năm 2019 là bao nhiêu tấn?",\n"Lượng đường đấu giá được nhập khẩu năm 2019 được quy định thế nào?",\n"Số tấn đường được nhập khẩu đấu giá năm 2019 là bao nhiêu?",\n"Năm 2019, bao nhiêu tấn đường được phép nhập khẩu dưới dạng đấu giá?",\n"Ngành đường đấu giá có hạn ngạch nhập khẩu bao nhiêu tấn vào năm 2019?" ] \n', '5d8ca1d2': '[\n"Xe khách được phép đón trả khách lúc xe đan

100%|█████████████████████████| 30/30 [00:04<00:00,  6.93it/s]


Chunk 28 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth70.pkl
{'e21a389e': '["Thông tin dữ liệu trong cơ sở dữ liệu về nhà ở và thị trường bất động sản có được coi là có giá trị pháp lý như thế nào?", "Cơ sở dữ liệu về nhà ở và thị trường bất động sản được cập nhật và xử lý theo quy định nào?", "Trong trường hợp dữ liệu trong cơ sở dữ liệu không trùng khớp với hồ sơ giấy, tài liệu nào được xem là có tính pháp lý?", "Nghiên cứu  đã kiểm tra và xử lý cơ sở dữ liệu về nhà ở và thị trường bất động sản theo quy định nào?", "Có dấu hiệu gì cho thấy cơ sở dữ liệu về nhà ở và thị trường bất động sản có tính pháp lý?"] \n', 'df51cc62': '[\n"Ngành nào là ngành đào tạo giáo viên để có thể làm giáo viên tiểu học hạng III?", \n"Trình độ học vấn tối thiểu để làm giáo viên tiểu học hạng III là gì?",\n"Ngoài trình độ học vấn, yêu cầu gì khác để trở thành giáo viên tiểu học hạng III?",\n"Chứng chỉ bồi dưỡng nào mà giáo viên tiểu học hạng III cần có?",\n"Một giáo viên mới đ

100%|█████████████████████████| 30/30 [00:06<00:00,  4.74it/s]


Chunk 29 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth71.pkl
{'ea9158da': '[\n"Nhiệm vụ của trực ban chạy tàu ga bao gồm điều hành những việc gì tại nhà ga?",\n"Truyền thống trực ban chạy tàu ga tuân thủ những tài liệu nào trong khi đảm nhiệm công việc?",\n"Nhận thức về an toàn của trực ban chạy tàu ga là gì?",\n"Công tác xếp dỡ hàng hóa và đón tiễn hành khách thuộc phạm vi trách nhiệm của ai?",\n"Vai trò của trực ban chạy tàu ga trong việc tổ chức công tác dồn, đón, tiễn tàu là gì?"\n] \n', 'ad5ee67f': '[\n"Bên cạnh Học viện Tư pháp, cơ quan nào khác cũng tổ chức bồi dưỡng nghiệp vụ công chứng hàng năm?",\n"Hội nào hỗ trợ bồi dưỡng nghiệp vụ cho công chứng viên?",\n"Có tổ chức nào ngoài Học viện Tư pháp giúp công chứng viên nâng cao nghiệp vụ?",\n"Ngoài Học viện Tư pháp, công chứng viên có thể học tập ở đâu để nâng cao trình độ?",\n"Việt Nam có bao nhiêu tổ chức bồi dưỡng nghiệp vụ công chứng?"\n] \n', '7d52d073': '["Mua dâm bị phạt bao nhiêu tiền?", "Hì

100%|█████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Chunk 30 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth72.pkl
{'2c443f04': '["Kiểm soát viên cao cấp chất lượng sản phẩm, hàng hóa thuộc cơ quan nào?", "Vai trò của Kiểm soát viên cao cấp chất lượng sản phẩm, hàng hóa trong việc chỉ đạo và kiểm tra chất lượng?", "Loại ngành nào cần sự chỉ đạo của Kiểm soát viên cao cấp chất lượng sản phẩm, hàng hóa?", "Kiểm soát viên cao cấp chất lượng sản phẩm, hàng hóa có chức năng gì?", "Mức chuyên môn nghiệp vụ của Kiểm soát viên cao cấp chất lượng sản phẩm, hàng hóa được đánh giá thế nào? "]  \n', 'dba6457b': '{"questions":["Theo quy định của doanh nghiệp kinh doanh đường sắt đô thị, những sự cố nào cần được báo cáo, xử lý và lập hồ sơ?", "Quy định của doanh nghiệp kinh doanh đường sắt đô thị đối với việc xử lý tin báo sự cố giao thông đường sắt đô thị bao gồm những nội dung gì?", "Sự cố giao thông đường sắt đô thị nào không nằm trong phạm vi quản lý khai thác?", "Việc lập hồ sơ vụ việc sự cố giao thông đường sắt đô t

100%|█████████████████████████| 30/30 [00:04<00:00,  6.83it/s]


Chunk 31 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth73.pkl
{'e12c99b6': '[\n"Mục tiêu giáo dục nghề nghiệp từ tháng 7/2020  bao gồm những yếu tố nào?",\n"Giáo dục nghề nghiệp chuẩn 2020 hướng tới đào tạo loại nhân lực như thế nào?",\n"Theo mục tiêu mới, người học sau khi tốt nghiệp sẽ có những khả năng gì?",\n"Điểm khác biệt của mục tiêu giáo dục nghề nghiệp từ tháng 7/2020 so với trước đó là gì?",\n"Đào tạo nghề nghiệp từ tháng 7/2020 tập trung vào lĩnh vực nào?"\n]\n\n\n\n', '6f393e61': '["Có bao nhiêu Tổng công ty điện lực?", "Tổng công ty Điện lực thành phố nào được kể đến?", "Trung tâm quản lý điện lực Miền Nam được đứng về một tổng công ty nào?", "Tên các Tổng công ty Điện lực ở miền Bắc, Trung, Nam là gì?", "Hà Nội và TP. HCM có chung một công ty điện lực?"] \n\n\n', '2de6e2b1': '{\n"questions": [\n"Theo quy định, ai phải nộp phí, lệ phí khi được Cơ quan đại diện Việt Nam ở nước ngoài cung cấp dịch vụ công?",\n"Ai là những cá nhân hoặc tổ chức Vi

100%|█████████████████████████| 30/30 [00:11<00:00,  2.62it/s]


Chunk 32 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth74.pkl
{'b9cd55da': '{"questions":["Hàng hóa vẫn còn trong thời hạn bảo hành thì cần phải có Giấy phép tạm xuất, tái nhập không?",\n"Trong trường hợp hết thời hạn bảo hành, thủ tục tạm xuất, tái nhập hàng hóa bao gồm những quy định nào?",\n"Nếu hàng hóa cần sửa chữa thuộc diện cấm xuất khẩu, cấm nhập khẩu thì cần làm gì?",\n"Hàng hóa tạm ngưng xuất khẩu, tạm ngưng nhập khẩu được phép tạm xuất, tái nhập không?",\n"Bộ Công Thương cấp Giấy phép tạm xuất, tái nhập theo quy định nào?"],"answers":["Không cần.\\n", "Quy định tại Điểm a, Điểm b, Điểm c Khoản 3.\\n", "Phải tuân thủ quy định tại Điểm a Khoản 3.\\n", "Phải tuân thủ quy định tại Điểm b Khoản 3.\\n", "Theo Điều 19, Điều 20 Nghị định này."]}\n', '7b4d9e86': '["Phòng vắt, trữ sữa mẹ tại doanh nghiệp có cần thiết phải trang bị bình tiệt trùng?", "Sữa mẹ vắt tại doanh nghiệp có được tiệt trùng không?", "Có nghĩa là phòng vắt, trữ sữa mẹ tại doanh nghiệ

100%|█████████████████████████| 30/30 [00:03<00:00,  7.55it/s]


Chunk 33 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth75.pkl
{'699401f4': '["Tiêu chuẩn cân nặng tối thiểu để đăng ký dự tuyển vào trường công an là bao nhiêu?", "Nam muốn đăng ký dự tuyển vào trường công an, cậu ấy cần cân nặng ít nhất bằng bao nhiêu?", "Có bao nhiêu kg là đủ trọng lượng để con trai đăng ký thi vào trường công an?", "Vậy nếu một bạn nam cân 47kg có đủ điều kiện để xét tuyển vào trường công an không?", "Với giới tính nam, tiêu chuẩn cân nặng như thế nào để được xét tuyển vào trường cảnh sát?"] \n', '81cfe398': '{\n"question1": "Nội dung huấn luyện nghiệp vụ bảo vệ trên tàu hỏa bao gồm những gì?",\n"question2": "Huấn luyện lý thuyết bao gồm những kiến thức nào?",\n"question3": "Thực hành huấn luyện bao gồm những kỹ năng nào?",\n"question4": "Thời gian tối thiểu để hoàn thành khóa huấn luyện là bao nhiêu?",\n"question5": "Ai là cơ quan tổ chức và cấp giấy chứng nhận huấn luyện nghiệp vụ bảo vệ trên tàu hỏa?"\n} \n', '6fb66662': '[\n"Người n

100%|█████████████████████████| 30/30 [00:06<00:00,  4.78it/s]


Chunk 34 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth76.pkl
{'2f0b514f': '["Thời gian thông báo về tình hình phạm nhân là bao nhiêu?", \n"Công an cấp huyện có trách nhiệm thông báo về tình hình của phạm nhân  bao nhiêu lần trong một năm?", \n"Tổ chức nào có trách nhiệm thông báo tình hình phạm nhân cho gia đình?",\n"Nhà chức trách thông báo tình hình phạm nhân cho ai?",\n"Nội dung thông báo cho gia đình về tình hình phạm nhân là gì? "] \n\n\n', '20b7ebf3': '[\n"Nếu muốn kiện lại quyết định cấp bìa đỏ năm 2017 phải khởi kiện trong bao lâu?",\n"Thời hạn kiện quyết định hành chính buộc thôi việc là bao nhiêu?",\n"Thời hạn kiện quyết định hành chính nói chung là bao nhiêu?",\n"Khi nào thời hạn khởi kiện bắt đầu tính từ?",\n"Loại quyết định nào có thời hạn kiện là một năm?"\n] \n', '48072fc7': '["Mức phạt cao nhất cho cá nhân vi phạm sản xuất, buôn bán hàng giả, hàng cấm là bao nhiêu?",\n"Đối với tổ chức, mức phạt tối đa cho hành vi tương tự là bao nhiêu?",\n

100%|█████████████████████████| 30/30 [00:03<00:00,  8.40it/s]


Chunk 35 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth77.pkl
{'88ddefd3': '[\n"Khi nào đăng ký xe cần phải mang xe đến cơ quan đăng ký?",\n"Ngoài đăng ký lần đầu, những trường hợp nào cần mang xe đến cơ quan đăng ký?",\n"Có trường hợp thay đổi thông tin xe nào phải mang xe đến đăng ký?",\n"Giao dịch đăng ký xe sang tên có được thực hiện trực tuyến không?",\n"Đăng ký xe cải tạo yêu cầu mang xe đến cơ quan đăng ký?"\n]  \n', 'ffb14fe4': '["Hoạt động của đại lý bảo hiểm bao gồm những gì?", "Ngoài giới thiệu và chào bán, đại lý bảo hiểm còn làm những gì?",  "Truyền đạt quyền hạn của công ty bảo hiểm để đại lý làm điều gì?", "Sự liên quan của đại lý bảo hiểm trong việc ký kết hợp đồng bảo hiểm là gì?", "Công ty bảo hiểm uỷ quyền cho đại lý những công việc gì?"] \n', '60b6420a': '["Luật sư có thể gặp người bị tạm giam ở nơi nào để thực hiện bào chữa?",\n"Ai được cho phép gặp người bị tạm giam?",\n"Người bị tạm giam được gặp luật sư khi nào?",\n"Thủ tục nào để l

100%|█████████████████████████| 30/30 [00:05<00:00,  5.48it/s]


Chunk 36 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth78.pkl
{'ddf15285': '[\n"Hội đồng tư vấn chuyên môn đánh giá nguyên nhân tai biến nặng do vắc xin có mấy cấp độ?",\n"Ai có thẩm quyền thành lập Hội đồng tư vấn chuyên môn cấp Bộ?",\n"Hội đồng tư vấn chuyên môn cấp tỉnh được thành lập bởi ai?",\n"Ngoài Hội đồng tư vấn chuyên môn cấp Bộ, còn có cơ quan nào khác có trách nhiệm đánh giá nguyên nhân tai biến nặng?",\n"Hội đồng tư vấn chuyên môn cấp tỉnh được thành lập ở đâu?"\n] \n', 'f6c157cd': '["",{\n"question": "Điều kiện cụ thể để trở thành bảo vệ ở Việt Nam là gì?",\n"answer": "Công dân Việt Nam đủ 18 tuổi trở lên có thể làm bảo vệ, nếu họ đáp ứng đủ các điều kiện khác được yêu cầu."\n},\n{\n"question": "Độ tuổi tối thiểu để làm bảo vệ ở Việt Nam là bao nhiêu?",\n"answer": "Công dân Việt Nam đủ 18 tuổi trở lên có thể làm bảo vệ."\n},\n{\n"question": "Có hạn chế về độ tuổi để làm bảo vệ ở Việt Nam không?",\n"answer": "Không có thông tin chi tiết về việ

100%|█████████████████████████| 30/30 [00:03<00:00,  8.50it/s]


Chunk 37 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth79.pkl
{'ecf9beeb': '["Chứng từ GSP có giá trị hiệu lực bao lâu?", "Thời hạn sử dụng của giấy chứng nhận xuất xứ hàng hóa GSP là bao nhiêu?", "Họp lực của văn bản chứng nhận xuất xứ hàng hóa theo GSP kéo dài trong bao lâu?", "Ngày phát hành chứng minh GSP có ý nghĩa gì đối với độ dài hiệu lực?", "Giấy chứng nhận xuất xứ GSP có hiệu lực trong bao lâu kể từ ngày được cấp?" ] \n', '8d4400e2': '["Bạn có thể cho biết mức phạt cho việc thi công công trình trên đất dành cho đường bộ mà đã hết hạn Giấy phép thi công không?", "Việc thi công công trình vượt quá thời hạn Giấy phép thi công sẽ bị phạt bao nhiêu tiền?", "Nếu thi công công trình trên đất đường bộ lỗi thời hạn Giấy phép thi công, cá nhân và tổ chức sẽ bị phạt bao nhiêu?", "Mức phạt cho việc thi công trái phép trên đất đường bộ liệu có khác nhau giữa cá nhân và tổ chức?", "Linh vực nào áp dụng mức phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối với

100%|█████████████████████████| 30/30 [00:04<00:00,  6.61it/s]


Chunk 38 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth80.pkl
{'ec587a7c': '{"question1": "Quy trình kiểm tra giấy tờ tùy thân như thế nào khi đến khách sạn thăm bạn?", "question2": "Khách sạn cần lưu trữ thông tin về ai?", "question3": "Bao nhiêu thời gian khách sạn phải lưu giữ thông tin của người đến thăm?","question4": "Khi ra khỏi khách sạn, liệu người đến thăm có được lấy lại giấy tờ tùy thân?", "question5": "Những thông tin nào của người đến thăm được ghi vào sổ?"} \n', 'd2c7880b': '[\n"Theo Luật Cạnh tranh, việc không thông báo khi tập trung kinh tế sẽ bị xử phạt như thế nào?",\n"Giải thích về hình phạt đối với doanh nghiệp vi phạm nghĩa vụ thông báo khi tập trung kinh tế.",\n"Hạn mức phạt tiền đối với doanh nghiệp vi phạm Điều 33 của Luật Cạnh tranh là bao nhiêu?",\n"Tính toán phạt tiền đối với vi phạm Điều 33 Luật Cạnh tranh dựa trên cơ sở gì?", \n"Tại sao doanh nghiệp cần phải thông báo khi tập trung kinh tế?"\n] \n\n\n', 'cae22d60': '["Người có

100%|█████████████████████████| 30/30 [00:03<00:00,  7.61it/s]


Chunk 39 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth81.pkl
{'201d284c': '["Theo quy định, hành vi nào sẽ bị xử lý như không có giấy đăng ký xe?", "Điều kiện để bị lập biên bản vi phạm hành chính khi điều khiển phương tiện là gì?", "Nghị định nào quy định về xử lý hành vi không xuất trình được giấy đăng ký xe?", "Hành vi không xuất trình được giấy đăng ký xe có thể dẫn đến hậu quả gì?", "Phương tiện nào phải xuất trình giấy đăng ký xe khi điều khiển?"] \n', 'd2345f1f': '["Cơ quan nhà nước có thẩm quyền yêu cầu thông tin về an toàn thực phẩm nhưng người kinh doanh không cung cấp, phạt bao nhiêu?", "Vi phạm cung cấp thông tin an toàn thực phẩm, mức phạt tiền cụ thể là bao nhiêu?", "Mức phạt tiền tối thiểu khi không cung cấp thông tin an toàn thực phẩm theo yêu cầu cơ quan nhà nước là bao nhiêu?", "Giá trị phạt tiền cho việc không cung cấp thông tin an toàn thực phẩm như yêu cầu có giới hạn nào không?", "Hình phạt tài chính đối với việc không tuân thủ yêu c

In [41]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents2[1200:], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth82.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 17/17 [00:05<00:00,  3.09it/s]


In [42]:
with open('../data/vietnamese_rag/documents-with-ids3.json', 'rt') as f_in:
    documents3 = json.load(f_in)

In [43]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents3) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    # print(i + 42, chunk_start, chunk_end)
    chunk = documents3[chunk_start:chunk_end]

    # Use map_progress to process documents
    processed_results = map_progress(pool, chunk, process_document)

    # Store the results incrementally
    for result in processed_results:
        if result is not None:
            doc_id, questions = result
            results[doc_id] = questions

    # Save the results to a file
    file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 83}.pkl'
    with open(file_name, 'wb') as file:
        pickle.dump(results, file)

    # Print out the results
    print(f"Chunk {i} processed and saved to {file_name}")
    print(results)

    # Wait for 1 minute to reset rate limit
    time.sleep(60)

40


100%|█████████████████████████| 30/30 [00:41<00:00,  1.39s/it]


Chunk 0 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth83.pkl
{'18dae9ff': '{"Sách Quy chi": "Chi phí lập đồ án quy hoạch chung đô thị được xác định như thế nào?",\n "Chi phí": "Các khoản chi phí nào được bao gồm trong chi phí lập đồ án quy hoạch?",\n "Quy mô": "Người ta dựa vào những yếu tố nào để xác định chi phí lập đồ án quy hoạch?",\n "Phụ lục 1": "Ở đâu người ta có thể tìm thấy các bảng định mức chi phí quy hoạch?",\n "Tỷ lệ": "Đối với thiết kế đô thị riêng, chi phí được tính theo cách nào?"} \n', '566d2af1': '["Địa phương có vai trò như thế nào trong việc tổ chức hướng dẫn kỹ thuật Hệ thống cơ sở dữ liệu ngành tại các cơ sở giáo dục?", "Những trường hợp nào đòi hỏi địa phương phải báo cáo sự cố kỹ thuật liên quan đến Hệ thống cơ sở dữ liệu ngành?", "Ai là đơn vị nhận báo cáo về sự cố kỹ thuật liên quan đến Hệ thống cơ sở dữ liệu ngành?", "Cục nào của Bộ Giáo dục và Đào tạo xử lý các báo cáo về sự cố kỹ thuật liên quan đến Hệ thống?", "Nhà quản lý hệ 

100%|█████████████████████████| 30/30 [00:11<00:00,  2.67it/s]


Chunk 1 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth84.pkl
{'fd882ec2': '[\n"Theo quy định pháp luật nào, việc bảo trì tài sản kết cấu hạ tầng thủy lợi được thực hiện?",\n"Ngoài giai đoạn sau khi bàn giao, bảo trì công trình hạ tầng thủy lợi bao gồm giai đoạn nào?",\n"Khi bảo trì, cần đảm bảo điều gì cho công trình và các thiết bị liên quan?",\n"Trong quá trình bảo trì, việc thay đổi mục đích sử dụng của công trình được phép hay không?",\n"Trong quá trình bảo trì, cần hạn chế ảnh hưởng đến điều gì của công trình thủy lợi?"\n] \n\n\n', '0fd566f5': '["Số tiền phạt tối đa dành cho tổ chức vi phạm hành chính trong lĩnh vực khai thác dầu khí là bao nhiêu?", "Theo luật, mức phạt tiền tối đa đối với tổ chức vi phạm tại ngành dầu khí là bao nhiêu?", "Mức phạt cao nhất đối với tổ chức vi phạm hành chính trong thăm dò, khai thác dầu khí là bao nhiêu?", "Đối với vi phạm hành chính của tổ chức trong lĩnh vực thăm dò, khai thác dầu khí, mức phạt tiền có thể lên tới b

100%|█████████████████████████| 30/30 [00:05<00:00,  5.44it/s]


Chunk 2 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth85.pkl
{'f25e2350': '[\n"Cán bộ, công chức đến tuổi nghỉ hưu muốn làm việc kéo dài thì chế độ lương và các chế độ có được điều chỉnh như thế nào?",\n"Quy định về việc điều chỉnh lương cho cán bộ, công chức được kéo dài thời gian công tác sau khi đến tuổi nghỉ hưu là như thế nào?",\n" Khi được kéo dài thời gian công tác, lương của cán bộ, công chức có thấp hơn trước đây không?",\n"Đối với cán bộ, công chức được kéo dài thời gian công tác sau khi đến tuổi nghỉ hưu, ai có trách nhiệm bảo đảm điều kiện làm việc và thực hiện chế độ, chính sách?",\n"Lương của cán bộ, công chức được kéo dài thời gian công tác sau khi đến tuổi nghỉ hưu được điều chỉnh dựa vào yếu tố nào?"\n] \n', '5cac8dee': '["Người nào có quyền bổ nhiệm Chủ tịch UBND Quận 3 ở TPHCM?",\n"Chức danh nào có thẩm quyền bổ nhiệm Chủ tịch UBND Quận 3?",\n" UBND Quận 3 được tổ chức và quản lý bởi ai?",\n"Chủ tịch UBND thành phố có trách nhiệm gì về Q

100%|█████████████████████████| 30/30 [00:03<00:00,  7.75it/s]


Chunk 3 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth86.pkl
{'31faae90': '["Vi phạm qui định về thông báo khai thác mạng sẽ bị phạt như thế nào?", "Hệ quả pháp lý khi cung cấp dịch vụ viễn thông mà không thông báo chính thức khai thác?", "Lạm dụng dịch vụ viễn thông mà không có thông báo khai thác mạng sẽ bị xử lý ra sao?", "Giới hạn mức phạt đối với hành vi không thông báo khai thác mạng?", "Theo luật, việc cung cấp dịch vụ viễn thông cần thông báo khai thác mạng chưa được thực hiện sẽ dẫn đến kết quả gì?"] \n', '961510fc': '["Từ chối cung cấp dịch vụ bưu chính công ích có vi phạm pháp luật không?", "Hậu quả pháp lý của việc từ chối cung cấp dịch vụ bưu chính công ích là gì?", "Cung cấp dịch vụ bưu chính công ích là nghĩa vụ của ai?", "Mức phạt đối với việc từ chối cung cấp dịch vụ bưu chính công ích cụ thể như thế nào?", "Những trường hợp nào được xem là từ chối cung cấp dịch vụ bưu chính công ích?"] \n', '5e56a9f2': '["Sổ đăng ký thành viên công ty có 

100%|█████████████████████████| 30/30 [00:03<00:00,  8.40it/s]


Chunk 4 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth87.pkl
{'b36dc18b': '[\n"UBND cấp huyện có trách nhiệm gì khi tổ chức lựa chọn sách giáo khoa cho cơ sở giáo dục phổ thông?",\n"Theo UBND cấp huyện, ai có trách nhiệm đề xuất danh mục sách giáo khoa?",\n"UBND cấp huyện có tham gia vào việc điều chỉnh danh mục sách giáo khoa?",\n"UBND cấp huyện đảm bảo điều gì để các cơ sở giáo dục phổ thông có thể tổ chức lựa chọn sách giáo khoa?",\n"Vai trò của UBND cấp huyện trong việc cung cấp nguồn tài chính cho việc lựa chọn sách giáo khoa là gì?"\n]\n', '2bbfae06': '["Hợp đồng chỉ có chữ ký có hiệu lực pháp lý không?", "Điều kiện để chữ ký trên hợp đồng được công nhận hợp lệ?", "Nghị định nào quy định về hiệu lực của chữ ký trên hợp đồng?", "Theo luật, có quy định gì về việc thực hiện chữ ký trên hợp đồng?", "Chữ ký giả trên hợp đồng có hiệu lực không? "] \n', '5b3f7e99': '["Hành vi thu gom, sơ chế hải sản từ cơ sở nuôi cấm thu hoạch bị phạt bao nhiêu tiền?", "Mức

100%|█████████████████████████| 30/30 [00:03<00:00,  8.85it/s]


Chunk 5 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth88.pkl
{'7b5a29fe': '["Những hình thức đăng ký phương tiện phục vụ hoạt động vui chơi giải trí dưới nước là gì?", "Ngoài đăng ký trực tiếp, phương tiện nào có thể đăng ký bằng bưu chính?", "Hồ sơ đăng ký phương tiện vui chơi giải trí dưới nước bao gồm những loại giấy tờ nào?", "Trường hợp nào không cần xuất trình giấy tờ quy định khi đăng ký phương tiện?", "Thời hạn mà cơ quan đăng ký phương tiện cấp Giấy chứng nhận đăng ký phương tiện là bao nhiêu?"] \n', '9fda825c': '["Thời hạn đại diện sẽ là bao nhiêu nếu như không có thỏa thuận cụ thể trong giấy ủy quyền?",\n"Làm sao để xác định thời hạn đại diện khi giấy ủy quyền không ghi rõ?",\n"Có quy định pháp luật về thời hạn đại diện trong trường hợp không có thỏa thuận?",\n"Trong trường hợp nào thời hạn đại diện là một năm?",\n"Kể từ ngày nào thời hạn một năm đối với việc đại diện được tính?"] \n', '883c87a5': '["Mức phạt đối với công chứng viên không tham g

100%|█████████████████████████| 30/30 [00:03<00:00,  9.23it/s]


Chunk 6 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth89.pkl
{'e261e643': '["Nếu đấu giá tài sản không thành công, Công ty Mua bán nợ sẽ xử lý như thế nào?", "Khi nào Công ty Mua bán nợ quyết định bán thỏa thuận tài sản?", "Đối với tài sản không có giá trị thu hồi, Công ty Mua bán nợ sẽ làm gì?", "Công ty Mua bán nợ có sử dụng đơn vị bên ngoài để xử lý tài sản không?", "Bao gồm những loại tài sản nào được quy định xử lý như thế nào?"] \n', '3f9e2209': '[\n"Khai thác thủy sản bất hợp pháp trong vùng biển thuộc quyền tài phán của một quốc gia là gì?",\n"Việc nào được xem là vi phạm luật pháp, quy định của một quốc gia khi khai thác thủy sản?",\n"Khi tàu cá treo cờ của một quốc gia ký thỏa ước với một tổ chức quản lý nghề cá khu vực, hoạt động nào sẽ được coi là bất hợp pháp?",\n"Tổ chức quản lý nghề cá khu vực có những biện pháp nào là có tính chất ràng buộc đối với các quốc gia tàu treo cờ?",\n"Ngoài luật pháp quốc gia, điều gì nữa có thể khiến hoạt động kh

100%|█████████████████████████| 30/30 [00:03<00:00,  8.94it/s]


Chunk 7 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth90.pkl
{'38910ada': '[\n"Một người dân chiếm dụng đất đường bộ xây nhà, phạt bao nhiêu tiền?",\n"Đối với cá nhân chiếm dụng đất hành lang an toàn đường bộ, mức phạt tiền tối thiểu là bao nhiêu?",\n"Tổ chức nào chiếm dụng đất đường bộ để xây dựng sẽ bị phạt tiền bao nhiêu?",\n"Liệu có sự chênh lệch về mức phạt đối với cá nhân và tổ chức khi chiếm dụng đất đường bộ?",\n"Mức phạt tiền tối đa bao nhiêu cho cá nhân và tổ chức khi chiếm dụng đất đường bộ?"\n] \n\n\n\n\n', '21c1ee80': '```json\n[\n"Nội dung giáo dục ở bậc phổ thông cơ sở bao gồm những môn học nào?",\n"Mục tiêu của giáo dục trung học cơ sở là gì?",\n"Học sinh trung học cơ sở cần có kiến thức về lĩnh vực nào?",\n"Sự khác biệt giữa giáo dục tiểu học và trung học cơ sở là gì?",\n"Giáo dục trung học cơ sở cung cấp cho học sinh những hiểu biết cần thiết về kỹ thuật và hướng nghiệp?"\n]\n```\n', 'a474803a': '[\n"Các hoạt động khuyến mại cho doanh ngh

100%|█████████████████████████| 30/30 [00:06<00:00,  4.91it/s]


Chunk 8 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth91.pkl
{'ac696205': '["Học sinh, sinh viên cần làm gì để xây dựng môi trường giáo dục an toàn?", "Vai trò của học sinh, sinh viên trong việc nâng cao nhận thức về môi trường giáo dục?", "Học sinh, sinh viên có trách nhiệm gì khi bạo lực học đường xảy ra?", "Nêu rõ những hành vi học sinh, sinh viên cần chủ động phát hiện và báo cáo?", "Làm thế nào học sinh, sinh viên có thể tích cực tham gia hoạt động phòng ngừa?"] \n', '5903c11a': '["Từ ngày nào thời gian xét nâng bậc lương để quay về bậc lương cũ trước khi bị kỷ luật mới được tính?", "Là ngày nào thời gian xét nâng bậc lương để trở lại bậc lương cũ trước khi bị kỷ luật được bắt đầu?", "Kể từ ngày nào thời gian xét nâng bậc lương được tính nếu một người bị kỷ luật?", "Mức lương cũ được phục hồi sau kỷ luật kể từ bao lâu?", "Thời gian tính từ ngày nào để xét mức lương cũ sau khi bị kỷ luật ?"] \n', '581c307d': '[\n"Địa điểm nào mà Kho bạc Nhà nước cần ph

100%|█████████████████████████| 30/30 [00:03<00:00,  7.76it/s]


Chunk 9 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth92.pkl
{'23a5b558': '["Từ năm 2020, hành vi nào khi lái xe máy dẫn đến phạt tiền ?", "Mức phạt tiền cho hành vi điều khiển xe máy không báo hiệu khi vượt là bao nhiêu?", "Vi phạm luật giao thông nào được quy định phạt tiền từ 100.000 đồng đến 200.000 đồng?", "Phạt tiền cho người lái xe máy thiếu cẩn trọng như thế nào ? ", "Những người vi phạm luật giao thông khi điều khiển xe máy sẽ bị xử lý bằng hình thức gì? "] \n', '6f839214': '[\n"Hành khách nào được nhân viên phục vụ trên xe buýt hỗ trợ?",\n"Vai trò của nhân viên phục vụ trên xe buýt đối với người cao tuổi?",\n"Khi nào nhân viên phục vụ trên xe buýt cần hỗ trợ hành khách?", \n"Tên nghề nghiệp của người hỗ trợ hành khách trên xe buýt?",\n"Người nhận sự hỗ trợ của nhân viên phục vụ trên xe buýt bao gồm những ai?"\n] \n\n\n\n\n', '643bc01b': '{\n  "questions": [\n    "Hướng dẫn về các trường hợp xử phạt người điều khiển xe máy vi phạm điểm g khoản 2 Đ

100%|█████████████████████████| 30/30 [00:12<00:00,  2.33it/s]


Chunk 10 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth93.pkl
{'339539b3': '[\n"Các tiêu chuẩn đạo đức nghề nghiệp của nhân viên thiết bị, thí nghiệm bao gồm những gì?",\n"Vai trò của việc chấp hành luật pháp và các quy định ngành đối với nhân viên thiết bị, thí nghiệm là gì?",\n"Chất điểm đạo đức nào được đề cao đối với nhân viên thiết bị, thí nghiệm?",\n"Ngoài việc thực thi nhiệm vụ, nhân viên thiết bị, thí nghiệm còn cần làm gì để đáp ứng tiêu chuẩn đạo đức?",\n"Trung thực và khách quan thể hiện như thế nào trong thực hành công việc của nhân viên thiết bị, thí nghiệm?"\n] \n', '1006036e': '[\n"Các quy chuẩn kỹ thuật nào được áp dụng trong hoạt động giám định tư pháp lĩnh vực nông nghiệp?",\n"Tiêu chuẩn nào được áp dụng cho hoạt động nông nghiệp và phát triển nông thôn trong hoạt động giám định?",\n"Luật pháp nào quy định tiêu chuẩn và quy chuẩn kỹ thuật cho giám định tư pháp nông nghiệp?",\n"Giám định tư pháp nông nghiệp tuân theo những tiêu chuẩn nào?"

100%|█████████████████████████| 30/30 [00:04<00:00,  6.02it/s]


Chunk 11 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth94.pkl
{'54006adc': '[\n"Theo quy định, người tố cáo có quyền rút đơn tố cáo khi nào?",\n"Khi rút đơn tố cáo, người tố cáo cần lưu ý những điều gì?",\n"Ngoài việc viết văn bản rút tố cáo, có cách nào khác để rút đơn tố cáo?",\n"Văn bản rút tố cáo bao gồm những thông tin gì?",\n"Mẫu số nào được sử dụng để ghi lại việc rút đơn tố cáo?"\n]\n', '6bfe03eb': '["Những trường hợp nào hồ sơ thương nhân cần cập nhật?", \n"Quy định cập nhật hồ sơ thương nhân có bao gồm trường hợp không có thay đổi?", \n"Việc cập nhật hồ sơ thương nhân có tác dụng gì?", \n"Tần suất cập nhật hồ sơ thương nhân là bao nhiêu?", \n"Hạn chế gì khi hồ sơ thương nhân không được cập nhật?"]   \n', '1bb51c6a': '["Mục tiêu của việc đánh giá, xếp loại Đơn vị học tập là gì?", "Ai là người được đánh giá trong việc xếp loại Đơn vị học tập?", "Việc đánh giá, xếp loại Đơn vị học tập diễn ra bao nhiêu lần trong năm?", "Lợi ích của việc đánh giá, xế

100%|█████████████████████████| 30/30 [00:03<00:00,  7.52it/s]


Chunk 12 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth95.pkl
{'3af5733d': '[\n"Các chuẩn mực đạo đức nghề nghiệp được quy định bởi ai?",\n"Đạo đức nghề nghiệp có tính tùy chỉnh dựa trên lĩnh vực nào?",\n"Việc làm việc tuân thủ đạo đức nghề nghiệp có ảnh hưởng đến lĩnh vực nào?",\n"Hành vi nào được coi là phù hợp với đạo đức nghề nghiệp?",\n"Mô hình đạo đức nghề nghiệp được xây dựng dựa trên tiêu chí gì?"\n] \n\n\n\n\n', '5e0646a7': '["Nghị định 30/2020 có áp dụng đối với tổ chức kinh tế không?", "Đối tượng áp dụng Nghị định 30/2020 là ai?", "Bản thân Nghị định 30/2020/NĐ-CP quy định gì?", "Việc đóng dấu có quy định gì theo Nghị định 30/2020?", "Tổ chức kinh tế theo quy định của pháp luật là gì?"] \n\n\n', '687cb6e1': '["Mức phạt đối với hành vi dừng xe, đỗ xe máy cản trở giao thông là bao nhiêu?", "Hành vi nào bị phạt vì dừng xe, đỗ xe máy ở lòng đường?", "Xe máy đỗ xe ở lòng đường đô thị sẽ bị phạt bao nhiêu tiền?", "Có mức phạt nào đối với việc dừng xe,

100%|█████████████████████████| 30/30 [00:04<00:00,  6.30it/s]


Chunk 13 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth96.pkl
{'eef2989c': '[\n"Sau khi hết thời hạn biệt phái, viên chức có phải nghỉ việc?",\n"Khi hết thời hạn biệt phái, viên chức được điều động về đâu?",\n"Quy định về việc trở về đơn vị cũ sau khi hết thời hạn biệt phái là gì?",\n"Việc biệt phái có ảnh hưởng đến thời gian công tác tại đơn vị cũ?",\n"Có nên hiểu việc biệt phái là việc thôi việc?"\n] \n', 'f64e29c9': '["Ủy ban nhân dân các địa phương có trách nhiệm gì trong quy hoạch mạng lưới bến xe khách?",\n"Thời gian quy hoạch vị trí bến xe khách được ổn định là bao nhiêu?",\n"Điều gì sẽ xảy ra nếu cần phải di dời vị trí một bến xe khách?",\n"Bến xe khách đầu tư theo hình thức xã hội hóa được đấu nối vào hệ thống giao thông đường bộ như thế nào?",\n"Quy hoạch hệ thống bến xe khách có liên quan đến quy hoạch mạng lưới tuyến nào?"] \n', '7a7d3686': '```json\n[\n"Theo quy định của pháp luật nào về quản lý, sử dụng tài sản công tại Cơ quan Việt Nam ở nướ

100%|███████████████████████████████████████████████████| 30/30 [00:04<00:00,  7.00it/s]


Chunk 14 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth97.pkl
{'06acb238': '```json\n[\n"Tổng cục có thời hạn bao lâu để xử lý hồ sơ đề nghị chỉ định tổ chức giữ chuẩn quốc gia?",\n"Nếu hồ sơ đề nghị không đủ điều kiện, người ta sẽ có bao lâu để bổ sung?",\n"Trong trường hợp hồ sơ đầy đủ, Tổng cục sẽ quyết định gì về việc đánh giá tại cơ sở?",\n"Thời hạn đưa ra cho việc đánh giá tại cơ sở là bao nhiêu ngày?",\n"Theo quy định, Tổng cục sẽ thông báo gì nếu hồ sơ đề nghị chưa đúng quy định?"\n]\n``` \n', '01e289d6': '["Người hướng dẫn tập sự công chứng viên vi phạm nghĩa vụ của mình sẽ bị phạt bao nhiêu tiền?", " mức phạt đối với công chứng viên không hoàn thành nghĩa vụ hướng dẫn tập sự là bao nhiêu?", "Quy định về xử phạt công chứng viên không thực hiện đúng nghĩa vụ hướng dẫn tại điều khoản nào?", "Hình phạt tối đa đối với công chứng viên vi phạm nhiệm vụ hướng dẫn tập sự là bao nhiêu?", "Điểm khoản nào trong Điều 3 quy định về xử phạt công chứng viên khôn

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.93it/s]


Chunk 15 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth98.pkl
{'d438b38d': '[\n"Việc triển khai hoạt động khu công nghệ thông tin sai mục tiêu có thể bị phạt bao nhiêu tiền?",\n"Họạt động khu công nghệ thông tin vi phạm quy định sẽ bị phạt tiền trong khoảng nào?",\n"Có mức phạt cụ thể nào đối với việc triển khai sai hoạt động khu công nghệ thông tin?",\n"Giới hạn tiền phạt dành cho hoạt động khu công nghệ thông tin không đúng mục tiêu là bao nhiêu?",\n" mức tiền phạt tối đa đối với việc triển khai sai hoạt động khu công nghệ thông tin là bao nhiêu?"\n]\n', 'df39516e': '["Hành vi phá hoại kho bảo quản hàng dự trữ quốc gia sẽ bị phạt bao nhiêu tiền?", "Từ đầu dãy tiền nào, bạn có thể bị phạt cho hành vi phá hoại kho bảo quản ?", "Mức phạt tiền cho hành vi phá hoại kho hàng dự trữ quốc gia là bao nhiêu?", "Ở Việt Nam, mức phạt tiền cho hành vi phá hoại kho hàng dự trữ quốc gia là bao nhiêu?", "Vi phạm pháp luật về hàng dự trữ quốc gia sẽ bị phạt tiền bao nhiê

100%|█████████████████████████| 30/30 [00:03<00:00,  9.05it/s]


Chunk 16 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth99.pkl
{'fbcf44b7': '[\n"Tỷ lệ nâng bậc lương trước thời hạn được quy định như thế nào cho quân nhân chuyên nghiệp lập thành tích xuất sắc?",\n"Giới hạn số lượng quân nhân chuyên nghiệp được nâng bậc lương trước thời hạn là bao nhiêu?",\n"Trên cơ sở những tiêu chí nào trước khi tính toán tỷ lệ nâng bậc lương trước thời hạn?",\n"Thời kì tính lương để xác định quân nhân có thể được nâng bậc lương trước thời hạn là bao lâu?",\n"Các đối tượng nào bị loại trừ khỏi việc tính toán tỷ lệ nâng bậc lương trước thời hạn?"\n] \n\n\n', 'fdc56818': '[\n"Các cơ sở sản xuất, kinh doanh thực phẩm nông, lâm, thủy sản cần làm gì để được đánh giá kiến thức về ATTP?",\n"Bộ câu hỏi đánh giá kiến thức ATTP có bao nhiêu câu hỏi?",\n"Thời gian làm bài đánh giá kiến thức ATTP là bao nhiêu?",\n"Ai là tổ chức xây dựng và ban hành tài liệu về nội dung kiến thức ATTP?",\n"Kiến thức chung và chuyên ngành trong bộ câu hỏi đánh giá AT

100%|█████████████████████████| 30/30 [00:05<00:00,  5.59it/s]


Chunk 17 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth100.pkl
{'18960764': '[\n"Phạt bao nhiêu tiền nếu Trung tâm Sát Hạch Lái Xe tự ý điều chỉnh vị trí các phòng chức năng?",\n"Mức phạt đối với việc thay đổi vị trí phòng chức năng tại Trung tâm Sát Hạch Lái Xe là bao nhiêu?",\n"Trung tâm Sát Hạch Lái Xe vi phạm quy định về vị trí phòng chức năng sẽ bị phạt bao nhiêu?",\n" khoản tiền phạt tối đa cho việc tự ý thay đổi vị trí phòng chức năng tại Trung tâm Sát Hạch Lái Xe là bao nhiêu?",\n"Có mức phạt nào đối với việc Trung tâm Sát Hạch Lái Xe di chuyển Phòng Chức năng không đúng quy định?"\n] \n\n\n', '48819de8': '[\n"Công ty đại chúng quy mô lớn bắt đầu công bố thông tin khi nào?",\n"Điều kiện để một công ty được coi là công ty đại chúng quy mô lớn là gì?",\n"Thời gian công ty đại chúng quy mô lớn phải ngừng công bố thông tin là bao lâu?",\n"Thông tư nào quy định về nghĩa vụ công bố thông tin của công ty đại chúng quy mô lớn?",\n"Bạn có thể nêu rõ khoản 1

100%|█████████████████████████| 30/30 [00:03<00:00,  8.15it/s]


Chunk 18 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth101.pkl
{'e96612d1': '["Bộ nào được tham gia kiến nghị quy hoạch cảng hàng không?", "Ngành nào có ý kiến về quy hoạch sân bay?", "Loại đơn vị nào được hỏi ý kiến về quy hoạch cảng hàng không?", "Ai được coi là đối tượng lấy ý kiến về quy hoạch sân bay?", " Cấp độ của Ủy ban nhân dân tham gia quy hoạch cảng hàng không?"] \n', '407259fc': '["Hội đồng tư vấn chuyên môn đánh giá nguyên nhân tai biến nặng được thành lập với mục đích gì?", "Việc đánh giá của Hội đồng tư vấn chuyên môn bao gồm những nội dung nào?", "Nội dung nào được Hội đồng tư vấn chuyên môn xác định sau khi đánh giá?", "Hội đồng tư vấn chuyên môn có chức năng gì đối với việc bồi thường?", "Theo Hội đồng tư vấn chuyên môn, ai có thể bị chịu trách nhiệm về tai biến nặng sau tiêm chủng?"] \n', '05b5dca1': '[\n  "Hồ sơ hỗ trợ kinh phí chăm sóc, nuôi dưỡng hàng tháng bao gồm những thông tin gì?",\n  "Mẫu số nào được sử dụng cho việc khai báo hộ

100%|█████████████████████████| 30/30 [00:04<00:00,  7.49it/s]


Chunk 19 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth102.pkl
{'8223b2f0': '[\n"Trong giao dịch chứng khoán phái sinh, giới hạn lệnh giao dịch là gì?",\n"Số lượng tối đa chứng khoán phái sinh có thể đặt trong một lệnh giao dịch là bao nhiêu?",\n"Giới hạn lệnh giao dịch áp dụng cho loại tài sản gì?",\n"Lệnh giao dịch có giới hạn có tác dụng gì trong việc mua bán chứng khoán phái sinh?",\n"Tại sao cần có giới hạn lệnh giao dịch trong chứng khoán phái sinh?"\n]  \n', 'ebb367f9': '["Phạt bao nhiêu tiền cho tài xế xe khách đe dọa hành khách?", \n"Hình phạt đối với tài xế xe khách xúc phạm hành khách là gì?", \n"Tài xế xe khách lôi kéo hành khách sẽ bị phạt bao nhiêu?",\n"Có phạt tài xế xe khách khi tranh giành hành khách không?",\n"Mức phạt tài xế xe khách với hành vi đe dọa, xúc phạm, tranh giành, lôi kéo hành khách như thế nào? "] \n', 'b817a4d9': '[\n"Mức điều chỉnh giá dịch vụ hạ cánh cho hãng hàng không mới là bao nhiêu?",\n"Thời gian áp dụng mức điều chỉ

100%|█████████████████████████| 30/30 [00:03<00:00,  9.00it/s]


Chunk 20 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth103.pkl
{'d742c1e5': '["Chứng chỉ đấu thầu có giá trị bao lâu?", "Bộ Kế hoạch và Đầu tư cấp chứng chỉ đấu thầu có thời hạn bao nhiêu?", "Hiệu lực của chứng chỉ đấu thầu được xác định như thế nào?", "Có giấy tờ nào quy định thời hạn của chứng chỉ đấu thầu không?", "Chứng chỉ hành nghề đấu thầu có liên quan đến chứng chỉ đấu thầu không?"] \n', '3ad90ca1': '["Người có con đã mất có được ưu tiên trong tuyển dụng viên chức không?",\n"Thi tuyển viên chức có xét đến trường hợp người có con đã mất không?",\n"Có trường hợp nào ngoại lệ cho việc ưu tiên tuyển dụng đối với gia đình có người chết không?",\n"Điều kiện ưu tiên tuyển dụng viên chức cho gia đình người bệnh binh là gì?",\n"Khi nào gia đình nhà hôn nhân không được coi là gia đình người lính?"] \n\n\n', 'f9ab00c6': '["Thủ tướng Chính phủ có thẩm quyền ban hành văn bản pháp luật nào liên quan đến đầu tư theo phương thức PPP?", "Trong hoạt động đầu tư PPP,

100%|█████████████████████████| 30/30 [00:03<00:00,  8.30it/s]


Chunk 21 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth104.pkl
{'5ff5eab4': '["Thời hạn thanh lý hợp đồng nhiệm vụ bảo vệ môi trường là bao nhiêu?", "Quy trình thanh lý hợp đồng nhiệm vụ bảo vệ môi trường ngành công thương diễn ra như thế nào?", "Ai có quyền nghiệm thu nhiệm vụ bảo vệ môi trường?", "Mẫu biên bản thanh lý hợp đồng nhiệm vụ bảo vệ môi trường là gì?", "Thành phần nào tham gia vào quá trình nghiệm thu nhiệm vụ bảo vệ môi trường?"]  \n', '2570cb19': '["Phải có thuyết minh gì khi áp dụng tiêu chuẩn cơ sở trong xây dựng?",\n"Việc công bố tiêu chuẩn cơ sở phải tuân thủ điều gì?",\n"Bên cạnh sự tuân thủ quy chuẩn kỹ thuật quốc gia, điều gì cần được đảm bảo khi áp dụng tiêu chuẩn cơ sở?",\n" Theo bạn, muốn áp dụng tiêu chuẩn cơ sở trong xây dựng cần tuân thủ các quy định của cơ quan nào?",\n"Bạn có thể cho tôi biết tiêu chuẩn cơ sở là gì không?"]\n\n\n', 'd1afa574': '[\n"Theo Hiệp định tránh đánh thuế hai lần,  quyền miễn trừ thuế áp dụng cho ai?",\

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.79it/s]


Chunk 22 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth105.pkl
{'b4b3c54f': '["Một trợ lý báo chí cho nhà báo nước ngoài có văn phòng thường trú ở Hà Nội phải là người Việt Nam không?", "Điều kiện trở thành trợ lý báo chí cho nhà báo nước ngoài ở Việt Nam là gì?", "Có quy định về quốc tịch cho trợ lý báo chí của nhà báo nước ngoài tại Việt Nam không?", "Ai được phép làm trợ lý báo chí cho nhà báo nước ngoài có văn phòng thường trú ở Việt Nam?", "Trợ lý báo chí cho nhà báo nước ngoài ở Việt Nam phải có quốc tịch nào?"] \n', '6b974626': '["Người điều khiển xe kéo mà không gắn biển báo hiệu sẽ bị phạt bao nhiêu tiền?", "Theo quy định, xe kéo cần gắn biển báo hiệu gì?", "Xe kéo rơ moóc không có biển báo hiệu sẽ bị phạt như thế nào?", "Làm sao để tránh bị phạt khi lái xe kéo?", "Có đối tượng nào ngoại lệ không phải gắn biển báo hiệu trên xe kéo?"] \n', 'b63f602f': '["Theo quy định pháp luật, báo cáo được sử dụng để làm gì?", "Báo cáo bao gồm những loại văn bản 

100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  8.83it/s]


Chunk 23 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth106.pkl
{'ed05ed37': '["Trong Quốc phòng, điều kiện nào được xem là tình tiết giảm nhẹ khi có vi phạm kỷ luật?", \n"Vi phạm kỷ luật nào được coi là có tình tiết giảm nhẹ khi người vi phạm tự nguyện khai báo?", \n"Người vi phạm kỷ luật có thể được hưởng tình tiết giảm nhẹ nếu đã làm gì?", \n"Vi phạm kỷ luật do bị ép buộc được xem là trường hợp có tình tiết giảm nhẹ?", \n"Có những trường hợp nào được xem là vi phạm trong hoàn cảnh đặc biệt khó khăn?"]  \n', '93a09193': '["Hành vi chuyển mục đích sử dụng rừng đặc dụng có diện tích từ 2.500 m2 đến dưới 3.500 m2 mà không đúng quy định sẽ bị phạt bao nhiêu tiền ? ", "Giới hạn mức phạt tiền vì hành vi vi phạm  chuyển mục đích sử dụng rừng đặc dụng trong khoảng từ 2.500 m2 đến 3.500 m2 là bao nhiêu?", "Với diện tích từ 2.500 m2 đến 3.500 m2, mức phạt tiền cho vi phạm chuyển mục đích sử dụng rừng đặc dụng quy định là bao nhiêu?", "Mức phạt tiền tối thiểu và tối

100%|█████████████████████████| 30/30 [00:03<00:00,  9.49it/s]


Chunk 24 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth107.pkl
{'15fd52b4': '["Thời hạn tham gia hoạt động của thanh niên tình nguyện ít nhất bao nhiêu tháng?", \n"Thanh niên tình nguyện có thể tham gia những hoạt động nào?", \n"Ai có thẩm quyền phê duyệt chương trình, đề án, dự án mà thanh niên tình nguyện tham gia?",\n"Mục tiêu của việc tham gia tình nguyện là gì?",\n"Những hoạt động nào được coi là hoạt động tình nguyện vì lợi ích của cộng đồng?" ] \n', '3e2f9ada': '["Quỹ Phát triển Doanh Nghiệp Nhỏ và Vừa hỗ trợ tăng cường năng lực cho doanh nghiệp như thế nào?", "Các hoạt động hỗ trợ tăng cường năng lực của Quỹ bao gồm những gì?", "Bên cạnh đào tạo và tư vấn, Quỹ còn hỗ trợ doanh nghiệp thông qua hoạt động nào?", "Quỹ có tham gia vào việc lập dự án gì?", "Ngoài cung cấp thông tin và cơ sở dữ liệu, Quỹ còn có hỗ trợ gì khác cho doanh nghiệp?"] \n', '10a89544': '["Những phương tiện nào được phép hoạt động vui chơi giải trí dưới nước?",\n"Làm thế nào để 

100%|█████████████████████████| 30/30 [00:03<00:00,  8.92it/s]


Chunk 25 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth108.pkl
{'9d413b45': '["Ủy ban nhân dân cấp tỉnh có phê duyệt những nội dung nào trong giai đoạn lựa chọn nhà đầu tư?", "Sở Kế hoạch và Đầu tư thực hiện thẩm định những nội dung nào khi Chủ tịch Ủy ban nhân dân cấp tỉnh là người có thẩm quyền?", "Vai trò của Sở Kế hoạch và Đầu tư trong việc thẩm định hồ sơ mời thầu?", "Khi nào Sở Kế hoạch và Đầu tư cần thẩm định danh sách nhà đầu tư đáp ứng yêu cầu kỹ thuật?", "Chủ tịch Ủy ban nhân dân cấp tỉnh có quyền phê duyệt các nội dung nào liên quan đến lựa chọn nhà đầu tư?" ] \n', '18dbe217': '["Đối với người dưới 18 tuổi, liệu có miễn lệ phí khi cấp hoặc đổi thẻ CCCD không?", "Độ tuổi nào có quyền cấp hoặc đổi thẻ CCCD?", "Có quy định miễn lệ phí khi cấp thẻ CCCD không?", "Thẻ CCCD được cấp cho những người từ bao nhiêu tuổi trở lên?", "Điều khoản áp dụng cho việc cấp/đổi thẻ CCCD cho người dưới 18 tuổi là gì?"] \n', 'c8dae2c8': '[\n  "Kiểm soát viên chất lượng

100%|█████████████████████████| 30/30 [00:03<00:00,  8.36it/s]


Chunk 26 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth109.pkl
{'928a09bc': '{"questions":["Chức năng chính của người đứng đầu cơ quan trong việc thành lập đoàn thanh tra là gì?","Ai được lựa chọn tham gia đoàn thanh tra và dựa trên tiêu chí nào?","Có những trường hợp nào không được phép bố trí làm trưởng đoàn hoặc thành viên đoàn thanh tra?","Muốn đảm bảo tính khách quan trong hoạt động thanh tra, cần tránh lựa chọn ai tham gia đoàn thanh tra?","Tại sao không nên bố trí thành viên đoàn thanh tra là những người có dòng họ hoặc mối quan hệ thân thiết với đối tượng thanh tra?"]}" \n\n\n\n', 'abd83e11': '[" ai là thành phần của phiên hòa giải, đối thoại?", "Ngoài hòa giải viên, ai khác tham gia phiên hòa giải, đối thoại?", "Những trường hợp nào người được mời tham gia hòa giải, đối thoại?", "Bên tham gia hòa giải, đối thoại bao gồm những ai?", "Giairat hòa giải, đối thoại có người phiên dịch không? "] \n', 'a887af0b': '["Câu lạc bộ thể thao được thành lập dựa

100%|█████████████████████████| 30/30 [00:03<00:00,  8.11it/s]


Chunk 27 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth110.pkl
{'014b5562': '[\n"Các cơ quan , tổ chức nào chịu trách nhiệm bảo vệ công trình hạ tầng đo đạc?",\n"Nêu các hành vi trái phép đối với hành lang bảo vệ công trình hạ tầng đo đạc?",\n"Quy định nào liên quan đến việc bảo vệ công trình hạ tầng đo đạc?",\n"Làm thế nào để xử lý trường hợp hành lang bảo vệ công trình hạ tầng đo đạc bị lấn chiếm?",\n"Ai có trách nhiệm phổ biến quy định về bảo vệ công trình hạ tầng đo đạc?"\n]\n\n\n\n', 'c201bb85': '["Đối với hành vi tự ý thay đổi giá mua bán hàng dự trữ quốc gia để trục lợi, mức phạt tiền tối thiểu là bao nhiêu?", "Hành vi tự ý thay đổi giá mua bán hàng dự trữ quốc gia để trục lợi có thể bị phạt tiền bao nhiêu?", "Phạt tiền bao nhiêu cho hành vi tự ý thay đổi giá mua bán hàng dự trữ quốc gia?", "Mức phạt cao nhất đối với hành vi tự ý thay đổi giá mua bán hàng dự trữ quốc gia để trục lợi là bao nhiêu?", "Tìm hiểu về mức phạt tiền đối với hành vi tự ý tha

100%|█████████████████████████| 30/30 [00:03<00:00,  8.02it/s]


Chunk 28 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth111.pkl
{'9b4f6082': '[\n"Bộ trưởng Bộ Công an quy định chế độ bổ nhiệm, miễn nhiệm Thu trưởng Cơ quan Điều tra như thế nào?",\n"Quyền lực bổ nhiệm Phó Thủ trưởng Cơ quan Điều tra thuộc về ai?",\n"Chế độ thu hồi Giấy chứng nhận Thủ trưởng Cơ quan Điều tra do ai quy định?",\n"Bộ trưởng Bộ nào quy định chế độ bổ nhiệm, miễn nhiệm, cách chức, cấp, thu hồi Giấy chứng nhận cho Thủ trưởng, Phó Thủ trưởng trong Quân đội nhân dân?",\n"Viện trưởng Viện kiểm sát nhân dân tối cao có quyền quy định chế độ gì cho Cơ quan Điều tra?"\n]  \n', '94dd9fcc': '[\n"Trả lời, mức phạt tiền khi lái xe ô tô có lắp bổ sung đèn là bao nhiêu?",\n"Người điều khiển xe ô tô lắp đèn thêm sẽ bị phạt bao nhiêu?",\n"Số tiền phạt cho hành vi lắp thêm đèn trên ô tô là gì?",\n"Có thể bị phạt bao nhiêu tiền nếu lắp thêm đèn cho xe ô tô?",\n"Mức phạt tối đa dành cho việc lắp đèn bổ sung trên xe ô tô là bao nhiêu?"\n]', 'd0ac6831': '["Trung t

100%|█████████████████████████| 30/30 [00:04<00:00,  7.22it/s]


Chunk 29 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth112.pkl
{'d6c9a3a8': '["Viettel quy định như thế nào về việc trích quỹ dự phòng tiền lương?", "Mức tối đa của quỹ dự phòng tiền lương hằng năm tại Viettel là bao nhiêu?", "Quỹ dự phòng tiền lương của Viettel được sử dụng vào mục đích gì?", "Quỹ dự phòng tiền lương được bổ sung vào quỹ lương của năm nào?", "Ai có quyền quyết định về việc trích quỹ dự phòng tiền lương của Viettel?"] \n', '7080d875': '[\n"Các công trình nào phải bố trí hạng mục xả dòng chảy tối thiểu khi xây dựng hồ chứa?",\n"Sự việc gì xảy ra khi một hồ chứa đã đi vào vận hành mà không thể điều chỉnh hạng mục xả dòng chảy tối thiểu?",\n"Theo pháp luật, hồ chứa nào phải có giấy phép khai thác sử dụng nước?",\n"Điều gì phải đảm bảo khi bố trí hạng mục công trình xả dòng chảy tối thiểu?",\n"Cơ quan nào có thẩm quyền xét duyệt về việc bổ sung hạng mục xả dòng chảy tối thiểu cho hồ chứa đã đi vào vận hành?"\n] \n', '4b7e434a': '["Đi xe đạp dà

100%|█████████████████████████| 30/30 [00:03<00:00,  7.54it/s]


Chunk 30 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth113.pkl
{'5bfca2f1': '[\n"Tên gọi của quỹ đầu tư chứng khoán được quy định như thế nào?",\n"Các loại hình quỹ đầu tư chứng khoán có tên gọi khác nhau?",\n"Ngoài tên loại hình quỹ, tên của quỹ đầu tư chứng khoán còn bao gồm yếu tố gì?",\n"Tên riêng của quỹ đầu tư chứng khoán phải phản ánh điều gì?",\n"Quỹ ETF có quy định gì đặc biệt về tên gọi?"\n] \n', '956e90f2': '["Phiên tòa hành chính lần thứ nhất diễn ra như thế nào nếu luật sư vắng mặt?", \n"Có hoãn phiên tòa hành chính nếu luật sư không đến?", \n"Phiên tòa hành chính lần thứ hai diễn ra thế nào nếu luật sư vắng mặt?",\n"Điều kiện để Tòa án tiến hành xét xử vắng mặt luật sư trong phiên tòa hành chính lần thứ hai là gì?", \n"Luật sư vắng mặt trong phiên tòa hành chính có thể được xem xét là sự kiện bất khả kháng không? "] \n', '6b780732': '{\n"questions": [\n"Ngoài Quốc hội, cơ quan nào khác chịu trách nhiệm về quản lý nhà nước về giáo dục?",\n"Bộ 

100%|█████████████████████████| 30/30 [00:03<00:00,  7.59it/s]


Chunk 31 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth114.pkl
{'814cc441': '["Bao lâu là thời gian công tác tối thiểu để thăng chức từ địa chính viên hạng III lên hạng II?", "Điều kiện cụ thể về thời gian công tác nào để thăng chức địa chính viên hạng II?", "Ngoài thời gian công tác tổng, điều kiện gì nữa cần phải thỏa mãn để thăng cấp?", "Thời gian gần nhất giữ chức vụ địa chính viên hạng III bao lâu là đủ để thăng chức?", "Yêu cầu thời gian giữ chức địa chính viên hạng III để thăng cấp có được tính dồn không?"] \n', '8c9675b0': '["Doanh nghiệp khoa học và công nghệ sử dụng đất nào để xây dựng cơ sở nghiên cứu khoa học?","Ngoài phòng thí nghiệm, doanh nghiệp khoa học và công nghệ còn sử dụng đất gì để xây dựng cơ sở nghiên cứu khoa học?","Cơ sở ươm tạo công nghệ và doanh nghiệp khoa học và công nghệ được xây dựng trên loại đất gì?","Cơ sở sản xuất thử nghiệm của doanh nghiệp khoa học và công nghệ được xây dựng trên loại đất nào?","Những loại đất nào được

100%|█████████████████████████| 30/30 [00:03<00:00,  9.26it/s]


Chunk 32 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth115.pkl
{'b7ac1d58': '["Quy trình đề cử, ứng cử thành viên Hội đồng quản trị của công ty đại chúng bao gồm những nội dung gì?", "Trong số lượng ứng cử viên đề cử và ứng cử đủ quy định, công ty đại chúng cần làm gì?", "Lễ công bố thông tin về ứng cử viên Hội đồng quản trị được thực hiện như thế nào?", "Nếu số ứng cử viên không đủ số lượng cần thiết, công ty đại chúng có thể thực hiện những biện pháp nào?", "Concurrent Hội đồng quản trị đương nhiệm có thể giới thiệu thêm ứng cử viên theo quy định của văn bản nào?"] \n\n', 'ba9906b0': '[\n"Ngân hàng được giao nhiệm vụ gì khi thực hiện giao dịch bán ngoại tệ cho khách hàng?" ,\n"Những loại giấy tờ nào ngân hàng cần lưu giữ khi tiến hành thanh toán và chuyển tiền cho dịch vụ chuyển khẩu?" ,\n"Theo quy định, ngân hàng cần đảm bảo điều gì khi cung cấp dịch vụ ngoại hối liên quan đến kinh doanh chuyển khẩu hàng hóa?",\n"Thông tư nào quy định về trách nhiệm của

100%|█████████████████████████| 30/30 [00:03<00:00,  9.12it/s]


Chunk 33 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth116.pkl
{'0053a2bb': '["Cách tổng kết báo cáo công tác thi đua, khen thưởng ngành Văn hóa, Thể thao và du lịch là gì?", "Đơn vị nào nhận báo cáo công tác thi đua, khen thưởng?", "Báo cáo công tác thi đua, khen thưởng được gửi đến Bộ khi nào?", "Mẫu số bao nhiêu được sử dụng cho báo cáo về Bộ?", "Tính thường xuyên của việc báo cáo thi đua, khen thưởng ngành Văn hóa, Thể thao và du lịch là gì?"] \n', '4bd15e79': '["Hành vi đánh nhau có bị phạt tiền không?", "Mức phạt tiền cho hành vi xúi giục đánh nhau là bao nhiêu?", "Việc đánh nhau bị phạt tiền bao nhiêu?", "Liệu có mức phạt khác ngoài tiền cho hành vi đánh nhau?", "Tội xúi giục đánh nhau có ai bị xử lý không?"] \n', 'e55d4005': '[\n"Người nào có quyền khởi kiện theo quy định pháp luật trong vụ án hành chính?",\n"Điều kiện để một người có quyền làm và ký đơn khởi kiện trong vụ án hành chính?",\n"Ai tác động đến quyền khởi kiện trong vụ án hà

100%|█████████████████████████| 30/30 [00:03<00:00,  8.84it/s]


Chunk 34 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth117.pkl
{'d2b92ab4': '[\n"Người lao động được hỗ trợ bao nhiêu phần trăm chi phí chữa bệnh nghề nghiệp?",\n"Mức hỗ trợ tối đa cho việc chữa bệnh nghề nghiệp là bao nhiêu?",\n"Có bao nhiêu lần người lao động được hỗ trợ chi phí chữa bệnh nghề nghiệp trong suốt thời gian làm việc?",\n"Điều kiện để được hỗ trợ chi phí chữa bệnh nghề nghiệp là gì?",\n"Hạn mức hỗ trợ chi phí chữa bệnh nghề nghiệp trong một năm là bao nhiêu?"\n] \n\n\n', 'baf3cbb8': '["Chủ tịch Ủy ban nhân dân cấp xã có thẩm quyền giải quyết khiếu nại kiểu gì?", "Kể tên những quyết định chủ tịch xã có thẩm quyền giải quyết khiếu nại?", "Trường hợp nào chủ tịch xã có quyền giải quyết khiếu nại?", "Ai là người được Chủ tịch Ủy ban nhân dân cấp xã quản lý trực tiếp?", "Chức năng của Chủ tịch Ủy ban nhân dân cấp xã khi xử lý khiếu nại là gì?"]\t\n', '5ae0676b': '["Kế hoạch bảo quản tài nguyên thông tin của thư viện được phê duyệt bởi ai?","Thư v

100%|█████████████████████████| 30/30 [00:03<00:00,  9.09it/s]


Chunk 35 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth118.pkl
{'118d50cd': '{"question1":"Theo Thông tư nào thì tổ chức và cá nhân phải nộp phí trong lĩnh vực bảo vệ thực vật?", "question2":"Ai cần nộp phí khi đề nghị cơ quan nhà nước thực hiện bảo vệ thực vật?", "question3":"Đơn vị nào có thẩm quyền được đề nghị thực hiện bảo vệ thực vật theo quy định?", "question4":"Ngoài bảo vệ thực vật, lĩnh vực nào còn yêu cầu nộp phí theo Thông tư?", "question5":"Việc nộp phí nào liên quan đến việc quản lý thuốc bảo vệ thực vật?"} \n', '4f65c82a': '[\n"Nghị định nào quy định về hành vi vi phạm quy định thực hành tiết kiệm trong đầu tư xây dựng ?",\n"Các ngành nghề nào bị quy định về hành vi vi phạm quy định thực hành tiết kiệm trong đầu tư xây dựng ?",\n"Khi nào Nghị định số 139/2017/NĐ-CP được áp dụng ?",\n"Có văn bản nào bổ sung hoặc sửa đổi Nghị định số 139/2017/NĐ-CP không ?",\n"Theo Nghị định số 139/2017/NĐ-CP, ai phải thực hiện các quy định về tiết kiệm trong 

100%|█████████████████████████| 30/30 [00:03<00:00,  9.02it/s]


Chunk 36 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth119.pkl
{'a60fb307': '["Người 16 tuổi có đủ điều kiện để tự mình mua sắm bất động sản không?", "Độ tuổi nào được phép tự mua xe máy?", "Theo luật, ai là người đại diện theo pháp luật cho người chưa đủ 18 tuổi?", "Giao dịch dân sự nào ở người dưới 18 tuổi phải có sự đồng ý của người đại diện theo pháp luật?", "Người 17 tuổi có được tự mình mua xe ôtô không?"] \n', '2642767c': '[\n"Kiểm soát dựng rạp, lều trái phép tại gầm cầu vượt thuộc vòng nào?",\n"Số tiền phạt cho cá nhân vi phạm quy định dựng rạp tại gầm cầu vượt gần đây là bao nhiêu?",\n"Nếu là tổ chức vi phạm quy định dựng rạp, lều tại gầm cầu vượt, mức phạt sẽ là bao nhiêu?",\n"Mức phạt cho vi phạm dựng công trình trái phép tại gầm cầu vượt bao gồm loại hình hình phạt nào?",\n"Có quy định phạt riêng cho việc dựng rạp, lều trái phép tại gầm cầu vượt không?"\n] \n', 'bea3b053': '["Dự phòng tổn thất các khoản đầu tư bao gồm dự phòng cho những khoản 

100%|█████████████████████████| 30/30 [00:04<00:00,  6.53it/s]


Chunk 37 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth120.pkl
{'a4bb327d': '[\n"Người dưới 18 tuổi có được gọi điện cho gia đình không?",\n"Giới hạn lần gọi điện của phạm nhân dưới 18 tuổi là bao nhiêu trong một tháng?",\n"Mỗi cuộc gọi điện của phạm nhân dưới 18 tuổi được kéo dài tối đa bao nhiêu phút?",\n"Phạm nhân dưới 18 tuổi có được phép liên lạc với gia đình bằng điện thoại không?",\n"Ai giám sát cuộc gọi điện của phạm nhân dưới 18 tuổi?"\n]  \n\n\n', '0de9a7fe': '{"questions": ["Nhà thầu thi công xây dựng và nhà thầu cung ứng thiết bị cần làm gì để công nhận việc bảo hành công trình hoàn tất?", "Chủ đầu tư có những trách nhiệm gì khi xác nhận hoàn thành bảo hành công trình xây dựng?", "Điều kiện để chủ đầu tư hoàn trả tiền bảo hành cho nhà thầu là gì?", "Ai có trách nhiệm tham gia xác nhận hoàn thành bảo hành công trình xây dựng khi chủ đầu tư yêu cầu?", "Văn bản chủ đầu tư sử dụng để xác nhận hoàn thành bảo hành công trình như thế nào?"]} \n', 'd8c

100%|█████████████████████████| 30/30 [00:03<00:00,  9.59it/s]


Chunk 38 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth121.pkl
{'b0a7c303': '[\n"Thông tin về người sở hữu chứng khoán được ghi lại ở đâu?",\n"Ai có quyền quản lý việc đăng ký chứng khoán?",\n"Tổng công ty lưu ký và bù trừ chứng khoán Việt Nam có vai trò gì trong việc quản lý chứng khoán?",\n"Theo bạn, chứng khoán được bán cho ai?" ,\n"Điều kiện để được ghi tên trên sổ đăng ký sở hữu chứng khoán là gì?"\n] \n', 'f1590119': '{"questions":["Nguồn ngân sách nào được sử dụng để hỗ trợ phát triển nhân lực DNNVV?", "Chính sách hỗ trợ DNNVV được tài trợ bởi ngân sách trung ương theo hình thức nào?", "Biên chế ngân sách địa phương được bố trí để hỗ trợ phát triển nguồn nhân lực DNNVV ở đâu?", "Bộ nào, cơ quan nào trong ngân sách trung ương được giao nhiệm vụ hỗ trợ phát triển nhân lực DNNVV?", "Ngoài ngân sách trung ương và địa phương, có những nguồn hỗ trợ nào khác cho DNNVV?"]} \n', 'c48b9e9e': '["Những loài thủy sản nào được cấm xuất khẩu?", "Xuất khẩu giống th

100%|█████████████████████████| 30/30 [00:03<00:00,  9.34it/s]


Chunk 39 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth122.pkl
{'d0720e42': '["Nghiên cứu đào tạo lái xe có công khai quy chế tuyển sinh không?", "Cơ sở đào tạo lái xe phải công khai thông tin gì?", "Theo quy định, cơ sở đào tạo lái xe có bị ràng buộc về công khai học phí không?", "Mức thu học phí ở cơ sở đào tạo lái xe được quản lý như thế nào?", "Tại sao cơ sở đào tạo lái xe cần công khai thông tin?"] \n', 'e785eac6': '[\n"Hướng dẫn nào để nộp hồ sơ công nhận tổ chức đủ điều kiện tổ chức sát hạch cấp CCHN kiến trúc?",\n"Những gì cần có trong đơn đề nghị công nhận đủ điều kiện tổ chức sát hạch kiến trúc?",\n"Bản thuyết minh về khả năng đáp ứng yêu cầu tại khoản 3 Điều 26 Luật Kiến trúc cần có nội dung gì?",\n"Loại văn bản nào được yêu cầu chứng thực khả năng hoạt động của tổ chức?",\n"Người liên hệ để nhận được mẫu đơn đề nghị công nhận đủ điều kiện tổ chức sát hạch kiến trúc là ai?"\n] \n', 'bdcad92d': '[\n"Từ tháng 7/2020, trường của cơ quan nhà nước vẫ

In [46]:
# results = {}
# # Use map_progress to process documents
# processed_results = map_progress(pool, documents3[1200:], process_document)

# # Store the results
# for result in processed_results:
#     if result is not None:
#         doc_id, questions = result
#         results[doc_id] = questions
# with open('../data/vietnamese_rag/ground_truth_data/ground_truth84.pkl', 'wb') as file:
#     pickle.dump(results, file)

In [47]:
# with open('../data/vietnamese_rag/documents-with-ids4.json', 'rt') as f_in:
#     documents4 = json.load(f_in)

In [48]:
# chunk_size = 30
# start_chunk = 0 # Starting chunk index
# end_chunk = (len(documents4) // chunk_size)  # Ending chunk index
# print(end_chunk)
# for i in range(start_chunk, end_chunk):
#     results = {}
#     chunk_start = i * chunk_size
#     chunk_end = chunk_start + chunk_size
#     # print(i + 42, chunk_start, chunk_end)
#     chunk = documents4[chunk_start:chunk_end]

#     # Use map_progress to process documents
#     processed_results = map_progress(pool, chunk, process_document)

#     # Store the results incrementally
#     for result in processed_results:
#         if result is not None:
#             doc_id, questions = result
#             results[doc_id] = questions

#     # Save the results to a file
#     file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 85}.pkl'
#     with open(file_name, 'wb') as file:
#         pickle.dump(results, file)

#     # Print out the results
#     print(f"Chunk {i} processed and saved to {file_name}")
#     print(results)

#     # Wait for 1 minute to reset rate limit
#     time.sleep(60)

In [49]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents3[1200:], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth123.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|███████████████████████████████████████████████████| 17/17 [00:02<00:00,  6.71it/s]


In [50]:
with open('../data/vietnamese_rag/documents-with-ids4.json', 'rt') as f_in:
    documents4 = json.load(f_in)

In [51]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents4) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    # print(i + 42, chunk_start, chunk_end)
    chunk = documents4[chunk_start:chunk_end]

    # Use map_progress to process documents
    processed_results = map_progress(pool, chunk, process_document)

    # Store the results incrementally
    for result in processed_results:
        if result is not None:
            doc_id, questions = result
            results[doc_id] = questions

    # Save the results to a file
    file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 124}.pkl'
    with open(file_name, 'wb') as file:
        pickle.dump(results, file)

    # Print out the results
    print(f"Chunk {i} processed and saved to {file_name}")
    # print(results)

    # Wait for 1 minute to reset rate limit
    time.sleep(60)

40


100%|█████████████████████████| 30/30 [00:14<00:00,  2.04it/s]


Chunk 0 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth124.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  8.87it/s]


Chunk 1 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth125.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  6.81it/s]


Chunk 2 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth126.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  8.01it/s]


Chunk 3 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth127.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  6.44it/s]


Chunk 4 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth128.pkl


100%|█████████████████████████| 30/30 [00:17<00:00,  1.70it/s]


Chunk 5 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth129.pkl


100%|█████████████████████████| 30/30 [00:05<00:00,  5.88it/s]


Chunk 6 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth130.pkl


100%|█████████████████████████| 30/30 [00:10<00:00,  2.99it/s]


Chunk 7 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth131.pkl


100%|█████████████████████████| 30/30 [00:07<00:00,  3.81it/s]


Chunk 8 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth132.pkl


100%|█████████████████████████| 30/30 [00:05<00:00,  5.57it/s]


Chunk 9 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth133.pkl


100%|█████████████████████████| 30/30 [00:07<00:00,  4.28it/s]


Chunk 10 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth134.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  6.29it/s]


Chunk 11 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth135.pkl


100%|█████████████████████████| 30/30 [00:08<00:00,  3.64it/s]


Chunk 12 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth136.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  7.93it/s]


Chunk 13 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth137.pkl


100%|█████████████████████████| 30/30 [00:05<00:00,  5.84it/s]


Chunk 14 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth138.pkl


100%|█████████████████████████| 30/30 [00:08<00:00,  3.40it/s]


Chunk 15 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth139.pkl


100%|█████████████████████████| 30/30 [00:06<00:00,  4.42it/s]


Chunk 16 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth140.pkl


100%|█████████████████████████| 30/30 [00:13<00:00,  2.28it/s]


Chunk 17 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth141.pkl


100%|█████████████████████████| 30/30 [00:06<00:00,  4.59it/s]


Chunk 18 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth142.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  6.20it/s]


Chunk 19 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth143.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  6.32it/s]


Chunk 20 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth144.pkl


100%|█████████████████████████| 30/30 [00:09<00:00,  3.33it/s]


Chunk 21 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth145.pkl


100%|█████████████████████████| 30/30 [00:14<00:00,  2.04it/s]


Chunk 22 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth146.pkl


100%|█████████████████████████| 30/30 [00:27<00:00,  1.11it/s]


Chunk 23 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth147.pkl


100%|█████████████████████████| 30/30 [00:15<00:00,  1.96it/s]


Chunk 24 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth148.pkl


100%|█████████████████████████| 30/30 [00:04<00:00,  7.07it/s]


Chunk 25 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth149.pkl


100%|█████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Chunk 26 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth150.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Chunk 27 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth151.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:04<00:00,  7.32it/s]


Chunk 28 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth152.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  7.67it/s]


Chunk 29 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth153.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  9.26it/s]


Chunk 30 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth154.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  7.88it/s]


Chunk 31 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth155.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  8.08it/s]


Chunk 32 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth156.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  8.34it/s]


Chunk 33 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth157.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.97it/s]


Chunk 34 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth158.pkl


100%|███████████████████████████████████████████████████| 30/30 [00:03<00:00,  7.79it/s]


Chunk 35 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth159.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  9.20it/s]


Chunk 36 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth160.pkl


100%|█████████████████████████| 30/30 [00:03<00:00,  8.68it/s]


Chunk 37 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth161.pkl


100%|█████████████████████████| 30/30 [01:08<00:00,  2.28s/it]


Chunk 38 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth162.pkl


100%|█████████████████████████| 30/30 [02:24<00:00,  4.81s/it]


Chunk 39 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth163.pkl


In [52]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents4) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    print(i + 124, chunk_start, chunk_end)

40
124 0 30
125 30 60
126 60 90
127 90 120
128 120 150
129 150 180
130 180 210
131 210 240
132 240 270
133 270 300
134 300 330
135 330 360
136 360 390
137 390 420
138 420 450
139 450 480
140 480 510
141 510 540
142 540 570
143 570 600
144 600 630
145 630 660
146 660 690
147 690 720
148 720 750
149 750 780
150 780 810
151 810 840
152 840 870
153 870 900
154 900 930
155 930 960
156 960 990
157 990 1020
158 1020 1050
159 1050 1080
160 1080 1110
161 1110 1140
162 1140 1170
163 1170 1200


In [53]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents4[1200:], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth164.pkl', 'wb') as file:
    pickle.dump(results, file)

100%|█████████████████████████| 17/17 [00:02<00:00,  6.55it/s]


In [8]:
with open('../data/vietnamese_rag/documents-with-ids5.json', 'rt') as f_in:
    documents5 = json.load(f_in)

In [9]:
len(documents5)

1221

In [10]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents5) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    print(i + 165, chunk_start, chunk_end)

40
165 0 30
166 30 60
167 60 90
168 90 120
169 120 150
170 150 180
171 180 210
172 210 240
173 240 270
174 270 300
175 300 330
176 330 360
177 360 390
178 390 420
179 420 450
180 450 480
181 480 510
182 510 540
183 540 570
184 570 600
185 600 630
186 630 660
187 660 690
188 690 720
189 720 750
190 750 780
191 780 810
192 810 840
193 840 870
194 870 900
195 900 930
196 930 960
197 960 990
198 990 1020
199 1020 1050
200 1050 1080
201 1080 1110
202 1110 1140
203 1140 1170
204 1170 1200


In [None]:
chunk_size = 30
start_chunk = 0 # Starting chunk index
end_chunk = (len(documents5) // chunk_size)  # Ending chunk index
print(end_chunk)
for i in range(start_chunk, end_chunk):
    results = {}
    chunk_start = i * chunk_size
    chunk_end = chunk_start + chunk_size
    # print(i + 42, chunk_start, chunk_end)
    chunk = documents5[chunk_start:chunk_end]

    # Use map_progress to process documents
    processed_results = map_progress(pool, chunk, process_document)

    # Store the results incrementally
    for result in processed_results:
        if result is not None:
            doc_id, questions = result
            results[doc_id] = questions

    # Save the results to a file
    file_name = f'../data/vietnamese_rag/ground_truth_data/ground_truth{i + 165}.pkl'
    with open(file_name, 'wb') as file:
        pickle.dump(results, file)

    # Print out the results
    print(f"Chunk {i} processed and saved to {file_name}")
    # print(results)

    # Wait for 1 minute to reset rate limit
    time.sleep(30)

40


100%|███████████████████████████| 30/30 [00:18<00:00,  1.64it/s]


Chunk 0 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth165.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:40<00:00,  1.36s/it]


Chunk 1 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth166.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:37<00:00,  1.25s/it]


Chunk 2 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth167.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:44<00:00,  1.48s/it]


Chunk 3 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth168.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:37<00:00,  1.25s/it]


Chunk 4 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth169.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:50<00:00,  1.70s/it]


Chunk 5 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth170.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:37<00:00,  1.24s/it]


Chunk 6 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth171.pkl


100%|██████████████████████████████████████████████████████████| 30/30 [00:51<00:00,  1.72s/it]


Chunk 7 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth172.pkl


100%|███████████████████████████████| 30/30 [00:51<00:00,  1.71s/it]


Chunk 8 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth173.pkl


100%|███████████████████████████████| 30/30 [00:46<00:00,  1.56s/it]


Chunk 9 processed and saved to ../data/vietnamese_rag/ground_truth_data/ground_truth174.pkl


 87%|██████████████████████████▊    | 26/30 [00:32<00:09,  2.41s/it]

In [None]:
results = {}
# Use map_progress to process documents
processed_results = map_progress(pool, documents5[1200:], process_document)

# Store the results
for result in processed_results:
    if result is not None:
        doc_id, questions = result
        results[doc_id] = questions
with open('../data/vietnamese_rag/ground_truth_data/ground_truth205.pkl', 'wb') as file:
    pickle.dump(results, file)