# **TON DUC THANG IT PROJECT (ProjectIT_504091_2425)**
### ***- @Author:** 521H0220 Bui Hai Duong*
### ***- @Instructor:** Assoc. Prof. PhD. Le Anh Cuong*

## ***Import libraries for RAG***

In [1]:
import os, re, glob
from pathlib import Path
import torch
import numpy as np
import pandas as pd
from collections import Counter
from docx import Document
from pinecone import Pinecone, ServerlessSpec
from pinecone_text.sparse import BM25Encoder

In [2]:
from langchain_core.documents import Document as LC_Document
from langchain.load import dumps, loads
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_pinecone import PineconeVectorStore
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_google_genai import GoogleGenerativeAI
from langchain_experimental.text_splitter import SemanticChunker
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_community.retrievers import PineconeHybridSearchRetriever
from langchain_community.document_loaders import DirectoryLoader
from langchain_core.messages import HumanMessage
from langchain_core.output_parsers.string import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder, FewShotPromptTemplate, PromptTemplate

## ***Environment Variable***

In [3]:
os.environ['PINECONE_API_KEY'] = "pcsk_3EcDrL_3mUVa7rhMVLMFBZJFPvgGEaunymPs7T5XcZXjBp9dF55S73miNRzeW2FMsFWcEb"
os.environ['GOOGLE_API_KEY'] = "AIzaSyD6fv2qZAcRc30uDjn96CbsM6pUJwLkdFE"

In [4]:
os.environ["GOOGLE_API_KEY"] = "AIzaSyCekUE-sNiAc_Jw-TFaLO11Xn18lLc-Lkw"

## ***Checking whether GPU is available***

In [4]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda')

In [9]:
device = torch.device('cpu')

In [10]:
device

device(type='cpu')

### ***Prompting function***

In [96]:
def fusion_query(query, llm, retriever):
    system_template = """
    Bạn là một chuyên gia tạo ra nhiều câu hỏi liên quan từ câu query đầu vào của người dùng. 
    Trong mỗi câu output đừng giải thích gì thêm cả, chỉ cần tạo ra câu hỏi liên quan từ câu query đầu vào.
    Hãy tạo ra 4 câu query liên quan tới query sau: "{query}"
    Output:
    ...
    ...
    ...
    ...
    """
    prompt_template = PromptTemplate(
        input_variables=["query"],
        template=system_template,
    )
    prompt = prompt_template.format(query=query)
    get_response = llm(prompt)
    list_query = [line.strip() for line in get_response.split("\n") if line.strip()]
    retriever.top_k = 5
    retrieved_list = [retriever.invoke(query) for query in list_query]
    
    lst=[]
    for ddxs in retrieved_list:
        for ddx in ddxs:
            if ddx.page_content not in lst:
                lst.append(ddx.page_content)
                
    fused_scores = {}
    k=60
    for docs in retrieved_list:
        for rank, doc in enumerate(docs):
            doc_str = dumps(doc)
            if doc_str not in fused_scores:
                fused_scores[doc_str] = 0
            previous_score = fused_scores[doc_str]
            fused_scores[doc_str] += 1 / (rank + k)

    reranked_results = [
        (loads(doc), score)
        for doc, score in sorted(fused_scores.items(), key=lambda x: x[1], reverse=True)
    ]
    return reranked_results

In [6]:
def zero_shot_prompting(query, llm, retriever):
    SYSTEM_TEMPLATE = """
    Trả lời các câu hỏi dựa và các context được cung cấp dưới đây
    Nếu context không liên quan đến câu hỏi hoặc không chứa thông tin cần thiết, hãy trả lời "Tôi không tìm được thông tin liên quan" và không nói gì thêm

    <context>
    {context}
    </context>
    """
    context = retriever.invoke(query)
    question_answering_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            SYSTEM_TEMPLATE,
        ),
        MessagesPlaceholder(variable_name="messages"),
    ]
)

    document_chain = create_stuff_documents_chain(llm, question_answering_prompt)
    result = document_chain.invoke(
        {
            "context": context,
            "messages": [
                HumanMessage(content=query)
            ],
        }
    )
    return result

In [97]:
def few_shot_fusion(query, llm, context):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Không thể trả lời câu hỏi này.",
        },
    ]
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    prefix = """
    # Bạn là một chuyên gia pháp luật

    Nhiệm vụ của bạn là cung cấp câu trả lời chính xác và chi tiết cho các câu hỏi của người dùng dựa trên các văn bản pháp luật được cung cấp.
    Khi thực hiện trả lời câu hỏi, hãy dựa vào những context được truyền vào để trả lời câu hỏi một cách chính xác nhất. 
    Nếu trong context truyền vào không chứa thông tin để trả lời câu hỏi hoặc không liên quan đến câu hỏi, hãy trả lời "Không thể trả lời câu hỏi này" và không nói gì thêm.
    Không nói lan man hoặc thêm bất kỳ thông tin nào khác ngoài câu trả lời cho câu hỏi.
    """
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix=prefix,
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    context = [ctx[0].page_content for ctx in context[:16]]
    final_prompt = few_shot_prompt.format(question=f"{query}\nContext: {context}")
    print(final_prompt)
    
    response = llm(final_prompt)
    return response

In [94]:
def few_shot_prompting(query, llm, retriever):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Không thể trả lời câu hỏi này.",
        },
    ]
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    prefix = """
    # Bạn là một chuyên gia về luật giao thông

    Nhiệm vụ của bạn là cung cấp câu trả lời chính xác và chi tiết cho các câu hỏi của người dùng dựa trên các context về luật giao thông được cung cấp.
    Khi thực hiện trả lời câu hỏi, hãy dựa vào những context được truyền vào để trả lời câu hỏi một cách chính xác nhất. 
    Nếu trong context không bao gồm nội dung nào liên quan để có thể trả lời được câu hỏi thì hãy trả lời "Không thể trả lời câu hỏi này." và không nói gì thêm.
    
    """
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix=prefix,
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    contexts = retriever.invoke(query)
    context = [context.page_content for context in contexts]
    
    final_prompt = few_shot_prompt.format(question=f"{query}\nContext: {context}")
    print(final_prompt)
    
    response = llm(final_prompt)
    return response

In [8]:
def StepBackPrompting(query, llm):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Quy định về quyền và trách nhiệm của người đi bộ là gì?",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Các quy định về tốc độ tối đa trong giao thông là gì?",
        },
    ]   
    
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là viết lại câu hỏi của người dùng theo nghĩa rộng và bao quát hơn, dễ dàng cho việc trả lời. Đây là một số ví dụ:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    
    formatted_prompt = few_shot_prompt.format(question=query)
    step_back_question = llm.invoke(formatted_prompt)
    return step_back_question

## ***Custom chunking method definition***

In [14]:
def read_docx(file_path):
    doc = Document(file_path)
    content = []
    for paragraph in doc.paragraphs:
        if paragraph.text.strip():
            paragraph = paragraph.text.lower()
            content.append(paragraph.strip())
    return content

In [37]:
path = r"D:\Documents\TDTU\ProjectIT\Chatbot_RAG_2024\data\documents\new_law\168_2024_ND-CP_619502.docx"
loader = read_docx(path)

In [12]:
path_new_law = r"D:\Documents\TDTU\ProjectIT\Chatbot_RAG_2024\data\documents\new_law\*"
path_old_law = r"D:\Documents\TDTU\ProjectIT\Chatbot_RAG_2024\data\documents\old_law\*"

In [9]:
def extract_sections(text: list[str]) -> tuple:
    title = f"{text[0].capitalize()} {text[1].capitalize()}"
    sections = {}
    current_section = None
    for line in text:
        match = re.match(r"^\s*(điều \d+\. .+)$", line, re.IGNORECASE)
        if match:
            current_section = match.group(1)
            sections[current_section] = []
        elif current_section:
            sections[current_section].append(line)
    return title, sections

In [10]:
def article_chunk(path):
    file_list = glob.glob(path)
    basename_list = [Path(p).stem for p in file_list]
    documents = []
    for i, path in enumerate(file_list):
        loader = read_docx(path)
        title, sections = extract_sections(loader)
        keys = list(sections.keys())
        values = list(sections.values())
        for j in range(len(sections)):
            page_content = values[j]
            if isinstance(page_content, list):
                page_content = " ".join(page_content)
            document = LC_Document(
                page_content=page_content,
                metadata={"source": basename_list[i], 
                          "title": title,
                          "article": keys[j].split(".")[0].strip(),
                          "article_title": keys[j].split(".")[1].strip()}
            )
            documents.append(document)
    return documents

In [16]:
old_docs = article_chunk(path_old_law)

In [18]:
len(old_docs)

1603

In [53]:
new_docs = article_chunk(path_new_law)

In [55]:
len(new_docs)

1312

# ***Baseline setup***

### ***Load documents from dictionary***

In [5]:
path = "../data/documents"
loader = DirectoryLoader(path, "**/*.docx")
documents = loader.load()

In [10]:
documents[0].metadata.update

{'source': '..\\data\\documents\\01_2010_TTLT-BCA-BGTVT_101788.docx'}

### ***Create Huggingface embedding***

In [19]:
model_name = "hiieu/halong_embedding"
hf = HuggingFaceEmbeddings(model_name=model_name)




### ***Defining model***

In [20]:
llm = GoogleGenerativeAI(model="gemini-1.5-pro", google_api_key=os.environ['GOOGLE_API_KEY'], temperature=0)

### ***Chunking***

In [56]:
spliter = SemanticChunker(hf, breakpoint_threshold_type="gradient", breakpoint_threshold_amount=85.0)
docs = spliter.split_documents(new_docs)

In [58]:
len(docs)

4128

In [20]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=8000, chunk_overlap=300)
docs = text_splitter.split_documents(documents)

### ***Create Pinecone Index***

In [27]:
def create_index(index_name, dimention, metric):
    pc = Pinecone(api_key=os.environ['PINECONE_API_KEY'])
    if index_name not in pc.list_indexes().names():
        pc.create_index(name=index_name,
                        dimension=dimention,
                        metric=metric,
                        spec=ServerlessSpec(cloud='aws', region='us-east-1'))
    return pc.Index(index_name)

In [57]:
new_docs_index = create_index("new-documents", 768, "dotproduct")

In [58]:
new_docs_storage = PineconeVectorStore(index=new_docs_index, embedding=hf)

In [52]:
new_docs_hybrid_index = create_index("new-documents-hybrid", 768, "dotproduct")
hybrid_storage = PineconeVectorStore(index=new_docs_hybrid_index, embedding=hf)

In [30]:
old_docs_hybrid_index = create_index("old-documents-hybrid", 768, "dotproduct")
hybrid_storage = PineconeVectorStore(index=old_docs_hybrid_index, embedding=hf)

## ***Upsert values to Pinecone***

### ***Semantic Index***

In [15]:
vectorstore_from_docs = PineconeVectorStore.from_documents(docs, 
                                                           index_name='hybrid-rag', 
                                                           embedding=hf)

  attn_output = torch.nn.functional.scaled_dot_product_attention(


In [68]:
vectorstore = PineconeVectorStore(index=semantic_index, embedding=hf)
semantic_retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

In [69]:
semantic_retriever.invoke("Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?")

[Document(id='dc995f4f-c8a9-4185-84f0-ca45cbfa56aa', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 8. Các hành vi bị nghiêm cấm \n\n1. Phá hoại công trình đường bộ. 2. Đào, khoan, xẻ đường trái phép; đặt, để các chướng ngại vật trái phép trên đường; mở đường trái phép; lấn chiếm hành lang an toàn đường bộ; tháo dỡ, di chuyển trái phép hoặc làm sai lệch công trình báo hiệu đường bộ.'),
 Document(id='18301047-56cf-4557-864c-e47dafc03e35', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 52. Điều kiện tham gia giao thông của xe máy chuyên dùng\n\n1. Bảo đảm các tiêu chuẩn chất lượng, an toàn kỹ thuật và tiêu chuẩn bảo vệ môi trường sau đây:\n\na) Có đủ hệ thống hãm có hiệu lực;\n\nb) Có hệ thống chuyển hướng có hiệu lực;\n\nc) Có đèn chiếu sáng;\n\nd) Bảo đảm tầm nhìn cho người điều khiển;\n\nđ) Các bộ phận chuyên dùng phải lắp đặt đúng vị trí, chắc chắn, bảo đảm an toàn khi di chuyển;\n\ne) Có bộ phận giảm thanh, giảm

### ***Hybrid index***

In [43]:
spliter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=10)

In [44]:
docs = spliter.split_documents(new_docs)
len(docs)

513

In [45]:
docs

[Document(metadata={'source': '168_2024_ND-CP_619502', 'title': 'Nghị định Quy định xử phạt vi phạm hành chính về trật tự, an toàn giao thông trong lĩnh vực giao thông đường bộ; trừ điểm, phục hồi điểm giấy phép lái xe', 'article': 'điều 1', 'article_title': 'phạm vi điều chỉnh'}, page_content='1. nghị định này quy định về: a) xử phạt vi phạm hành chính về trật tự, an toàn giao thông trong lĩnh vực giao thông đường bộ bao gồm: hành vi vi phạm hành chính; hình thức, mức xử phạt, biện pháp khắc phục hậu quả đối với từng hành vi vi phạm hành chính; thẩm quyền lập biên bản, thẩm quyền xử phạt, mức phạt tiền cụ thể theo từng chức danh đối với hành vi vi phạm hành chính về trật tự, an toàn giao thông trong lĩnh vực giao thông đường bộ; b) mức trừ điểm giấy phép lái xe đối với từng hành vi vi phạm hành'),
 Document(metadata={'source': '168_2024_ND-CP_619502', 'title': 'Nghị định Quy định xử phạt vi phạm hành chính về trật tự, an toàn giao thông trong lĩnh vực giao thông đường bộ; trừ điểm, ph

In [59]:
retriever = new_docs_storage.as_retriever(search_kwargs={"k": 5})

In [59]:
doc_list = [doc.page_content for doc in docs if doc.page_content != ""]
metadata = [doc.metadata for doc in docs if doc.page_content != ""]

In [60]:
empty = [doc for doc in doc_list if doc == ""]

In [61]:
empty

[]

In [62]:
bm25_encoder = BM25Encoder().default()

In [None]:
bm25_encoder.fit(doc_list)
bm25_encoder.dump("bm25-values.json")
bm25_encoder

  0%|          | 0/1276 [00:00<?, ?it/s]

<pinecone_text.sparse.bm25_encoder.BM25Encoder at 0x215461e5390>

In [None]:
bm25_encoder = BM25Encoder().load("bm25-values.json")

### ***Hydrid Search***

In [63]:
retriever = PineconeHybridSearchRetriever(embeddings=hf, sparse_encoder=bm25_encoder, index=new_docs_hybrid_index)

In [64]:
retriever.add_texts(texts=doc_list,metadatas=metadata)

  0%|          | 0/129 [00:00<?, ?it/s]

## ***Baseline testing***

In [65]:
retriever.top_k = 5
retriever.alpha = 0.7
retriever.invoke("vượt đèn đỏ bị phạt bao nhiêu tiền")

[Document(metadata={'article': 'điều 36', 'article_title': 'xử phạt người điều khiển xe mô tô, xe gắn máy, xe thô sơ thực hiện hành vi vi phạm vận chuyển hành khách, hàng hóa', 'source': '168_2024_ND-CP_619502', 'title': 'Nghị định Quy định xử phạt vi phạm hành chính về trật tự, an toàn giao thông trong lĩnh vực giao thông đường bộ; trừ điểm, phục hồi điểm giấy phép lái xe', 'score': 0.444075644}, page_content='phạt tiền từ 300.000 đồng đến 400.000 đồng đối với người điều khiển phương tiện thực hiện một trong các hành vi vi phạm sau đây: a) vận chuyển hàng hóa mà sắp xếp, chằng buộc hàng hóa không bảo đảm an toàn hoặc gây nguy hiểm cho người, phương tiện tham gia giao thông; b) vận chuyển hàng hóa trên xe gây cản trở tầm nhìn của người lái xe hoặc che khuất đèn, biển số xe (đối với loại xe có đèn, biển số xe); để rơi hàng hóa xuống đường. 2. phạt tiền từ 400.000 đồng đến 600.000 đồng đối với một trong các hành vi vi phạm sau đây: a) chở hành lý, hàng hóa vượt quá khối lượng cho phép củ

In [89]:
query = "Xe ô tô vượt đèn đỏ bị phạt bao nhiêu tiền"
result = fusion_query(query, llm, retriever)

In [85]:
result

[(Document(metadata={'article': 'điều 73', 'article_title': 'ngăn chặn hành vi không chấp hành yêu cầu kiểm tra, kiểm soát, cản trở, chống người thi hành công vụ', 'source': '36_2024_QH15_444251', 'title': 'Luật Trật tự, an toàn giao thông đường bộ', 'score': 0.454530358}, page_content='1. khi người tham gia giao thông đường bộ không chấp hành yêu cầu kiểm tra, kiểm soát, có hành vi cản trở, chống người thi hành công vụ thì người thi hành công vụ thực hiện các biện pháp sau đây: a) giải thích cho người vi phạm biết rõ về hành vi không chấp hành yêu cầu kiểm tra, kiểm soát, có hành vi cản trở, chống người thi hành công vụ; quyền và trách nhiệm của người vi phạm; thuyết phục, yêu cầu chấm dứt ngay hành vi vi phạm, chấp hành yêu cầu kiểm tra, kiểm soát; b) áp dụng các biện pháp ngăn chặn theo quy định của pháp luật trong trường hợp người vi phạm cản trở, không chấp hành yêu cầu kiểm tra, kiểm soát của người thi hành công vụ; c) trường hợp người vi phạm có hành vi chống người thi hành công

In [95]:
# query = "Đậu xe trên vỉa hè bị phạt bao nhiêu tiền?"
query = "Đua xe trái phép bị phạt bao nhiêu tiền?"
response = few_shot_fusion(query, llm, result)
response


        # Bạn là một chuyên gia pháp luật

        Nhiệm vụ của bạn là cung cấp câu trả lời chính xác và chi tiết cho các câu hỏi của người dùng dựa trên các văn bản pháp luật được cung cấp.
        Khi thực hiện trả lời câu hỏi, hãy dựa vào những context được truyền vào để trả lời câu hỏi một cách chính xác nhất. 
        Nếu trong context truyền vào không chứa thông tin để trả lời câu hỏi hoặc không liên quan đến câu hỏi, hãy trả lời "Không thể trả lời câu hỏi này" và không nói gì thêm.
        Không nói lan man hoặc thêm bất kỳ thông tin nào khác ngoài câu trả lời cho câu hỏi.
    

Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
AI: Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.


Human: Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?
AI: Không thể trả lời câu hỏi này.


Hu

'Phạt tiền từ 1.000.000 đồng đến 2.000.000 đồng đối với hành vi tụ tập để cổ vũ, giúp sức, xúi giục đua xe trái phép.\n'

In [56]:
query = "Dừng xe, đỗ xe trên cầu bị phạt thế nào?"
result = StepBackPrompting(query, llm)
print("Back_step_prompting: ", result)
few_shot_prompting(result, llm, retriever)

Back_step_prompting:  Quy định về đỗ xe và dừng xe trên đường là gì?


'Dừng xe, đỗ xe trên đường xe điện, điểm dừng đón trả khách của xe buýt, nơi đường bộ giao nhau, trên phần đường dành cho người đi bộ qua đường; dừng xe nơi có biển “cấm dừng xe và đỗ xe”; đỗ xe tại nơi có biển “cấm đỗ xe” hoặc biển “cấm dừng xe và đỗ xe”; không tuân thủ các quy định về dừng xe, đỗ xe tại nơi đường bộ giao nhau cùng mức với đường sắt; dừng xe, đỗ xe trong phạm vi an toàn của đường sắt, trừ hành vi vi phạm quy định tại điểm b khoản 2, điểm b khoản 3 điều 48 nghị định này'

In [143]:
query = "Quy định về đỗ xe và dừng xe trên đường là gì?"
zero_shot_prompting(query, llm, retriever).replace('\n', ' ').strip()

KeyboardInterrupt: 

In [75]:
query = "Xe máy vượt đèn đỏ bị phạt bao nhiêu tiền"
few_shot_prompting(query, llm, retriever)

Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:

Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
AI: Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.


Human: Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?
AI: Không thể trả lời câu hỏi này.


Human: Xe máy vượt đèn đỏ bị phạt bao nhiêu tiền
Context: ['giới xin vượt, gây cản trở xe ưu tiên; đ) không chấp hành hiệu lệnh của đèn tín hiệu giao thông. 3. phạt tiền từ 300.000 đồng đến 400.000 đồng đối với người điều khiển xe thực hiện một trong các hành vi vi phạm sau đây: a) điều khiển xe lạng lách, đánh võng; đuổi nhau trên đường; b) đi

'Không thể trả lời câu hỏi này.\n'

In [None]:
PROMPTING = """
    Bạn là một chuyên gia về luật.
    Công việc của bạn là trả lời các câu hỏi của người dùng về luật.
    Format của câu trả lời bao gồm:
    - Nội dung của câu trả lời được trích xuất từ văn bản nào?
    - Nội dung của câu trả lời được trích xuất từ chương nào? .
    - Nội dung của câu trả lời được trích xuất từ điều nào? Hãy ghi rõ nội dung liên quan tới câu hỏi của người dùng.
    Format của câu trả lời: 
    - Tên văn bản - Tên chương - Tên điều: \n
            Nội dung câu trả lời
            
    Nêu văn bản không chia theo chương hoặc điều, hãy bỏ qua phần tương ứng.
    Câu trả lời phải chính xác và đầy đủ thông tin dựa theo câu hỏi của người dùng và nội dung của văn bản.
    Nếu không có thông tin của câu trả lời dựa vào những văn bản được truyền vào, hãy trả lời "Không thể trả lời câu hỏi này" và không nói gì thêm. Không trả lời lan man.
    
    ###
    {context}
    ###
"""