# **TON DUC THANG IT PROJECT (ProjectIT_504091_2425)**
### ***- @Author:** 521H0220 Bui Hai Duong*
### ***- @Instructor:** Assoc. Prof. PhD. Le Anh Cuong*

## ***Import libraries for RAG***

In [1]:
import os, re
import torch
import pandas as pd
from docx import Document
from typing import Literal
from pinecone import Pinecone, ServerlessSpec
from pinecone_text.sparse import BM25Encoder

In [2]:
from langchain_pinecone import PineconeVectorStore
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_google_genai import GoogleGenerativeAI
from langchain_experimental.text_splitter import SemanticChunker
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_community.retrievers import PineconeHybridSearchRetriever
from langchain_community.document_loaders import DirectoryLoader
from langchain_core.messages import HumanMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder, FewShotPromptTemplate, PromptTemplate


## ***Environment Variable***

In [3]:
os.environ['PINECONE_API_KEY'] = "pcsk_3EcDrL_3mUVa7rhMVLMFBZJFPvgGEaunymPs7T5XcZXjBp9dF55S73miNRzeW2FMsFWcEb"
os.environ['GOOGLE_API_KEY'] = "AIzaSyD6fv2qZAcRc30uDjn96CbsM6pUJwLkdFE"

## ***Checking whether GPU is available***

In [4]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda')

### ***Prompting function***

In [115]:
def zero_shot_prompting(query, llm, retriever):
    SYSTEM_TEMPLATE = """
    Trả lời các câu hỏi dựa và các context được cung cấp dưới đây
    Nếu context không liên quan đến câu hỏi hoặc không chứa thông tin cần thiết, hãy trả lời "Tôi không tìm được thông tin liên quan" và không nói gì thêm

    <context>
    {context}
    </context>
    """
    context = retriever.invoke(query)
    question_answering_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            SYSTEM_TEMPLATE,
        ),
        MessagesPlaceholder(variable_name="messages"),
    ]
)

    document_chain = create_stuff_documents_chain(llm, question_answering_prompt)
    result = document_chain.invoke(
        {
            "context": context,
            "messages": [
                HumanMessage(content=query)
            ],
        }
    )
    return result

In [74]:
def few_shot_prompting(query, llm, retriever):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Không thể trả lời câu hỏi này.",
        },
    ]
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    contexts = retriever.invoke(query)
    context = [context.page_content for context in contexts]
    
    final_prompt = few_shot_prompt.format(question=f"{query}\nContext: {context}")
    print(final_prompt)
    
    response = llm(final_prompt)
    return response

In [11]:
def StepBackPrompting(query, llm):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Quy định về quyền và trách nhiệm của người đi bộ là gì?",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Các quy định về tốc độ tối đa trong giao thông là gì?",
        },
    ]   
    
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là viết lại câu hỏi của người dùng theo nghĩa rộng và bao quát hơn, dễ dàng cho việc trả lời. Đây là một số ví dụ:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    
    formatted_prompt = few_shot_prompt.format(question=query)
    step_back_question = llm.invoke(formatted_prompt)
    return step_back_question

## ***Custom chunking method definition***

In [7]:
def read_docx(file_path):
    doc = Document(file_path)
    content = []
    for paragraph in doc.paragraphs:
        if paragraph.text.strip():
            paragraph = paragraph.text.lower()
            content.append(paragraph.strip())
    return content

In [8]:
class ChunkMethod:
    def __init__(self, raw_data: list, chunk_size: int = 300, chunk_overlap: int = 20):
        self.raw_data = raw_data

    def HierachicalChunking(self):
        data = []
        current_title = None
        current_chapter = None
        current_articles = []
        document_title = []
        document_intro = []

        intro_section = True

        for idx, line in enumerate(self.raw_data):
            line = line.strip()

            if intro_section and not re.match(r"(chương\s+\w+)", line, re.IGNORECASE):
                if line: 
                    if not re.match(r"điều\s+\d+\.", line, re.IGNORECASE):
                        if len(document_title) < 2:  
                            document_title.append(line)
                        else:
                            document_intro.append(line)
                continue

            if re.match(r"(chương\s+\w+)\s*(.*)", line, re.IGNORECASE):
                intro_section = False
                chapter_match = re.match(r"(chương\s+\w+)\s*(.*)", line, re.IGNORECASE)

                if current_chapter and current_articles:
                    data.append({
                        "chapter": current_chapter,
                        "chapter_title": current_title,
                        "chapter_articles": current_articles
                    })

                current_chapter = chapter_match.group(1)
                current_title = self.raw_data[idx + 1] if idx + 1 < len(self.raw_data) else ""
                current_articles = []

            elif re.match(r"điều\s+\d+\.", line, re.IGNORECASE):
                article_match = re.match(r"(điều\s+\d+\.)(.*)", line, re.IGNORECASE)
                if article_match:
                    current_articles.append({
                        "article": article_match.group(1).strip(),
                        "title": article_match.group(2).strip(),
                        "lines": []
                    })

            else:
                if current_articles:
                    current_articles[-1]["lines"].append(line)

        if current_chapter and current_articles:
            data.append({
                "chapter": current_chapter,
                "chapter_title": current_title,
                "chapter_articles": current_articles
            })
            
        result = {
            "document_title": " ".join(document_title),
            "document_intro": " ".join(document_intro),
            "chapters": data
        }

        return result


In [9]:
loader = read_docx(r"D:\Documents\TDTU\ProjectIT\Chatbot_RAG_2024\data\documents\duong_bo_2008.docx")

In [10]:
chunker = ChunkMethod(loader)
hierachical_chunked = chunker.HierachicalChunking()

In [17]:
hierachical_chunked['chapters'][0]['chapter_articles'][2]['lines']

['trong luật này, các từ ngữ dưới đây được hiểu như sau:',
 '1. đường bộ gồm đường, cầu đường bộ, hầm đường bộ, bến phà đường bộ.',
 '2. công trình đường bộ gồm đường bộ, nơi dừng xe, đỗ xe trên đường bộ, đèn tín hiệu, biển báo hiệu, vạch kẻ đường, cọc tiêu, rào chắn, đảo giao thông, dải phân cách, cột cây số, tường, kè, hệ thống thoát nước, trạm kiểm tra tải trọng xe, trạm thu phí và các công trình, thiết bị phụ trợ đường bộ khác.',
 '3. kết cấu hạ tầng giao thông đường bộ gồm công trình đường bộ, bến xe, bãi đỗ xe, trạm dừng nghỉ và các công trình phụ trợ khác trên đường bộ phục vụ giao thông và hành lang an toàn đường bộ.',
 '4. đất của đường bộ là phần đất trên đó công trình đường bộ được xây dựng và phần đất dọc hai bên đường bộ để quản lý, bảo trì, bảo vệ công trình đường bộ.',
 '5. hành lang an toàn đường bộ là dải đất dọc hai bên đất của đường bộ, tính từ mép ngoài đất của đường bộ ra hai bên để bảo đảm an toàn giao thông đường bộ.',
 '6. phần đường xe chạy là phần của đường bộ

In [29]:
lines = hierachical_chunked['chapters'][0]['chapter_articles'][2]['lines']
max = 0
for i in range(len(hierachical_chunked['chapters'][7]['chapter_articles'])):
    count = 0
    lines = hierachical_chunked['chapters'][7]['chapter_articles'][i]['lines']
    for line in lines:
        count += len(line.split())
    if count>max:
        max = count
max

73

In [None]:
def preprocess_data(document_based_chunked):
    dict = {'document_title':[], 'document_intro':[], 'chapter':[], 'chapter_title':[], 'article':[]}
    doc_title = document_based_chunked['document_title']
    doc_intro = document_based_chunked['document_intro']
    chapters = document_based_chunked['chapters']
    for chapter in chapters:
        dict['document_title'].append(doc_title)
        dict['document_intro'].append(doc_intro)
        dict['chapter'].append(chapter['chapter'])
        dict['chapter_title'].append(chapter['chapter_title'])
        dict['article'].append(chapter['chapter_articles'])
        
    dict = pd.DataFrame(dict)
    context_dict = {'document_title':[],'document_intro':[], 'chapter':[], 'chapter_title':[], 'article':[], 'title':[], 'context':[]}
    for i in range(len(dict)):
        document_title = dict[dict.index == i]['document_title'].values[0]
        document_intro = dict[dict.index == i]['document_intro'].values[0]
        chapter = dict[dict.index == i]['chapter'].values[0]
        chapter_title = dict[dict.index == i]['chapter_title'].values[0]
        articles = dict[dict.index == i]['article'].values[0]
        for article in articles:
            context_dict['document_title'].append(document_title)
            context_dict['document_intro'].append(document_intro)
            context_dict['chapter'].append(chapter)
            context_dict['chapter_title'].append(chapter_title)
            context_dict['article'].append(article['article'])
            context_dict['title'].append(article['title'])
            context_dict['context'].append(article['lines'])
    context_dict = pd.DataFrame(context_dict)
    result_dict = {'document_title':[],'document_intro':[], 'chapter':[], 'chapter_title':[], 'article':[], 'title':[], 'context':[]}
    for i in range(len(context_dict)):
        document_title = context_dict[context_dict.index == i]['document_title'].values[0]
        document_intro = context_dict[context_dict.index == i]['document_intro'].values[0]
        chapter = context_dict[context_dict.index == i]['chapter'].values[0]
        chapter_title = context_dict[context_dict.index == i]['chapter_title'].values[0]
        article = context_dict[context_dict.index == i]['article'].values[0]
        title = context_dict[context_dict.index == i]['title'].values[0]
        contexts = context_dict[context_dict.index == i]['context'].values[0]
        for line in contexts:
            result_dict['document_title'].append(document_title)
            result_dict['document_intro'].append(document_intro)
            result_dict['chapter'].append(chapter)
            result_dict['chapter_title'].append(chapter_title)
            result_dict['article'].append(article)
            result_dict['title'].append(title)
            result_dict['context'].append(line)
    result_dict = pd.DataFrame(result_dict)
    return result_dict

In [5]:
def preprocess_data(document_based_chunked):
    flattened_data = []
    for chapter in document_based_chunked['chapters']:
        for article in chapter['chapter_articles']:
            count_max = 0
            for line in article['lines']:
                flattened_data.append({
                    "document_title": document_based_chunked['document_title'],
                    "document_intro": document_based_chunked['document_intro'],
                    "chapter": chapter['chapter'],
                    "chapter_title": chapter['chapter_title'],
                    "article": article['article'],
                    "title": article['title'],
                    "context": line
                })

    result_df = pd.DataFrame(flattened_data)
    combination_result = result_df[['document_title', 'document_intro', 'chapter', 'chapter_title', 'article', 'title', 'context']].apply(lambda x: " - ".join(x), axis=1)
    return combination_result.to_list()

In [None]:
max = 0
for i in range(len(hierachical_chunked['chapters'][7]['chapter_articles'])):
    count = 0
    lines = hierachical_chunked['chapters'][7]['chapter_articles'][i]['lines']
    for line in lines:
        count += len(line.split())
    if count>max:
        max = count

In [45]:
def preprocess_data(document_based_chunked):
    flattened_data = []
    context = ""
    for chapter in document_based_chunked['chapters']:
        for article in chapter['chapter_articles']:
            for line in article['lines']:
                context += line + " "
            flattened_data.append({
                "document_title": document_based_chunked['document_title'],
                "document_intro": document_based_chunked['document_intro'],
                "chapter": chapter['chapter'],
                "chapter_title": chapter['chapter_title'],
                "article": article['article'],
                "title": article['title'],
                "context": context
            })

    result_df = pd.DataFrame(flattened_data)
    combination_result = result_df[['document_title', 'document_intro', 'chapter', 'chapter_title', 'article', 'title', 'context']].apply(lambda x: " - ".join(x), axis=1)
    return combination_result.to_list()

In [46]:
preprocess_list = preprocess_data(hierachical_chunked)

In [47]:
preprocess_list

['luật giao thông đường bộ - căn cứ hiến pháp nước cộng hòa xã hội chủ nghĩa việt nam năm 1992 đã được sửa đổi, bổ sung một số điều theo nghị quyết số 51/2001/qh10; quốc hội ban hành luật giao thông đường bộ. - chương i - những quy định chung - điều 1. - phạm vi điều chỉnh - luật này quy định về quy tắc giao thông đường bộ; kết cấu hạ tầng giao thông đường bộ; phương tiện và người tham gia giao thông đường bộ; vận tải đường bộ và quản lý nhà nước về giao thông đường bộ. ',
 'luật giao thông đường bộ - căn cứ hiến pháp nước cộng hòa xã hội chủ nghĩa việt nam năm 1992 đã được sửa đổi, bổ sung một số điều theo nghị quyết số 51/2001/qh10; quốc hội ban hành luật giao thông đường bộ. - chương i - những quy định chung - điều 2. - đối tượng áp dụng - luật này quy định về quy tắc giao thông đường bộ; kết cấu hạ tầng giao thông đường bộ; phương tiện và người tham gia giao thông đường bộ; vận tải đường bộ và quản lý nhà nước về giao thông đường bộ. luật này áp dụng đối với tổ chức, cá nhân liên q

# ***Baseline setup***

### ***Load documents from dictionary***

In [5]:
path = "../data/documents"
loader = DirectoryLoader(path, "**/*.docx")
documents = loader.load()

In [None]:
len(documents)

15

### ***Create Huggingface embedding***

In [48]:
model_name = "sentence-transformers/all-MiniLM-L6-v2"
hf = HuggingFaceEmbeddings(model_name=model_name)






### ***Defining model***

In [49]:
llm = GoogleGenerativeAI(model="gemini-pro", google_api_key=os.environ['GOOGLE_API_KEY'])

### ***Chunking***

In [7]:
spliter = SemanticChunker(hf, breakpoint_threshold_type="gradient")
docs = spliter.split_documents(documents)

  attn_output = torch.nn.functional.scaled_dot_product_attention(


### ***Create Pinecone Index***

In [50]:
def create_index(index_name, dimention, metric):
    pc = Pinecone(api_key=os.environ['PINECONE_API_KEY'])
    if index_name not in pc.list_indexes().names():
        pc.create_index(name=index_name,
                        dimension=dimention,
                        metric=metric,
                        spec=ServerlessSpec(cloud='aws', region='us-east-1'))
    return pc.Index(index_name)

In [17]:
hybrid_index = create_index("hybrid-index", 384, "dotproduct")
semantic_index = create_index("semantic-index", 384, "cosine")

In [19]:
hybrid_storage = PineconeVectorStore(index=hybrid_index, embedding=hf)
semantic_storage = PineconeVectorStore(semantic_index, embedding=hf)

In [52]:
test_index = create_index("test-index", 384, "dotproduct")

In [None]:
test_storage = PineconeVectorStore(test_index, embedding=hf)

## ***Upsert values to Pinecone***

### ***Semantic Index***

In [27]:
vectorstore_from_docs = PineconeVectorStore.from_documents(docs, 
                                                           index_name='semantic-index', 
                                                           embedding=hf)

In [68]:
vectorstore = PineconeVectorStore(index=semantic_index, embedding=hf)
semantic_retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

In [69]:
semantic_retriever.invoke("Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?")

[Document(id='dc995f4f-c8a9-4185-84f0-ca45cbfa56aa', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 8. Các hành vi bị nghiêm cấm \n\n1. Phá hoại công trình đường bộ. 2. Đào, khoan, xẻ đường trái phép; đặt, để các chướng ngại vật trái phép trên đường; mở đường trái phép; lấn chiếm hành lang an toàn đường bộ; tháo dỡ, di chuyển trái phép hoặc làm sai lệch công trình báo hiệu đường bộ.'),
 Document(id='18301047-56cf-4557-864c-e47dafc03e35', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 52. Điều kiện tham gia giao thông của xe máy chuyên dùng\n\n1. Bảo đảm các tiêu chuẩn chất lượng, an toàn kỹ thuật và tiêu chuẩn bảo vệ môi trường sau đây:\n\na) Có đủ hệ thống hãm có hiệu lực;\n\nb) Có hệ thống chuyển hướng có hiệu lực;\n\nc) Có đèn chiếu sáng;\n\nd) Bảo đảm tầm nhìn cho người điều khiển;\n\nđ) Các bộ phận chuyên dùng phải lắp đặt đúng vị trí, chắc chắn, bảo đảm an toàn khi di chuyển;\n\ne) Có bộ phận giảm thanh, giảm

### ***Hybrid index***

In [31]:
doc_list = [doc.page_content for doc in docs]

In [55]:
bm25_encoder = BM25Encoder().default()
bm25_encoder

<pinecone_text.sparse.bm25_encoder.BM25Encoder at 0x12318d5b050>

### ***Hydrid Search***

In [56]:
retriever = PineconeHybridSearchRetriever(embeddings=hf, sparse_encoder=bm25_encoder, index=test_index)

In [57]:
retriever.add_texts(preprocess_list)

  0%|          | 0/3 [00:00<?, ?it/s]

  attn_output = torch.nn.functional.scaled_dot_product_attention(


PineconeApiException: (400)
Reason: Bad Request
HTTP response headers: HTTPHeaderDict({'Date': 'Mon, 30 Dec 2024 04:06:24 GMT', 'Content-Type': 'application/json', 'Content-Length': '115', 'Connection': 'keep-alive', 'x-pinecone-request-latency-ms': '1899', 'x-pinecone-request-id': '6209673331700814855', 'x-envoy-upstream-service-time': '47', 'server': 'envoy'})
HTTP response body: {"code":3,"message":"Metadata size is 41648 bytes, which exceeds the limit of 40960 bytes per vector","details":[]}


## ***Baseline testing***

In [12]:
retriever.top_k = 5
retriever.invoke("Chở quá số người quy định trên xe máy, xe gắn máy có bị phạt không")

  attn_output = torch.nn.functional.scaled_dot_product_attention(


[Document(metadata={'score': 0.481697828}, page_content='luật giao thông đường bộ - căn cứ hiến pháp nước cộng hòa xã hội chủ nghĩa việt nam năm 1992 đã được sửa đổi, bổ sung một số điều theo nghị quyết số 51/2001/qh10; quốc hội ban hành luật giao thông đường bộ. - chương ii - quy tắc giao thông đường bộ - điều 30. - người điều khiển, người ngồi trên xe mô tô, xe gắn máy - 2. người điều khiển, người ngồi trên xe mô tô hai bánh, xe mô tô ba bánh, xe gắn máy phải đội mũ bảo hiểm có cài quai đúng quy cách.'),
 Document(metadata={'score': 0.474980474}, page_content='luật giao thông đường bộ - căn cứ hiến pháp nước cộng hòa xã hội chủ nghĩa việt nam năm 1992 đã được sửa đổi, bổ sung một số điều theo nghị quyết số 51/2001/qh10; quốc hội ban hành luật giao thông đường bộ. - chương ii - quy tắc giao thông đường bộ - điều 30. - người điều khiển, người ngồi trên xe mô tô, xe gắn máy - 1. người điều khiển xe mô tô hai bánh, xe gắn máy chỉ được chở một người, trừ những trường hợp sau thì được chở 

In [56]:
query = "Dừng xe, đỗ xe trên cầu bị phạt thế nào?"
result = StepBackPrompting(query, llm)
print("Back_step_prompting: ", result)
few_shot_prompting(result, llm, retriever)

Back_step_prompting:  Quy định về đỗ xe và dừng xe trên đường là gì?


'Dừng xe, đỗ xe trên đường xe điện, điểm dừng đón trả khách của xe buýt, nơi đường bộ giao nhau, trên phần đường dành cho người đi bộ qua đường; dừng xe nơi có biển “cấm dừng xe và đỗ xe”; đỗ xe tại nơi có biển “cấm đỗ xe” hoặc biển “cấm dừng xe và đỗ xe”; không tuân thủ các quy định về dừng xe, đỗ xe tại nơi đường bộ giao nhau cùng mức với đường sắt; dừng xe, đỗ xe trong phạm vi an toàn của đường sắt, trừ hành vi vi phạm quy định tại điểm b khoản 2, điểm b khoản 3 điều 48 nghị định này'

In [114]:
query = "Quy định về đỗ xe và dừng xe trên đường là gì?"
zero_shot_prompting(query, llm, retriever).replace('\n', ' ').strip()

AttributeError: 'str' object has no attribute 'page_content'

In [110]:
query = "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?"
few_shot_prompting(query, llm, retriever)

Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:

Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
AI: Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.


Human: Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?
AI: Không thể trả lời câu hỏi này.


Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
Context: ['luật giao thông đường bộ - căn cứ hiến pháp nước cộng hòa xã hội chủ nghĩa việt nam năm 1992 đã được sửa đổi, bổ sung một số điều theo nghị quyết số 51/2001/qh10; quốc hội ban hành luật giao thông đường bộ. - chương ii - quy tắc giao thông đường bộ -

'Có, người đi bộ được phép băng qua đường tại nơi không có vạch kẻ đường, nhưng phải quan sát các xe đang đi tới, chỉ qua đường khi bảo đảm an toàn và chịu trách nhiệm bảo đảm an toàn khi qua đường.'

In [None]:
PROMPTING = """
    Bạn là một chuyên gia về luật.
    Công việc của bạn là trả lời các câu hỏi của người dùng về luật.
    Format của câu trả lời bao gồm:
    - Nội dung của câu trả lời được trích xuất từ văn bản nào?
    - Nội dung của câu trả lời được trích xuất từ chương nào? .
    - Nội dung của câu trả lời được trích xuất từ điều nào? Hãy ghi rõ nội dung liên quan tới câu hỏi của người dùng.
    Format của câu trả lời: 
    - Tên văn bản - Tên chương - Tên điều: \n
            Nội dung câu trả lời
            
    Nêu văn bản không chia theo chương hoặc điều, hãy bỏ qua phần tương ứng.
    Câu trả lời phải chính xác và đầy đủ thông tin dựa theo câu hỏi của người dùng và nội dung của văn bản.
    Nếu không có thông tin của câu trả lời dựa vào những văn bản được truyền vào, hãy trả lời "Không thể trả lời câu hỏi này" và không nói gì thêm. Không trả lời lan man.
    
    ###
    {context}
    ###
"""