# **TON DUC THANG IT PROJECT (ProjectIT_504091_2425)**
### ***- @Author:** 521H0220 Bui Hai Duong*
### ***- @Instructor:** Assoc. Prof. PhD. Le Anh Cuong*

## ***Import libraries for RAG***

In [1]:
import os, re
import torch
import pandas as pd
from docx import Document
from typing import Literal
from pinecone import Pinecone, ServerlessSpec
from pinecone_text.sparse import BM25Encoder

In [2]:
from langchain.load import dumps, loads
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_pinecone import PineconeVectorStore
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_google_genai import GoogleGenerativeAI
from langchain_experimental.text_splitter import SemanticChunker
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_community.retrievers import PineconeHybridSearchRetriever
from langchain_community.document_loaders import DirectoryLoader
from langchain_core.messages import HumanMessage
from langchain_core.output_parsers.string import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder, FewShotPromptTemplate, PromptTemplate


## ***Environment Variable***

In [3]:
os.environ['PINECONE_API_KEY'] = "pcsk_3EcDrL_3mUVa7rhMVLMFBZJFPvgGEaunymPs7T5XcZXjBp9dF55S73miNRzeW2FMsFWcEb"
os.environ['GOOGLE_API_KEY'] = "AIzaSyD6fv2qZAcRc30uDjn96CbsM6pUJwLkdFE"

In [4]:
os.environ["GOOGLE_API_KEY"] = "AIzaSyCekUE-sNiAc_Jw-TFaLO11Xn18lLc-Lkw"

## ***Checking whether GPU is available***

In [4]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda')

In [5]:
device = torch.device('cpu')

In [6]:
device

device(type='cpu')

### ***Prompting function***

In [5]:
def fusion_query(query, llm, retriever):
    system_template = """
        Bạn là một chuyên gia tạo ra nhiều câu hỏi liên quan từ câu query đầu vào của người dùng. 
        Trong mỗi câu output đừng giải thích gì thêm cả, chỉ cần tạo ra câu hỏi liên quan từ câu query đầu vào.
        Hãy tạo ra 4 câu query liên quan tới query sau: "{query}"
        Output:
        ...
        ...
        ...
        ...
    """
    prompt_template = PromptTemplate(
        input_variables=["query"],
        template=system_template,
    )
    prompt = prompt_template.format(query=query)
    get_response = llm(prompt)
    list_query = [line.strip() for line in get_response.split("\n") if line.strip()]
    retriever.top_k = 15
    retrieved_list = [retriever.invoke(query) for query in list_query]
    
    lst=[]
    for ddxs in retrieved_list:
        for ddx in ddxs:
            if ddx.page_content not in lst:
                lst.append(ddx.page_content)
                
    fused_scores = {}
    k=60
    for docs in retrieved_list:
        for rank, doc in enumerate(docs):
            doc_str = dumps(doc)
            if doc_str not in fused_scores:
                fused_scores[doc_str] = 0
            previous_score = fused_scores[doc_str]
            fused_scores[doc_str] += 1 / (rank + k)

    reranked_results = [
        (loads(doc), score)
        for doc, score in sorted(fused_scores.items(), key=lambda x: x[1], reverse=True)
    ]
    return reranked_results

In [8]:
def zero_shot_prompting(query, llm, retriever):
    SYSTEM_TEMPLATE = """
    Trả lời các câu hỏi dựa và các context được cung cấp dưới đây
    Nếu context không liên quan đến câu hỏi hoặc không chứa thông tin cần thiết, hãy trả lời "Tôi không tìm được thông tin liên quan" và không nói gì thêm

    <context>
    {context}
    </context>
    """
    context = retriever.invoke(query)
    question_answering_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            SYSTEM_TEMPLATE,
        ),
        MessagesPlaceholder(variable_name="messages"),
    ]
)

    document_chain = create_stuff_documents_chain(llm, question_answering_prompt)
    result = document_chain.invoke(
        {
            "context": context,
            "messages": [
                HumanMessage(content=query)
            ],
        }
    )
    return result

In [6]:
def few_shot_fusion(query, llm, context):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Không thể trả lời câu hỏi này.",
        },
    ]
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    prefix = """
        # Bạn là một chuyên gia pháp luật

        Nhiệm vụ của bạn là cung cấp câu trả lời chính xác và chi tiết cho các câu hỏi của người dùng dựa trên các văn bản pháp luật được cung cấp.
        Khi thực hiện trả lời câu hỏi, hãy dựa vào những context được truyền vào để trả lời câu hỏi một cách chính xác nhất. 
        Nếu trong context không bao gồm nội dung nào liên quan để có thể trả lời được câu hỏi thì hãy trả lời "Không thể trả lời câu hỏi này." và không nói gì thêm.

        ## Yêu cầu về câu trả lời
        1. **Nguồn gốc nội dung**: Trích dẫn rõ ràng nội dung từ văn bản pháp luật nào.
        2. **Phân loại theo cấu trúc văn bản**:
        - Nếu văn bản được chia theo chương, nêu rõ tên chương.
        - Nếu văn bản được chia theo điều, nêu rõ số điều và nội dung cụ thể liên quan.

        ## Định dạng câu trả lời
        - **Tên văn bản - Tên chương (nếu có) - Tên điều (nếu có)**:
        <cụ thể về luật>
        Nội dung trả lời chi tiết và chính xác.
        </cụ thể về luật>
    
    """
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    context = [ctx[0].page_content for ctx in context[:16]]
    final_prompt = few_shot_prompt.format(question=f"{query}\nContext: {context}")
    print(final_prompt)
    
    response = llm(final_prompt)
    return response

In [15]:
def few_shot_prompting(query, llm, retriever):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Không thể trả lời câu hỏi này.",
        },
    ]
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    prefix = """
        # Bạn là một chuyên gia pháp luật

        Nhiệm vụ của bạn là cung cấp câu trả lời chính xác và chi tiết cho các câu hỏi của người dùng dựa trên các văn bản pháp luật được cung cấp.
        Khi thực hiện trả lời câu hỏi, hãy dựa vào những context được truyền vào để trả lời câu hỏi một cách chính xác nhất. 
        Nếu trong context không bao gồm nội dung nào liên quan để có thể trả lời được câu hỏi thì hãy trả lời "Không thể trả lời câu hỏi này." và không nói gì thêm.

        ## Yêu cầu về câu trả lời
        1. **Nguồn gốc nội dung**: Trích dẫn rõ ràng nội dung từ văn bản pháp luật nào.
        2. **Phân loại theo cấu trúc văn bản**:
        - Nếu văn bản được chia theo chương, nêu rõ tên chương.
        - Nếu văn bản được chia theo điều, nêu rõ số điều và nội dung cụ thể liên quan.

        ## Định dạng câu trả lời
        - **Tên văn bản - Tên chương (nếu có) - Tên điều (nếu có)**:
        <cụ thể về luật>
        Nội dung trả lời chi tiết và chính xác.
        </cụ thể về luật>
    
    """
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    contexts = retriever.invoke(query)
    context = [context.page_content for context in contexts]
    
    final_prompt = few_shot_prompt.format(question=f"{query}\nContext: {context}")
    print(final_prompt)
    
    response = llm(final_prompt)
    return response

In [11]:
def StepBackPrompting(query, llm):
    examples = [
        {
            "input": "Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?",
            "output": "Quy định về quyền và trách nhiệm của người đi bộ là gì?",
        },
        {
            "input": "Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?",
            "output": "Các quy định về tốc độ tối đa trong giao thông là gì?",
        },
    ]   
    
    example_template = PromptTemplate(
        input_variables=["input", "output"],
        template="Human: {input}\nAI: {output}\n",
    )
    
    few_shot_prompt = FewShotPromptTemplate(
        examples=examples,
        example_prompt=example_template,
        prefix="Bạn là một chuyên gia về luật. Công việc của bạn là viết lại câu hỏi của người dùng theo nghĩa rộng và bao quát hơn, dễ dàng cho việc trả lời. Đây là một số ví dụ:",
        suffix="Human: {question}\nAI:",
        input_variables=["question"],
    )
    
    formatted_prompt = few_shot_prompt.format(question=query)
    step_back_question = llm.invoke(formatted_prompt)
    return step_back_question

## ***Custom chunking method definition***

In [7]:
def read_docx(file_path):
    doc = Document(file_path)
    content = []
    for paragraph in doc.paragraphs:
        if paragraph.text.strip():
            paragraph = paragraph.text.lower()
            content.append(paragraph.strip())
    return content

In [8]:
class ChunkMethod:
    def __init__(self, raw_data: list, chunk_size: int = 300, chunk_overlap: int = 20):
        self.raw_data = raw_data

    def HierachicalChunking(self):
        data = []
        current_title = None
        current_chapter = None
        current_articles = []
        document_title = []
        document_intro = []

        intro_section = True

        for idx, line in enumerate(self.raw_data):
            line = line.strip()

            if intro_section and not re.match(r"(chương\s+\w+)", line, re.IGNORECASE):
                if line: 
                    if not re.match(r"điều\s+\d+\.", line, re.IGNORECASE):
                        if len(document_title) < 2:  
                            document_title.append(line)
                        else:
                            document_intro.append(line)
                continue

            if re.match(r"(chương\s+\w+)\s*(.*)", line, re.IGNORECASE):
                intro_section = False
                chapter_match = re.match(r"(chương\s+\w+)\s*(.*)", line, re.IGNORECASE)

                if current_chapter and current_articles:
                    data.append({
                        "chapter": current_chapter,
                        "chapter_title": current_title,
                        "chapter_articles": current_articles
                    })

                current_chapter = chapter_match.group(1)
                current_title = self.raw_data[idx + 1] if idx + 1 < len(self.raw_data) else ""
                current_articles = []

            elif re.match(r"điều\s+\d+\.", line, re.IGNORECASE):
                article_match = re.match(r"(điều\s+\d+\.)(.*)", line, re.IGNORECASE)
                if article_match:
                    current_articles.append({
                        "article": article_match.group(1).strip(),
                        "title": article_match.group(2).strip(),
                        "lines": []
                    })

            else:
                if current_articles:
                    current_articles[-1]["lines"].append(line)

        if current_chapter and current_articles:
            data.append({
                "chapter": current_chapter,
                "chapter_title": current_title,
                "chapter_articles": current_articles
            })
            
        result = {
            "document_title": " ".join(document_title),
            "document_intro": " ".join(document_intro),
            "chapters": data
        }

        return result


In [9]:
loader = read_docx(r"D:\Documents\TDTU\ProjectIT\Chatbot_RAG_2024\data\documents\duong_bo_2008.docx")

In [10]:
chunker = ChunkMethod(loader)
hierachical_chunked = chunker.HierachicalChunking()

In [45]:
def preprocess_data(document_based_chunked):
    flattened_data = []
    context = ""
    for chapter in document_based_chunked['chapters']:
        for article in chapter['chapter_articles']:
            for line in article['lines']:
                context += line + " "
            flattened_data.append({
                "document_title": document_based_chunked['document_title'],
                "document_intro": document_based_chunked['document_intro'],
                "chapter": chapter['chapter'],
                "chapter_title": chapter['chapter_title'],
                "article": article['article'],
                "title": article['title'],
                "context": context
            })

    result_df = pd.DataFrame(flattened_data)
    combination_result = result_df[['document_title', 'document_intro', 'chapter', 'chapter_title', 'article', 'title', 'context']].apply(lambda x: " - ".join(x), axis=1)
    return combination_result.to_list()

In [46]:
preprocess_list = preprocess_data(hierachical_chunked)

# ***Baseline setup***

### ***Load documents from dictionary***

In [19]:
path = "../data/documents"
loader = DirectoryLoader(path, "**/*.docx")
documents = loader.load()

In [10]:
documents[0].metadata.update

{'source': '..\\data\\documents\\01_2010_TTLT-BCA-BGTVT_101788.docx'}

### ***Create Huggingface embedding***

In [7]:
model_name = "hiieu/halong_embedding"
hf = HuggingFaceEmbeddings(model_name=model_name)




### ***Defining model***

In [17]:
llm = GoogleGenerativeAI(model="gemini-1.5-pro", google_api_key=os.environ['GOOGLE_API_KEY'], temperature=0)

### ***Chunking***

In [20]:
spliter = SemanticChunker(hf, breakpoint_threshold_type="gradient")
docs = spliter.split_documents(documents)

In [18]:
docs[1].page_content

'13. Đường chính là đường bảo đảm giao thông chủ yếu trong khu vực. 14. Đường nhánh là đường nối vào đường chính. 15. Đường ưu tiên là đường mà trên đó phương tiện tham gia giao thông đường bộ được các phương tiện giao thông đến từ hướng khác nhường đường khi qua nơi đường giao nhau, được cắm biển báo hiệu đường ưu tiên. 16. Đường gom là đường để gom hệ thống đường giao thông nội bộ của các khu đô thị, công nghiệp, kinh tế, dân cư, thương mại - dịch vụ và các đường khác vào đường chính hoặc vào đường nhánh trước khi đấu nối vào đường chính. 17.'

In [20]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=100)
docs = text_splitter.split_documents(documents)

### ***Create Pinecone Index***

In [9]:
def create_index(index_name, dimention, metric):
    pc = Pinecone(api_key=os.environ['PINECONE_API_KEY'])
    if index_name not in pc.list_indexes().names():
        pc.create_index(name=index_name,
                        dimension=dimention,
                        metric=metric,
                        spec=ServerlessSpec(cloud='aws', region='us-east-1'))
    return pc.Index(index_name)

In [10]:
hybrid_index = create_index("hybrid-rag", 768, "dotproduct")

In [24]:
hybrid_storage = PineconeVectorStore(index=hybrid_index, embedding=hf)

In [52]:
test_index = create_index("test-index", 384, "dotproduct")

In [None]:
test_storage = PineconeVectorStore(test_index, embedding=hf)

## ***Upsert values to Pinecone***

### ***Semantic Index***

In [15]:
vectorstore_from_docs = PineconeVectorStore.from_documents(docs, 
                                                           index_name='hybrid-rag', 
                                                           embedding=hf)

  attn_output = torch.nn.functional.scaled_dot_product_attention(


In [68]:
vectorstore = PineconeVectorStore(index=semantic_index, embedding=hf)
semantic_retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

In [69]:
semantic_retriever.invoke("Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?")

[Document(id='dc995f4f-c8a9-4185-84f0-ca45cbfa56aa', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 8. Các hành vi bị nghiêm cấm \n\n1. Phá hoại công trình đường bộ. 2. Đào, khoan, xẻ đường trái phép; đặt, để các chướng ngại vật trái phép trên đường; mở đường trái phép; lấn chiếm hành lang an toàn đường bộ; tháo dỡ, di chuyển trái phép hoặc làm sai lệch công trình báo hiệu đường bộ.'),
 Document(id='18301047-56cf-4557-864c-e47dafc03e35', metadata={'source': '..\\data\\documents\\duong_bo_2001.docx'}, page_content='Điều 52. Điều kiện tham gia giao thông của xe máy chuyên dùng\n\n1. Bảo đảm các tiêu chuẩn chất lượng, an toàn kỹ thuật và tiêu chuẩn bảo vệ môi trường sau đây:\n\na) Có đủ hệ thống hãm có hiệu lực;\n\nb) Có hệ thống chuyển hướng có hiệu lực;\n\nc) Có đèn chiếu sáng;\n\nd) Bảo đảm tầm nhìn cho người điều khiển;\n\nđ) Các bộ phận chuyên dùng phải lắp đặt đúng vị trí, chắc chắn, bảo đảm an toàn khi di chuyển;\n\ne) Có bộ phận giảm thanh, giảm

### ***Hybrid index***

In [21]:
doc_list = [doc.page_content for doc in docs]

In [22]:
len(doc_list)

19708

In [23]:
bm25_encoder = BM25Encoder().default()

In [18]:
bm25_encoder.fit(doc_list)
bm25_encoder.dump("bm25-values.json")
bm25_encoder

  0%|          | 0/19708 [00:00<?, ?it/s]

<pinecone_text.sparse.bm25_encoder.BM25Encoder at 0x208d2f60050>

In [12]:
bm25_encoder = BM25Encoder().load("bm25-values.json")

In [None]:
bm25_encoder.encode_queries(["Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?"])


### ***Hydrid Search***

In [24]:
retriever = PineconeHybridSearchRetriever(embeddings=hf, sparse_encoder=bm25_encoder, index=hybrid_index)

In [25]:
retriever.add_texts(doc_list)

  0%|          | 0/616 [00:00<?, ?it/s]

## ***Baseline testing***

In [23]:
retriever.invoke("Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?")

KeyError: 'context'

In [37]:
query = "Theo luật mới nhất thì vượt đèn đỏ bị phạt bao nhiêu tiền"
result = fusion_query(query, llm, retriever)

In [38]:
response = few_shot_fusion(query, llm, result)

Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:

Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
AI: Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.


Human: Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?
AI: Không thể trả lời câu hỏi này.


Human: Theo luật mới nhất thì vượt đèn đỏ bị phạt bao nhiêu tiền
Context: ['8. Phạt tiền từ 8.000.000 đồng đến 12.000.000 đồng đối với hành vi điều khiển xe (kể cả rơ moóc và sơ mi rơ moóc) chở hàng vượt trọng tải (khối lượng hàng chuyên chở) cho phép tham gia giao thông được ghi trong Giấy chứng nhận kiểm định an toàn kỹ thuật và bảo vệ môi tr

In [39]:
response

'Không thể trả lời câu hỏi này.\n'

In [56]:
query = "Dừng xe, đỗ xe trên cầu bị phạt thế nào?"
result = StepBackPrompting(query, llm)
print("Back_step_prompting: ", result)
few_shot_prompting(result, llm, retriever)

Back_step_prompting:  Quy định về đỗ xe và dừng xe trên đường là gì?


'Dừng xe, đỗ xe trên đường xe điện, điểm dừng đón trả khách của xe buýt, nơi đường bộ giao nhau, trên phần đường dành cho người đi bộ qua đường; dừng xe nơi có biển “cấm dừng xe và đỗ xe”; đỗ xe tại nơi có biển “cấm đỗ xe” hoặc biển “cấm dừng xe và đỗ xe”; không tuân thủ các quy định về dừng xe, đỗ xe tại nơi đường bộ giao nhau cùng mức với đường sắt; dừng xe, đỗ xe trong phạm vi an toàn của đường sắt, trừ hành vi vi phạm quy định tại điểm b khoản 2, điểm b khoản 3 điều 48 nghị định này'

In [None]:
query = "Quy định về đỗ xe và dừng xe trên đường là gì?"
zero_shot_prompting(query, llm, retriever).replace('\n', ' ').strip()

In [27]:
query = "Vượt đèn đỏ bị phạt bao nhiêu tiền?"
few_shot_prompting(query, llm, retriever)

Bạn là một chuyên gia về luật. Công việc của bạn là trả lời các câu hỏi dựa vào các Context được truyền vào. Nếu context không chứa thông tin hoặc không tiên quan đến câu trả lời thì hãy trả lời 'Không thể trả lời câu hỏi này' và không nói gì thêm:

Human: Người đi bộ có được phép băng qua đường tại nơi không có vạch kẻ đường không?
AI: Người đi bộ chỉ được phép băng qua đường tại các vị trí có vạch kẻ đường hoặc nơi có tín hiệu giao thông cho phép. Nếu không có vạch kẻ đường, người đi bộ phải đảm bảo an toàn và không gây cản trở giao thông.


Human: Tốc độ tối đa được phép chạy trong khu dân cư là bao nhiêu?
AI: Không thể trả lời câu hỏi này.


Human: Vượt đèn đỏ bị phạt bao nhiêu tiền?
Context: ['1. Phạt tiền từ 60.000 đồng đến 100.000 đồng đối với người đi bộ vượt rào chắn đường ngang, cầu chung khi chắn đang dịch chuyển hoặc đã đóng; vượt qua đường ngang khi đèn đỏ đã bật sáng; không chấp hành hiệu lệnh, chỉ dẫn của biển báo hiệu, vạch kẻ đường hoặc hướng dẫn của nhân viên gác đườn

'Đối với người đi bộ vượt đèn đỏ tại đường ngang, mức phạt từ 60.000 đồng đến 100.000 đồng. Đối với người điều khiển xe đạp, xe đạp máy, xe thô sơ, mức phạt từ 80.000 đồng đến 100.000 đồng.  Mức phạt cho người điều khiển máy kéo, xe máy chuyên dùng là từ 1.000.000 đồng đến 2.000.000 đồng. Context không đề cập đến mức phạt cho các loại xe khác như ô tô, xe máy thông thường.\n'

In [None]:
PROMPTING = """
    Bạn là một chuyên gia về luật.
    Công việc của bạn là trả lời các câu hỏi của người dùng về luật.
    Format của câu trả lời bao gồm:
    - Nội dung của câu trả lời được trích xuất từ văn bản nào?
    - Nội dung của câu trả lời được trích xuất từ chương nào? .
    - Nội dung của câu trả lời được trích xuất từ điều nào? Hãy ghi rõ nội dung liên quan tới câu hỏi của người dùng.
    Format của câu trả lời: 
    - Tên văn bản - Tên chương - Tên điều: \n
            Nội dung câu trả lời
            
    Nêu văn bản không chia theo chương hoặc điều, hãy bỏ qua phần tương ứng.
    Câu trả lời phải chính xác và đầy đủ thông tin dựa theo câu hỏi của người dùng và nội dung của văn bản.
    Nếu không có thông tin của câu trả lời dựa vào những văn bản được truyền vào, hãy trả lời "Không thể trả lời câu hỏi này" và không nói gì thêm. Không trả lời lan man.
    
    ###
    {context}
    ###
"""