In [1]:
# !pip install faiss-gpu -q
# !pip install huggingface_hub -q
# !pip install transformers -q
# !pip install sentence_transformers -q
# !pip install langchain langchain-community pypdf langchain-anthropic -q
# !pip install elasticsearch -q
# !pip install langchain-huggingface -q
# !pip install llama-index -q
# !pip install langchain qdrant-client -q
# !pip install optimum -q
# !pip install vllm -q

In [2]:
GENERATE_MODEL_NAME= "Qwen/Qwen2.5-Coder-32B-Instruct"
EMBEDDINGS_MODEL_NAME="keepitreal/vietnamese-sbert"
QDRANT_URL = "https://e8b175ef-98b7-480c-a651-92f6f634a6b9.europe-west3-0.gcp.cloud.qdrant.io:6333"
QDRANT_COLLECTION_NAME = "Law-DB-SBERT-VN-CustomChunk-vietnamese-sbert"
HUGGINGFACE_API_KEY= "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"
QDRANT_API_KEY = "yMIGHgLaj0rJzyn3sxSe5xQaOixnWo5b8eHXsJNhV_vZVdkgnoEuqA"

In [3]:
from langchain.retrievers import WikipediaRetriever
from langchain.vectorstores import Qdrant
from langchain.llms import HuggingFaceHub
from qdrant_client import QdrantClient
from langchain.prompts import PromptTemplate
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.chains import RetrievalQA

class LLMServe:
    def __init__(self) -> None:
        # Initialize components with direct variables
        self.embeddings = self.load_embeddings()
        self.retriever = self.load_retriever(embeddings=self.embeddings)
        self.llm = self.load_llm()
        self.prompt = self.load_prompt_template()
        self.rag_pipeline = self.load_rag_pipeline(
            llm=self.llm,
            retriever=self.retriever,
            prompt=self.prompt
        )

    def load_embeddings(self):
        embeddings = HuggingFaceEmbeddings(
            model_name=EMBEDDINGS_MODEL_NAME
        )
        return embeddings

    def load_retriever(self, embeddings):
        """
        Configure the retriever using Qdrant.
        """
        client = QdrantClient(
            url=QDRANT_URL,
            api_key=QDRANT_API_KEY,
            prefer_grpc=False
        )
        db = Qdrant(
            client=client,
            embeddings=embeddings,
            collection_name=QDRANT_COLLECTION_NAME
        )
        base_retriever = db.as_retriever(search_kwargs={"k": 15})
        return base_retriever

    def load_llm(self):
        """
        Use Hugging Face Hub API for LLM.
        """
        llm = HuggingFaceHub(
            repo_id=GENERATE_MODEL_NAME,
            model_kwargs={
                "max_new_tokens": 1000,
                "temperature": 0.4,
                "top_p": 0.95,
                "top_k": 10
            },
            huggingfacehub_api_token=HUGGINGFACE_API_KEY
        )
        return llm

    def load_prompt_template(self):
        query_template = (
            "Bạn là một trợ lý tư vấn pháp luật thông minh trả lời câu hỏi dựa trên ngữ cảnh (context). \n\n"
            "### Context:\n{context} \n\n"
            "### Human: {question} \n\n"
            "### Assistant:"
        )
        prompt = PromptTemplate(
            template=query_template,
            input_variables=["context", "question"]
        )
        return prompt

    def load_rag_pipeline(self, llm, retriever, prompt):
        rag_pipeline = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type="stuff",
            retriever=retriever,
            chain_type_kwargs={
                "prompt": prompt
            },
            return_source_documents=True
        )
        return rag_pipeline

    def rag(self):
        self.retriever = self.load_retriever(embeddings=self.embeddings)
        self.rag_pipeline = self.load_rag_pipeline(
            llm=self.llm,
            retriever=self.retriever,
            prompt=self.prompt
        )
        return self.rag_pipeline

In [4]:
# Initialize the LLMServe class
app = LLMServe()

# Get RAG pipeline
rag_pipeline = app.rag()

  from tqdm.autonotebook import tqdm, trange
  db = Qdrant(
  llm = HuggingFaceHub(


In [7]:
question =  "Trách nhiệm của Cục Thi hành án Bộ Quốc phòng trong việc thi hành án dân sự là gì?"
response = rag_pipeline({"query": question})
print(response["result"])
print(response["result"]["answer"])

Bạn là một trợ lý tư vấn pháp luật thông minh trả lời câu hỏi dựa trên ngữ cảnh (context). 

### Context:
Thông tư này áp dụng đối với: 1. Cơ quan quản lý thi hành án dân sự bao gồm: Tổng cục Thi hành án dân sự thuộc Bộ Tư pháp, Cục Thi hành án thuộc Bộ Quốc phòng.

1. Cơ quan quản lý thi hành án dân sự bao gồm: Tổng cục Thi hành án dân sự thuộc Bộ Tư pháp, Cục Thi hành án thuộc Bộ Quốc phòng. 2. Cơ quan thi hành án dân sự bao gồm: Cục Thi hành án dân sự cấp tỉnh, Chi cục Thi hành án dân sự cấp huyện và Phòng Thi hành án cấp quân khu.

2. Cơ quan thi hành án dân sự bao gồm: Cục Thi hành án dân sự cấp tỉnh, Chi cục Thi hành án dân sự cấp huyện và Phòng Thi hành án cấp quân khu. 3. Công chức, viên chức, người lao động thuộc cơ quan quản lý thi hành án dân sự và cơ quan thi hành án dân sự.

2. Cục Thi hành án dân sự quản lý và hướng dẫn sử dụng biểu mẫu nghiệp vụ thi hành án dân sự trong phạm vi địa phương.

5. Trên cơ sở văn bản đề nghị của Cục trưởng Cục Thi hành án dân sự đối với cơ qu

In [8]:
# Fast text-based visualization
print("\n" + "=" * 50)
print(f"QUESTION:\n{question}")
print("=" * 50)
print(f"ANSWER:\n{response['result']}")
print("=" * 50)
print("SOURCES:")
for doc in response["source_documents"]:
    metadata = doc.metadata  # Access the metadata dictionary
    title = metadata.get("title", "No Title")
    law_id = metadata.get("law_id", "No Law ID")
    content = doc.page_content
    print(f"- {title} (Law ID: {law_id})")
    print(f"  Content: {content}")  # Print a snippet of the page content for better readability
    print()

print("=" * 50)


QUESTION:
Trách nhiệm của Cục Thi hành án Bộ Quốc phòng trong việc thi hành án dân sự là gì?
ANSWER:
Bạn là một trợ lý tư vấn pháp luật thông minh trả lời câu hỏi dựa trên ngữ cảnh (context). 

### Context:
Thông tư này áp dụng đối với: 1. Cơ quan quản lý thi hành án dân sự bao gồm: Tổng cục Thi hành án dân sự thuộc Bộ Tư pháp, Cục Thi hành án thuộc Bộ Quốc phòng.

1. Cơ quan quản lý thi hành án dân sự bao gồm: Tổng cục Thi hành án dân sự thuộc Bộ Tư pháp, Cục Thi hành án thuộc Bộ Quốc phòng. 2. Cơ quan thi hành án dân sự bao gồm: Cục Thi hành án dân sự cấp tỉnh, Chi cục Thi hành án dân sự cấp huyện và Phòng Thi hành án cấp quân khu.

2. Cơ quan thi hành án dân sự bao gồm: Cục Thi hành án dân sự cấp tỉnh, Chi cục Thi hành án dân sự cấp huyện và Phòng Thi hành án cấp quân khu. 3. Công chức, viên chức, người lao động thuộc cơ quan quản lý thi hành án dân sự và cơ quan thi hành án dân sự.

2. Cục Thi hành án dân sự quản lý và hướng dẫn sử dụng biểu mẫu nghiệp vụ thi hành án dân sự trong 