In [2]:
from llama_index.core import PromptTemplate
import json
import torch
from llama_index.core import Document
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core import StorageContext
from llama_index.core import VectorStoreIndex
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.vector_stores.weaviate import WeaviateVectorStore
from pyvi import ViTokenizer
import weaviate
from weaviate.classes.init import Auth

  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# Configuration constants
WEAVIATE_URL = "https://eypxka08rk6gbnyt57idzq.c0.us-west3.gcp.weaviate.cloud"
WEAVIATE_API_KEY = "jWgkVYQprMDiOuvTh56iLqRK5oqITcxN27wJ"
DATA_COLLECTION = "ND168"
DEVICE = "cuda:0" if torch.cuda.is_available() else "cpu"
MODEL_NAME = "dangvantuan/vietnamese-document-embedding"
CHUNK_SIZE = 512  # Optimized for Vietnamese text
CHUNK_OVERLAP = 50  # Small overlap to maintain context

In [4]:
# Setup vector store
client = weaviate.connect_to_weaviate_cloud(
    cluster_url=WEAVIATE_URL,
    auth_credentials=Auth.api_key(WEAVIATE_API_KEY),
)
vector_store = WeaviateVectorStore(
    weaviate_client=client,
    index_name=DATA_COLLECTION
)

In [4]:
SYSTEM_PROMPT = PromptTemplate(
    template=(
                "Dựa trên tài liệu đã trích xuất, hãy phân tích và trả lời câu hỏi.\n"
                "Câu hỏi: {question}\n"
                "Tài liệu: {context}\n"
                "Hãy suy nghĩ từng bước:\n"
                "1. Phân tích xem thông tin có đủ và liên quan không?\n"
                "2. Nếu chưa đủ, hãy đưa ra truy vấn mới để tìm thêm thông tin\n"
                "3. Nếu đã đủ, đưa ra câu trả lời cuối cùng\n\n"
                "Hãy trả lời theo định dạng sau:\n"
                "Phân tích: <phân tích thông tin hiện có>\n"
                "Quyết định: [Cần thêm thông tin/Đã đủ thông tin]\n"
                "Truy vấn tiếp theo: <truy vấn mới> (nếu cần)\n"
                "Câu trả lời cuối cùng: <câu trả lời> (nếu đã đủ thông tin)\n"
            )
)

In [5]:
index = VectorStoreIndex.from_vector_store(
    vector_store=vector_store,
    embed_model = HuggingFaceEmbedding(model_name=MODEL_NAME, device=DEVICE, trust_remote_code=True),
)

In [6]:
# Create retriever
retriever = index.as_retriever(
    vector_store_query_mode="hybrid",
    similarity_top_k=5,
    alpha=0.5  # Balance between keyword and semantic search
)

In [7]:
from llama_index.llms.openai import OpenAI

In [8]:
llm = OpenAI(model="gpt-4o-mini", api_key="")

In [9]:
# Test reasoning and retrieval
async def test_autonomous_reasoning(question):
    retrieved_docs = retriever.retrieve(question)
    docs_text = "\n".join([doc.text for doc in retrieved_docs])
    print(docs_text)
    prompt = SYSTEM_PROMPT.format(question=question, context=docs_text)
    response = await llm.acomplete(prompt)
    return response.text.strip()


In [10]:
import asyncio

question = "Xe vượt tải trọng cho phép từ 10% đến 20% bị phạt bao nhiêu tiền?"

# Use `await` directly in Jupyter Notebook
answer = await test_autonomous_reasoning(question)

print("AI Answer:", answer)


4 . phạt tiền từ 13.000.000 đồng đến 15.000.000 đồng đối_với một trong các hành_vi vi_phạm sau đây : a ) điều_khiển xe mà tổng trọng_lượng ( khối_lượng toàn_bộ ) của xe hoặc tải_trọng trục xe ( bao_gồm cả hàng_hóa xếp trên xe , người được chở trên xe ) vượt quá tải_trọng cho phép của đường_bộ trên 20 % đến 50 % , trừ trường_hợp có giấy_phép lưu_hành còn giá_trị sử_dụng ; b ) điều_khiển xe có giấy_phép lưu_hành còn giá_trị sử_dụng nhưng tổng trọng_lượng ( khối_lượng toàn_bộ ) của xe hoặc tải_trọng trục xe ( bao_gồm cả hàng_hóa xếp trên xe nếu có ) vượt quá quy_định trong giấy_phép lưu_hành ; c ) điều_khiển xe có giấy_phép lưu_hành còn giá_trị sử_dụng nhưng đi không đúng tuyến đường quy_định trong giấy_phép lưu_hành . 5 .
điều 34 . xử_phạt , trừ điểm giấy_phép lái_xe của người điều_khiển quá_khổ giới_hạn , xe quá tải_trọng , xe bánh xích lưu_hành đường_bộ ( kể_cả xe ô_tô chở hành_khách ) 1 . phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối_với hành_vi không thực_hiện đúng quy_định tron

Retrying llama_index.llms.openai.base.OpenAI._achat in 0.026774340565102195 seconds as it raised APIConnectionError: Connection error..
Retrying llama_index.llms.openai.base.OpenAI._achat in 1.7846253371186152 seconds as it raised APIConnectionError: Connection error..


APIConnectionError: Connection error.

In [7]:
question = "Mức phạt nồng độ cồn 2025 đối với xe máy"
retrieved_docs = retriever.retrieve(question)

for i, node in enumerate(retrieved_docs):
    print(f"Result {i+1}:\n")
    print(f"Text: {node.text}\n")
    print(f"Metadata: {node.metadata}\n")
    print(f"Score: {node.score}\n")
    print("="*50)

Result 1:

Text: loại phương_tiện : ô_tô mức phạt : tước quyền sử_dụng giấy_phép lái_xe từ 22 tháng đến 24 tháng nội_dung vi_phạm : không chấp_hành yêu_cầu kiểm_tra về chất ma_túy hoặc chất kích_thích khác mà pháp_luật cấm sử_dụng

Metadata: {'category': 'ô tô', 'fine_amount': 'Tước quyền sử dụng giấy phép lái xe từ 22 tháng đến 24 tháng', 'violation_type': 'nồng_độ_cồn', 'original_text': 'Loại phương tiện: ô tô\nMức phạt: Tước quyền sử dụng giấy phép lái xe từ 22 tháng đến 24 tháng\nNội dung vi phạm: Không chấp hành yêu cầu kiểm tra về chất ma túy hoặc chất kích thích khác mà pháp luật cấm sử dụng'}

Score: 0.92305588722229

Result 2:

Text: loại phương_tiện : ô_tô mức phạt : phạt tiền từ 30.000.000 đồng đến 40.000.000 đồng_nội_dung vi_phạm : không chấp_hành yêu_cầu kiểm_tra về chất ma_túy hoặc chất kích_thích khác mà pháp_luật cấm sử_dụng của người thi_hành công_vụ

Metadata: {'category': 'ô tô', 'fine_amount': 'Phạt tiền từ 30.000.000 đồng đến 40.000.000 đồng', 'violation_type': 'nồ