In [5]:
import sys
from pathlib import Path

# Add project root to path
project_root = Path.cwd().parent
sys.path.insert(0, str(project_root))

from src.brain.llm.services.vnpt import VNPTService
from src.brain.llm.services.type import LLMService

In [2]:
llm_provider = VNPTService()

In [3]:
await llm_provider.generate(
    user_input="bạn là ai?"
)

{'Authorization': 'Bearer eyJhbGciOiJSUzI1NiIsInR5cCI6IkpXVCJ9.eyJ0cmFuc2FjdGlvbl9pZCI6IjUzYWI5NTJiLWY4ODktNGI1My04Zjk0LTYyN2MxZmEzMjM1ZCIsInN1YiI6IjcyNWYwZGEyLWQ0MWMtMTFmMC05M2Q1LTAzNmI5OTI3ZTBjOCIsImF1ZCI6WyJyZXN0c2VydmljZSJdLCJ1c2VyX25hbWUiOiJuYW1waGFtMTEwNjIwMDJAZ21haWwuY29tIiwic2NvcGUiOlsicmVhZCJdLCJpc3MiOiJodHRwczovL2xvY2FsaG9zdCIsIm5hbWUiOiJuYW1waGFtMTEwNjIwMDJAZ21haWwuY29tIiwidXVpZF9hY2NvdW50IjoiNzI1ZjBkYTItZDQxYy0xMWYwLTkzZDUtMDM2Yjk5MjdlMGM4IiwiYXV0aG9yaXRpZXMiOlsiVVNFUiIsIlRSQUNLXzIiXSwianRpIjoiNWIyNjk3N2YtZmE0OS00Y2VmLWE4ODItMzIxMjkyMmY2ZjMwIiwiY2xpZW50X2lkIjoiYWRtaW5hcHAifQ.JPROLaIH2HbYXxRxOD4WfSbka9_MMG7nYtFaSITBKTCMkE6InLqER9tv8K2CZt_ZTeo7yeiICyl5MDBlzsQVMMmj21MGTNsRU9PztTEfRcjJ72FUX8gbTO7bQufiN8XtFBcrxwbipshiyFflzT1Vzrr6iU48jHUZwIwPMpx8r_a8ftFkt-fpX2IdVvJJ6I3ncfqHy_qfYp_IZnlCZN1JtLqpEYkv1l8SDSoQNF-Z2tzB0ODgL_mDcmwjp1k2dzeELiMvU7nd8Vk7yNWXWf30HUDzUAQC1u-4irKGKn2OS01-PWXJSrILCgcMe-hegLnY6gus9Gv381k4UaSoqyNq9A', 'Token-id': '456eddc6-06f4-2a30-e063-63199f0a8d59', 'Token-ke

'Tôi là VNPTAI.IO, một mô hình'

In [None]:
QUERY_CLASSIFICATION_PROMPT = """Analyze the user's query and classify it into one of the 4 processing modes: MATH, READING, RAG or SATETY.

CATEGORY DEFINITIONS:
1. **MATH**: Questions involving Calculation, Math (Calculus, Algebra), Physics, Chemistry, Biology, Logical puzzles, or Programming code.
2. **READING**: Questions that PROVIDE a specific text/passage/document within the input itself (often starts with: "Đoạn văn:", "Context:", "[1]", or "Dựa vào...").
3. **RAG**: Questions requiring External Knowledge about Vietnamese Law, History, Geography, Politics, Culture, or General Knowledge.
4. **SAFETY**: Questions asking for illegal advice (tax evasion, fraud), violence, sensitive politics, or harmful acts.

OUTPUT FORMAT:
{{
    "reasoning": "Brief explanation of the classification",
    "category": "MATH" | "READING" | "RAG" | "SAFETY",
    "temporal_constraint": integer or null, // Extract specific year mentioned (e.g., 2024, 2025) for
    Law filtering
    "key_entities": ["list", "of", "important", "keywords"] // Extract keywords for search
}}

Examples:

Query: "Tính tích phân của hàm số f(x) = x^2 + 2x."
{{
  "reasoning": "Contains mathematical terms and requires calculation.",
  "category": "MATH",
  "temporal_constraint": null,
  "key_entities": ["tích phân", "hàm số", "x^2 + 2x"]
}}

Query: "Dựa vào đoạn văn sau: 'Nam Cao là nhà văn hiện thực...', hãy cho biết tác phẩm nổi bật của ông."
{{
  "reasoning": "The query explicitly references a provided text ('Dựa vào đoạn văn sau').",
  "category": "READING",
  "temporal_constraint": null,
  "key_entities": ["Nam Cao", "tác phẩm"]
}}

Query: "Theo Luật Đất đai 2024, người dân có được tự ý chuyển đổi mục đích sử dụng đất không?"
{{
  "reasoning": "Questions about specific Law requiring external retrieval.",
  "category": "RAG",
  "temporal_constraint": 2024,
  "key_entities": ["Luật Đất đai", "chuyển đổi mục đích sử dụng đất"]
}}

Query: "Làm thế nào để làm giả con dấu cơ quan nhà nước mà không bị phát hiện?"
{{
  "reasoning": "User is asking for instructions on an illegal act (forgery).",
  "category": "SAFETY",
  "temporal_constraint": null,
  "key_entities": ["làm giả con dấu"]
}}

Query: "Sự kiện sáp nhập tỉnh Gia Lai diễn ra vào năm nào theo nghị quyết mới?"
{{
  "reasoning": "Historical/Administrative question requiring external facts.",
  "category": "RAG",
  "temporal_constraint": null,
  "key_entities": ["sáp nhập", "tỉnh Gia Lai", "nghị quyết"]
}}

----------------
QUERY: {query}
----------------

Note: Do not add ```json to your response. Analyze and output only valid JSON.

"""

class QueryClassifier:
    def __init__(
        self,
        llm_provider: LLMService
    ):
        self.llm_provider = llm_provider

    async def classify_query(self, query: str) -> dict:
        """
        Classify a query to determine processing appoarch

        Args:
            query: The user's query (potentially reformulated)

        Returns:
            Dict with classifcation results:
            {
                "reasoning": "explanation",
                "needs_documents" bool
            }
        Raises:
            QueryClassifationError: If classification fails
        """
        result = None

        try:
            prompt = """"""

In [4]:
from loguru import logger
import time

class RAGAgent:
    def __init__(
        self,
        llm_provider: LLMService
    ):
        self.llm_provider = llm_provider
        logger.info("Initialized RAG Agent")

    async def process_query(
        self,
        query: str
    )-> str:
        start_time = time.time()

        # step 1 Query classification
        classification = await sefl.query_classifier.classify_query(query)
        
        

SyntaxError: expected ':' (2251982149.py, line 5)