In [2]:
# Enhanced chat router with retriever approach
import os
import re
import asyncio
import time
from collections import defaultdict
from fastapi import FastAPI, HTTPException, Header
from fastapi import APIRouter
from fastapi.responses import StreamingResponse

from pydantic import BaseModel
from llama_index.core import Settings 
from llama_index.indices.managed.llama_cloud import LlamaCloudIndex 
from llama_index.llms.google_genai import GoogleGenAI
# from llama_index.llms.groq import Groq
# from llama_index.llms.cerebras import Cerebras
# from llama_index.llms.together import TogetherLLM
# from llama_index.llms.openai import OpenAI


from llama_index.core.memory import ChatMemoryBuffer
from llama_index.core.storage.chat_store import SimpleChatStore

from llama_index.core.tools import QueryEngineTool, FunctionTool
from llama_index.core.agent.workflow import ReActAgent
from llama_index.core.workflow import Context

import json
from dotenv import load_dotenv
load_dotenv()

True

In [None]:

# Index global - chỉ khởi tạo 1 lần
index_dsdaihoc = LlamaCloudIndex(
        name="dsdaihoc",
        project_name="Default",
        organization_id="1bcf5fb2-bd7d-4c76-b6d5-bb793486e1b3",
        api_key=os.getenv("LLAMA_CLOUD_API_KEY"),
        )




# 2️⃣ Setup tools
qe = index_dsdaihoc.as_query_engine(similarity_top_k=5)
rag_tool = QueryEngineTool.from_defaults(
    query_engine=qe,
    name="RAG",
    description="Thông tin các trường đại học tại Việt Nam"
)

def score_program(
    user_gpa: float,
    desired_program: str,
    budget: float,
    location_pref: str,
    candidate_program: dict
) -> dict:
    """Tính điểm cho các chương trình dựa trên thông tin người dùng."""
    score = 0
    reasons = []
    
    if user_gpa >= candidate_program.get("cutoff_gpa", 0):
        score += 5
        reasons.append("GPA đạt yêu cầu")
    
    if candidate_program.get("tuition_per_month", 0)/1e6 <= budget:
        score += 3
        reasons.append("Trong ngân sách")
    
    if location_pref.lower() in candidate_program.get("location", "").lower():
        score += 2
        reasons.append("Gần khu vực")
    
    if desired_program.lower() in [p.lower() for p in candidate_program.get("programs", [])]:
        score += 4
        reasons.append("Có ngành bạn muốn")
    
    return {
        "program_name": candidate_program.get("name"), 
        "score": score, 
        "reasons": reasons
    }

score_tool = FunctionTool.from_defaults(
    fn=score_program,
    name="ScoreProgram",
    description="Score a candidate program for a student based on GPA, program, budget, and location preferences"
)

# 6️⃣ Tạo agent ReAct với cả 2 tools
agent = ReActAgent(
    tools=[rag_tool, score_tool],
    llm=Settings.llm,
    verbose=True
)
ctx = Context(agent)

agent.run("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội", ctx=ctx)

In [7]:
from llama_index.core.agent.workflow import ToolCallResult, AgentStream

handler = agent.run("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội", ctx=ctx)

async for ev in handler.stream_events():
    # if isinstance(ev, ToolCallResult):
    #     print(f"\nCall {ev.tool_name} with {ev.tool_kwargs}\nReturned: {ev.tool_output}")
    if isinstance(ev, AgentStream):
        print(f"{ev.delta}", end="", flush=True)

response = await handler

Running step init_run
Step init_run produced event AgentInput
Running step setup_agent
Step setup_agent produced event AgentSetup
Running step run_agent_step
Thought: I need to use a tool to help me answer the question.

Action: ScoreProgram
Action Input: {"user_gpa": 0, "desired_program": "Kinh tế", "budget": 10000000, "location_pref": "Hà Nội", "candidate_program": {}}Step run_agent_step produced event AgentOutput
Running step parse_agent_output
Step parse_agent_output produced no event
Running step call_tool
Step call_tool produced event ToolCallResult
Running step aggregate_tool_results
Step aggregate_tool_results produced event AgentInput
Running step setup_agent
Step setup_agent produced event AgentSetup
Running step run_agent_step
Thought: I can answer without using any more tools. I'll use the user's language to answer
Answer: Với ngân sách 10 triệu một tháng và mong muốn học ngành Kinh tế tại Hà Nội, bạn có thể xem xét các trường có chương trình phù hợp với GPA của bạn và nằm 

In [12]:
SYSTEM_PROMPT=""" Bạn là một tư vấn viên giáo dục chuyên nghiệp, giúp học sinh tìm trường đại học phù hợp.

NHIỆM VỤ CHÍNH:
1. Sử dụng tool RAG để tìm thông tin các trường đại học từ database
2. Sử dụng tool ScoreProgram để đánh giá mức độ phù hợp của từng chương trình
3. Đưa ra lời khuyên cụ thể dựa trên tiêu chí của học sinh

QUY TRÌNH LẬP LUẬN:
1. Trước tiên, hãy sử dụng tool RAG để tìm các trường/chương trình liên quan
2. Với mỗi chương trình tìm được, sử dụng tool ScoreProgram để tính điểm phù hợp
3. Sắp xếp theo điểm số và đưa ra top 3-5 gợi ý tốt nhất
4. Giải thích lý do tại sao mỗi lựa chọn phù hợp

NGUYÊN TẮC:
- Luôn sử dụng tools trước khi đưa ra lời khuyên
- Không bịa đặt thông tin về trường đại học
- Trả lời bằng tiếng Việt
- Thể hiện sự đồng cảm và hỗ trợ tích cực""",

In [15]:
import os
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex, Settings
from llama_index.llms.openai import OpenAI
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core.tools import QueryEngineTool, FunctionTool
from llama_index.core.agent import ReActAgent
from llama_index.core.workflow import Context
from llama_index.core.agent.workflow import AgentWorkflow

# 1️⃣ Configure global LLM và embedding model
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
Settings.llm = OpenAI(model="gpt-4o-mini", temperature=0)
Settings.embed_model = OpenAIEmbedding()

# # 2️⃣ Tạo và index dữ liệu đại học (ví dụ nằm trong ./data_daihoc)
# documents = SimpleDirectoryReader("./data_daihoc").load_data()
# index = VectorStoreIndex.from_documents(documents)

# Index global - chỉ khởi tạo 1 lần
index_dsdaihoc = LlamaCloudIndex(
        name="dsdaihoc",
        project_name="Default",
        organization_id="1bcf5fb2-bd7d-4c76-b6d5-bb793486e1b3",
        api_key=os.getenv("LLAMA_CLOUD_API_KEY"),
        )
# 3️⃣ Build query engine (RAG engine)
query_engine = index_dsdaihoc.as_query_engine(similarity_top_k=5)

# 4️⃣ Wrap nó thành một tool để agent có thể gọi
rag_tool = QueryEngineTool.from_defaults(
    query_engine=query_engine,
    name="RAG",
    description="Thông tin các trường đại học tại Việt Nam"
)

# 5️⃣ Tool chấm điểm chương trình như bạn có
def score_program(user_gpa: float, desired_program: str, budget: float, location_pref: str, candidate_program: dict) -> dict:
    score = 0
    reasons = []
    if user_gpa >= candidate_program.get("cutoff_gpa", 0):
        score += 5; reasons.append("GPA đạt yêu cầu")
    if candidate_program.get("tuition_per_month", 0) / 1e6 <= budget:
        score += 3; reasons.append("Trong ngân sách")
    if location_pref.lower() in candidate_program.get("location", "").lower():
        score += 2; reasons.append("Gần khu vực")
    if desired_program.lower() in [p.lower() for p in candidate_program.get("programs", [])]:
        score += 4; reasons.append("Có ngành bạn muốn")
    return {
        "program_name": candidate_program.get("name"),
        "score": score,
        "reasons": reasons
    }

score_tool = FunctionTool.from_defaults(
    fn=score_program,
    name="ScoreProgram",
    description="Chấm điểm chương trình đại học dựa trên GPA, ngành, ngân sách, nơi ở"
)

memory = ChatMemoryBuffer.from_defaults(token_limit=1500)

# # 6️⃣ Tạo Agent theo kiểu ReAct có thể gọi cả RAG và tính điểm
# agent = ReActAgent(
#     tools=[rag_tool, score_tool],
#     llm=Settings.llm,
#     verbose=True,
#     memory=memory,
    
# )
# agent = ReActAgent.from_tools(
#     tools=[rag_tool, score_tool],
#     llm=Settings.llm,
#     verbose=True,
#     context="Bạn là trợ lý tư vấn đại học tại Việt Nam.",
# )

# 7️⃣ Tạo context và chạy agent với câu hỏi của bạn
ctx = Context(agent)
response = agent.run("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?", ctx=ctx)

print(response)

workflow = AgentWorkflow.from_tools_or_functions(
    tools_or_functions=[rag_tool, score_tool],
    llm=Settings.llm,
    system_prompt="Bạn là trợ lý tư vấn...",  # prompt tuỳ biến
    verbose=True,
)

ctx = Context(workflow)
response = workflow.run("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?", ctx=ctx)
print(response)


AttributeError: 'ReActAgent' object has no attribute '_get_steps'

In [None]:
"""
Simple Agentic RAG với Tools và Memory - LlamaIndex 0.12+
"""

import os
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings, Document
from llama_index.core.agent import ReActAgent
from llama_index.core.tools import QueryEngineTool, ToolMetadata, FunctionTool
from llama_index.core.memory import ChatMemoryBuffer
from llama_index.llms.openai import OpenAI
from llama_index.embeddings.openai import OpenAIEmbedding

# Setup LLM và Embeddings
Settings.llm = OpenAI(api_key=os.getenv("OPENAI_API_KEY"), model="gpt-4")
Settings.embed_model = OpenAIEmbedding(api_key=os.getenv("OPENAI_API_KEY"))

# # Tạo sample documents
# docs = [
#     Document(text="Đại học Bách Khoa HN: cutoff_gpa=8.5, tuition_per_month=2000000, location='Hà Nội', programs=['Công nghệ thông tin', 'Cơ khí', 'Điện tử']"),
#     Document(text="Đại học Kinh tế Quốc dân: cutoff_gpa=7.8, tuition_per_month=1500000, location='Hà Nội', programs=['Kinh tế', 'Tài chính', 'Marketing']"),
#     Document(text="Đại học FPT: cutoff_gpa=6.5, tuition_per_month=3000000, location='TP.HCM', programs=['CNTT', 'Kinh doanh', 'Thiết kế']"),
# ]

# # Tạo Vector Index và Query Engine
# index = VectorStoreIndex.from_documents(docs)

index_dsdaihoc = LlamaCloudIndex(
        name="dsdaihoc",
        project_name="Default",
        organization_id="1bcf5fb2-bd7d-4c76-b6d5-bb793486e1b3",
        api_key=os.getenv("LLAMA_CLOUD_API_KEY"),
        )
# 3️⃣ Build query engine (RAG engine)

query_engine = index_dsdaihoc.as_query_engine(similarity_top_k=5)
# query_engine = index.as_query_engine(similarity_top_k=2)

# Tool chấm điểm chương trình đại học
def score_program(user_gpa: float, desired_program: str, budget: float, location_pref: str, candidate_program: dict) -> dict:
    score = 0
    reasons = []
    if user_gpa >= candidate_program.get("cutoff_gpa", 0):
        score += 5; reasons.append("GPA đạt yêu cầu")
    if candidate_program.get("tuition_per_month", 0) / 1e6 <= budget:
        score += 3; reasons.append("Trong ngân sách")
    if location_pref.lower() in candidate_program.get("location", "").lower():
        score += 2; reasons.append("Gần khu vực")
    if desired_program.lower() in [p.lower() for p in candidate_program.get("programs", [])]:
        score += 4; reasons.append("Có ngành bạn muốn")
    return {
        "program_name": candidate_program.get("name"),
        "score": score,
        "reasons": reasons
    }

# Setup Tools
rag_tool = QueryEngineTool(
    query_engine=query_engine,
    metadata=ToolMetadata(name="knowledge_base", description="Search knowledge base")
)

score_tool = FunctionTool.from_defaults(
    fn=score_program,
    name="ScoreProgram", 
    description="Chấm điểm chương trình đại học dựa trên GPA, ngành, ngân sách, nơi ở"
)

tools = [rag_tool, score_tool]

# Setup Memory
memory = ChatMemoryBuffer.from_defaults(token_limit=2000)

# Tạo Agent
agent = ReActAgent.from_tools(
    tools=tools,
    memory=memory,
    verbose=True,
    system_prompt="Bạn là trợ lý tư vấn tuyển sinh đại học. Có thể tìm kiếm thông tin và chấm điểm chương trình học."
)
response =agent.chat("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?")
# Chat function
# def chat():
#     print("🎓 Trợ lý tư vấn tuyển sinh (type 'quit' to exit)")
#     while True:
#         user_input = input("\n👤 You: ")
#         if user_input.lower() == 'quit':
#             break
        
#         response = agent.chat(user_input)
#         print(f"🤖 Bot: {response}")

# # Run chat
# if __name__ == "__main__":
#     chat()

> Running step 3665f99b-3505-4112-b020-a389011122ab. Step input: Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?
[1;3;38;5;200mThought: The user is asking for a suitable economics program in Hanoi with a budget of 10 million VND per month. I can use the ScoreProgram tool to find a suitable program based on the user's GPA, desired program, budget, and location preference.
Action: ScoreProgram
Action Input: {'user_gpa': 3.0, 'desired_program': 'Kinh tế', 'budget': 10000000, 'location_pref': 'Hà Nội', 'candidate_program': AttributedDict()}
[0m[1;3;34mObservation: {'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}
[0m> Running step 7bb1a6b2-a7be-4c7c-ba35-204a2d3a31d1. Step input: None
[1;3;38;5;200mThought: The ScoreProgram tool didn't provide a specific program name, but it did indicate that there are economics programs in Hanoi within the user's budget and suitable for a student with a GPA of 3.0. I can answer without using any more tools.

AgentChatResponse(response='Có các chương trình đào tạo ngành Kinh tế ở Hà Nội phù hợp với ngân sách của bạn và yêu cầu về GPA. Tuy nhiên, để có thông tin cụ thể hơn, bạn nên tìm hiểu thêm từ các trường đại học cụ thể.', sources=[ToolOutput(content="{'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}", tool_name='ScoreProgram', raw_input={'args': (), 'kwargs': {'user_gpa': 3.0, 'desired_program': 'Kinh tế', 'budget': 10000000, 'location_pref': 'Hà Nội', 'candidate_program': AttributedDict()}}, raw_output={'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}, is_error=False)], source_nodes=[], is_dummy_stream=False, metadata=None)

In [19]:
response =agent.chat("Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?")


> Running step dde6ceb7-44e5-420a-b24b-9f342772fba8. Step input: Có 10 triệu 1 tháng nên học ngành kinh tế nào ở Hà Nội?
[1;3;38;5;200mThought: The user is asking for a recommendation on which economics program to study in Hanoi with a budget of 10 million VND per month. I can use the ScoreProgram tool to provide a suitable recommendation based on the user's GPA, desired program, budget, and location preference.
Action: ScoreProgram
Action Input: {'user_gpa': 3.0, 'desired_program': 'Economics', 'budget': 10000000, 'location_pref': 'Hanoi', 'candidate_program': AttributedDict()}
[0m[1;3;34mObservation: {'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}
[0m> Running step a9337fd9-8fe8-449d-915b-4e982a1a3887. Step input: None
[1;3;38;5;200mThought: The ScoreProgram tool has returned a score of 8, indicating that there are suitable economics programs in Hanoi within the user's budget. However, the tool did not provide a specific program name. I can 

In [20]:
response

AgentChatResponse(response='Với ngân sách 10 triệu VND mỗi tháng, bạn hoàn toàn có thể tìm được các chương trình đào tạo ngành Kinh tế ở Hà Nội phù hợp. Tuy nhiên, để có thông tin cụ thể hơn, bạn nên tìm hiểu thêm từ các trường đại học cụ thể.', sources=[ToolOutput(content="{'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}", tool_name='ScoreProgram', raw_input={'args': (), 'kwargs': {'user_gpa': 3.0, 'desired_program': 'Economics', 'budget': 10000000, 'location_pref': 'Hanoi', 'candidate_program': AttributedDict()}}, raw_output={'program_name': None, 'score': 8, 'reasons': ['GPA đạt yêu cầu', 'Trong ngân sách']}, is_error=False)], source_nodes=[], is_dummy_stream=False, metadata=None)