## Cách hoạt động:

Bạn định nghĩa một hàm Python (get_restaurant_recommendations) với decorator @tool để biến nó thành một tool mà LLM (ChatOpenAI) có thể gọi.

Bạn tạo một list các tool, rồi bind tool đó vào LLM bằng .bind_tools().

Khi nhận message ("Recommend some restaurants in Munich."), LLM sẽ quyết định (dựa vào prompt và tool description) có nên gọi tool không, và tự động lấy kết quả trả về.

Tất cả tool đều nằm local, chạy trực tiếp trong process Python của bạn.

## Đặc trưng:

Binding tool trực tiếp cho model.

Gọi tool là nội bộ, không qua bất kỳ giao thức trung gian nào.

Thích hợp cho workflow đơn giản, nhanh gọn, quản lý tool dễ.

In [6]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage
from langchain_core.tools import tool
from dotenv import load_dotenv
load_dotenv()  

@tool
def get_restaurant_recommendations(location: str):
    """Provides a list of top restaurant recommendations for a given location."""
    recommendations = {
        "munich": ["Hofbräuhaus", "Augustiner-Keller", "Tantris"],
        "new york": ["Le Bernardin", "Eleven Madison Park", "Joe's Pizza"],
        "paris": ["Le Meurice", "L'Ambroisie", "Bistrot Paul Bert"],
    }
    return recommendations.get(location.lower(), ["No recommendations available for this location."])


# TODO: Bind the tool to the model
tools = [get_restaurant_recommendations]
llm = ChatOpenAI()
llm_with_tools = llm.bind_tools(tools)


messages = [
    HumanMessage("Recommend some restaurants in Munich.")
]

#TODO: Invoke the llm
llm_output = llm_with_tools.invoke(messages)
print(llm_output)




content='' additional_kwargs={'tool_calls': [{'id': 'call_6OM9HJfCRY83qbfJTAHf3B87', 'function': {'arguments': '{"location":"Munich"}', 'name': 'get_restaurant_recommendations'}, 'type': 'function'}], 'refusal': None} response_metadata={'token_usage': {'completion_tokens': 19, 'prompt_tokens': 59, 'total_tokens': 78, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'tool_calls', 'logprobs': None} id='run-e9671cd8-2feb-4ee9-a180-b8e36b2216e9-0' tool_calls=[{'name': 'get_restaurant_recommendations', 'args': {'location': 'Munich'}, 'id': 'call_6OM9HJfCRY83qbfJTAHf3B87', 'type': 'tool_call'}] usage_metadata={'input_tokens': 59, 'output_tokens': 19, 'total_tokens': 78, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0

## 1. Cơ chế tool-calling của OpenAI (và LangChain)
Khi bạn bind một tool vào LLM (như ChatOpenAI), model sẽ không trả về text trả lời thông thường (content), mà sẽ kích hoạt chế độ tool-calling nếu model xác định rằng prompt phù hợp với một tool đã bind.

Lúc này, LLM không sinh ra “nội dung trả lời” cho người dùng, mà phát sinh một lệnh gọi tool với tham số phù hợp.

## 2. Dấu hiệu trong kết quả trả về
Trong additional_kwargs có trường tool_calls chứa thông tin:

"function": {"name": "get_restaurant_recommendations", "arguments": '{"location":"Munich"}'}

Tức là LLM đã chọn gọi tool này thay vì trả về content.

Trường "finish_reason": "tool_calls" cũng xác nhận điều này.

## 3. Tại sao lại thế?
Design của API: Khi tool được gọi, content trả về luôn là rỗng (content='') — vì ý định của LLM là: “Tôi muốn hệ thống gọi tool này, sau đó lấy kết quả tool trả về để tiếp tục cuộc hội thoại.”

Đáp án của model sẽ là một lệnh gọi tool, chứ chưa phải câu trả lời cuối cùng cho user.

## 4. Luồng thực tế (tool-calling):
Người dùng hỏi: Recommend some restaurants in Munich.

LLM trả về:

content = '' (rỗng)

tool_calls = [{...get_restaurant_recommendations, args...}]

Hệ thống thực hiện tool:

Tool get_restaurant_recommendations(location="Munich") được gọi trong Python.

Trả về: danh sách nhà hàng.

(Nếu muốn có content cuối cùng):

Bạn cần tiếp tục đưa kết quả tool trả về vào LLM để model tổng hợp thành câu trả lời cho người dùng.

## 5. Ý nghĩa thực tiễn
content='' là bình thường trong quy trình tool-calling.

Kết quả cuối cùng gửi cho user chỉ có sau khi tool được gọi xong, và (nếu cần) kết hợp lại với LLM để model viết ra nội dung trả lời.

## Tóm lại:
Khi LLM muốn gọi tool, trường content sẽ rỗng vì model nhường quyền trả lời cho tool — chỉ sau khi tool chạy xong, bạn mới có thể lấy nội dung ý nghĩa cho user nếu cần.