# Overview of [smolagents](https://huggingface.co/docs/smolagents)

In [1]:
import os

from smolagents import LiteLLMModel, ToolCallingAgent

from travel_agent.qdrant import client as qdrant_client
from travel_agent.retrieval.embedding.embedding_generation import MODELS_PROMPTS
from travel_agent.retrieval.smolagents.tool import TravelReviewQueryTool

if not os.getenv("QDRANT_URL"):
    print("Set QDRANT_URL and QDRANT_API_KEY env")
    exit(1)

print(f"Available embed models:\n- {'\n- '.join(MODELS_PROMPTS.keys())}")

Available embed models:
- cointegrated/rubert-tiny2
- DeepPavlov/rubert-base-cased-sentence
- ai-forever/sbert_large_nlu_ru
- ai-forever/sbert_large_mt_nlu_ru
- sentence-transformers/distiluse-base-multilingual-cased-v1
- sentence-transformers/distiluse-base-multilingual-cased-v2
- sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- sentence-transformers/paraphrase-multilingual-mpnet-base-v2
- intfloat/multilingual-e5-large
- intfloat/multilingual-e5-base
- intfloat/multilingual-e5-small
- ai-forever/ru-en-RoSBERTa
- sergeyzh/BERTA


In [5]:
# Replace with your favourite local model
MODEL_NAME = "hf.co/IlyaGusev/saiga_nemo_12b_gguf:Q4_0"
model_id = f"ollama_chat/{MODEL_NAME}"

collection_name = "moskva_intfloat_multilingual_e5_base"
embed_model_name = "intfloat/multilingual-e5-base"


model = LiteLLMModel(
    model_id=model_id,
    api_base="http://127.0.0.1:11434",
)


agent = ToolCallingAgent(
    tools=[TravelReviewQueryTool(embed_model_name, qdrant_client, collection_name, retrieve_limit=10)],
    model=model,
    max_steps=2,
)

[32m2025-04-19 20:53:50.490[0m | [1mINFO    [0m | [36mtravel_agent.retrieval.smolagents.tool[0m:[36m__init__[0m:[36m35[0m - [1mUsing device: mps[0m


In [6]:
print(agent.system_prompt)

You are an expert assistant who can solve any task using tool calls. You will be given a task to solve as best you can.
To do so, you have been given access to some tools.

The tool call you write is an action: after the tool is executed, you will get the result of the tool call as an "observation".
This Action/Observation can repeat N times, you should take several steps when needed.

You can use the result of the previous action as input for the next action.
The observation will always be a string: it can represent a file, like "image_1.jpg".
Then you can use it as input for the next action. You can do it for instance as follows:

Observation: "image_1.jpg"

Action:
{
  "name": "image_transformer",
  "arguments": {"image": "image_1.jpg"}
}

To provide the final answer to the task, use an action blob with "name": "final_answer" tool. It is the only way to complete the task, else you will be stuck on a loop. So your final output should look like this:
Action:
{
  "name": "final_answer"

In [3]:
# Sanity check
agent.run("Что ты думаешь о римской империи?")

"Римская Империя упоминается в отзыве о Дворце царя Алексея Михайловича Романова, который является символом поздней эпохи российской истории, когда существовал тесный культурный и торговый обмен с Западной Европой. Отзыв о дворце: \n'Очень рекомендую побывать... Это эпоха Алексея Михайловича, 17 век.', что показывает связь между двумя империями. Однако, напрямую отзывы не сосредоточены на Римской Империи как таковой."

In [7]:
agent.run("Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?")

"Основываясь на доступных данных, один из лучших японских ресторанов в Москве - это 'Джонджоли', расположенный по адресу: Новомарьинская улица, 1/163. Отзывы описывают его как место с самыми вкусными хинкали."