# Overview of [smolagents](https://huggingface.co/docs/smolagents)

In [None]:
import os

from smolagents import LiteLLMModel, ToolCallingAgent

from travel_agent.qdrant import client as qdrant_client
from travel_agent.retrieval.embedding.embedding_generation import MODELS_PROMPTS
from travel_agent.retrieval.smolagents.prompts import RUS_PROMPT_TEMPLATES
from travel_agent.retrieval.smolagents.tool import TravelReviewQueryTool

if not os.getenv("QDRANT_URL"):
    print("Set QDRANT_URL and QDRANT_API_KEY env")
    exit(1)

print(f"Available embed models:\n- {'\n- '.join(MODELS_PROMPTS.keys())}")

[32m2025-04-20 08:37:45.455[0m | [34m[1mDEBUG   [0m | [36mtravel_agent.qdrant.client[0m:[36mcreate_client[0m:[36m12[0m - [34m[1mConnecting to Qdrant at https://21a1c8c4-0d63-4176-9930-ee7848dafd2f.eu-central-1-0.aws.cloud.qdrant.io[0m
[32m2025-04-20 08:37:46.212[0m | [32m[1mSUCCESS [0m | [36mtravel_agent.qdrant.client[0m:[36mcreate_client[0m:[36m22[0m - [32m[1mconnected: title='qdrant - vector search engine' version='1.13.6' commit='4db98ecdbf66bedbce268ec26865ea446d0bba7b'[0m


Available embed models:
- cointegrated/rubert-tiny2
- DeepPavlov/rubert-base-cased-sentence
- ai-forever/sbert_large_nlu_ru
- ai-forever/sbert_large_mt_nlu_ru
- sentence-transformers/distiluse-base-multilingual-cased-v1
- sentence-transformers/distiluse-base-multilingual-cased-v2
- sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- sentence-transformers/paraphrase-multilingual-mpnet-base-v2
- intfloat/multilingual-e5-large
- intfloat/multilingual-e5-base
- intfloat/multilingual-e5-small
- ai-forever/ru-en-RoSBERTa
- sergeyzh/BERTA


In [2]:
# Replace with your favourite local model
MODEL_NAME = "hf.co/IlyaGusev/saiga_nemo_12b_gguf:Q4_0"
model_id = f"ollama_chat/{MODEL_NAME}"


model = LiteLLMModel(
    model_id=model_id,
    api_base=os.getenv("OLLAMA_URL", "http://127.0.0.1:11434"),
    num_ctx=8192,  # ollama default is 2048 which will fail horribly. 8192 works for easy tasks, more is better. Check https://huggingface.co/spaces/NyxKrage/LLM-Model-VRAM-Calculator to calculate how much VRAM this will need for the selected model.
)

test_response = model([{"role": "user", "content": [{"text": "Алло, это Кизару у телефона?", "type": "text"}]}]).content
print(test_response)
assert test_response

Привет! Да, это я, Кизару. - *улыбается* Как я могу помочь вам сегодня?


In [3]:
embed_model_name = "intfloat/multilingual-e5-base"
collection_name = "moskva_intfloat_multilingual_e5_base"


review_search_tool = TravelReviewQueryTool(embed_model_name, qdrant_client, collection_name)


agent = ToolCallingAgent(tools=[review_search_tool], model=model, max_steps=3, verbosity_level=2)

[32m2025-04-20 08:38:05.644[0m | [1mINFO    [0m | [36mtravel_agent.retrieval.smolagents.tool[0m:[36m__init__[0m:[36m38[0m - [1mUsing device: mps[0m
No sentence-transformers model found with name intfloat/multilingual-e5-base. Creating a new one with mean pooling.


In [4]:
print(agent.system_prompt)

You are an expert assistant who can solve any task using tool calls. You will be given a task to solve as best you can.
To do so, you have been given access to some tools.

The tool call you write is an action: after the tool is executed, you will get the result of the tool call as an "observation".
This Action/Observation can repeat N times, you should take several steps when needed.

You can use the result of the previous action as input for the next action.
The observation will always be a string: it can represent a file, like "image_1.jpg".
Then you can use it as input for the next action. You can do it for instance as follows:

Observation: "image_1.jpg"

Action:
{
  "name": "image_transformer",
  "arguments": {"image": "image_1.jpg"}
}

To provide the final answer to the task, use an action blob with "name": "final_answer" tool. It is the only way to complete the task, else you will be stuck on a loop. So your final output should look like this:
Action:
{
  "name": "final_answer"

In [5]:
# Sanity check
agent.run("Что ты думаешь о римской империи?")

'Римская империя была одним из величайших государственных образований в истории человечества. Вот краткий обзор её основных аспектов:\n- Просуществовала более тысячи лет (примерно с 27 до н.э. по 476 н.э.)\n- Объединила под своим управлением огромные территории, включая большую часть Европы и Ближнего Востока\n- Была центром искусства, архитектуры, права и литературы\n- Развивала сложную административную систему и правовую основу (право Рима оказало значительное влияние на современное право)\n- Внесла вклад в развитие инфраструктуры через строительство дорог и водопроводных систем\n- Прошла через периоды расцвета и кризиса, завершив свое существование разделением на Западную и Восточную Римскую империи.'

In [6]:
resp = agent.run("Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?")

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


In [7]:
print(resp)

Основываясь на полученных отзывах, рекомендую посетить ресторан 'Izumi' по адресу Мясницкая улица, д.38с1 в Москве. Отзывы отмечают разнообразие блюд, качественное обслуживание и приятную атмосферу. Также стоит обратить внимание на 'Tsunami Sushi & Cocktails', расположенный по адресу Благовещенский переулок, д.1А, особенно если вы цените не только еду, но и современную атмосферу.


In [8]:
agent.memory.steps

[TaskStep(task='Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?', task_images=None),
 ActionStep(model_input_messages=[{'role': <MessageRole.SYSTEM: 'system'>, 'content': [{'type': 'text', 'text': 'You are an expert assistant who can solve any task using tool calls. You will be given a task to solve as best you can.\nTo do so, you have been given access to some tools.\n\nThe tool call you write is an action: after the tool is executed, you will get the result of the tool call as an "observation".\nThis Action/Observation can repeat N times, you should take several steps when needed.\n\nYou can use the result of the previous action as input for the next action.\nThe observation will always be a string: it can represent a file, like "image_1.jpg".\nThen you can use it as input for the next action. You can do it for instance as follows:\n\nObservation: "image_1.jpg"\n\nAction:\n{\n  "name": "image_transformer",\n  "arguments": {"image": "image_1.jpg"}\n}\n\

In [None]:
# translated prompts

agent = ToolCallingAgent(
    tools=[review_search_tool], model=model, prompt_templates=RUS_PROMPT_TEMPLATES, max_steps=3, verbosity_level=2
)

print(agent.system_prompt)

Вы — эксперт-ассистент, который может решать любые задачи с использованием вызовов инструментов. Вам будет дана задача, которую вы должны решить наилучшим образом.
Для этого вам предоставлен доступ к некоторым инструментам.
Вызов инструмента, который вы пишете, является действием: после выполнения инструмента вы получите результат вызова инструмента как "наблюдение".
Эта последовательность Действие/Наблюдение может повторяться N раз, вам следует выполнять несколько шагов, когда это необходимо.
Вы можете использовать результат предыдущего действия как ввод для следующего действия.
Наблюдение всегда будет строкой: она может представлять файл, например "image_1.jpg".
Затем вы можете использовать его как ввод для следующего действия. Вы можете сделать это, например, следующим образом:

Наблюдение: "image_1.jpg"

Действие:
{
  "name": "image_transformer",
  "arguments": {"image": "image_1.jpg"}
}
Чтобы предоставить окончательный ответ на задачу, используйте блок действия с "name": "final_an

In [11]:
resp = agent.run("Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?")

In [None]:
print(resp)

С учетом мнений посетителей, могу порекомендовать следующие японские рестораны в Москве:

- **Tsunami Sushi & Cocktails**
Адрес: Москва, Благовещенский переулок, 1А
Рейтинг: 5.0
Отзыв: Уютное место с неоновой атмосферой Токио и отличными роллами.
- **Izumi** (Мясницкая улица, 38с1)
Рейтинг: 5.0
Отзыв: Предлагает разнообразное меню при адекватной цене с акцентом на аутентичность японской кухни.
- **Якитория** (угол Маршала Полубоярова, д.1)
Рейтинг: 5.0
Отзыв: Рекомендуется для любителей роллов и горячих блюд с детским меню.
