# Overview of [smolagents](https://huggingface.co/docs/smolagents)

In [1]:
import os

from openinference.instrumentation.smolagents import SmolagentsInstrumentor
from phoenix.otel import register
from smolagents import LiteLLMModel, ToolCallingAgent

from travel_agent.qdrant import client as qdrant_client
from travel_agent.retrieval.embedding.embedding_generation import MODELS_PROMPTS
from travel_agent.retrieval.smolagents.prompts import RUS_PROMPT_TEMPLATES
from travel_agent.retrieval.smolagents.tool import GetExistingAvailableRubricsTool, TravelReviewQueryTool

if not os.getenv("QDRANT_URL"):
    print("Set QDRANT_URL and QDRANT_API_KEY env")
    exit(1)

print(f"Available embed models:\n- {'\n- '.join(MODELS_PROMPTS.keys())}")

Available embed models:
- cointegrated/rubert-tiny2
- DeepPavlov/rubert-base-cased-sentence
- ai-forever/sbert_large_nlu_ru
- ai-forever/sbert_large_mt_nlu_ru
- sentence-transformers/distiluse-base-multilingual-cased-v1
- sentence-transformers/distiluse-base-multilingual-cased-v2
- sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- sentence-transformers/paraphrase-multilingual-mpnet-base-v2
- intfloat/multilingual-e5-large
- intfloat/multilingual-e5-base
- intfloat/multilingual-e5-small
- ai-forever/ru-en-RoSBERTa
- sergeyzh/BERTA


In [2]:
# OPTIONAL: add tracing
# First, run server in background: uv run -m phoenix.server.main serve
# Then, run this cell


tracer_provider = register(project_name="travel-agent-local")
SmolagentsInstrumentor().instrument(
    tracer_provider=tracer_provider
)  # automatically captures any smolagents calls as traces

🔭 OpenTelemetry Tracing Details 🔭
|  Phoenix Project: travel-agent-local
|  Span Processor: SimpleSpanProcessor
|  Collector Endpoint: localhost:4317
|  Transport: gRPC
|  Transport Headers: {'user-agent': '****'}
|  
|  Using a default SpanProcessor. `add_span_processor` will overwrite this default.
|  
|  
|  `register` has set this TracerProvider as the global OpenTelemetry default.
|  To disable this behavior, call `register` with `set_global_tracer_provider=False`.



In [3]:
# Replace with your favourite local model
MODEL_NAME = "hf.co/IlyaGusev/saiga_nemo_12b_gguf:Q4_0"
model_id = f"ollama_chat/{MODEL_NAME}"


model = LiteLLMModel(
    model_id=model_id,
    api_base=os.getenv("OLLAMA_URL", "http://127.0.0.1:11434"),
    num_ctx=8192,  # ollama default is 2048 which will fail horribly. 8192 works for easy tasks, more is better. Check https://huggingface.co/spaces/NyxKrage/LLM-Model-VRAM-Calculator to calculate how much VRAM this will need for the selected model.
)

test_response = model([{"role": "user", "content": [{"text": "Алло, это Кизару у телефона?", "type": "text"}]}]).content
print(test_response)
assert test_response

Здравствуйте! Да, это Кизару. (Учитывая, что я — виртуальный персонаж.) Как я могу вам помочь?


In [17]:
embed_model_name = "intfloat/multilingual-e5-base"
collection_name = "moskva_intfloat_multilingual_e5_base"


get_available_rubrics_tool = GetExistingAvailableRubricsTool()
review_search_tool = TravelReviewQueryTool(embed_model_name, qdrant_client, collection_name)


agent = ToolCallingAgent(
    tools=[review_search_tool, get_available_rubrics_tool], model=model, max_steps=10, verbosity_level=2
)

[32m2025-04-26 19:44:30.024[0m | [1mINFO    [0m | [36mtravel_agent.retrieval.smolagents.tool[0m:[36m__init__[0m:[36m84[0m - [1mUsing device: mps[0m


In [18]:
print(agent.system_prompt)

You are an expert assistant who can solve any task using tool calls. You will be given a task to solve as best you can.
To do so, you have been given access to some tools.

The tool call you write is an action: after the tool is executed, you will get the result of the tool call as an "observation".
This Action/Observation can repeat N times, you should take several steps when needed.

You can use the result of the previous action as input for the next action.
The observation will always be a string: it can represent a file, like "image_1.jpg".
Then you can use it as input for the next action. You can do it for instance as follows:

Observation: "image_1.jpg"

Action:
{
  "name": "image_transformer",
  "arguments": {"image": "image_1.jpg"}
}

To provide the final answer to the task, use an action blob with "name": "final_answer" tool. It is the only way to complete the task, else you will be stuck on a loop. So your final output should look like this:
Action:
{
  "name": "final_answer"

In [19]:
# Sanity check
agent.run("Что ты думаешь о римской империи?")

'Римская империя была выдающимся государственным образованием с богатым историческим наследием. По некоторым оценкам и отзывам историков, основные факты и достижения включают:\n- Расцвет в области права (правосудие, правовые нормы), которое до сих пор влияет на современное законодательство.\n- Эффективная система управления и инфраструктуры: дороги, мосты, акведуки, которые облегчали торговлю и распространение культуры.\n- Величественные архитектурные памятники (Колизей, Форум Римский) и искусство.\n- Сильную армию, обеспечивающую порядок в империи на протяжении столетий.\nОднако, следует отметить проблемы с коррупцией, социальное неравенство и военные конфликты, которые привели к её упадку.'

In [20]:
print(agent.run("Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?"))

На основе положительных отзывов рекомендую посетить ресторан **Izumi** по адресу Москва, Мясницкая улица, 38с1. Отмечают разнообразие меню и высокое качество блюд японской кухни. Также стоит обратить внимание на Tsunami Sushi & Cocktails в Благовещенском переулке за атмосферу неонового Токио и отличные коктейли.


In [21]:
agent.memory.steps

[TaskStep(task='Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?', task_images=None),
 ActionStep(model_input_messages=[{'role': <MessageRole.SYSTEM: 'system'>, 'content': [{'type': 'text', 'text': 'You are an expert assistant who can solve any task using tool calls. You will be given a task to solve as best you can.\nTo do so, you have been given access to some tools.\n\nThe tool call you write is an action: after the tool is executed, you will get the result of the tool call as an "observation".\nThis Action/Observation can repeat N times, you should take several steps when needed.\n\nYou can use the result of the previous action as input for the next action.\nThe observation will always be a string: it can represent a file, like "image_1.jpg".\nThen you can use it as input for the next action. You can do it for instance as follows:\n\nObservation: "image_1.jpg"\n\nAction:\n{\n  "name": "image_transformer",\n  "arguments": {"image": "image_1.jpg"}\n}\n\

In [22]:
print(agent.run("Можешь ли посоветовать гостиницы в Москве?"))

На основе отзывов могу порекомендовать следующие гостиницы в Москве: 1) Вега Измайлово Конгресс-центр, 2) Националь, 3) Хилтон Москва Ленинградская, 4) Аэростар и 5) СтандАрт. Все они получили высокие оценки за качество обслуживания, удобное расположение и комфортные номера.


In [23]:
# translated prompts

agent = ToolCallingAgent(
    tools=[review_search_tool],
    model=model,
    prompt_templates=RUS_PROMPT_TEMPLATES,
    max_steps=3,
    verbosity_level=2,  # DEBUG
)

print(agent.system_prompt)

Вы — эксперт-ассистент, который может решать любые задачи с использованием вызовов инструментов. Вам будет дана задача, которую вы должны решить наилучшим образом.
Для этого вам предоставлен доступ к некоторым инструментам.
Вызов инструмента, который вы пишете, является действием: после выполнения инструмента вы получите результат вызова инструмента как "наблюдение".
Эта последовательность Действие/Наблюдение может повторяться N раз, вам следует выполнять несколько шагов, когда это необходимо.
Вы можете использовать результат предыдущего действия как ввод для следующего действия.
Наблюдение всегда будет строкой: она может представлять файл, например "image_1.jpg".
Затем вы можете использовать его как ввод для следующего действия. Вы можете сделать это, например, следующим образом:

Наблюдение: "image_1.jpg"

Действие:
{
  "name": "image_transformer",
  "arguments": {"image": "image_1.jpg"}
}
Чтобы предоставить окончательный ответ на задачу, используйте блок действия с "name": "final_an

In [24]:
resp = agent.run("Я бы хотел посетить японский ресторан. Можешь ли посоветовать хороший в Москве?")

In [25]:
resp = agent.run("Подскажи мне ателье по ременту обуви?")