# Ragas evaluation of smolagents

In [2]:
import os

import torch
from sentence_transformers import SentenceTransformer
from smolagents import LiteLLMModel, ToolCallingAgent

from travel_agent.qdrant import client as qdrant_client
from travel_agent.retrieval.smolagents.tool import GetExistingAvailableRubricsTool, TravelReviewQueryTool

MODEL_NAME = "hf.co/IlyaGusev/saiga_nemo_12b_gguf:Q4_0"
model_id = f"ollama_chat/{MODEL_NAME}"


llm = LiteLLMModel(
    model_id=model_id,
    api_base=os.getenv("OLLAMA_URL", "http://127.0.0.1:11434"),
    num_ctx=8192,  # ollama default is 2048 which will fail horribly. 8192 works for easy tasks, more is better. Check https://huggingface.co/spaces/NyxKrage/LLM-Model-VRAM-Calculator to calculate how much VRAM this will need for the selected model.
)

test_response = llm([{"role": "user", "content": [{"text": "Алло, это Кизару у телефона?", "type": "text"}]}]).content
print(test_response)
assert test_response

Здравствуйте! Это не Кизару, но я здесь, чтобы помочь.Вы кто-то из мира видеоигр или аниме? Как могу быть полезен?


In [3]:
embed_model_name = "intfloat/multilingual-e5-base"
collection_name = "moskva_intfloat_multilingual_e5_base"


get_available_rubrics_tool = GetExistingAvailableRubricsTool()
review_search_tool = TravelReviewQueryTool(embed_model_name, qdrant_client, collection_name)


agent = ToolCallingAgent(
    tools=[review_search_tool, get_available_rubrics_tool], model=llm, max_steps=10, verbosity_level=2
)

[32m2025-04-27 16:16:17.793[0m | [34m[1mDEBUG   [0m | [36mtravel_agent.qdrant.client[0m:[36mcreate_client[0m:[36m12[0m - [34m[1mConnecting to Qdrant at https://21a1c8c4-0d63-4176-9930-ee7848dafd2f.eu-central-1-0.aws.cloud.qdrant.io[0m
[32m2025-04-27 16:16:18.232[0m | [32m[1mSUCCESS [0m | [36mtravel_agent.qdrant.client[0m:[36mcreate_client[0m:[36m22[0m - [32m[1mconnected: title='qdrant - vector search engine' version='1.14.0' commit='3617a0111fc8590c4adcc6e88882b63ca4dda9e7'[0m
[32m2025-04-27 16:16:21.571[0m | [1mINFO    [0m | [36mtravel_agent.retrieval.smolagents.tool[0m:[36m__init__[0m:[36m81[0m - [1mUsing device: mps[0m


In [3]:
# Sanity check
agent.run("Что ты думаешь о римской империи?")

'Отзывы о Римской империи напрямую найти сложно. Однако, отклики на исторические музеи Москвы отражают общее восхищение и уважение к истории, что аналогично восприятию римского периода. Основные моменты из этих отзывов: 1) Интересная экспозиция и интерактивность (Музей Московских стрельцов). 2) Воодушевление историческими памятниками (Иоанно-Предтеченский Ставропигиальный женский монастырь, Центральный музей Вооружённых Сил Российской Федерации). Эти отклики демонстрируют глубокий интерес к истории и культурному наследию, что вполне применимо к оценке Римской империи.'

In [4]:
device = torch.device("cuda" if torch.cuda.is_available() else ("mps" if torch.backends.mps.is_available() else "cpu"))
embedder = SentenceTransformer(embed_model_name, device=device)

In [6]:
# headline_extractor = HeadlinesExtractor(llm=generator_llm, max_num=20)
# headline_splitter = HeadlineSplitter(max_tokens=1500)
# keyphrase_extractor = KeyphrasesExtractor(llm=generator_llm)

# transforms = [headline_extractor, headline_splitter, keyphrase_extractor]

# apply_transforms(kg, transforms=transforms)