# Code Agents

При создании многоагентных систем, у нас есть компромисс между гибкостью и управляемостью системы. Управляемые системы обычно действуют на основе некоторых прописанных переходов и коммуникаций между агентами, в то время как в гибких системах LLM-агенты могут принимать решения и строить последовательности вызова инструкментов на основе своих знаний и опыта.

Такие системы могут быть построены на основе кодогенерации, когда LLM генерирует код на Python для решения задачи, использующий предоставленные инструменты, который затем выполняется в некоторой контролируемой песочнице.

Для демонстрации такого подхода используем фреймворк [smolagents](https://github.com/huggingface/smolagents).

In [None]:
%pip install smolagents[mcp]

## Простейший пример

Рассмотрим простейший пример, когда мы даём агенту возможность поиска в интернет. Для этого будем использовать доступный "из коробки" инструмент `DuckDuckGoSearchTool`.

Для работы с YandexGPT будем использовать [OpenAI-совместимое API](https://yandex.cloud/ru/docs/foundation-models/concepts/openai-compatibility). Вы можете попробовать модели YandexGPT 5 или Llama.

> **ВАЖНО**: При использовании YandexGPT 5 необходимо передать ключ `flatten_messages_as_text = True`, поскольку составные запросы, включающие текст и изображения, пока не поддерживаются.

Для начала убедимся, что языковая модель работает:

In [14]:
from smolagents import OpenAIServerModel, CodeAgent, DuckDuckGoSearchTool
import os

ygpt_model = OpenAIServerModel(api_key=os.environ['api_key'], 
                           model_id=f"gpt://{os.environ['folder_id']}/yandexgpt/rc",
                           #model_id=f"gpt://{os.environ['folder_id']}/llama/rc",
                           api_base="https://llm.api.cloud.yandex.net/v1",
                           flatten_messages_as_text = True
)

#ygpt_model([
#    {
#        "role" : "user",
#        "content" : "Расскажи анекдот"
#    }])

Теперь создадим агента с инструментом поиска в интернет, и зададим ему какой-нибудь вопрос:

In [15]:
agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=ygpt_model)

agent.run("Напиши список из трёх лучших вин, подходящих к стейку с кровью, и их цены")

'1. Бароло - от 2 494 ₽\n2. Каберне Совиньон - от 252 ₽\n3. Аргентинский Мальбек и чилийский Карменер не удалось найти цены.'

Несмотря на то, что мы задали вопрос на русском языке, весь поиск в интернет проводился на английском, и был найден результат из англоязычного сегмента. Почему?

Дело в том, что за кажущейся внешней простотой скрывается большая внутренняя работа. Во фреймворк smolagents заложена [идеология ReAct](https://habr.com/ru/articles/882432/), в которой агент сначала рассуждает и строит план решения, затем по шагам выполняет его, смотрит на результаты и адаптируется. За этим стоит достаточно сложный промптинг, который по умолчанию во фреймворке smolagents сделан на английском языке.

Загрузим русскоязычный пакет промптов:

In [16]:
import yaml
russian_templates = yaml.load(open('etc/smolagents_code_agent_russian_prompts.yaml'), Loader=yaml.FullLoader)
agent.prompt_templates = russian_templates
agent.run("Напиши список из трёх лучших вин, подходящих к стейку с кровью, и их цены")

[{'name': 'Испанский Темпранильо', 'price': 'от 211 руб. за бутылку 0.75 л'},
 {'name': "Итальянский Монтепульчано д'Абруццо",
  'price': 'от 430 руб. за бутылку 0.75 л'},
 {'name': 'Французская Сира', 'price': 'от 314 руб. за бутылку 0.7 л'}]

Видим, что результат получился уже на русском языке.

## Model Context Protocol

В примере выше, мы искали цены где-то в интернет. А как быть, если агенту нужно работать с конкретным рестораном?

Для этого можно использовать технологию [Model Context Protocol (MCP)](https://modelcontextprotocol.io/introduction). Это по сути дела стандартизированный способ сделать "удалённый RAG" и "удалённый вызов инструментов". В этом случае ресторан может предоставлять своё меню через набор MCP-вызовов. Для этого он должен реализовать MCP-сервер.

В нашем примере предположим, что у нас есть ресторан, с некоторым [меню кухни](data/menu/food.md) и [бара](data/menu/drinks.md). Мы реализовали [простой MCP-сервер](mcp-server/mcp-rest.py), который предоставляет два инструмента:
* `get_food_menu` для получения списка блюд в виде markdown-таблицы
* `get_drinks_menu` - для получения списка напитков

Для запуска сервера необходимо установить [FastMCP](https://github.com/jlowin/fastmcp), и далее в командной строке выполнить:
```bash
fastmcp run -p 8000 -h 127.0.0.1 -t sse mcp-rest.py
```

In [17]:
from smolagents import OpenAIServerModel, CodeAgent
import os
import yaml

russian_templates = yaml.load(open('etc/smolagents_code_agent_russian_prompts.yaml'), Loader=yaml.FullLoader)

ygpt_model = OpenAIServerModel(api_key=os.environ['api_key'], 
                           model_id=f"gpt://{os.environ['folder_id']}/yandexgpt/rc",
                           #model_id=f"gpt://{os.environ['folder_id']}/llama/rc",
                           api_base="https://llm.api.cloud.yandex.net/v1",
                           flatten_messages_as_text = True)

Теперь мы можем использовать MCP-инструменты в нашем агенте:

In [18]:
import yaml
from smolagents.mcp_client import MCPClient

with MCPClient({"url" : "http://127.0.0.1:8000/sse"}) as tools:
    agent = CodeAgent(tools=tools, model=ygpt_model)
    agent.prompt_templates = yaml.load(open('etc/smolagents_code_agent_russian_prompts.yaml'), Loader=yaml.FullLoader)
    agent.run("Какое самое дорогое блюдо в ресторане?")

## Подбор меню для ужина

Теперь попробуем решить более сложную задачу - подобрать меню для ужина таким образом, чтобы вино и основное блюдо хорошо сочетались. Для этого будем использовать [табличку соответствий еды и вина](data/food_wine_table.md):

In [19]:
import pandas as pd
import re 

foodmatch = [ x.strip() for x in open("data/food_wine_table.md", encoding="utf8").readlines()[2:-1]]
foodmatch = [ { "food" : x.split('|')[0].strip(), "wine" : x.split('|')[1].strip()} for x in foodmatch]
df = pd.DataFrame(foodmatch)
df

Unnamed: 0,food,wine
0,"Баклажаны, запеченые с сыром",Красное вино: «среднетелые»* сухие — Гренаш (Г...
1,Баранина деликатесная (филе или каре ягненка),Красное вино: сухие выдержанные вина из виногр...
2,"Баранина пикантная: жареная, гриль, тушеная — ...",Красные вина: сухие вина из винограда Каберне ...
3,Бефстроганов,"Белые вина: выдержанные в дубе Шардоне, Пино Г..."
4,Блинчики с мясом говядина,"Крепкие напитки: Водка, Полугар, Хреновуха. Т..."
...,...,...
155,"Шашлык из свинины, пикантный — в уксусно-луков...",Красные вина: тихие сухие и полусухие вина из ...
156,Шоколад,"Чай: черный, травяной, ягодно-фруктовый. Не об..."
157,Эклер классический,"Белые вина: более сладкое, чем торт выдержанно..."
158,Яичница — глазунья,Белые вина: сухие легкие вина с невысокой кисл...


Чтобы научить нашего агента искать соответствия еды и вина, нам нужно дать ему соответствующие инструменты. А для этого реализовать какой-то вид поиска поверх нашей таблички.

Будем использовать семантический поиск через YandexGPT Embeddings:

In [20]:
from yandex_cloud_ml_sdk import YCloudML

sdk = YCloudML(folder_id=os.environ['folder_id'], auth=os.environ['api_key'])
query_model = sdk.models.text_embeddings('query')
doc_model = sdk.models.text_embeddings('doc')

Посчитаем эмбеддинги для всех блюд и вин в табличке:

In [None]:
df['food_embed'] = df['food'].apply(lambda x : doc_model.run(x))
df['wine_embed'] = df['wine'].apply(lambda x : doc_model.run(x))
df.to_pickle("data/food_wine_table.pkl")

In [21]:
df = pd.read_pickle("data/food_wine_table.pkl")

Теперь собственно опишем функцию поиска подходящей еды к вину `find_matching_food`:

In [22]:
from scipy.spatial.distance import cdist
import numpy as np
from smolagents import tool

@tool
def find_matching_food(wine : str) -> str:
    """
    Найти подходщее блюдо к заданному вину
    Args:
        wine: Описание вина, под которое надо найти блюдо
    """
    wine_embed = query_model.run(wine)
    we = np.array([np.array(x) for x in df['wine_embed']])
    dist = cdist([wine_embed], we, metric='cosine')[0]
    return "Вот наиболее подходящие блюда:\n" + "\n".join(
        [f"{j+1}. {df.iloc[i]['food']}" 
        for j, i in enumerate(dist.argsort()[0:3])])

print(find_matching_food("Сухое белое"))


Вот наиболее подходящие блюда:
1. Нарезка мясная деликатесная варено-копченая (в т.ч. колбаса)
2. Сыры козие молодые
3. Рыба белая речная (судак, щука, жерех, толстолобик, карп)


Аналогичная функция для поиска вина:

In [23]:
@tool
def find_matching_wine(food : str) -> str:
    """
    Найти подходщее вино к заданному блюду
    Args:
        food: Описание блюда, под которое надо найти вино
    """
    food_embed = query_model.run(food)
    fe = np.array([np.array(x) for x in df['food_embed']])
    dist = cdist([food_embed], fe, metric='cosine')[0]
    return "Вот наиболее подходящие вина:\n" + "\n".join(
        [f"{j+1}. {df.iloc[i]['wine']}" 
        for j, i in enumerate(dist.argsort()[0:3])])

print(find_matching_wine('Стейк'))

Вот наиболее подходящие вина:
1. Красные вина: к прожарке Rare — выдержанные и «благородные» вина из Темпранильо (Рибейра дель Дуэро или любые от Ризервы и выше), Санджовезе (Кьянти Ризерва, Брунелло), «супертосканские» вина, Бордо Правого берега, шелковистые аргентинские Мальбеки. К прожарке Medium или WellDone — сухие и полусухие из винограда Сира (Шираз), Каберне Совиньон, «тельный» Мальбек, Примитиво, Зинфандель, Альянико (выдержанное и слегка «округлившееся»), выдержанный «ронский» ассамбляж Гренаш+Сира+Мурведр, вина Приората от 6-8 лет выдержки и выше.
2. Красные вина: легкие и элегантные из винограда Пино Нуар, Нерелло Маскалезе, элегантно сделанное и выдержанное Мерло. Также подойдут «округлые», выдержанные варианты из сортов Неббиоло (Барбареско), Темпранильо (Рибейра дель Дуэро), Санджовезе (Кьянти Ризерва).
3. Красные вина: сухие вина из винограда Санджовезе (Кьянти) и Неро д’Авола, испанские Темпранильо, «тельные» Мерло, «тельные» Пино Нуары (из Нового Света, Австрии, Герма

Теперь собираем всё это вместе, и создаём агента, которому доступны как инструменты подбора блюд/вин, так и меню ресторана по протоколу MCP.

In [24]:
with MCPClient({"url" : "http://127.0.0.1:8000/sse"}) as res_tools:
    agent = CodeAgent(
        tools=res_tools+[find_matching_food,find_matching_wine], 
        prompt_templates = russian_templates,
        model=ygpt_model)
    agent.prompt_templates = yaml.load(open('etc/smolagents_code_agent_russian_prompts.yaml'), Loader=yaml.FullLoader)
    agent.run("""
    Подбери меню для ужина в ресторане из основного блюда, подходящего вина и десерта, и
    посчитай его стоимость.
    Выведи табличку из названий блюд и напитков и их стоимости. Я хочу стейк!
    """)

## Заключение

Code Agents - это способ создания достаточно гибких агентов, способных самостоятельно декомпозировать задачу на подзадачи и решать их с помощью написания кода. 