# AI agents workshop
## Теория
1. Что такое AI агенты
2. Фреймворки для создания AI агентов
3. Библиотека smolagents
4. Библиотека LiteLLM
5. Классы smolagents
## Практика
6. Настройка доступа к Mistral
7. Простой поисковый AI агент
8. AI агент для написания кода парсеров
9. Собственный инструмент для AI агента
10. Перевод AI агента на Qwen через vLLM


# Что такое AI агент?

**AI агент** — это автономная программная система, которая:

1. **Воспринимает** окружающую среду через:
   - Текстовые/голосовые запросы
   - API и данные
   - Сенсоры (в IoT-системах)

2. **Обрабатывает** информацию с помощью:
   - Языковых моделей (LLM)
   - Алгоритмов принятия решений
   - Баз знаний

3. **Действует** для достижения целей:
   - Генерирует ответы
   - Выполняет задачи через инструменты
   - Автоматизирует процессы

**Ключевые особенности**:
- 🧠 Автономность (работает без постоянного контроля)
- 🔄 Способность к итерациям (улучшает решения)
- 🛠️ Интеграция с внешними сервисами

**Пример**: Агент, который самостоятельно:
1. Получает задачу "Найди лучшие отели в Сочи"
2. Ищет данные через поисковик
3. Анализирует отзывы
4. Формирует отчет с рекомендациями


## Отличие AI агента от LLM (языковой модели)

| Характеристика       | LLM (GPT-4, Claude и др.)           | AI Агент                          |
|----------------------|-----------------------------------|----------------------------------|
| **Функционал**       | Генерация текста                 | Автономное выполнение задач      |
| **Память**           | Контекст диалога                 | Долгосрочное хранение данных     |
| **Инструменты**      | Нет доступа                      | Работа с API/поисковиками/кодом  |
| **Итерации**         | Один ответ                       | Циклы "мысли-действие-анализ"    |
| **Пример**           | "Вот рецепт пасты"               | Находит рецепт → проверяет ингредиенты в вашем холодильнике → адаптирует рецепт |

**Аналогия**:
- 🧠 LLM — "мозг" без тела (знает, но не действует)
- 🤖 AI агент — "робот" с этим мозгом, который:
  - Сам решает когда "думать"
  - Использует "руки" (инструменты)
  - Учится на ошибках


# Сравнительная таблица наиболее популярных фреймворков AI агентов

| Критерий          | LlamaIndex         | LangGraph          | SmolAgents         |
|-------------------|--------------------|--------------------|--------------------|
| **Архитектура**   | Event-based workflow | Графовая (DAG)     | Code-first loop    |
| **Сильные стороны**| Глубокий поиск данных | Контроль потока    | Скорость разработки|
| **Сложность**     | Средняя            | Высокая            | Низкая            |
| **Интеграции**    | Векторные БД       | LangChain tools    | HF/OpenAI/Anthropic|
| **Использование** | Data-centric задачи| Enterprise системы | Прототипирование  |

**Рекомендуют выбирать**:
1. Начинающим → SmolAgents
2. Для работы с данными → LlamaIndex 
3. Для продакшена → LangGraph + мониторинг


# SmolAgents 🦾

**Микробиблиотека для создания автономных AI-агентов**  

Крошечный (но мощный) инструмент для быстрого развертывания агентов с автономным выполнением задач.  

### Ключевые особенности:
- ⚡ **Минимум строк кода** - минимальные зависимости  
- 🔄 **Автономные циклы** с self-prompting  
- 🛠️ **Интеграция** с OpenAI, Anthropic и другими через адаптеры  

https://github.com/huggingface/smolagents

In [None]:
!pip install -q smolagents

# LiteLLM ⚡

**Универсальный интерфейс для 100+ LLM-провайдеров**  

Единый API для работы с разными языковыми моделями (OpenAI, Anthropic, Gemini, Mistral и др.) без смены кода.  

### Ключевые возможности:
- 🔄 **Совместимость с OpenAI-форматом** – подмена провайдера одной строкой
- 🌐 **Поддержка 100+ моделей** через единый интерфейс
- 🛡 **Retry-логика** при ошибках API

https://github.com/BerriAI/litellm

In [None]:
!pip install -q 'smolagents[litellm]'

# Классы smolagents и их назначение

## 🤖 Основные агенты

### `CodeAgent`
**Назначение**: Агент для выполнения программирования и работы с кодом  
**Зачем нужен**:
- Генерация и анализ кода на разных языках
- Автоматическое исправление ошибок в коде
- Интерактивное взаимодействие с кодом (запуск, дебаггинг)

### `ToolCallingAgent`
**Назначение**: Агент с расширенными возможностями вызова инструментов  
**Зачем нужен**:
- Динамический выбор и использование инструментов
- Композиция сложных workflows из нескольких инструментов
- Поддержка цепочек вызовов инструментов

## 🔧 Инструменты (Tools)

### `DuckDuckGoSearchTool`
**Назначение**: Поиск информации в интернете  
**Зачем нужен**:
- Получение актуальных данных из поисковой системы
- Исследование тем, проверка фактов
- Поиск релевантных ресурсов

### `VisitWebpageTool`
**Назначение**: Извлечение контента веб-страниц  
**Зачем нужен**:
- Парсинг содержимого веб-страниц
- Анализ контента сайтов
- Получение текстовой информации с веб-ресурсов

## 🧠 Модели LLM

### `LiteLLMModel`
**Назначение**: Унифицированный доступ к разным LLM  
**Зачем нужен**:
- Единый интерфейс для 100+ моделей разных провайдеров
- Легкое переключение между моделями
- Fallback-механизмы при ошибках API

## Архитектурная логика:
1. **Агенты** - "мозг" системы, принимают решения
2. **Инструменты** - "руки", выполняют конкретные действия
3. **Модели** - "знания", обеспечивают интеллектуальные возможности

# Для дальнейших шагов нам потребуется доступ к LLM по API
На 29.03.2025 доступ к облачной Mistral можно получить после простой регистрации по адресу https://auth.mistral.ai/ui/registration. 

Понадобится, например, почта на gmail и подтверждение телефонного номера. Ограничения по коду страны мне неизвестны.

![image.png](attachment:f86b2ba2-c58a-45f9-9b4d-8b6067f8b091.png)

Выпустить себе ключ для доступа по API можно по адресу https://console.mistral.ai/api-keys.

![image.png](attachment:334a8ac3-a8f5-442c-aef2-cedb89bb02b7.png)

## Наконец-то пишем код! 
### Импортируем самое нужное и настраиваем доступ к Mistral по API

In [None]:
import os
import sys
from smolagents import CodeAgent, DuckDuckGoSearchTool, VisitWebpageTool, LiteLLMModel, ToolCallingAgent, tool

In [None]:
os.environ['MISTRAL_API_KEY'] = "<YOR_MISTRAL_API_KEY>"

model = LiteLLMModel(
    model_id="mistral/codestral-latest"
)

# Сделаем самого простого агента для поиска информации в интернете
Дадим ему необходимы минимум встроенных инструментов для работы

In [None]:
agent = ToolCallingAgent(
    tools=[DuckDuckGoSearchTool(), VisitWebpageTool()],           
    model=model
)

### Теперь поставим ему задачу
Какая новость дня? И чтобы проверил по трем сайтам.

Агент будет решать задачу итерационно. В логе можно увидеть, какие шаги он выполняет.

In [None]:
task = f"What is the top news today at three different news sites?"
agent.run(task)

## Более техническая задача
### Хочу парсить новости с конкретного сайта. И чтобы в JSON!
Хотите знать новости машиностроения? В любом случае, мы их сейчас узнаем.

In [None]:
page_name = "https://mashnews.ru/novosti.html"
task = f"Get the news from {page_name}. Print information about a title and news date in multiline json format."
agent.run(task)

# А если нам нужно парсить сайт часто? Каждый раз вызывать AI агент? Пусть лучше он напишет легковесный парсер.
### Нам понадобится другой агент. Такой, который умеет писать и исполнять код
Самые прозорливые скажут, что это небезопасно. Cпокойно, решение есть. Он сам может поднять docker и выполнять код в нем, но пока мы ему просто разрешим импортировать лишь несколько пакетов. Инструментов мы ему уже не даем, ведь парсеру они будут недоступны. Лог агента всегда интересный. Но иногда он еще и очень важный. Там можно узнать, почему код не хочет исполняться. Возможно, мы не разрешили использовать какую-то нужную библиотеку. А, может, она и не установлена вовсе.

In [None]:
agent = CodeAgent(
    tools=[],           
    model=model,
    additional_authorized_imports=["bs4", "json", "requests"],
)

### Промпт мы тоже изменим. Качественный промпт с подсказками - залог успеха

In [None]:
page_name = "https://mashnews.ru/novosti.html"
task = f'''Write a parser for {page_name} in python. The parser should print information about a title and news date in json format.
The result is the parser code. Analyze page content first. Make sure the code works correctly.
'''
agent.run(task)

### Скопируем код и проверим
Код может сгенерироваться другой. LLM, вероятностный характер и все такое. Но внизу вполне реальный пример.

In [None]:
import requests
from bs4 import BeautifulSoup
import json

# Fetch the page content
url = "https://mashnews.ru/novosti.html"
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')

# Extract news articles
news_articles = soup.find_all('div', class_='article')

# Extract title and date for each article and print in JSON format
for article in news_articles:
    title = article.find('div', class_='article-title').get_text(strip=True)
    date = article.find('div', class_='article-date').get_text(strip=True)
    print(json.dumps({'title': title, 'date': date}, ensure_ascii=False))


Такой парсер не может преодолевать защиту от роботов на сайте, не умеет переходить на более старые новости по ссылкам, работать в несколько потоков и делать латте с парным австрийским козьим молоком. Но часто этого и не требуется. Как минимум, уже не нужно самостоятельно копаться в разметке, все нужные названия элементов разметки AI агент нашел за нас. 

# Сделаем собственный инструмент для нашего AI агента
### Будем использовать декоратор tool
Я сделал тривиальную фукнцию звукового оповещения и очень горжусь ей. Качественный docstring и декоратор tool превращают ее в инструмент, которым AI агент может нам сообщить, что все готово.

In [None]:
@tool
def notify_beep() -> None:
    '''
    Makes a beep notification
    '''
    if sys.platform in ('linux', 'win32'):
        os.system("echo '\a'") 
    if sys.platform == 'darwin':
        os.system('say beep')
    else:
        print('beep')

### Добавим инструмент в репертуар нашего AI агента

In [None]:
agent = CodeAgent(
    tools=[notify_beep],           
    model=model,
    additional_authorized_imports=["bs4", "json", "requests"],
)

### Добавим к промпту просьбу известить нас, когда все будет готово. 

In [None]:
page_name = "https://mashnews.ru/novosti.html"
task = f'''Write a parser for {page_name} in python. The parser should print information about a title and news date in json format.
The result is the parser code. Analyze page content first. Make sure the code works correctly.
Notify me with a beep in the end.
'''

agent.run(task)

Вы слышали оповещение несколько раз? Самые внимательные поймут почему после чтения лога. Инструмент может быть вызван на любом шаге и не всегда по делу. Держим в уме эту особенность.

# А что делать, если безопасники в компании запрещают пользоваться LLM вне безопасного контура?
Надо пользоваться тем, что доступно на локальной машине или внутри контура.

Так, например, можно настроить доступ к Qwen2.5-32B-Instruct, запущенной через vLLM.

In [None]:
model = LiteLLMModel(
    api_key="YOUR-API-KEY",
    api_base="https://YOUR-DOMAIN/v1",
    model_id="openai/models/Qwen2.5-32B-Instruct",
    num_ctx=8192
)

### Та же задача про парсер, тот же код

In [None]:
agent = CodeAgent(
    tools=[notify_beep],           
    model=model,
    additional_authorized_imports=["bs4", "json", "requests"],
)

page_name = "https://mashnews.ru/novosti.html"
task = f'''Write a parser for {page_name} in python. The parser should print information about a title and news date in json format.
The result is the parser code. Analyze page content first. Make sure the code works correctly.
Notify me with a beep in the end.
'''
agent.run(task)

### Скопируем код и проверим
Менее подходящая модель - больше итераций для достижения цели, меньше вероятность получения идеального результата с первой попытки.

In [None]:
  import requests                                                                                                  
  from bs4 import BeautifulSoup                                                                                    
  import json                                                                                                      
                                                                                                                   
  # request the data from the website                                                                              
  response = requests.get('https://mashnews.ru/novosti.html')                                                      
  # create soup object                                                                                             
  soup = BeautifulSoup(response.content, 'html.parser')                                                            
                                                                                                                   
  # find all news items                                                                                            
  news_items = soup.find_all("div", class_="article")                                                              
                                                                                                                   
  # create a list of dictionaries to hold the title and date of each news                                          
  parsed_news = [{"title": news.find("div", class_="article-title").get_text(),                                    
                  "date": news.find("div", class_="article-date").get_text()} for news in news_items]              
                                                                                                                   
  # print in json format                                                                                           
  print(json.dumps(parsed_news, ensure_ascii=False, indent=4))                                                     

## 🔍 Ключевые выводы
1. **AI агенты** - это новый уровень автоматизации, сочетающий:
   - Интеллект языковых моделей
   - Автономное принятие решений
   - Работу с реальными инструментами

2. **Главные преимущества** рассмотренных технологий:
   - `smolagents`: Минимализм и скорость разработки
   - `LiteLLM`: Универсальный доступ к моделям

## 💡 Практические рекомендации
1. **Для старта**: Начните с smolagents + Mistral (баланс простоты и мощности)
2. **Для продакшена**: Добавьте LangGraph для управления workflow
3. **Для безопасности**: Используйте LLM по внутреннем контуре

## Что дальше
   - Изучаем агентов глубже на бесплатном курсе от HuggingFace https://huggingface.co/agents-course
   - Ждем следующих воркшопов от  <img src="https://telegram.org/img/t_logo.png" width="16" height="16">@ds_professional
   
## 📌 Главный урок
Лучший агент - не самый сложный, а тот, что решает задачу. Часто простые smolagents-решения оказываются эффективнее переусложненных систем. И реализовать их довольно несложно.
