In [1]:
! pip install langchain==0.3.16 langchain-core==0.3.32 langchain-openai==0.3.2 langchain-together==0.3.0 llama-index-llms-together==0.2.0 smolagents==1.13.0 together==1.5.5 transformers==4.51.3 numpy pydantic==2.7.4

Collecting langchain==0.3.16
  Downloading langchain-0.3.16-py3-none-any.whl.metadata (7.1 kB)
Collecting langchain-core==0.3.32
  Downloading langchain_core-0.3.32-py3-none-any.whl.metadata (6.3 kB)
Collecting langchain-openai==0.3.2
  Downloading langchain_openai-0.3.2-py3-none-any.whl.metadata (2.7 kB)
Collecting langchain-together==0.3.0
  Downloading langchain_together-0.3.0-py3-none-any.whl.metadata (1.9 kB)
Collecting llama-index-llms-together==0.2.0
  Downloading llama_index_llms_together-0.2.0-py3-none-any.whl.metadata (703 bytes)
Collecting smolagents==1.13.0
  Downloading smolagents-1.13.0-py3-none-any.whl.metadata (15 kB)
Collecting together==1.5.5
  Downloading together-1.5.5-py3-none-any.whl.metadata (14 kB)
Collecting pydantic==2.7.4
  Downloading pydantic-2.7.4-py3-none-any.whl.metadata (109 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m109.4/109.4 kB[0m [31m4.5 MB/s[0m eta [36m0:00:00[0m
Collecting numpy
  Downloading numpy-1.26.4-cp311-cp311-

**После установки окружения, если возникает ошибка с numpy - перезапустите ноутбук.**

In [2]:
import numpy as np
np.max([1,2,3])

np.int64(3)

# Tools and Agents
В этом домашнем задании мы разберемся в том, как работают function calls, как их видит и обрабатывает модель и разберемся с несколькими популярными фреймворками

In [1]:
import json
from typing import List, Dict

import requests
from together import Together
from transformers import AutoTokenizer

# Function calls - 20 баллов

## Клиент - 5 баллов

В предыдущем задании мы разобрались с походами в API - мы ходили к провайдеру с помощью библиотеки requests и каждый раз собирали данные для посылки руками.

Многие провайдеры предоставляют удобный интерфейс для взаимодействия ввиде библиотеки для python. Таки библиотеки есть и у [openai](https://platform.openai.com/docs/api-reference/responses/create) и у [Together](https://github.com/togethercomputer/together-python?tab=readme-ov-file#chat-completions). Многие провайдеры специально делают свой API совместимым с openai, например так сделал [deepseek](https://api-docs.deepseek.com/)


Давайте познакомимся с Together клиентом в этом задании. Для этого давайте используем функцию `client.chat.completions.create`. Также давайте добавим опции сэмплинга, которые в этой функции поддержаны. Их можно посылать и в запросах через requests, но мы здесь и далее будем пользоваться клиентом.
* top_k = 100
* temperature = 0.5
* top_p = 0.9
* repetition_penalty = 1.05

In [70]:
import os
# Вставьте свой ключ из https://api.together.ai/
# и не забудьте удалить его перед посылкой
#или подайте его через переменную окружения

# ---- Ваш код здесь ----

API_KEY = ""
# ---- Конец кода ----



In [71]:
client = Together(api_key=API_KEY)

In [72]:
model_name = "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo"
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "What is the capital of Britain?"}
]



# ---- Ваш код здесь ----
# docs
# https://github.com/togethercomputer/together-python?tab=readme-ov-file#chat-completions
sampling_parameters = {
    "temperature": 0.5,
    "repetition_penalty": 1.05,
    "top_p": 0.9,
    "top_k": 100,
}
response = client.chat.completions.create(model=model_name, messages=messages, **sampling_parameters) # ваш код здесь

response_text: str = json.loads(response.model_dump_json())['choices'][0]['message']['content']
print(response_text)
# ---- Конец кода ----

assert "london" in response_text.lower()

The capital of the United Kingdom (Britain) is London.


## Structured output - 5 баллов

На лекции мы узнали, что можно попросить модель напрямую сгенерировать структурированный выход несколькими способами:
1. Попросить модель сгенерировать данные в нужном формате
2. Использовать какой-либо алгоритм выбора токенов для соответствия заданной структуре.


Давайте попробуем оба этих подхода.

1. Попросите модель с помощью промптинга сгенерировать ингредиенты для какого-нибудь блюда
2. Используйте для этой же задачи [structured output / constrained generation](https://docs.together.ai/docs/json-mode) с помощью Pydantic-классов

In [73]:
model_name = "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo"

import json
from pydantic import BaseModel, Field




# ---- Ваш код здесь ----
# в качестве блюда можно выбрать "english breakfast"

# здесь составьте промпт в свободном формате
messages = [{'role': 'user', 'content': 'Please list ingridients for a chicken Kiev in Json format like so: \
               {\"ingridient 1\": "<your answer>", \"ingridient 2\": \"<your answer>\"}. \
               No yapping, only json.'}]
response_freeform = client.chat.completions.create(
    model=model_name,
    messages=messages,
)
response_text: str = json.loads(response_freeform.model_dump_json())['choices'][0]['message']['content']
# print(response_text)

try:
  json.loads(response_text)
  print("В свободном формате получилось сгенерировать json")
except:
  print("В свободном формате не получилось сгенерировать json, но это не ошибка, не нужно подгонять промпт")

# https://docs.together.ai/docs/json-mode
class RecipeItem(BaseModel):
  name: str = Field(description="Name of the ingridient")
  quantity: str = Field(description="Quantity of said ingridient")

class RecipeModel(BaseModel):
    actionItems: list[RecipeItem] = Field(description="List of recipe ingridients")
response = client.chat.completions.create(
    model=model_name,
    messages=messages,
    response_format={
      "type": "json_object",
      "schema": RecipeModel.model_json_schema(),
    }
)
response_text: str = response.choices[0].message.content
try:
  print(json.loads(response_text))
  print("Успешно сгенерировался json в structured output")
except:
  print("Здесь должен был сгенерироваться валидный json")

# ---- Конец кода ----


В свободном формате получилось сгенерировать json
{'actionItems': [{'name': 'Chicken breast', 'quantity': '4'}, {'name': 'Butter', 'quantity': '2 tablespoons'}, {'name': 'Mushroom duxelles', 'quantity': '1/2 cup'}, {'name': 'Onion', 'quantity': '1/4 cup'}, {'name': 'Garlic', 'quantity': '2 cloves'}, {'name': 'Salt', 'quantity': 'to taste'}, {'name': 'Black pepper', 'quantity': 'to taste'}, {'name': 'All-purpose flour', 'quantity': '1 cup'}, {'name': 'Eggs', 'quantity': '2'}, {'name': 'Breadcrumbs', 'quantity': '1 cup'}, {'name': 'Grated cheese', 'quantity': '1/2 cup'}, {'name': 'Fresh parsley', 'quantity': 'chopped'}, {'name': 'Olive oil', 'quantity': 'for frying'}]}
Успешно сгенерировался json в structured output


## Function Call pipeline - 10 баллов

Давайте теперь посмотрим, как можно использовать tools в связке с моделями. У нас есть функция, которая входит в базу данных и получает информацию о юзере. Базы данных, конечно же, у нас никакой нет, но у нас есть некоторая функция, которая эмулирует это поведение, так что давайте попробуем ее описать.


In [74]:
def get_user_info_from_db(person_name: str) -> Dict[str, str]:
    """
    Get a dictionary with information about person
    Args:
      person_name: Name of the person to look for
    Returns:
      Dictionary with information about person
    """
    database = {
        "ilya": {
            "job": "Software Developer",
            "pets": "dog",
        },
        "farruh": {
            "job": "Senior Data & Solution Architect",
            "hobby": "travelling, hiking",
        },
        "timur": {
            "job": "DeepSchool Founder",
            "city": "Novosibirsk",
        }
    }
    no_info = {"err": f"No info about {person_name}"}
    return database.get(person_name.lower(), no_info)

print(get_user_info_from_db("Timur"))

{'job': 'DeepSchool Founder', 'city': 'Novosibirsk'}


Давайте попробуем описать эту функцию в формате json, чтобы модель могла ее увидеть!
Заполните поля в определении дальше

In [75]:

# ---- Ваш код здесь ----

get_user_info_from_db_tool = {
    "type": "function",
    "function": {
        "name": "get_user_info_from_db",
        "description": "emulates query to a database", # Напишите, что функция делает своими словами
        "parameters": {
            "type": "object",
            "properties": {
                "person_name": {
                    "type": "string",
                    "description": "name of a person"# Опишите смысл аргумента
                }
            },
            "required": ["person_name"] # укажите обязательные аргументы для функции
        }
    }
}
# ---- Конец кода ----




Давайте пошлем наш запрос в модель. Для этого воспользуемся клиентом и функцией
`client.chat.completions.create`. Не забудьте передать в поле tools список список из инструментов (список json).


In [76]:
model_name = "Qwen/Qwen2.5-7B-Instruct-Turbo"
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "What do you know about Ilya?"}

]




# ---- Ваш код здесь ----
response = client.chat.completions.create(
    tools=[get_user_info_from_db_tool],
    model=model_name,
    messages=messages,
) # допишите вызов функции
# ---- Конец кода ----


assert len(response.choices[0].message.tool_calls) > 0

print(response.choices[0].message.tool_calls)
print()
print(response.choices[0].message.tool_calls[0].function)

[ToolCalls(id='call_m4n9cgha2andgnz0dc6isfux', type='function', function=FunctionCall(name='get_user_info_from_db', arguments='{"person_name":"Ilya"}'), index=0)]

name='get_user_info_from_db' arguments='{"person_name":"Ilya"}'


Если все хорошо, то мы получили ответ от модели со списком `response.choices[0].message.tool_calls`, который содержит в себе название функции и словарь с ее аргументами.

Если бы мы не использовали клиент, то нам пришлось бы самим по правилам (регулярными выражениями) определять, что модель вызвала инструмент, но клиент берет эту работу за нас.

Давайте теперь напишем код, который может с помощью значения tool_calls вызывать функцию с правильными аргументами.

Здесь нам поможет FUNCTION_REGISTRY и то, что параметры в функцию можно передавать как словарь, например так
```python
def foo(a, b, c):
    print(a, b, c)

obj = {'b':10, 'c':'lee'}

foo(100, **obj)
```

In [77]:
from together.types.chat_completions import FunctionCall

FUNCTION_REGISTRY = {"get_user_info_from_db": get_user_info_from_db}

# ---- Ваш код здесь ----

def use_function_call(tool_call: FunctionCall):
  # Ваш код здесь
  # 1. Берем имя функции и по ней получаем функцию из FUNCTION_REGISTRY
  func = FUNCTION_REGISTRY[tool_call.function.name]
  # 2. Загружаем аргументы
  args = json.loads(tool_call.function.arguments)
  # 3. Вызываем функцию с аргументами и возвращаем результат
  return func(**args)

# ---- Конец кода ----


assert use_function_call(response.choices[0].message.tool_calls[0]) == get_user_info_from_db("Ilya")

Теперь давайте добавим ответ инструмента с ролью tool и сгенерируем моделью финальный ответ

In [78]:
# ---- Ваш код здесь ----
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "What do you know about Ilya?"}
]
# Давайте положим в историю диалога ответ инструмента с ролью tool
messages.append({"role": "tool", "content": json.dumps(use_function_call(response.choices[0].message.tool_calls[0]))})
# вызовем новую генерацию
response = client.chat.completions.create(
    tools=[get_user_info_from_db_tool],
    model=model_name,
    messages=messages
    ) #
response_text: str = response.choices[0].message.content
# ---- Конец кода ----

print(response_text)

Based on the information provided, Ilya is a Software Developer and he has a dog as a pet. Is there anything specific you would like to know about Ilya or his job?


Теперь давайте посмотрим, как выглядел промпт на самом деле, для этого нужно использовать функцию `tokenizer.apply_chat_template` и в аргументе tools передать список функций, которые модель может использовать.

In [79]:
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-3B")

messages = [
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "What do you know about Ilya?"}
]

# ---- Ваш код здесь ----
full_prompt = tokenizer.apply_chat_template(
    conversation=messages,
    tools=[get_user_info_from_db_tool],
    tokenize=False
)
# ---- Конец кода ----


print(full_prompt)

tokenizer_config.json:   0%|          | 0.00/7.23k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/2.78M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/1.67M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/7.03M [00:00<?, ?B/s]

<|im_start|>system
You are a helpful assistant

# Tools

You may call one or more functions to assist with the user query.

You are provided with function signatures within <tools></tools> XML tags:
<tools>
{"type": "function", "function": {"name": "get_user_info_from_db", "description": "emulates query to a database", "parameters": {"type": "object", "properties": {"person_name": {"type": "string", "description": "name of a person"}}, "required": ["person_name"]}}}
</tools>

For each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:
<tool_call>
{"name": <function-name>, "arguments": <args-json-object>}
</tool_call><|im_end|>
<|im_start|>user
What do you know about Ilya?<|im_end|>



# Использование библиотек - 10 баллов

Теперь, когда мы руками прошли весь пути обработки function call можно посмотреть уже на готовые инструменты.
Мы много чего сделали руками:
1. Писали описание функции
2. Обрабатывали ответ
3. Вызывали функцию
4. Возвращали все это в модель

Давайте теперь посмотрим, как оно работает в библиотеках!

**NB** - библиотеки развиваются и вполне возможно, что к концу курса те интерфейсы, которые мы используем в этом домашнем задании будут уже неактуальны, но я уверен, что знаний и принципов, полученных из этих заданий хватит, чтобы адаптироваться к будущим вызовам!

## LangChain - 5 баллов

In [80]:
import os
from langchain_together import ChatTogether
from langchain_core.tools import tool

Давайте ознакомимся с langchain-интеграцией together.ai

In [81]:
os.environ["TOGETHER_API_KEY"] = API_KEY

llm = ChatTogether(
    model=model_name,
    temperature=0,
    max_tokens=100,
    timeout=None,
    max_retries=2
)

In [82]:
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "What do you know about Ilya?"}
]
response = llm.invoke(messages)
print(response.content)

There are a few notable individuals named Ilya, but without more context, it's difficult to specify which one you're referring to. Here are a few prominent people named Ilya:

1. **Ilya Muromets**: A legendary hero from Russian folklore, known for his strength and adventures.

2. **Ilya I (Ilie I)**: A historical figure, the first Prince of Moldavia, who ruled from 1345 to 1374.

3.


Теперь, когда мы разобрались, как базово работать с langchain, давайте попробуем добавить инструментов. Чтобы нам было не так скучно, давайте напишем новую функцию, которая считает "волшебную операцию".

Эта функция принимает 2 строки, возвращает строку строку b в обратном порядке, сконкатенированную со строкой a. Допишите эту функцию.

In [83]:

# ---- Ваш код здесь ----

@tool # декоратор
def magic_operation_tool(a: str, b: str) -> str: # аннотации типов
    """Returns inverted string b concatenated with string a.""" # docstring
    return b[::-1] + a

# ---- Конец кода ----



print(magic_operation_tool.args_schema.schema())
# несколько способов вызова
assert magic_operation_tool.invoke({"a": "456", "b": "321"}) == "123456"
assert magic_operation_tool.func("456", "321") == "123456"
print("Good")

{'description': 'Returns inverted string b concatenated with string a.', 'properties': {'a': {'title': 'A', 'type': 'string'}, 'b': {'title': 'B', 'type': 'string'}}, 'required': ['a', 'b'], 'title': 'magic_operation_tool', 'type': 'object'}
Good


Теперь давайте обернем эту функцию в декоратор tool из langchain, аннотируем типы и допишем docstring. После этого можно будет автоматически сгенерировать описание функции в function call формате!

Теперь давайте попробуем подать запрос в нашу LLM и обогатить ее нашим function_call. Для этого нужна функция `llm.bind_tools`.

In [84]:
llm_with_tools = llm.bind_tools([magic_operation_tool])

Теперь давайте как и раньше:
1. Сгенерируем ответ на messages
2. Проверим в ответе resp.tool_calls, вызовем нужный инструмент
3. Расширим messages ответом модели и ответом инструмента, сгенерируем финальный ответ.

In [85]:
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "Can you help me? Do not reveal the workings of magic operation, but give me the result of it for strings `456` and `321`"}
]
resp = llm_with_tools.invoke(messages)

In [86]:
print(resp.tool_calls)
assert len(resp.tool_calls) > 0

[{'name': 'magic_operation_tool', 'args': {'a': '456', 'b': '321'}, 'id': 'call_lyrkt95gogivl1cajgz6h915', 'type': 'tool_call'}]


[Документация langchain](https://python.langchain.com/docs/concepts/tool_calling/#tool-calling-1) в данный момент не говорит нам, как с помощью примитивов библиотеки можно вызывать инструмент и посылает в документацию LangGraph. Если покопаться поглубже, то можно найти вызов функции с [помощью PydanticToolParsing](https://python.langchain.com/docs/how_to/tool_calling/#parsing). В данном задании можно не использовать эти пайплайны и не писать свою function_registry - можно вызвать magic_operation_tool напрямую с нужными аргументами.

In [87]:
messages = [
    {"role": "system", "content": "You are a helpful assistant"},
    {"role": "user", "content": "Can you help me? Do not reveal the workings of magic operation, but give me the result of it for strings `456` and `321`"}

]

# ---- Ваш код здесь ----
from langchain_core.output_parsers import PydanticToolsParser
# Ваша задача
# добавить вызов (resp) инструмента в историю диалога
tool_call_resp = resp.tool_calls[0]
messages.append({'role': 'system', 'content': json.dumps(tool_call_resp)})
# вызвать инструмент, положить его ответ в историю диалога
tool_res = magic_operation_tool(tool_input=tool_call_resp['args'])
messages.append({'role': 'tool', 'content': tool_res, 'tool_call_id': tool_call_resp['id']})
# вызвать LLM, чтобы она сообщила вам финальный результат
response = llm_with_tools.invoke(messages)

res: str = response.content
print(res)
# ---- Конец кода ----



assert "123456" in res and len(messages) == 4


  tool_res = magic_operation_tool(tool_input=tool_call_resp['args'])


The result of the magic operation for the strings `456` and `321` is `123456`.


## LlamaIndex - 5 баллов

Аналогичный инструмент LlamaIndex. Давайте попробуем сразу собрать ReActAgent с помощью этой библиотеки, который поможет нам в использовании магической операции

In [88]:
from llama_index.llms.together import TogetherLLM
from llama_index.core.llms import ChatMessage
from llama_index.core.tools import FunctionTool
from llama_index.core.agent import ReActAgent

In [89]:
llm = TogetherLLM(model=model_name, api_key=API_KEY)

Инструменты в llamaindex заполняются почти как в langchain

In [90]:
# ---- Ваш код здесь ----
# аннтоируйте выходные и выходные типы, допишите docstring и реализацию функциии
def magic_operation_tool(a: str, b: str) -> str: # аннотации типов
    """Returns inverted string b concatenated with string a.""" # docstring
    return b[::-1] + a

# ---- Конец кода ----


magic_operation_tool_llamaindex = FunctionTool.from_defaults(fn=magic_operation_tool)
print(magic_operation_tool_llamaindex.metadata)

ToolMetadata(description='magic_operation_tool(a: str, b: str) -> str\nReturns inverted string b concatenated with string a.', name='magic_operation_tool', fn_schema=<class 'llama_index.core.tools.utils.magic_operation_tool'>, return_direct=False)


Давайте создадим ReActAgent: ему нужно передать tools, llm, memory=None и verbose=True

In [91]:
# ---- Ваш код здесь ----
agent = ReActAgent(tools=[magic_operation_tool_llamaindex], llm=llm, memory=None, verbose=True) # допишите конструктор
# ---- Конец кода ----


In [None]:
text = "Can you help me? Do not reveal the workings of magic operation, but give me the result of it for strings `456` and `321`"
agent.chat(text)

> Running step 22061ded-d6ef-497d-9e58-aa0b20f87141. Step input: Can you help me? Do not reveal the workings of magic operation, but give me the result of it for strings `456` and `321`
[1;3;38;5;200mThought: The user wants the result of the magic operation on the strings '456' and '321'. I need to use the magic_operation_tool for this.
Action: magic_operation_tool
Action Input: {'a': '456', 'b': '321'}
[0m[1;3;34mObservation: 123456
[0m> Running step a81813dc-b17b-41ac-b80d-93249b55d74f. Step input: None
[1;3;38;5;200mThought: I can answer without using any more tools. I'll use the user's language to answer
Answer: The result of the magic operation on the strings '456' and '321' is '123456'.
[0m

AgentChatResponse(response="The result of the magic operation on the strings '456' and '321' is '123456'.", sources=[ToolOutput(content='123456', tool_name='magic_operation_tool', raw_input={'args': (), 'kwargs': {'a': '456', 'b': '321'}}, raw_output='123456', is_error=False)], source_nodes=[], is_dummy_stream=False, metadata=None)

# Финансовый агент - 10

Настала пора сделать своего агента!
Попробуем сделать финансового аналитика. Требования следующие:
бот должен по запросу данных о какой-либо компании смотреть самые большие изменения цены ее акций за последний месяц, после чего бот должен объяснить, с какой новостью это связано.

Предлагается не строить сложную систему с классификаторами, а отдать всю сложную работу агенту. Давайте посмотрим, какие API нам доступны.

Первым делом получение котировок - для этого нам поможет библиотека yfinance. По названию компании и периоду отчетности можно посмотреть открывающие цены на момент открытия и закрытия биржи.

In [93]:
! pip install yfinance



In [94]:
import yfinance as yf

stock = yf.Ticker("AAPL") # посмотрим котировки APPLE
df = stock.history(period="1mo")
df[["Open", "Close"]]

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2025-03-24 00:00:00-04:00,221.0,220.729996
2025-03-25 00:00:00-04:00,220.770004,223.75
2025-03-26 00:00:00-04:00,223.509995,221.529999
2025-03-27 00:00:00-04:00,221.389999,223.850006
2025-03-28 00:00:00-04:00,221.669998,217.899994
2025-03-31 00:00:00-04:00,217.009995,222.130005
2025-04-01 00:00:00-04:00,219.809998,223.190002
2025-04-02 00:00:00-04:00,221.320007,223.889999
2025-04-03 00:00:00-04:00,205.539993,203.190002
2025-04-04 00:00:00-04:00,193.889999,188.380005


Для поиска новостей нам поможет https://newsapi.org/
Можно легко получить свой ключ за короткую регистрацию, дается 1000 запросов в день, каждый запрос может включать в себя ключевое слово и промежуток дат. По бесплатному апи ключу дается ровно 1 месяц, что нам подходит.

In [115]:
from datetime import datetime, timedelta
api_key = "" # ваш API ключ здесь!
api_template = "https://newsapi.org/v2/everything?q={keyword}&apiKey={api_key}&from={date_from}"

# дата должна быть не ранее месяца назад, иначе ошибка
month_ago =str(datetime.now().date() - timedelta(days=30))
articles = requests.get(api_template.format(keyword="Apple", api_key=api_key, date_from=month_ago)).json()

for article in articles["articles"]:
    if article["title"] != "[Removed]":
        print(article["title"])
        print(article["description"])
        break

Apple says it’ll use Apple Maps Look Around photos to train AI
Sometime earlier this month, Apple updated a section of its website that discloses how it collects and uses imagery for Apple Maps’ Look Around feature, which is similar to Google Maps’ Street View, as spotted by 9to5Mac. A newly added paragraph reveals that,…


Очень много статей заблокированы и имеют название `[Removed]`, нужно их отфильтровать. В оставшихся статьях будем брать только title (заголовок) и description (описание или краткий пересказ).

Вам необходимо реализовать [ReAct Agent](https://react-lm.github.io/). Особенность этого агента заключается в том, что он вначале формирует мысль, а потом вызывает действие (function call) для достижения какой-либо цели.

Что нужно сделать:
1. Описать и реализовать function call для определения, в какой день была самая большая разница в цене акций в момент открытия и закрытия биржи. Функция получает один аргумент - название акций компании (например AAPL для Apple), а выдает словарь с 2мя полями: с датой максимальной разницы в ценах и самой разницей в ценах.
2. Описать и реализовать function call для получения 5 релевантных новостей о компании. В качестве аргумента принимаются название компании и дата. Ваша задача - сходить в newsapi, получить новости и вернуть 5 случайных новостей, которые произошли не позже чем день торгов. Если новостей меньше 5, то верните столько, сколько получится.
3. После этого агент должен вернуть ответ, в котором постарается аргументировать изменения в цене.


Реализовывать агента можно любым удобным способом, в том числе взять готовые имплементации.
1. [LlamaIndex](https://docs.llamaindex.ai/en/stable/examples/agent/react_agent/) - вдобавок можно посмотреть предыдущее задание, где он уже используется.
2. [Langchain/Langgraph](https://langchain-ai.github.io/langgraph/how-tos/create-react-agent/#code)
3. Написать полностью свою реализацию


Не забудьте, что очень важно описать задачу в промпте: нужно сказать, какие цели у агента и что он должен сделать. У функций должны быть говорящие описания, чтобы LLM без лишних проблем поняла, какие есть функции и когда их использовать. По всем вопросам можно обращаться в наш телеграм-чат в канал "Tools & Agents".


In [116]:
# ---- Ваш код здесь ----
def max_price_diff(stock_name: str) -> Dict[str, float]:
    """
    Get the date with the maximum price difference for a given stock.
    Args:
        stock_name: The name of the stock to analyze.
    Returns:
        A dictionary with the date and maximum price difference.
    """
    stock = yf.Ticker(stock_name)
    df = stock.history(period="1mo")
    max_diff = (df["Close"] - df["Open"]).max()
    max_diff_date = (df["Close"] - df["Open"]).idxmax()
    return {"date": str(max_diff_date.date()), "max_diff": max_diff}
print(max_price_diff('AAPL'))

def get_relevant_news(stock_name: str, date: str) -> List[Dict[str, str]]:
    """
    Get relevant news articles for a given stock and date.
    Args:
        stock_name: The name of the stock to analyze.
        date: The date of the stock data.
    Returns:
        A list of relevant news articles.
    """
    api_key = "" # ваш API ключ здесь!
    api_template = "https://newsapi.org/v2/everything?q={keyword}&apiKey={api_key}&from={date_from}"
    month_ago =str(datetime.now().date() - timedelta(days=30))
    articles = requests.get(api_template.format(keyword=stock_name, api_key=api_key, date_from=month_ago)).json()
    filtered_articles = [{"title": el["title"], "description": el["description"], "date": el["publishedAt"]} for el in articles["articles"] if
                         (el["title"] != "[Removed]")
                         and (el["publishedAt"] <= date)]
    return filtered_articles[:5]

max_price_diff_llamaindex = FunctionTool.from_defaults(fn=max_price_diff)
get_relevant_news_llamaindex = FunctionTool.from_defaults(fn=get_relevant_news)
agent = ReActAgent(tools=[max_price_diff_llamaindex, get_relevant_news_llamaindex], llm=llm, memory=None, verbose=True)
text = "Can you help me? What happened to TSLA stock over the last month?"
agent.chat(text)
# ---- Конец кода ----


{'date': '2025-04-09', 'max_diff': 26.900009155273438}
> Running step e002c23b-9579-42fc-b2e8-2cd251cccfbd. Step input: Can you help me? What happened to TSLA stock over the last month?
[1;3;38;5;200mThought: The user wants to know what happened to TSLA stock over the last month. I need to find the date with the maximum price difference for TSLA to understand if there was a significant change in the stock price.
Action: max_price_diff
Action Input: {'stock_name': 'TSLA'}
[0m[1;3;34mObservation: {'date': '2025-04-09', 'max_diff': 47.510009765625}
[0m> Running step 71d50dd3-2942-41e8-af85-98a9d132fc61. Step input: None
[1;3;38;5;200mThought: I have found that the maximum price difference for TSLA occurred on 2025-04-09 with a difference of 47.51. To provide a more comprehensive analysis, I should also look for relevant news articles around that date.
Action: get_relevant_news
Action Input: {'stock_name': 'TSLA', 'date': '2025-04-09'}
[0m[1;3;34mObservation: [{'title': 'India Bars 

AgentChatResponse(response='Over the last month, TSLA stock experienced a significant price change on April 9, 2025, with a difference of 47.51. Some relevant news articles around that time include:\n- "India Bars BYD Entry as Minister Signals Preference for Tesla, Citing Trade Concerns" on April 8, 2025.\n- "Trump\'s auto tariffs will have a \'significant\' impact on Tesla, Elon Musk says" on March 27, 2025.\n- "Tesla just reported its worst quarterly sales in years as Elon Musk courts controversy" on April 2, 2025.\n- "Tesla issued its eighth Cybertruck recall last week, this time over faulty exterior panels that could become a road hazard" on March 24, 2025.\n- "BYD\'s stock jumps on better-than-expected earnings" on March 24, 2025, which might have affected TSLA\'s stock price as well.', sources=[ToolOutput(content="{'date': '2025-04-09', 'max_diff': 47.510009765625}", tool_name='max_price_diff', raw_input={'args': (), 'kwargs': {'stock_name': 'TSLA'}}, raw_output={'date': '2025-04

# Smolagents sql agent - 10 баллов

Теперь давайте познакомимся со smolagents - библиотекой, которая тоже позволяет писать код для агентов.

Давайте попробуем написать агента для взаимодействия с БД

In [2]:
#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
from huggingface_hub import notebook_login
notebook_login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

Наш агент будет работать с базой данных и выполнять задачу text2sql - ходить в базу данных за нас. Мы создадим базу данных с 2мя таблицами:
1. Таблица A содержит id человека и его имя
2. Таблица B содержит id человека и его работу

In [3]:
import sqlite3

conn = sqlite3.connect('example.db')
cursor = conn.cursor()

cursor.execute('DROP TABLE IF EXISTS A')
cursor.execute('DROP TABLE IF EXISTS B')

cursor.execute('''
    CREATE TABLE A (
        id INTEGER PRIMARY KEY,
        username TEXT NOT NULL
    )
''')

cursor.execute('''
    CREATE TABLE B (
        id INTEGER PRIMARY KEY,
        job TEXT NOT NULL
    )
''')

user_data = [
    (1, 'alice'),
    (2, 'bob'),
    (3, 'charlie'),
    (4, 'dave'),
    (5, 'eve'),
    (6, 'frank'),
    (7, 'grace'),
    (8, 'heidi'),
    (9, 'ivan'),
    (10, 'judy'),
]

job_data = [
    (1, 'engineer'),
    (2, 'designer'),
    (3, 'manager'),
    (4, 'developer'),
    (5, 'analyst'),
    (6, 'engineer'),
    (7, 'support'),
    (8, 'engineer'),
    (9, 'engineer'),
    (10, 'marketing'),
]

cursor.executemany('INSERT INTO A (id, username) VALUES (?, ?)', user_data)
cursor.executemany('INSERT INTO B (id, job) VALUES (?, ?)', job_data)

conn.commit()
conn.close()

print("Done")


Done


Некоторые пользователи имеют одинаковые професии. Давайте попросим агента решить следующую задачу: найти самую популярную профессию и вывести имена всех людей, которые ей владеют.

In [61]:
from smolagents import tool

# ---- Ваш код здесь ----
"""
Допиишите документацию, чтобы модель лучше работала можете сообщить ей о том,
какие таблицы есть в бд и какие у них схемы.
"""

@tool
def sql_engine(query: str) -> str:
    """
    This function executes the passed SQL query on the database and returns the
    result as a string.

    Database schema:
    table A: id (INTEGER PRIMARY KEY), username (TEXT)
    table B: id (INTEGER PRIMARY KEY), job (TEXT)

    Args:
        query: The SQL query to execute.

    Outputs:
        String with the result of the query.
    """
    output = ""
    con = sqlite3.connect('example.db')
    rows = con.execute(query)
    for row in rows:
        output += "\n" + str(row)
    return output

# ---- Конец кода ----


In [69]:
# ---- Ваш код здесь ----
model = HfApiModel(
    model_id="Qwen/Qwen2.5-Coder-32B-Instruct",
    token="", # тут API_KEY
    provider="together"
)

agent = CodeAgent(tools=[sql_engine], model=model)
# напишите промпт - агент должен найти самую популярную профессию и вывести имена людей, которые ей занимаются
question = "Do the following actions step by step:"\
          "1) Find the most frequent job name in the database."\
          "2) Find the list of usernames who have this job."\
          "3) Output the most frequent job name and the list of people with this job in easily readable format."\
agent.run(question)
# ---- Конец кода ----

'The most frequent job is: engineer\nUsernames with this job: alice, frank, heidi, ivan'

Самой популярной работой должен быть engineer, в ней заняты alice, frank, heidi, ivan