<center><a href="https://www.pieriantraining.com/" ><img src="../PTCenteredPurple.png" alt="Pierian Training Logo" /></a></center>


## Ассистент OpenAI с интерпретатором кода

Давайте рассмотрим еще один пример создания помощника с помощью инструмента интерпретатора кода!

In [13]:
from openai import OpenAI 
from pprint import pprint

In [5]:
client = OpenAI()

### ШАГ 1: СОЗДАНИЕ ПОМОЩНИКА

In [6]:
assistant = client.beta.assistants.create(
    name="Bot Analyst",
    instructions="You use Python and Pandas code to perform graph visualization",
    tools=[{"type": "code_interpreter"}],
    model="gpt-3.5-turbo"
)

### ШАГ 2: СОЗДАНИЕ ПОТОКА

In [7]:
thread = client.beta.threads.create()

### ШАГ 3: ДОБАВЬТЕ СООБЩЕНИЕ В ПОТОК

In [8]:
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="Data on how unstructured data grows by year. From 2010 (5-zettabytes) through 2024, the amount of data grows by 10 zettabytes each year",
    metadata={"task": "generate_graph","graph_type": "line_chart"} 
)

### ШАГ 4: ЗАПУСТИТЕ ПОТОК С ПОМОЩНИКОМ

In [9]:
run = client.beta.threads.runs.create(
  thread_id=thread.id,
  assistant_id=assistant.id,
  temperature=0.3
  instructions="Give detailed analysis and considerations for the user question."
)

In [10]:
import time

while run.status != "completed":
    run = client.beta.threads.runs.retrieve(
          thread_id=thread.id,
          run_id=run.id
        )
    
    print(run.status)
    
    time.sleep(secs=5)

completed


### ШАГ 5: ОТОБРАЖЕНИЕ ОТВЕТА

In [11]:
messages = client.beta.threads.messages.list(
  thread_id=thread.id
)

In [14]:
pprint(messages)

SyncCursorPage[Message](data=[Message(id='msg_EK6yZZiP0zNjHexzw51Vnc9f', assistant_id='asst_DCfLBgmUc6oz4ya1OfkMadAZ', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='Here is the calculated amount of unstructured data (in zettabytes) for each year from 2010 to 2024, where the data grows by 10 zettabytes each year starting from an initial amount of 5 zettabytes in 2010:\n\n- 2010: 5 zettabytes\n- 2011: 15 zettabytes\n- 2012: 25 zettabytes\n- 2013: 35 zettabytes\n- 2014: 45 zettabytes\n- 2015: 55 zettabytes\n- 2016: 65 zettabytes\n- 2017: 75 zettabytes\n- 2018: 85 zettabytes\n- 2019: 95 zettabytes\n- 2020: 105 zettabytes\n- 2021: 115 zettabytes\n- 2022: 125 zettabytes\n- 2023: 135 zettabytes\n- 2024: 145 zettabytes\n\nIf you need any further analysis or calculations based on this data, feel free to ask!'), type='text')], created_at=1714591512, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant',

In [18]:
for thread_message in messages.data[::-1]:
    print(thread_message.content[0].text.value)
    print('\n')

Data on how unstructured data grows by year. From 2010 (5-zettabytes) through 2024, the amount of data grows by 10 zettabytes each year


To calculate the amount of unstructured data each year from 2010 to 2024, where the data grows by 10 zettabytes each year starting from an initial amount of 5 zettabytes in 2010, we can use a simple Python script. 

We can create a loop that iterates over the years from 2010 to 2024, incrementing the amount of data by 10 zettabytes each year. This will allow us to calculate the total amount of unstructured data for each year.

Let's calculate the amount of unstructured data for each year from 2010 to 2024.


Here is the calculated amount of unstructured data (in zettabytes) for each year from 2010 to 2024, where the data grows by 10 zettabytes each year starting from an initial amount of 5 zettabytes in 2010:

- 2010: 5 zettabytes
- 2011: 15 zettabytes
- 2012: 25 zettabytes
- 2013: 35 zettabytes
- 2014: 45 zettabytes
- 2015: 55 zettabytes
- 2016: 65 

In [19]:
def display_thread_messages(messages):
    # ОЖИДАЕТ СООБЩЕНИЙ В ПОРЯДКЕ ВОЗРАСТАНИЯ!
    for thread_message in messages.data:
        print(thread_message.content[0].text.value)
        print('\n')

### ШАГ 6: ПРОДОЛЖИТЬ РАЗГОВОР

In [20]:
def wait_on_run(run, thread):
    '''
    Простая функция, которая ожидает выполнения определенного потока.
    Возвращает выполнение после того, как поток был запущен.
    '''
    while run.status == "queued" or run.status == "in_progress":
        run = client.beta.threads.runs.retrieve(
            thread_id=thread.id,
            run_id=run.id,
        )
        time.sleep(0.5)
    return run

In [21]:
client.beta.threads.messages.list(thread_id=thread.id)

SyncCursorPage[Message](data=[Message(id='msg_EK6yZZiP0zNjHexzw51Vnc9f', assistant_id='asst_DCfLBgmUc6oz4ya1OfkMadAZ', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='Here is the calculated amount of unstructured data (in zettabytes) for each year from 2010 to 2024, where the data grows by 10 zettabytes each year starting from an initial amount of 5 zettabytes in 2010:\n\n- 2010: 5 zettabytes\n- 2011: 15 zettabytes\n- 2012: 25 zettabytes\n- 2013: 35 zettabytes\n- 2014: 45 zettabytes\n- 2015: 55 zettabytes\n- 2016: 65 zettabytes\n- 2017: 75 zettabytes\n- 2018: 85 zettabytes\n- 2019: 95 zettabytes\n- 2020: 105 zettabytes\n- 2021: 115 zettabytes\n- 2022: 125 zettabytes\n- 2023: 135 zettabytes\n- 2024: 145 zettabytes\n\nIf you need any further analysis or calculations based on this data, feel free to ask!'), type='text')], created_at=1714591512, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant',

In [22]:
message = client.beta.threads.messages.create(
    thread_id=thread.id, role="user", content="Теперь данные изменились, и теперь прирост составляет по 20 зеттабайт"
)

In [23]:
# Выполнить наш запуск
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
)

# Дождитесь завершения
wait_on_run(run, thread)

# Получите все сообщения, добавленные после последнего сообщения пользователя
# МЫ МОЖЕМ ЗАПРОСИТЬ В ПОРЯДКЕ 'ASC'
# МЫ ТАКЖЕ МОЖЕМ ЗАПРОСИТЬ ТОЛЬКО СООБЩЕНИЯ ПОСЛЕ ОПРЕДЕЛЕННОГО ИДЕНТИФИКАТОРА!
messages = client.beta.threads.messages.list(
    thread_id=thread.id, order="asc", after=message.id
)

display_thread_messages(messages)

Давайте пересчитаем количество структурных данных для каждого года с 2010 по 2024 год, учитывая, что данные увеличиваются на 20 зеттабайт каждый год, начиная с изначального количества 5 зеттабайт в 2010 году. Давайте рассчитаем это:


Вот пересчитанное количество неструктурированных данных (в зеттабайтах) для каждого года с 2010 по 2024, учитывая, что данные увеличиваются на 20 зеттабайт каждый год начиная с изначального количества в 5 зеттабайт в 2010 году:

- 2010: 5 зеттабайт
- 2011: 25 зеттабайт
- 2012: 45 зеттабайт
- 2013: 65 зеттабайт
- 2014: 85 зеттабайт
- 2015: 105 зеттабайт
- 2016: 125 зеттабайт
- 2017: 145 зеттабайт
- 2018: 165 зеттабайт
- 2019: 185 зеттабайт
- 2020: 205 зеттабайт
- 2021: 225 зеттабайт
- 2022: 245 зеттабайт
- 2023: 265 зеттабайт
- 2024: 285 зеттабайт

Если у вас есть какие-либо дополнительные вопросы или запросы, пожалуйста, дайте знать!




-----

### Дополнительно: Просмотрите шаги выполнения программы для получения ответа

In [26]:
client.beta.threads.runs.list(thread.id)

SyncCursorPage[Run](data=[Run(id='run_FOu7NvY5Shqd5AXwVY6NxfPE', assistant_id='asst_DCfLBgmUc6oz4ya1OfkMadAZ', cancelled_at=None, completed_at=1714592277, created_at=1714592266, expires_at=None, failed_at=None, incomplete_details=None, instructions='You use Python and Pandas code to perform graph visualization', last_error=None, max_completion_tokens=None, max_prompt_tokens=None, metadata={}, model='gpt-3.5-turbo', object='thread.run', required_action=None, response_format='auto', started_at=1714592266, status='completed', thread_id='thread_zImKK7Uxpzspw0lNe4Ch9RAe', tool_choice='auto', tools=[CodeInterpreterTool(type='code_interpreter')], truncation_strategy=TruncationStrategy(type='auto', last_messages=None), usage=Usage(completion_tokens=562, prompt_tokens=2789, total_tokens=3351), temperature=1.0, top_p=1.0, tool_resources={}), Run(id='run_l4Se54X7XxYdPgzBClMRzJdt', assistant_id='asst_DCfLBgmUc6oz4ya1OfkMadAZ', cancelled_at=None, completed_at=1714591517, created_at=1714591504, expi

In [27]:
run_steps = client.beta.threads.runs.steps.list(
    thread_id=thread.id,
    run_id=run.id
)

In [28]:
for step in run_steps:
    print(step.step_details)
    print('\n')

MessageCreationStepDetails(message_creation=MessageCreation(message_id='msg_qHMhd2uB9Sqm1Jzqqy6WVq8R'), type='message_creation')


ToolCallsStepDetails(tool_calls=[CodeInterpreterToolCall(id='call_HfbyVs1Z1TvAq1Lzc9Od4yH3', code_interpreter=CodeInterpreter(input='# Initial amount of unstructured data in 2010\r\ninitial_amount = 5  # in zettabytes\r\n\r\n# Dictionary to store the amount of unstructured data for each year\r\ndata_growth_updated = {}\r\n\r\n# Calculate the amount of unstructured data for each year from 2010 to 2024\r\nfor year in range(2010, 2025):\r\n    data_growth_updated[year] = initial_amount\r\n    initial_amount += 20  # Data grows by 20 zettabytes each year\r\n\r\ndata_growth_updated', outputs=[CodeInterpreterOutputLogs(logs='{2010: 5,\n 2011: 25,\n 2012: 45,\n 2013: 65,\n 2014: 85,\n 2015: 105,\n 2016: 125,\n 2017: 145,\n 2018: 165,\n 2019: 185,\n 2020: 205,\n 2021: 225,\n 2022: 245,\n 2023: 265,\n 2024: 285}', type='logs')]), type='code_interpreter')], type='too

### Optional: Delete Assistant

In [29]:
my_assistants = client.beta.assistants.list(
    order="desc",
    limit="20",
)
print(my_assistants.data)

[Assistant(id='asst_DCfLBgmUc6oz4ya1OfkMadAZ', created_at=1714590439, description=None, instructions='You use Python and Pandas code to perform graph visualization', metadata={}, model='gpt-3.5-turbo', name='Bot Analyst', object='assistant', tools=[CodeInterpreterTool(type='code_interpreter')], response_format='auto', temperature=1.0, tool_resources=ToolResources(code_interpreter=ToolResourcesCodeInterpreter(file_ids=[]), file_search=None), top_p=1.0), Assistant(id='asst_0kP8noXV2QqPl1WepqZEWM8E', created_at=1714551808, description=None, instructions='You use Python code to help answer questions about mortgage and interest payments.', metadata={}, model='gpt-3.5-turbo', name='Mortgage Bot', object='assistant', tools=[CodeInterpreterTool(type='code_interpreter')], response_format='auto', temperature=1.0, tool_resources=ToolResources(code_interpreter=ToolResourcesCodeInterpreter(file_ids=[]), file_search=None), top_p=1.0), Assistant(id='asst_kCHX8rGZcgXJE16aX08fQIGz', created_at=17145462

In [30]:
my_assistants.data[1].id

'asst_0kP8noXV2QqPl1WepqZEWM8E'

In [31]:
response = client.beta.assistants.delete(my_assistants.data[1].id)
print(response)

AssistantDeleted(id='asst_0kP8noXV2QqPl1WepqZEWM8E', deleted=True, object='assistant.deleted')
