# Assistants API

Assistants API를 사용하면 자체 애플리케이션 내에 AI 도우미를 구축할 수 있습니다. 어시스턴트에는 instruction(지침)이 있으며 모델, 도구 및 파일을 활용하여 사용자 쿼리에 응답할 수 있습니다. Assistants API는 현재 코드 해석기, 파일 검색 및 함수 호출의 세 가지 유형의 도구를 지원합니다.  

Assistants 플레이그라운드(https://platform.openai.com/playground?mode=assistant)를 사용 하거나 아래에 설명된 것과 같이 Assistants API의 기능을 탐색할 수 있습니다.

In [1]:
import os
import openai
import sys
sys.path.append('./')

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file

### 코드 해석기 (Code Interpreter)

Assistants가 샌드박스 실행 환경에서 Python 코드를 작성하고 실행할 수 있습니다. 이 도구는 다양한 데이터와 포맷의 파일을 처리할 수 있으며, 데이터와 그래프 이미지가 포함된 파일을 생성할 수 있습니다. 코드 해석기를 사용하면 어시스턴트가 코드를 반복적으로 실행하여 어려운 코드 및 수학 문제를 해결할 수 있습니다. 어시스턴트가 실행에 실패한 코드를 작성하면 코드 실행이 성공할 때까지 다른 코드 실행을 시도하여 이 코드를 반복할 수 있습니다.

### Step 1 : assistant 생성  

- assistant는 model , instructions및 같은 여러 매개변수를 사용하여 사용자의 메시지에 응답하도록 구성할 수 있는 엔터티를 나타냅니다.

Instruction: 어시스턴트와 모델이 어떻게 행동하거나 반응해야 하는지 지시  
Model: 모델 지정   
Tools: API는 OpenAI에서 구축하고 호스팅하는 코드 해석기 및 검색을 지원합니다.  
Functions: 함수 호출을 사용하면 Assistants API에 함수를 설명하고 인수와 함께 호출해야 하는 함수를 지능적으로 반환하도록 할 수 있습니다.  

### 이 예에서는 코드 해석기 도구가 활성화된 개인 수학 교사인 도우미를 만듭니다.  
예) code interpreter가 활성화된 개인 수학 교사 assistant를 생성하여 주어진 수학 문제를 푸는 python code 생성

In [14]:
from openai import OpenAI
client = OpenAI()

assistant = client.beta.assistants.create(
    name="Math Tutor",
    instructions="당신은 개인 수학 교사입니다. 수학 문제에 답하는 python 코드를 작성하고 실행해 보세요.",
    tools=[{"type": "code_interpreter"}],
    model="gpt-4o"
)
assistant

Assistant(id='asst_JuUI4QlGkjixVP9I5KnJTu4n', created_at=1718685597, description=None, instructions='당신은 개인 수학 교사입니다. 수학 문제에 답하는 python 코드를 작성하고 실행해 보세요.', metadata={}, model='gpt-4o', name='Math Tutor', object='assistant', tools=[CodeInterpreterTool(type='code_interpreter')], response_format='auto', temperature=1.0, tool_resources=ToolResources(code_interpreter=ToolResourcesCodeInterpreter(file_ids=[]), file_search=None), top_p=1.0)

### Step 2 : Thread 생성

스레드는 사용자와 하나 이상의 Assistant 간의 대화를 나타냅니다. 사용자(또는 AI 애플리케이션)가 어시스턴트와 대화를 시작할 때 스레드를 생성할 수 있습니다.  
사용자가 대화를 시작하자마자 사용자당 하나의 스레드를 생성하는 것이 좋습니다. 메시지를 생성하여 이 스레드에 사용자별 컨텍스트와 파일을 전달합니다.    

In [15]:
thread = client.beta.threads.create()
thread

Thread(id='thread_NueePtjLDxjCMqrZ5KaSM5tC', created_at=1718685600, metadata={}, object='thread', tool_resources=ToolResources(code_interpreter=None, file_search=None))

### Step 3 : Thread에 message 추가

사용자나 애플리케이션이 생성한 메시지의 내용은 스레드에 메시지 개체로 추가됩니다. 메시지에는 텍스트와 파일이 모두 포함될 수 있습니다. 스레드에 추가할 수 있는 메시지 수에는 제한이 없습니다. 모델의 컨텍스트 창에 맞지 ​​않는 모든 컨텍스트를 스마트하게 자릅니다. 어시스턴트 API를 사용하면 특정 RUN에 대해 모델에 전달되는 입력 토큰 수에 대한 제어를 위임합니다. 즉, 경우에 따라 어시스턴트 실행 비용에 대한 제어 권한이 줄어들지만 복잡성을 처리할 필요는 없습니다. 

In [16]:
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    #content="I need to solve the equation `3x + 11 = 14`. Can you help me?"
    content="방정식 `3x + 11 = 14`를 풀려고해. 도와줘."
)

message

Message(id='msg_1yqdfSGQ1VmNxFybYmizoZuX', assistant_id=None, attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='방정식 `3x + 11 = 14`를 풀려고해. 도와줘.'), type='text')], created_at=1718685602, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='user', run_id=None, status=None, thread_id='thread_NueePtjLDxjCMqrZ5KaSM5tC')

In [17]:
vars(message)

{'id': 'msg_1yqdfSGQ1VmNxFybYmizoZuX',
 'assistant_id': None,
 'attachments': [],
 'completed_at': None,
 'content': [TextContentBlock(text=Text(annotations=[], value='방정식 `3x + 11 = 14`를 풀려고해. 도와줘.'), type='text')],
 'created_at': 1718685602,
 'incomplete_at': None,
 'incomplete_details': None,
 'metadata': {},
 'object': 'thread.message',
 'role': 'user',
 'run_id': None,
 'status': None,
 'thread_id': 'thread_NueePtjLDxjCMqrZ5KaSM5tC'}

### Step 4 : Run 생성

모든 사용자 메시지가 스레드에 추가되면 특정 Assistant를 사용하여 스레드를 Run할 수 있습니다. Run을 생성하면 Assistant와 관련된 모델 및 도구를 사용하여 응답을 생성합니다. 이러한 응답은 스레드에 assistant메시지로 추가됩니다.

### 방법 1 - streaming 사용
OpenAI의 AssistantEventHandler를 사용하여 Run을 만들고 응답을 스트리밍할 수 있습니다.

In [18]:
from typing_extensions import override
from openai import AssistantEventHandler
 
# 먼저, 이벤트 핸들러 클래스(EventHandler)를 생성하여
# 응답 스트림에서 이벤트를 어떻게 처리할지 정의합니다.
class EventHandler(AssistantEventHandler):    
  # 텍스트 생성이 완료되었을 때 호출되는 메서드
  @override
  def on_text_created(self, text) -> None:
    print(f"\nassistant > ", end="", flush=True)
      
  # 텍스트 생성 중간에 호출되는 메서드
  @override
  def on_text_delta(self, delta, snapshot):
    print(delta.value, end="", flush=True)
      
  # 도구 호출이 생성되었을 때 호출되는 메서드
  def on_tool_call_created(self, tool_call):
    print(f"\nassistant > {tool_call.type}\n", flush=True)
  
  # 도구 호출 중간에 호출되는 메서드
  def on_tool_call_delta(self, delta, snapshot):
    if delta.type == 'code_interpreter':
      if delta.code_interpreter.input:
        print(delta.code_interpreter.input, end="", flush=True)
      if delta.code_interpreter.outputs:
        print(f"\n\noutput >", flush=True)
        for output in delta.code_interpreter.outputs:
          if output.type == "logs":
            print(f"\n{output.logs}", flush=True)

In [20]:
# 그런 다음, `stream` SDK 도우미와 `EventHandler` 클래스를 사용하여
# Run을 생성하고 응답을 스트리밍합니다.
with client.beta.threads.runs.stream(
  thread_id=thread.id,
  assistant_id=assistant.id,
  instructions="Python code를 생성해 주세요.",  # 사용자에 대한 지시
  event_handler=EventHandler(),  # EventHandler 클래스 인스턴스를 이벤트 핸들러로 사용
) as stream:
  stream.until_done()  # 스트림이 완료될 때까지 대기


assistant > 이 값을 확인하기 위해 Python 코드를 사용하여 해결해 보겠습니다. 

```python
# 방정식 3x + 11 = 14를 풀기 위해 sympy 모듈을 사용하겠습니다.
from sympy import symbols, Eq, solve

# 변수를 정의합니다.
x = symbols('x')

# 방정식을 설정합니다.
equation = Eq(3 * x + 11, 14)

# 방정식을 풉니다.
solution = solve(equation, x)
solution
```

이 코드를 실행하여 \(x\)의 값을 확인해보겠습니다.
assistant > code_interpreter

from sympy import symbols, Eq, solve

# 변수를 정의합니다.
x = symbols('x')

# 방정식을 설정합니다.
equation = Eq(3 * x + 11, 14)

# 방정식을 풉니다.
solution = solve(equation, x)
solution
assistant > Python 코드를 실행한 결과, \( x = 1 \)로 확인되었습니다.

따라서, 방정식 \(3x + 11 = 14\)의 해는 \( x = 1 \)입니다.

### 방법 2 - streaming 사용 않음
RUN은 비동기식입니다. 즉, 터미널 상태에 도달할 때까지 Run 개체를 폴링하여 상태를 모니터링해야 한다는 뜻입니다. 'create_and_poll' SDK는 Run 생성과 완료 폴링을 모두 지원합니다.

In [21]:
# `create_and_poll` 메서드를 사용하여 새로운 실행(run)을 생성하고 해당 실행이 완료될 때까지 폴링합니다.
run = client.beta.threads.runs.create_and_poll(
  thread_id=thread.id,  # 실행할 스레드의 ID
  assistant_id=assistant.id,  # 실행할 어시스턴트의 ID
  instructions="풀이 과정을 단계적으로 설명해줘"  # 어시스턴트에게 제공할 지시사항
)

vars(run)

{'id': 'run_zaZNJGejDkmvrrs2U2eqF75I',
 'assistant_id': 'asst_JuUI4QlGkjixVP9I5KnJTu4n',
 'cancelled_at': None,
 'completed_at': 1718685698,
 'created_at': 1718685697,
 'expires_at': None,
 'failed_at': None,
 'incomplete_details': None,
 'instructions': '풀이 과정을 단계적으로 설명해줘',
 'last_error': None,
 'max_completion_tokens': None,
 'max_prompt_tokens': None,
 'metadata': {},
 'model': 'gpt-4o',
 'object': 'thread.run',
 'parallel_tool_calls': True,
 'required_action': None,
 'response_format': 'auto',
 'started_at': 1718685697,
 'status': 'completed',
 'thread_id': 'thread_NueePtjLDxjCMqrZ5KaSM5tC',
 'tool_choice': 'auto',
 'tools': [CodeInterpreterTool(type='code_interpreter')],
 'truncation_strategy': TruncationStrategy(type='auto', last_messages=None),
 'usage': Usage(completion_tokens=106, prompt_tokens=569, total_tokens=675),
 'temperature': 1.0,
 'top_p': 1.0,
 'tool_resources': {}}

In [22]:
# 실행 상태 확인
if run.status == 'completed': 
  messages = client.beta.threads.messages.list(
    thread_id=thread.id
  )
  print(messages)
else:
  print(run.status)

SyncCursorPage[Message](data=[Message(id='msg_9xn3n8c5YOjf0qi7s1xl2uTI', assistant_id='asst_JuUI4QlGkjixVP9I5KnJTu4n', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='추가적으로, 이 값을 방정식에 대입하여 해가 올바른지 확인해 봅시다.\n\n방정식에 \\( x = 1 \\)을 대입하면:\n\\[\n3(1) + 11 = 3 + 11 = 14\n\\]\n\n원래의 방정식 \\( 14 = 14 \\)가 성립하기 때문에, \\( x = 1 \\)이 올바른 해라는 것을 재확인할 수 있습니다.'), type='text')], created_at=1718685697, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant', run_id='run_zaZNJGejDkmvrrs2U2eqF75I', status=None, thread_id='thread_NueePtjLDxjCMqrZ5KaSM5tC'), Message(id='msg_76IvfGNXRTDKEl2rK7h9tosI', assistant_id='asst_JuUI4QlGkjixVP9I5KnJTu4n', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='Python 코드를 실행한 결과, \\( x = 1 \\)로 확인되었습니다.\n\n따라서, 방정식 \\(3x + 11 = 14\\)의 해는 \\( x = 1 \\)입니다.'), type='text')], created_at=1718685687, incomplete_at=None, incomplete_details=None, me

In [23]:
messages.data

[Message(id='msg_9xn3n8c5YOjf0qi7s1xl2uTI', assistant_id='asst_JuUI4QlGkjixVP9I5KnJTu4n', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='추가적으로, 이 값을 방정식에 대입하여 해가 올바른지 확인해 봅시다.\n\n방정식에 \\( x = 1 \\)을 대입하면:\n\\[\n3(1) + 11 = 3 + 11 = 14\n\\]\n\n원래의 방정식 \\( 14 = 14 \\)가 성립하기 때문에, \\( x = 1 \\)이 올바른 해라는 것을 재확인할 수 있습니다.'), type='text')], created_at=1718685697, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant', run_id='run_zaZNJGejDkmvrrs2U2eqF75I', status=None, thread_id='thread_NueePtjLDxjCMqrZ5KaSM5tC'),
 Message(id='msg_76IvfGNXRTDKEl2rK7h9tosI', assistant_id='asst_JuUI4QlGkjixVP9I5KnJTu4n', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='Python 코드를 실행한 결과, \\( x = 1 \\)로 확인되었습니다.\n\n따라서, 방정식 \\(3x + 11 = 14\\)의 해는 \\( x = 1 \\)입니다.'), type='text')], created_at=1718685687, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.me

In [24]:
messages.data[0].role

'assistant'

In [25]:
messages.data[0].content[0].text.value

'추가적으로, 이 값을 방정식에 대입하여 해가 올바른지 확인해 봅시다.\n\n방정식에 \\( x = 1 \\)을 대입하면:\n\\[\n3(1) + 11 = 3 + 11 = 14\n\\]\n\n원래의 방정식 \\( 14 = 14 \\)가 성립하기 때문에, \\( x = 1 \\)이 올바른 해라는 것을 재확인할 수 있습니다.'

In [26]:
values = [(messages.data[i].role, messages.data[i].content[0].text.value) for i in range(len(messages.data)-1, -1, -1)]

for role, value in values:
    print(f"role: {role}")
    print(value)
    print(150*"-")

role: user
방정식 `3x + 11 = 14`를 풀려고해. 도와줘.
------------------------------------------------------------------------------------------------------------------------------------------------------
role: assistant
좋아요, 방정식 \(3x + 11 = 14\)를 풀어봅시다.

1. 우선 방정식의 양변에서 11을 빼줍니다.
   \[
   3x + 11 - 11 = 14 - 11
   \]
   이는 다음과 같이 됩니다:
   \[
   3x = 3
   \]

2. 이제 양변을 3으로 나눕니다.
   \[
   \frac{3x}{3} = \frac{3}{3}
   \]
   따라서:
   \[
   x = 1
   \]

따라서, \( x \)의 값은 1입니다.
------------------------------------------------------------------------------------------------------------------------------------------------------
role: assistant
이 값을 확인하기 위해 Python 코드를 사용하여 해결해 보겠습니다. 

```python
# 방정식 3x + 11 = 14를 풀기 위해 sympy 모듈을 사용하겠습니다.
from sympy import symbols, Eq, solve

# 변수를 정의합니다.
x = symbols('x')

# 방정식을 설정합니다.
equation = Eq(3 * x + 11, 14)

# 방정식을 풉니다.
solution = solve(equation, x)
solution
```

이 코드를 실행하여 \(x\)의 값을 확인해보겠습니다.
-----------------------------------------------------------------------

## 코드 해석기에 파일 전달
Assistant 에 전달된 파일은 이 Assistant를 사용하는 모든 Run에서 액세스할 수 있습니다.  

다음은 OpenAI의 code interpreter 도구를 사용하여 업로드된 mydata.csv 파일을 바탕으로 사용자에게 응답하는 샘플 코드입니다. 이 코드는 사용자가 특정 질문을 할 때 CSV 파일을 읽고, 해당 질문에 맞는 응답을 제공하는 예제입니다.

가정: 사용자가 학생의 이름을 입력하면 해당 학생의 나이와 성적을 반환하는 예제

#### 1. CSV 파일 업로드 및 어시스턴트 생성 코드

In [27]:
import pandas as pd

# 예시 데이터 생성
data = {
    "name": ["Alice", "Bob", "Charlie"],
    "age": [14, 15, 13],
    "grade": ["A", "B", "A"]
}

# 데이터프레임 생성
df = pd.DataFrame(data)

# CSV 파일로 저장
csv_file_path = "data/mydata.csv"
df.to_csv(csv_file_path, index=False)

print(f"CSV 파일이 {csv_file_path}에 저장되었습니다.")

CSV 파일이 data/mydata.csv에 저장되었습니다.


In [28]:
# "mydata.csv" 파일을 업로드
file = client.files.create(
  file=open("data/mydata.csv", "rb"),
  purpose='assistants'
)

# 파일 ID를 사용하여 어시스턴트 생성
assistant = client.beta.assistants.create(
  instructions="당신은 개인 비서입니다. 학생 정보에 관해 질문을 받으면 코드 해석기를 사용하여 CSV 파일에서 세부정보를 가져옵니다. 한국어로 답합니다.",
  model="gpt-4o",
  tools=[{"type": "code_interpreter"}],
  tool_resources={
    "code_interpreter": {
      "file_ids": [file.id]
    }
  }
)

print("어시스턴트가 생성되었습니다.")

어시스턴트가 생성되었습니다.


#### 2. 사용자 질문에 응답하는 코드 인터프리터 코드

In [29]:
thread = client.beta.threads.create(
  messages=[
    {
      "role": "user",
      "content": "Alice 의 나이와 학년은 어떻게 되나요?",
      "attachments": [
        {
          "file_id": file.id,
          "tools": [{"type": "code_interpreter"}]
        }
      ]
    }
  ]
)

In [30]:
# 그런 다음, `stream` SDK 도우미와 `EventHandler` 클래스를 사용하여
# Run을 생성하고 응답을 스트리밍합니다.
with client.beta.threads.runs.stream(
  thread_id=thread.id,
  assistant_id=assistant.id,
  instructions="사용자를 고객님이라고 부르세요.",  # 사용자를 Jane Doe라고 부르고, 프리미엄 계정을 가지고 있다고 지시
  event_handler=EventHandler(),  # EventHandler 클래스 인스턴스를 이벤트 핸들러로 사용
) as stream:
  stream.until_done()  # 스트림이 완료될 때까지 대기


assistant > code_interpreter

import pandas as pd

# Load the uploaded file to see its content
file_path = '/mnt/data/file-9qyVbzN8rkp3kYdavPZXo6jp'
data = pd.read_excel(file_path)
data.head()
assistant > 파일 형식을 식별할 수 없는 이유로 인해 엑셀 파일을 로드하는 데 문제가 발생했습니다. 파일 형식이 엑셀 파일이 아닐 수도 있습니다. 대신에 csv 또는 다른 형식일 수 있습니다.

파일 형식을 추측하여 다시 로드해 보겠습니다.# Try to read the file as a CSV
data_csv = pd.read_csv(file_path)
data_csv.head()
assistant > 업로드해주신 파일은 CSV 형식이며, 데이터는 다음과 같습니다.

```
      name  age grade
0    Alice   14     A
1      Bob   15     B
2  Charlie   13     A
```

Alice의 나이와 학년은 다음과 같습니다:
- 나이: 14
- 학년: A