# Assistants API

Assistants API를 사용하면 자체 애플리케이션 내에 AI 도우미를 구축할 수 있습니다. 어시스턴트에는 instruction(지침)이 있으며 모델, 도구 및 파일을 활용하여 사용자 쿼리에 응답할 수 있습니다. Assistants API는 현재 코드 해석기, 파일 검색 및 함수 호출의 세 가지 유형의 도구를 지원합니다.  

Assistants 플레이그라운드(https://platform.openai.com/playground?mode=assistant)를 사용 하거나 아래에 설명된 것과 같이 Assistants API의 기능을 탐색할 수 있습니다.

In [1]:
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv()) # read local .env file

True

In [2]:
from openai import OpenAI
client = OpenAI()

Model = "gpt-4o-mini"

### 코드 해석기 (Code Interpreter)

Assistants가 샌드박스 실행 환경에서 Python 코드를 작성하고 실행할 수 있습니다. 이 도구는 다양한 데이터와 포맷의 파일을 처리할 수 있으며, 데이터와 그래프 이미지가 포함된 파일을 생성할 수 있습니다. 코드 해석기를 사용하면 어시스턴트가 코드를 반복적으로 실행하여 어려운 코드 및 수학 문제를 해결할 수 있습니다. 어시스턴트가 실행에 실패한 코드를 작성하면 코드 실행이 성공할 때까지 다른 코드 실행을 시도하여 이 코드를 반복할 수 있습니다.

### Step 1 : assistant 생성  

- assistant는 model , instructions및 같은 여러 매개변수를 사용하여 사용자의 메시지에 응답하도록 구성할 수 있는 엔터티를 나타냅니다.

Instruction: 어시스턴트와 모델이 어떻게 행동하거나 반응해야 하는지 지시  
Model: 모델 지정   
Tools: API는 OpenAI에서 구축하고 호스팅하는 코드 해석기 및 검색을 지원합니다.  
Functions: 함수 호출을 사용하면 Assistants API에 함수를 설명하고 인수와 함께 호출해야 하는 함수를 지능적으로 반환하도록 할 수 있습니다.  

### 이 예에서는 코드 해석기 도구가 활성화된 개인 수학 교사인 도우미를 만듭니다.  
예) code interpreter가 활성화된 개인 수학 교사 assistant를 생성하여 주어진 수학 문제를 푸는 python code 생성

In [3]:
# assistant 생성
assistant = client.beta.assistants.create(
    name="Math Tutor",
    instructions="당신은 개인 수학 교사입니다. 수학 문제에 답하는 python 코드를 작성하고 실행해 보세요.",
    tools=[{"type": "code_interpreter"}],
    model=Model
)
assistant

Assistant(id='asst_lsZINCgA1q0LERcbqwmvPW2w', created_at=1738883707, description=None, instructions='당신은 개인 수학 교사입니다. 수학 문제에 답하는 python 코드를 작성하고 실행해 보세요.', metadata={}, model='gpt-4o-mini', name='Math Tutor', object='assistant', tools=[CodeInterpreterTool(type='code_interpreter')], response_format='auto', temperature=1.0, tool_resources=ToolResources(code_interpreter=ToolResourcesCodeInterpreter(file_ids=[]), file_search=None), top_p=1.0, reasoning_effort=None)

### Step 2 : Thread 생성

스레드는 사용자와 하나 이상의 Assistant 간의 대화를 나타냅니다. 사용자(또는 AI 애플리케이션)가 어시스턴트와 대화를 시작할 때 스레드를 생성할 수 있습니다.  
사용자가 대화를 시작하자마자 사용자당 하나의 스레드를 생성하는 것이 좋습니다. 메시지를 생성하여 이 스레드에 사용자별 컨텍스트와 파일을 전달합니다.    

In [4]:
# thread 생성
thread = client.beta.threads.create()
thread

Thread(id='thread_sjaKjyDz9OSBgA3cll8ZRTdU', created_at=1738883707, metadata={}, object='thread', tool_resources=ToolResources(code_interpreter=None, file_search=None))

### Step 3 : Thread에 message 추가

사용자나 애플리케이션이 생성한 메시지의 내용은 스레드에 메시지 개체로 추가됩니다. 메시지에는 텍스트와 파일이 모두 포함될 수 있습니다. 스레드에 추가할 수 있는 메시지 수에는 제한이 없습니다. 모델의 컨텍스트 창에 맞지 ​​않는 모든 컨텍스트를 스마트하게 자릅니다. 어시스턴트 API를 사용하면 특정 RUN에 대해 모델에 전달되는 입력 토큰 수에 대한 제어를 위임합니다. 즉, 경우에 따라 어시스턴트 실행 비용에 대한 제어 권한이 줄어들지만 복잡성을 처리할 필요는 없습니다. 

In [5]:
# thread에 message 추가
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    #content="I need to solve the equation `3x + 11 = 14`. Can you help me?"
    content="방정식 `3x + 11 = 14`를 풀려고해. 도와줘."
)

message

Message(id='msg_1ZPcY1HfiH5h30Ru4ZC3L8yZ', assistant_id=None, attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='방정식 `3x + 11 = 14`를 풀려고해. 도와줘.'), type='text')], created_at=1738883708, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='user', run_id=None, status=None, thread_id='thread_sjaKjyDz9OSBgA3cll8ZRTdU')

In [6]:
vars(message)

{'id': 'msg_1ZPcY1HfiH5h30Ru4ZC3L8yZ',
 'assistant_id': None,
 'attachments': [],
 'completed_at': None,
 'content': [TextContentBlock(text=Text(annotations=[], value='방정식 `3x + 11 = 14`를 풀려고해. 도와줘.'), type='text')],
 'created_at': 1738883708,
 'incomplete_at': None,
 'incomplete_details': None,
 'metadata': {},
 'object': 'thread.message',
 'role': 'user',
 'run_id': None,
 'status': None,
 'thread_id': 'thread_sjaKjyDz9OSBgA3cll8ZRTdU',
 '_request_id': 'req_54d23538db0aec866c7a6f5bf0d94cf3',
 '__exclude_fields__': {'__exclude_fields__', '_request_id'}}

### Step 4 : Run 생성

모든 사용자 메시지가 스레드에 추가되면 특정 Assistant를 사용하여 스레드를 Run할 수 있습니다. Run을 생성하면 Assistant와 관련된 모델 및 도구를 사용하여 응답을 생성합니다. 이러한 응답은 스레드에 assistant메시지로 추가됩니다.

| 방식                          | 응답 속도       | 구현 난이도 | 사용 시점                   | 특징                              | 선택 기준 |
|------------------------------|--------------|----------|--------------------------|----------------------------------|------------------------------|
| **Streaming (`stream()`)**   | 빠름 (즉시 응답) | 복잡함     | 실시간 응답이 필요한 경우      | 이벤트 기반 응답, 자연스러운 대화 | ✅ 대화형 챗봇처럼 실시간 응답이 중요한 경우  |
|                              |              |          |                          |                                  | ✅ 결과를 빠르게 부분적으로 보여줘야 하는 경우 |
|                              |              |          |                          |                                  | ✅ API 요청이 오래 걸리는 작업을 실행하는 경우 (예: 코드 실행, 데이터 분석 등) |
| **Polling (`create_and_poll()`)** | 느림 (완료 후 응답) | 간단함     | 전체 결과가 필요할 때          | 한 번에 모든 결과를 가져옴       | ✅ 응답을 한 번에 처리해야 하는 경우 (예: 로그 분석, 문서 요약 등) |
|                              |              |          |                          |                                  | ✅ 실시간 응답이 필요하지 않은 백그라운드 작업 |
|                              |              |          |                          |                                  | ✅ 간단한 API 호출이 필요한 경우 |
 |


### 방법 1 - streaming 방식
OpenAI의 AssistantEventHandler를 사용하여 Run을 만들고 응답을 스트리밍할 수 있습니다.

In [7]:
from typing_extensions import override
from openai import AssistantEventHandler
 
# 먼저, 이벤트 핸들러 클래스(EventHandler)를 생성하여
# 응답 스트림에서 이벤트를 어떻게 처리할지 정의합니다.
class EventHandler(AssistantEventHandler):    
  # 텍스트 생성이 완료되었을 때 호출되는 메서드
  @override
  def on_text_created(self, text) -> None:
    print(f"\nassistant-1 > ", end="", flush=True)
      
  # 텍스트 생성 중간에 호출되는 메서드. 점진적으로 delta.value 출력
  @override
  def on_text_delta(self, delta, snapshot):
    print(delta.value, end="", flush=True)
      
  # 도구 호출이 생성되었을 때 호출되는 메서드
  def on_tool_call_created(self, tool_call):
    print(f"\nassistant-2 > {tool_call.type}\n", flush=True)  #호출한 도구 출력
  
  # 도구 호출 중간에 호출되는 메서드
  def on_tool_call_delta(self, delta, snapshot):
    if delta.type == 'code_interpreter':
      # 파이썬 코드
      if delta.code_interpreter.input:
        print(delta.code_interpreter.input, end="", flush=True)
      # 파이썬 코드 실행 결과
      if delta.code_interpreter.outputs:
        print(f"\n\noutput >", flush=True)
        for output in delta.code_interpreter.outputs:
          # 실행된 코드의 출력을 로그 형태로 출력
          if output.type == "logs":
            print(f"\n{output.logs}", flush=True)

In [8]:
# 그런 다음, `stream` SDK 도우미와 `EventHandler` 클래스를 사용하여
# Run을 생성하고 응답을 스트리밍합니다.
with client.beta.threads.runs.stream(
  thread_id=thread.id,
  assistant_id=assistant.id,
  instructions="Python code를 생성해 주세요.",  # 사용자에 대한 지시
  event_handler=EventHandler(),  # EventHandler 클래스 인스턴스를 이벤트 핸들러로 사용
) as stream:
  stream.until_done()  # 스트림이 완료될 때까지 대기


assistant-2 > code_interpreter

import sympy as sp

# 변수 정의
x = sp.symbols('x')

# 방정식 정의
equation = sp.Eq(3*x + 11, 14)

# 방정식 풀기
solution = sp.solve(equation, x)
solution
assistant-1 > 방정식 \( 3x + 11 = 14 \)의 해는 \( x = 1 \)입니다.

### 방법 2 - polling 방식 
RUN은 비동기식입니다. 즉, 터미널 상태에 도달할 때까지 Run 개체를 폴링하여 상태를 모니터링해야 한다는 뜻입니다. 'create_and_poll' SDK는 Run 생성과 완료 폴링을 모두 지원합니다.

In [9]:
# `create_and_poll` 메서드를 사용하여 새로운 실행(run)을 생성하고 해당 실행이 완료될 때까지 폴링합니다.
run = client.beta.threads.runs.create_and_poll(
  thread_id=thread.id,  # 실행할 스레드의 ID
  assistant_id=assistant.id,  # 실행할 어시스턴트의 ID
  instructions="풀이 과정을 단계적으로 설명해줘"  # 어시스턴트에게 제공할 지시사항
)

vars(run)

{'id': 'run_SSeCelH1rZyZdbg3T6sppHqG',
 'assistant_id': 'asst_lsZINCgA1q0LERcbqwmvPW2w',
 'cancelled_at': None,
 'completed_at': 1738883747,
 'created_at': 1738883740,
 'expires_at': None,
 'failed_at': None,
 'incomplete_details': None,
 'instructions': '풀이 과정을 단계적으로 설명해줘',
 'last_error': None,
 'max_completion_tokens': None,
 'max_prompt_tokens': None,
 'metadata': {},
 'model': 'gpt-4o-mini',
 'object': 'thread.run',
 'parallel_tool_calls': True,
 'required_action': None,
 'response_format': 'auto',
 'started_at': 1738883741,
 'status': 'completed',
 'thread_id': 'thread_sjaKjyDz9OSBgA3cll8ZRTdU',
 'tool_choice': 'auto',
 'tools': [CodeInterpreterTool(type='code_interpreter')],
 'truncation_strategy': TruncationStrategy(type='auto', last_messages=None),
 'usage': Usage(completion_tokens=219, prompt_tokens=256, total_tokens=475, prompt_token_details={'cached_tokens': 0}, completion_tokens_details={'reasoning_tokens': 0}),
 'temperature': 1.0,
 'top_p': 1.0,
 'tool_resources': {},
 'r

In [10]:
# 실행 상태 확인
if run.status == 'completed': 
  messages = client.beta.threads.messages.list(
    thread_id=thread.id
  )
  print(messages)
else:
  print(run.status)

SyncCursorPage[Message](data=[Message(id='msg_4pnuoHePc6DKbIXwvoQxOTnU', assistant_id='asst_lsZINCgA1q0LERcbqwmvPW2w', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='이 방정식을 푸는 과정을 단계적으로 설명할게요.\n\n1. **방정식 상태**: \n   \\[\n   3x + 11 = 14\n   \\]\n\n2. **변수 정리**: \n   방정식의 양 변에서 \\( 11 \\)을 빼줍니다:\n   \\[\n   3x + 11 - 11 = 14 - 11\n   \\]\n\n3. **정리**:\n   \\[\n   3x = 3\n   \\]\n\n4. **변수에 대한 식 만들기**:\n   \\( 3 \\)으로 양 변을 나누어 변수 \\( x \\)를 구합니다:\n   \\[\n   x = \\frac{3}{3}\n   \\]\n\n5. **최종 해**:\n   \\[\n   x = 1\n   \\]\n\n따라서 방정식 \\( 3x + 11 = 14 \\)의 해는 \\( x = 1 \\)입니다.'), type='text')], created_at=1738883742, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant', run_id='run_SSeCelH1rZyZdbg3T6sppHqG', status=None, thread_id='thread_sjaKjyDz9OSBgA3cll8ZRTdU'), Message(id='msg_b77yq1L4t5gqIlFOfuTibRAH', assistant_id='asst_lsZINCgA1q0LERcbqwmvPW2w', attachments=[], completed_at=None, content

In [11]:
messages.data[0]

Message(id='msg_4pnuoHePc6DKbIXwvoQxOTnU', assistant_id='asst_lsZINCgA1q0LERcbqwmvPW2w', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='이 방정식을 푸는 과정을 단계적으로 설명할게요.\n\n1. **방정식 상태**: \n   \\[\n   3x + 11 = 14\n   \\]\n\n2. **변수 정리**: \n   방정식의 양 변에서 \\( 11 \\)을 빼줍니다:\n   \\[\n   3x + 11 - 11 = 14 - 11\n   \\]\n\n3. **정리**:\n   \\[\n   3x = 3\n   \\]\n\n4. **변수에 대한 식 만들기**:\n   \\( 3 \\)으로 양 변을 나누어 변수 \\( x \\)를 구합니다:\n   \\[\n   x = \\frac{3}{3}\n   \\]\n\n5. **최종 해**:\n   \\[\n   x = 1\n   \\]\n\n따라서 방정식 \\( 3x + 11 = 14 \\)의 해는 \\( x = 1 \\)입니다.'), type='text')], created_at=1738883742, incomplete_at=None, incomplete_details=None, metadata={}, object='thread.message', role='assistant', run_id='run_SSeCelH1rZyZdbg3T6sppHqG', status=None, thread_id='thread_sjaKjyDz9OSBgA3cll8ZRTdU')

In [12]:
messages.data[0].role

'assistant'

In [13]:
messages.data[0].content[0].text.value

'이 방정식을 푸는 과정을 단계적으로 설명할게요.\n\n1. **방정식 상태**: \n   \\[\n   3x + 11 = 14\n   \\]\n\n2. **변수 정리**: \n   방정식의 양 변에서 \\( 11 \\)을 빼줍니다:\n   \\[\n   3x + 11 - 11 = 14 - 11\n   \\]\n\n3. **정리**:\n   \\[\n   3x = 3\n   \\]\n\n4. **변수에 대한 식 만들기**:\n   \\( 3 \\)으로 양 변을 나누어 변수 \\( x \\)를 구합니다:\n   \\[\n   x = \\frac{3}{3}\n   \\]\n\n5. **최종 해**:\n   \\[\n   x = 1\n   \\]\n\n따라서 방정식 \\( 3x + 11 = 14 \\)의 해는 \\( x = 1 \\)입니다.'

In [14]:
values = [(messages.data[i].role, messages.data[i].content[0].text.value) for i in range(len(messages.data)-1, -1, -1)]

for role, value in values:
    print(f"role: {role}")
    print(value)
    print(150*"-")

role: user
방정식 `3x + 11 = 14`를 풀려고해. 도와줘.
------------------------------------------------------------------------------------------------------------------------------------------------------
role: assistant
방정식 \( 3x + 11 = 14 \)의 해는 \( x = 1 \)입니다.
------------------------------------------------------------------------------------------------------------------------------------------------------
role: assistant
이 방정식을 푸는 과정을 단계적으로 설명할게요.

1. **방정식 상태**: 
   \[
   3x + 11 = 14
   \]

2. **변수 정리**: 
   방정식의 양 변에서 \( 11 \)을 빼줍니다:
   \[
   3x + 11 - 11 = 14 - 11
   \]

3. **정리**:
   \[
   3x = 3
   \]

4. **변수에 대한 식 만들기**:
   \( 3 \)으로 양 변을 나누어 변수 \( x \)를 구합니다:
   \[
   x = \frac{3}{3}
   \]

5. **최종 해**:
   \[
   x = 1
   \]

따라서 방정식 \( 3x + 11 = 14 \)의 해는 \( x = 1 \)입니다.
------------------------------------------------------------------------------------------------------------------------------------------------------


## 코드 해석기를 이용한 파일 내용 분석
Assistant 에 전달된 파일은 이 Assistant를 사용하는 모든 Run에서 액세스할 수 있습니다.  

다음은 OpenAI의 code interpreter 도구를 사용하여 업로드된 mydata.csv 파일을 바탕으로 사용자에게 응답하는 샘플 코드입니다. 이 코드는 사용자가 특정 질문을 할 때 CSV 파일을 읽고, 해당 질문에 맞는 응답을 제공하는 예제입니다.

가정: 사용자가 학생의 이름을 입력하면 해당 학생의 나이와 성적을 반환하는 예제

#### 1. CSV 파일 업로드 및 어시스턴트 생성 코드

In [17]:
import pandas as pd

# 예시 데이터 생성
data = {
    "name": ["Alice", "Bob", "Charlie"],
    "age": [14, 15, 13],
    "grade": ["A", "B", "A"]
}

# 데이터프레임 생성
df = pd.DataFrame(data)

# CSV 파일로 저장
csv_file_path = "data/mydata.csv"
df.to_csv(csv_file_path, index=False)

print(f"CSV 파일이 {csv_file_path}에 저장되었습니다.")

CSV 파일이 data/mydata.csv에 저장되었습니다.


In [18]:
# "mydata.csv" 파일을 업로드
file = client.files.create(
  file=open("data/mydata.csv", "rb"),
  purpose='assistants'
)

# 파일 ID를 사용하여 어시스턴트 생성
assistant = client.beta.assistants.create(
  instructions="당신은 개인 비서입니다. 학생 정보에 관해 질문을 받으면 코드 해석기를 사용하여 CSV 파일에서 세부정보를 가져옵니다. 한국어로 답합니다.",
  model=Model,
  tools=[{"type": "code_interpreter"}],
  tool_resources={
    "code_interpreter": {
      "file_ids": [file.id]
    }
  }
)

print("어시스턴트가 생성되었습니다.")

어시스턴트가 생성되었습니다.


#### 2. 사용자 질문에 응답하는 코드 인터프리터 코드

In [19]:
thread = client.beta.threads.create(
  messages=[
    {
      "role": "user",
      "content": "Alice 의 나이와 학년은 어떻게 되나요?",
      "attachments": [
        {
          "file_id": file.id,
          "tools": [{"type": "code_interpreter"}]
        }
      ]
    }
  ]
)

In [20]:
# 그런 다음, `stream` SDK 도우미와 `EventHandler` 클래스를 사용하여
# Run을 생성하고 응답을 스트리밍합니다.
with client.beta.threads.runs.stream(
  thread_id=thread.id,
  assistant_id=assistant.id,
  instructions="사용자를 고객님이라고 부르세요.",  # 사용자를 Jane Doe라고 부르고, 프리미엄 계정을 가지고 있다고 지시
  event_handler=EventHandler(),  # EventHandler 클래스 인스턴스를 이벤트 핸들러로 사용
) as stream:
  stream.until_done()  # 스트림이 완료될 때까지 대기


assistant-2 > code_interpreter

# 우선 업로드된 파일을 확인해 보겠습니다.
file_path = '/mnt/data/file-ScC9bkD2LKvXvS9b4qmaGj'

# 파일의 내용을 읽어보겠습니다.
with open(file_path, 'r') as file:
    file_contents = file.read()

file_contents
assistant-1 > 업로드된 파일의 내용은 다음과 같습니다:

```
name,age,grade
Alice,14,A
Bob,15,B
Charlie,13,A
```

이 파일에 따르면, Alice의 나이는 14살이고 학년은 A입니다.