# OpenAI Assistants 및 파일 API 기반 RAG 애플리케이션

**Assistants API**를 사용하면 개발자는 영구 스레드 및 메시지, 파일, 자동 RAG를 포함하여 LLM 기반 애플리케이션에 필요한 상태 저장 작업을 처리할 수 있는 AI 도우미를 구축할 수 있습니다.

어시스턴트에는 instruction이 있으며 모델, 도구 및 지식을 활용하여 사용자 쿼리에 응답할 수 있습니다. Assistants API는 현재 세 가지 유형의 도구를 지원합니다.

- 코드 해석기
- 검색
- 함수 호출

위에 나열된 OpenAI 호스팅 도구에 대한 'Assistant' 액세스 권한을 부여하면 도구 사용에 추가 비용이 발생합니다.

**RAG**(Retrieval Augmented Generation)는 검색 기반 모델과 생성 모델의 기능을 사용하여 생성된 텍스트의 품질과 관련성을 향상시키는 자연어 처리에 사용되는 기술입니다.

문서 기반 QA 봇은 RAG의 전형적인 사용 사례입니다. 'LangChain' 및 'LlamaIndex'와 같은 주류 LLM 프레임워크는 이러한 RAG 애플리케이션 구축을 지원합니다.

이 튜토리얼에서는 OpenAI `Assistants` 및 `Files` API를 사용하여 RAG 애플리케이션을 개발하는 방법을 보여 드리겠습니다. OpenAI 호스팅 도구인 **`Retrieval`** 사용에 대한 추가 비용을 고려하면 코드가 더 깔끔하고, 솔루션이 더 우아할 수 있으며, 비용이 조금 더 많이 들 수 있습니다.

이 솔루션을 사용하면 다음과 같은 지루한 작업을 처리할 필요가 없습니다.

- 적절한 전략으로 텍스트 분할
- 텍스트 덩어리(text chunks)를 벡터화
- 벡터 데이터 세트 유지
- 유사성 검색 (Similarity search)

In [1]:
import os
import openai
import sys
sys.path.append('./')

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file

openai.api_key  = os.environ['OPENAI_API_KEY']

In [2]:
openai_client = openai.OpenAI()

### 1. 기존 파일 검색

OpenAI Files API를 통해 업로드된 파일은 유지됩니다. 해당 ID를 참조하면 확실히 재사용할 수 있습니다.

이 단계에서는 이미 업로드된 파일을 검색하여 '2023-WilmerHale-VC-Report.pdf' PDF 파일이 있는지 확인합니존재하

그렇다면 삭제하고 다시 업로드해보겠습니다.

In [3]:
# Retrieve the file list

uploaded_files = openai_client.files.list()

In [4]:
uploaded_files.data

[FileObject(id='file-DnfxAX0779HxfCkNxPMCoGTw', bytes=1310948, created_at=1709727376, filename='2023-WilmerHale-VC-Report.pdf', object='file', purpose='assistants', status='processed', status_details=None),
 FileObject(id='file-czuds3Ze4cFJNhbnOWTJ6rRu', bytes=None, created_at=1704856972, filename='b94fe2a5-2c83-4ca9-9d50-64248b420083', object='file', purpose='assistants_output', status='processed', status_details=None),
 FileObject(id='file-QnLwFScZUvBdsQ5EY27nNvPd', bytes=49807, created_at=1704856931, filename='login_screen.png', object='file', purpose='assistants', status='processed', status_details=None),
 FileObject(id='file-mneZNZvJ9txEKsCxVNRk9mV8', bytes=763998, created_at=1704855403, filename='파이썬금융분석.pdf', object='file', purpose='assistants', status='processed', status_details=None),
 FileObject(id='file-2JnJ1Wg4SKHPw0qlYpyw41SG', bytes=763998, created_at=1704855314, filename='파이썬금융분석.pdf', object='file', purpose='assistants', status='processed', status_details=None)]

In [5]:
# Find the file by name

# filename_to_find = '2023-WilmerHale-VC-Report.pdf'
filename_to_find = '파이썬금융분석.pdf'
the_file_id = None

file_objects = list(filter(lambda x: x.filename == filename_to_find, uploaded_files.data))

if len(file_objects) > 0:
  the_file_id = file_objects[0].id

In [6]:
the_file_id

'file-mneZNZvJ9txEKsCxVNRk9mV8'

이미 존재한다면 삭제

In [7]:
if the_file_id:
  delete_status = openai_client.files.delete(the_file_id)

In [8]:
delete_status

FileDeleted(id='file-mneZNZvJ9txEKsCxVNRk9mV8', deleted=True, object='file')

### 2. PDF 파일 업로드

이 PDF 파일은 RAG 애플리케이션의 지식 기반이 됩니다.

In [9]:
file = openai_client.files.create(
  # file=open("2023-WilmerHale-VC-Report.pdf", "rb"),
  file=open('파이썬금융분석.pdf', "rb"),
  purpose='assistants'
)

In [10]:
file

FileObject(id='file-sa2dAFqohSk9OFTv8IOZDxqR', bytes=763998, created_at=1709728660, filename='파이썬금융분석.pdf', object='file', purpose='assistants', status='processed', status_details=None)

### 3. ID로 파일 검색

이는 파일이 성공적으로 업로드되었는지 확인하기 위한 것입니다.

In [11]:
retrieved_file = openai_client.files.retrieve(file.id)
retrieved_file

FileObject(id='file-sa2dAFqohSk9OFTv8IOZDxqR', bytes=763998, created_at=1709728660, filename='파이썬금융분석.pdf', object='file', purpose='assistants', status='processed', status_details=None)

### 4. 어시스턴트 만들기

이 어시스턴트`Retrieval`색' 도구를 사용하여 해당 ID로 업로드된 PDF 파일과 연결됩니다.

In [12]:
assistant = openai_client.beta.assistants.create(
  instructions="Use the file provided as your knowledge base to best respond to customer queries.",
  model="gpt-4-1106-preview",
  tools=[
      { "type": "retrieval" }
    ],
  file_ids=[retrieved_file.id]
)

### 5. 생성된 어시스턴트 검색

어시스턴트 ID로 검색됩니다.

응답에서 예상되는 도구와 파일이 관련되어 있는지 확인해야 합니다.

In [13]:
my_assistant = openai_client.beta.assistants.retrieve(assistant.id)
my_assistant

Assistant(id='asst_Ar9629qoIwOyuU4WzoXjaL1l', created_at=1709728726, description=None, file_ids=['file-sa2dAFqohSk9OFTv8IOZDxqR'], instructions='Use the file provided as your knowledge base to best respond to customer queries.', metadata={}, model='gpt-4-1106-preview', name=None, object='assistant', tools=[ToolRetrieval(type='retrieval')])

In [14]:
my_assistant.file_ids

['file-sa2dAFqohSk9OFTv8IOZDxqR']

### 6. (선택 사항) Assistant 업데이트

생성된 어시스턴트에 도구와 파일이 연결되어 있지 않다는 것을 한 번 알아차렸습니다.

이런 일이 발생하면 '업데이트' 기능을 사용하여 다시 연결하세요.

In [15]:
updated_assistant = openai_client.beta.assistants.update(
  assistant.id,
  tools=[{"type": "retrieval"}],
  file_ids=[retrieved_file.id],
)

updated_assistant

Assistant(id='asst_Ar9629qoIwOyuU4WzoXjaL1l', created_at=1709728726, description=None, file_ids=['file-sa2dAFqohSk9OFTv8IOZDxqR'], instructions='Use the file provided as your knowledge base to best respond to customer queries.', metadata={}, model='gpt-4-1106-preview', name=None, object='assistant', tools=[ToolRetrieval(type='retrieval')])

### 7. 스레드 생성

In [16]:
thread = openai_client.beta.threads.create()
thread

Thread(id='thread_AoYthewducRYq5DzAusEKxPD', created_at=1709728747, metadata={}, object='thread')

### 8. 메시지 작성

메시지 개체를 사용하여 Assistant에게 PDF 파일에서 콘텐츠 아키텍처를 추출하도록 요청하겠습니다.

In [17]:
thread_message = openai_client.beta.threads.messages.create(
  thread_id=thread.id,
  role="user",
  content="시계열 예측에는 어떤 사례가 있는지 알려주세요.",
)
thread_message

ThreadMessage(id='msg_GDIBQEjlERYpq9SkgoausYwv', assistant_id=None, content=[MessageContentText(text=Text(annotations=[], value='시계열 예측에는 어떤 사례가 있는지 알려주세요.'), type='text')], created_at=1709728809, file_ids=[], metadata={}, object='thread.message', role='user', run_id=None, thread_id='thread_AoYthewducRYq5DzAusEKxPD')

### 9. 실행 만들기

'Run'은 LLM에 대한 상호작용을 트리거합니다.

In [18]:
run = openai_client.beta.threads.runs.create(
  thread_id=thread.id,
  assistant_id=updated_assistant.id
)

### 10. 실행 검색

`Run`은 비동기 모드로 수행되므로 ID로 실행 상태를 쿼리해야 합니다.

In [27]:
retrieved_run = openai_client.beta.threads.runs.retrieve(
  thread_id=thread.id,
  run_id=run.id
)
retrieved_run

Run(id='run_VtE4dmUvoYkUnibuCJtXRPXi', assistant_id='asst_Ar9629qoIwOyuU4WzoXjaL1l', cancelled_at=None, completed_at=1709728839, created_at=1709728812, expires_at=None, failed_at=None, file_ids=['file-sa2dAFqohSk9OFTv8IOZDxqR'], instructions='Use the file provided as your knowledge base to best respond to customer queries.', last_error=None, metadata={}, model='gpt-4-1106-preview', object='thread.run', required_action=None, started_at=1709728813, status='completed', thread_id='thread_AoYthewducRYq5DzAusEKxPD', tools=[ToolAssistantToolsRetrieval(type='retrieval')], usage={'prompt_tokens': 7577, 'completion_tokens': 676, 'total_tokens': 8253})

In [28]:
retrieved_run.status

'completed'

### 11. 스레드의 메시지 목록을 검색합니다.

Run이 완료될 때까지 메시지 목록을 검색하고 LLM의 응답인 목록의 최신 메시지를 가져옵니다.

In [29]:
thread_messages = openai_client.beta.threads.messages.list(thread.id)
thread_messages.data

[ThreadMessage(id='msg_MLl7JXSdKD98mIDCRRhEcNFY', assistant_id='asst_Ar9629qoIwOyuU4WzoXjaL1l', content=[MessageContentText(text=Text(annotations=[TextAnnotationFileCitation(end_index=37, file_citation=TextAnnotationFileCitationFileCitation(file_id='file-sa2dAFqohSk9OFTv8IOZDxqR', quote='시계열 예측에는 다음과 같은 사례가 있습니다.\n\n\n⚫ 판매 예측:  회사 또는 제품의 향후 판매를 예측합니다.\n\n\n⚫ 재무 예측:  주가  환율 또는 이자율을 예측합니다.\n\n\n⚫ 기후 예측:  기온  강수량  풍속과 같은 날씨 패턴을 예측합니다.\n\n\n⚫ 에너지 예측:  발전소 및 유틸리티의 에너지 수요  생산 및 가격을 예측합니다.\n\n\n⚫ 의료 예측:  질병 확산  입원율  의료 자원 활용도를 예측합니다.\n\n\n⚫ 교통 예측:  교통 계획을 위한 교통 패턴  혼잡 및 이동 시간을 예측합니다.\n\n\n⚫ 공급망 예측:  원자재  재고 수준 및 생산 일정에 대한 수요를 예측합니다.\n\n\n⚫ 마케팅 예측:  고객 행동  시장 동향 및 광고 효과를 예측합니다.\n\n\n⚫ 농업 예측:  작물 수확량  날씨 패턴 및 시장 가격과 같은 농업 데이터의 미래 추세 \n\n\n및 패턴 예측이 포함됩니다.\n\n\n⚫ 교육 예측:  학생 등록  졸업율 및 교사 인력과 같은 교육 데이터의 미래 추세 및 패\n\n\n턴을 예측합니다.\n\n\n⚫ 여행 예측:  승객 수  항공편 예약 및 호텔 점유율과 같은 여행 관련 데이터의 미래 \n\n\n추세 및 패턴 예측이 포함됩니다'), start_index=27, text='【7†source】', type='file_citation')], value='시계열 예측에 대한 다음과 같은 사례들이 있습

In [30]:
print(thread_messages.data[0].content[0].text.value)

시계열 예측에 대한 다음과 같은 사례들이 있습니다【7†source】:

- **판매 예측**: 회사 또는 제품의 향후 판매를 예측합니다.
- **재무 예측**: 주가, 환율 또는 이자율을 예측합니다.
- **기후 예측**: 기온, 강수량, 풍속과 같은 날씨 패턴을 예측합니다.
- **에너지 예측**: 발전소 및 유틸리티의 에너지 수요, 생산 및 가격을 예측합니다.
- **의료 예측**: 질병 확산, 입원율, 의료 자원 활용도를 예측합니다.
- **교통 예측**: 교통 계획을 위한 교통 패턴, 혼잡 및 이동 시간을 예측합니다.
- **공급망 예측**: 원자재, 재고 수준 및 생산 일정에 대한 수요를 예측합니다.
- **마케팅 예측**: 고객 행동, 시장 동향 및 광고 효과를 예측합니다.
- **농업 예측**: 작물 수확량, 날씨 패턴 및 시장 가격과 같은 농업 데이터의 미래 추세 및 패턴을 예측합니다.
- **교육 예측**: 학생 등록, 졸업율 및 교사 인력과 같은 교육 데이터의 미래 추세 및 패턴을 예측합니다.
- **여행 예측**: 승객 수, 항공편 예약 및 호텔 점유율과 같은 여행 관련 데이터의 미래 추세 및 패턴 예측합니다.
