In [None]:
# 다중쿼리검색기(MultiQueryRetriever)
#
# 쿼리와 유사한 쿼리를 다수 생성해서, 다양한 관점에서 쿼리하고 쿼리후 나온 결과를 합집합을 구해, 잠재적으로 더 큰 문서집합을 얻도록 하는 방법

In [1]:
# 루트경로에 .env 파일을 만들고, OPENAI_API_KEY='{API_KEY}' 식으로 입력한다.
# API 키를 환경변수로 관리하기 위한 .env설정 파일 로딩
import os
from dotenv import load_dotenv

load_dotenv() # API 키 정보 로드
print(f"[OPENAI_API_KEY]\n{os.environ['OPENAI_API_KEY']}\n")
print(f"[HUGGINGFACEHUB_API_TOKEN]\n{os.environ['HUGGINGFACEHUB_API_TOKEN']}")

[OPENAI_API_KEY]
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

[HUGGINGFACEHUB_API_TOKEN]
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


In [3]:
# 샘플 벡터DB 구축
from langchain_community.document_loaders import WebBaseLoader
from langchain.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import ChatOpenAI
from langchain.retrievers.multi_query import MultiQueryRetriever

# 쿼리에 대한 로깅 설정
# => llm에 의해 생성된 쿼리들을 출력하기 위해 설정함.
import logging
logging.getLogger("langchain.retrievers.multi_query").setLevel(logging.INFO)


# url 블로그 로딩
loader = WebBaseLoader(
    "https://teddylee777.github.io/openai/openai-assistant-tutorial/", 
    encoding="utf-8"
)

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
docs = loader.load_and_split(text_splitter)

# 임베딩 모델 설정
embedding = OpenAIEmbeddings()

# 벡터db 설정 
db = FAISS.from_documents(docs, embedding)

# llm 모델 설정 => 다양한 쿼리를 만들 llm 모델 설정
llm = ChatOpenAI(temperature=0)

# MultiQuery
multiquery_retriever = MultiQueryRetriever.from_llm(
    retriever=db.as_retriever(),         # retriever 설정
    llm=llm,                             # llm 설정 
)

# 문서검색
query = "OpenAI Assistant API의 함수 사용법에 대해 알려주세요."
relevant_docs = multiquery_retriever.get_relevant_documents(query=query)


# 검색된 문서의 문서의 페이지 내용의 길이를 출력합니다.
for i, retrieved_doc in enumerate(relevant_docs): 
    retrieved_doc_len = len(retrieved_doc.page_content)
    print(f"*문서{i+1}의 길이: {retrieved_doc_len}", end="\n")
    # 문서의 일부를 출력합니다.
    print(retrieved_doc.page_content[:100], end="\n\n=====================\n\n")

*문서1의 길이: 257
OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다.


*문서2의 길이: 477
Assistant + tools(도구)
Assistants API의 핵심 기능 중 하나는 Code Interpreter, Retrieval, 그리고 사용자 정의 함수(OpenAI 


*문서3의 길이: 338
가장 강력한 도구로서, Assistant에게 사용자 정의 함수를 지정할 수 있습니다. 이는 Chat Completions API에서의 함수 호출과 매우 유사합니다.


Functi


*문서4의 길이: 450
질문에 답변할 때 Assistant가 제공된 문서나 지식 기반으로 답변할 수 있게하는 기능입니다.


검색은 독점적인 제품 정보나 사용자가 제공한 문서 등 모델 외부의 지식으로 A


*문서5의 길이: 389
# OpenAI API를 사용하기 위한 클라이언트 객체를 생성합니다.
client = OpenAI(api_key=api_key)

# 수학 과외 선생님 역할을 하는 챗봇을 생성합니


