In [1]:
# 샘플 벡터DB 구축
from langchain_community.document_loaders import WebBaseLoader
from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceBgeEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 블로그 포스트 로드
loader = WebBaseLoader(
    "https://teddylee777.github.io/openai/openai-assistant-tutorial/", encoding="utf-8"
)

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
docs = loader.load_and_split(text_splitter)

# 임베딩 정의
#################
# embedding model
#################
model_name = 'BM-K/KoSimCSE-roberta'
model_kwargs = {'device': 'mps'}
encode_kwargs = {'normalize_embeddings': True}

embeddings_model = HuggingFaceBgeEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)
# 벡터DB 생성
db = FAISS.from_documents(docs, embeddings_model)

# retriever 생성
retriever = db.as_retriever()

# 문서 검색
query = "OpenAI Assistant API의 Functions 사용법에 대해 알려주세요."
relevant_docs = retriever.get_relevant_documents(query)

# 검색된 문서의 개수 출력
len(relevant_docs)


  from .autonotebook import tqdm as notebook_tqdm
No sentence-transformers model found with name BM-K/KoSimCSE-roberta. Creating a new one with MEAN pooling.
  warn_deprecated(


4

In [12]:
for d in docs:
    print(d)

page_content='[Assistants API] Code Interpreter, Retrieval, Functions 활용법 - 테디노트\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\nSkip to primary navigation\nSkip to content\nSkip to footer\n\n\n\n\n\n\n\n          테디노트\n          데이터와 인공지능을 좋아하는 개발자 노트\n\n\n검색\n\n카테고리\n\n태그\n\n연도\n\n강의\n\n어바웃미\n\n\n토글 메뉴\n\n\n\n\n\n\n\n\n\n\n\nHome\n\n\n/\n\nOpenai\n\n\n/\n[Assistants API] Code Interpreter, Retrieval, Functions 활용법\n\n\n\n\n\n\n\n\n🔥알림🔥\n\n    ① 테디노트 유튜브 - \n    구경하러 가기!\n\n    ② LangChain 한국어 튜토리얼\n바로가기 👀\n\n    ③ 랭체인 노트 무료 전자책(wikidocs) \n    바로가기 🙌' metadata={'source': 'https://teddylee777.github.io/openai/openai-assistant-tutorial/', 'title': '[Assistants API] Code Interpreter, Retrieval, Functions 활용법 - 테디노트', 'description': 'OpenAI의 새로운 Assistants API는 상태 유지 대화와 강력한 도구 접근성을 제공합니다. OpenAI Assistants API 튜토리얼: Code Interpreter, Retrieval, Functions 활용법에 대하여 알아보겠습니다.', 'language': 'ko'}
page_content='[Assistants API] Code Interpreter, Retrieval, Functions 활용법\n\

In [10]:
print(docs[0].page_content)

[Assistants API] Code Interpreter, Retrieval, Functions 활용법 - 테디노트


































Skip to primary navigation
Skip to content
Skip to footer







          테디노트
          데이터와 인공지능을 좋아하는 개발자 노트


검색

카테고리

태그

연도

강의

어바웃미


토글 메뉴











Home


/

Openai


/
[Assistants API] Code Interpreter, Retrieval, Functions 활용법








🔥알림🔥

    ① 테디노트 유튜브 - 
    구경하러 가기!

    ② LangChain 한국어 튜토리얼
바로가기 👀

    ③ 랭체인 노트 무료 전자책(wikidocs) 
    바로가기 🙌


In [15]:
relevant_docs

[Document(page_content="INFO:langchain.retrievers.multi_query:Generated queries: ['How can I use the Functions of the OpenAI Assistant API?', 'Can you provide guidance on using the Functions of the OpenAI Assistant API?', 'What are the steps to utilize the Functions of the OpenAI Assistant API?', 'I need help understanding how to use the Functions of the OpenAI Assistant API.', 'Please explain the usage of the Functions in the OpenAI Assistant API.']", metadata={'source': 'https://wikidocs.net/234109', 'title': '06. 다중 쿼리 검색기(MultiQueryRetriever) - <랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷', 'description': '온라인 책을 제작 공유하는 플랫폼 서비스', 'language': 'ko'}),
 Document(page_content='"1. How can I learn about the usage of Functions in the OpenAI Assistant API?\\n2. Can you provide information on how to use Functions in the OpenAI Assistant API?\\n3. What is the proper way to utilize Functions in the OpenAI Assistant API?\\n4. Please explain the usage guidelines for Functions in the OpenAI Assist

In [16]:
for rd in relevant_docs:
    print(rd.page_content)

INFO:langchain.retrievers.multi_query:Generated queries: ['How can I use the Functions of the OpenAI Assistant API?', 'Can you provide guidance on using the Functions of the OpenAI Assistant API?', 'What are the steps to utilize the Functions of the OpenAI Assistant API?', 'I need help understanding how to use the Functions of the OpenAI Assistant API.', 'Please explain the usage of the Functions in the OpenAI Assistant API.']
"1. How can I learn about the usage of Functions in the OpenAI Assistant API?\n2. Can you provide information on how to use Functions in the OpenAI Assistant API?\n3. What is the proper way to utilize Functions in the OpenAI Assistant API?\n4. Please explain the usage guidelines for Functions in the OpenAI Assistant API.\n5. I'm looking for instructions on how to implement Functions in the OpenAI Assistant API."
이전에 생성한 Chain을 MultiQueryRetriever 에 전달하여 retrieve 할 수 있습니다.
logging.getLogger("langchain.retrievers.multi_query").setLevel(logging.INFO)


retriever_fro

# MultiQueryRetriever

In [17]:
from langchain.retrievers.multi_query import MultiQueryRetriever
from langchain_community.llms import GPT4All
from langchain_core.output_parsers import StrOutputParser
from langchain_core.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

##########
# llm 모델
##########
local_path = (
    "./EEVE-Korean-Instruct-10.8B-v1.0-gguf/EEVE-Korean-Instruct-10.8B-v1.0-Q5_K_M.gguf"
)
llm = GPT4All(
    model=local_path,
    callbacks=[StreamingStdOutCallbackHandler()],
    backend="mps", # GPU 설정
    streaming=True,
    verbose=True,
)

# 벡터DB 생성
# db = FAISS.from_documents(docs, embeddings_model)


multiquery_retriever = MultiQueryRetriever.from_llm(  # MultiQueryRetriever를 언어 모델을 사용하여 초기화합니다.
    # 벡터 데이터베이스의 retriever와 언어 모델을 전달합니다.
    retriever=db.as_retriever(),
    llm=llm,
)


In [19]:
multiquery_retriever.invoke("어떻게 langchain 사용하나요?")



1. LangChain을 사용하여 자연어 처리 작업을 수행하는 방법이나, 그 구성 요소와 기능을 이해하는 데 도움이 되는 자료는 어디인가요?
2. LangChain 라이브러리를 활용하여 NLP 애플리케이션을 구축하는 단계별 가이드를 제공해 주실 수 있나요?

[Document(page_content='logging.getLogger("langchain.retrievers.multi_query").setLevel(logging.INFO)\n\n\nretriever_from_llm 객체의 get_relevant_documents 메서드를 호출하여 question과 관련된 문서를 검색합니다.\nunique_docs에는 검색된 관련 문서가 저장됩니다.\nlen(unique_docs)를 통해 검색된 관련 문서의 개수를 확인합니다.\n\n# 질문을 정의합니다.\nquestion = "OpenAI Assistant API의 Functions 사용법에 대해 알려주세요."\n# 문서 검색\nrelevant_docs = multiquery_retriever.get_relevant_documents(query=question)', metadata={'source': 'https://wikidocs.net/234109', 'title': '06. 다중 쿼리 검색기(MultiQueryRetriever) - <랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷', 'description': '온라인 책을 제작 공유하는 플랫폼 서비스', 'language': 'ko'}),
 Document(page_content='# 프롬프트 템플릿을 정의합니다.(5개의 질문을 생성하도록 프롬프트를 작성하였습니다)\nprompt = PromptTemplate.from_template(\n    """You are an AI language model assistant. \nYour task is to generate five different versions of the given user question to retrieve relevant documents from a vector database. \nBy generating multiple perspectives on the user question, your goal is to 

In [20]:
# 질문을 정의합니다.
question = "OpenAI Assistant API의 Functions 사용법에 대해 알려주세요."
# 문서 검색
relevant_docs = multiquery_retriever.get_relevant_documents(query=question)

# 검색된 고유한 문서의 개수를 반환합니다.
print(
    f"===============\n검색된 문서 개수: {len(relevant_docs)}",
    end="\n===============\n",
)

# 검색된 문서의 내용을 출력합니다.
print(relevant_docs[0].page_content)




1. OpenAI Assistant API에서 사용할 수 있는 다양한 기능들에 대한 개요를 제공해 주실 수 있나요?
검색된 문서 개수: 6
INFO:langchain.retrievers.multi_query:Generated queries: ['How can I use the Functions of the OpenAI Assistant API?', 'Can you provide guidance on using the Functions of the OpenAI Assistant API?', 'What are the steps to utilize the Functions of the OpenAI Assistant API?', 'I need help understanding how to use the Functions of the OpenAI Assistant API.', 'Please explain the usage of the Functions in the OpenAI Assistant API.']


# LCEL Chain 활용하는 방법

In [21]:
from langchain_core.runnables import RunnablePassthrough # 데이터를 전달하는 역할
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser # 모델의 출력을 문자열 형태로 파싱하여 최종 결과를 반환

# 프롬프트 템플릿을 정의합니다.(5개의 질문을 생성하도록 프롬프트를 작성하였습니다)
prompt = PromptTemplate.from_template(
    """You are an AI language model assistant. 
Your task is to generate five different versions of the given user question to retrieve relevant documents from a vector database. 
By generating multiple perspectives on the user question, your goal is to help the user overcome some of the limitations of the distance-based similarity search. 
Your response should be a list of values separated by new lines, eg: `foo\nbar\nbaz\n`

#ORIGINAL QUESTION: 
{question}
"""
)

##########
# llm 모델
##########
local_path = (
    "./EEVE-Korean-Instruct-10.8B-v1.0-gguf/EEVE-Korean-Instruct-10.8B-v1.0-Q5_K_M.gguf"
)
llm = GPT4All(
    model=local_path,
    callbacks=[StreamingStdOutCallbackHandler()],
    backend="mps", # GPU 설정
    streaming=True,
    verbose=True,
)

# LLMChain을 생성합니다.
# RunnablePassthrough 데이터를 전달하는 역할
chain = (
            {"question": RunnablePassthrough()} | 
            prompt | 
            llm | 
            StrOutputParser()
            )

# 질문을 정의합니다.
question = "OpenAI Assistant API의 Functions 사용법에 대해 알려주세요."

# 체인을 실행하여 생성된 다중 쿼리를 확인합니다.
multi_queries = chain.invoke({"question": question})
# 결과를 확인합니다.(5개 질문 생성)
multi_queries



1. OpenAI Assistant API에서 사용할 수 있는 기능들에 대한 개요를 제공해 주실 수 있나요?
2. OpenAI Assistant API와 함께 제공되는 다양한 기능에 대해 설명해 줄 수 있나요?
3. OpenAI Assistant API에 내장된 주요 기능과 그 활용 방법에 대해서 안내해 주시겠어요?
4. OpenAI Assistant API의 핵심 기능을 탐색하는 데 도움이 될 예시나 사용법을 제공해 주실 수 있나요?
5. OpenAI Assistant API에서 사용할 수 있는 다양한 기능들에 대해 간략히 설명해 줄 수 있나요, 그리고 그것들을 어떻게 활용할 수 있는지요?

'\n1. OpenAI Assistant API에서 사용할 수 있는 기능들에 대한 개요를 제공해 주실 수 있나요?\n2. OpenAI Assistant API와 함께 제공되는 다양한 기능에 대해 설명해 줄 수 있나요?\n3. OpenAI Assistant API에 내장된 주요 기능과 그 활용 방법에 대해서 안내해 주시겠어요?\n4. OpenAI Assistant API의 핵심 기능을 탐색하는 데 도움이 될 예시나 사용법을 제공해 주실 수 있나요?\n5. OpenAI Assistant API에서 사용할 수 있는 다양한 기능들에 대해 간략히 설명해 줄 수 있나요, 그리고 그것들을 어떻게 활용할 수 있는지요?'

In [23]:
multiquery_retriever = MultiQueryRetriever.from_llm(
    llm=chain, retriever=db.as_retriever()
)

# 결과
relevant_docs = multiquery_retriever.get_relevant_documents(query=question)

# 검색된 고유한 문서의 개수를 반환합니다.
print(
    f"===============\n검색된 문서 개수: {len(relevant_docs)}",
    end="\n===============\n",
)

# 검색된 문서의 내용을 출력합니다.
print(relevant_docs[0].page_content)


검색된 문서 개수: 4
Do you want to report this comment? Report a comment is available for the following situations:
                    
Contains spam or advertising
Contains inappropriate content, such as profanity, libel, or personal information.
If it contains copyrighted material


Please enter the reason for the report.




※ Your report will be forwarded to an administrator who will review it and take appropriate action. Reports are anonymous and your information will not be disclosed.
