In [None]:
# RAG 예제
# => 문서를 벡터화 하여 질문에 대한 답변하는 예

# 루트경로에 .env 파일을 만들고, OPENAI_API_KEY='{API_KEY}' 식으로 입력한다.
# API 키를 환경변수로 관리하기 위한 .env설정 파일 로딩
import os
from dotenv import load_dotenv

load_dotenv() # API 키 정보 로드
print(f"[OPENAI_API_KEY]\n{os.environ['OPENAI_API_KEY']}\n")
print(f"[HUGGINGFACEHUB_API_TOKEN]\n{os.environ['HUGGINGFACEHUB_API_TOKEN']}\n")
print(f"[LANGCHAIN_API_KEY]\n{os.environ['LANGCHAIN_API_KEY']}\n")

#---------------------------------------------------------------------------
# 디버깅을 위해 LangSmith 설정
# LangChain으로 구축한 애플리케이션은 여러 단계에 걸쳐 LLM 호출을 여러 번 사용하게 됩니다. 
# 이러한 애플리케이션이 점점 더 복잡해짐에 따라, 체인이나 에이전트 내부에서 정확히 무슨 일이 일어나고 있는지 조사할 수 있는 능력이 매우 중요해집니다. 
# 이를 위한 최선의 방법은 LangSmith를 사용하는 것입니다.
#
# LangSmith가 필수는 아니지만, 유용합니다. LangSmith를 사용하고 싶다면, 
# https://smith.langchain.com/ 링크에서 가입한 후, API Keys 발급 받고 아래 처럼 .env 환경변수 파일에 추가.
# LANGCHAIN_API_KEY = 'lsv2_pt_xxx'
#
# langSmith 사이트에 프로젝트명 LANGCHAIN_PROJECT 에 해당하는 Test01 새로 추가 
#---------------------------------------------------------------------------
import os

# 디버깅을 위한 프로젝트명을 기입합니다.
os.environ["LANGCHAIN_PROJECT"] = "RAG_Test"

# tracing 을 위해서는 "true"로 설정
os.environ["LANGCHAIN_TRACING_V2"] = "true"

os.environ["LANGCHAIN_ENDPOINT"]="https://api.smith.langchain.com"

In [None]:
# 1. PDF 문서 로딩
from langchain.document_loaders import PyPDFLoader

# PDF 파일 로드. 
file_path = "../data/SPRI_AI_Brief_2023년12월호_F.pdf"
loader = PyPDFLoader(file_path=file_path)

# 2. 문서분할
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50)
split_docs = loader.load_and_split(text_splitter=text_splitter)
print(f'*문서 Len: {len(split_docs)}')
print(split_docs[1].page_content)

In [None]:
# 3. 임베딩 및 벡터 저장소 및 리트리버 설정
from langchain_community.vectorstores import FAISS
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain.retrievers import BM25Retriever, EnsembleRetriever

# 임베딩 모델 정의
embedding = OpenAIEmbeddings()

# FAISS 벡터저장소와 리트리버 정의
k=3
faiss_vectorstore = FAISS.from_documents(documents=split_docs, embedding=embedding)
faiss_retriever = faiss_vectorstore.as_retriever(search_kwargs={"k": k})

# BM25 리트리버 생성
bm25_retriever = BM25Retriever.from_documents(split_docs)
bm25_retriever.k = k

# FAISS 벡터 리트리버와 BM25 리트리버 앙상블 시킴
# =>  Reciprocal Rank Fusion 알고리즘 기반으로 순위 재 조정됨.
ensemble_retriever = EnsembleRetriever(
    retrievers=[bm25_retriever, faiss_retriever], weights=[0.5, 0.5]
)


In [None]:
# 4. 프롬프트 생성
from langchain import hub

prompt = hub.pull("rlm/rag-prompt")
print(prompt)
print()
print(prompt.messages[0].prompt.template)

In [None]:
# 5. LLM 생성
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)


In [None]:
# 6. 체인 생성
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

# 검색된 문서 결과를 하나의 문단으로 합쳐줌.
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# 체인 생성
reg_chain = (
    {"context": ensemble_retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)


In [10]:
# 7. 체인 실행
question = "sLLM 모델이란 무엇인지 설명해주세요"
response = reg_chain.invoke(question)

print(f"[HUMAN]\n{question}\n")
print(f"[AI]\n{response}")


[HUMAN]
sLLM 모델이란 무엇인지 설명해주세요

[AI]
알리바바 클라우드가 최신 LLM 모델인 '통이치엔원 2.0'을 공개했으며, 이 모델은 복잡한 지침 이해, 광고문구 작성, 추론, 암기 등에서 성능이 향상되었습니다. '통이치엔원 2.0'은 다양한 벤치마크 테스트에서 주요 AI 모델을 능가하며, 산업별로 특화된 생성 AI 모델을 공개하는 올인원 AI 모델 구축 플랫폼도 출시되었습니다. 해당 모델은 알리바바 클라우드의 웹사이트와 모바일 앱을 통해 대중에 제공되며, 개발자는 API를 통해 사용할 수 있습니다.


## [langsmith 사이트](http://smith.langchain.com)에서 RAG_Test 프로젝트 확인

![image.png](attachment:6e1c5a01-6b80-4387-83dd-73366eadca65.png)