## **RAG 정복하기**

### **RAG 구축하기 – 기본적인 QA 체인 구성**

**[필요한 라이브러리 호출 및 API키 설정]**

In [1]:
from langchain import hub
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_openai import ChatOpenAI
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

import os
os.environ["OPENAI_API_KEY"] = "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"

**[문서 로드/분할 및 벡터 임베딩]**

In [2]:
#헌법 PDF 파일 로드
loader = PyPDFLoader(r"C:\Users\gram\Downloads\대한민국헌법(헌법)(제00010호)(19880225).pdf")
pages = loader.load_and_split()

#PDF 파일을 1000자 청크로 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
docs = text_splitter.split_documents(pages)

#ChromaDB에 청크들을 벡터 임베딩으로 저장(OpenAI 임베딩 모델 활용)
vectorstore = Chroma.from_documents(docs, OpenAIEmbeddings(model = 'text-embedding-3-small'))
retriever = vectorstore.as_retriever()

**[프롬프트와 모델 선언]**

In [3]:
#GPT 3.5 모델 선언
llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

#Langchain Hub에서 RAG 프롬프트 호출
prompt = hub.pull("rlm/rag-prompt")

#Retriever로 검색한 유사 문서의 내용을 하나의 string으로 결합
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

In [4]:
prompt

ChatPromptTemplate(input_variables=['context', 'question'], metadata={'lc_hub_owner': 'rlm', 'lc_hub_repo': 'rag-prompt', 'lc_hub_commit_hash': '50442af133e61576e74536c6556cefe1fac147cad032f4377b60c436e6cdcb6e'}, messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['context', 'question'], template="You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.\nQuestion: {question} \nContext: {context} \nAnswer:"))])

In [5]:
prompt.messages

[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['context', 'question'], template="You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.\nQuestion: {question} \nContext: {context} \nAnswer:"))]

**[Chain 구축]**

In [6]:
rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

In [7]:
answer = rag_chain.invoke("국회의원의 의무는 뭐야?")
print(answer)

국회의원은 청렴의 의무가 있고, 국가이익을 우선하여 양심에 따라 직무를 행해야 합니다. 국회의원은 지위를 남용하여 국가ㆍ공공단체 또는 기업체와의 계약이나 그 처분에 의하여 재산상의 권리ㆍ이익 또는 직위를 취득하거나 타인을 위하여 그 취득을 알선할 수 없습니다. 국회의원은 직무상 행한 발언과 표결에 관하여 국회 외에서 책임을 지지 않습니다.


- Chain 구조 출력

In [8]:
rag_chain.get_graph().print_ascii()

           +---------------------------------+         
           | Parallel<context,question>Input |         
           +---------------------------------+         
                    **               **                
                 ***                   ***             
               **                         **           
+----------------------+              +-------------+  
| VectorStoreRetriever |              | Passthrough |  
+----------------------+              +-------------+  
                    **               **                
                      ***         ***                  
                         **     **                     
           +----------------------------------+        
           | Parallel<context,question>Output |        
           +----------------------------------+        
                             *                         
                             *                         
                             *                  

### **RAG 구축하기 – Memory**

**[문서 로드-분할-벡터 저장-Retreiver 생성]**

In [9]:
from langchain import hub
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import Chroma
from langchain_core.runnables import RunnablePassthrough, RunnableParallel
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables.history import BaseChatMessageHistory, RunnableWithMessageHistory

# PDF 파일 로드 및 처리
loader = PyPDFLoader(r"C:\Users\gram\Downloads\대한민국헌법(헌법)(제00010호)(19880225).pdf")

# 1,000자씩 분할하여 Document 객체 형태로 docs에 저장
pages = loader.load_and_split()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(pages)

# Chroma 벡터 저장소 설정 및 retriever 생성
vectorstore = Chroma.from_documents(docs, OpenAIEmbeddings(model='text-embedding-3-small'))
retriever = vectorstore.as_retriever()

**[채팅 히스토리와 사용자 질문 통합]**

In [10]:
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

# Define the contextualize question prompt
contextualize_q_system_prompt = """Given a chat history and the latest user question \
which might reference context in the chat history, formulate a standalone question \
which can be understood without the chat history. Do NOT answer the question, \
just reformulate it if needed and otherwise return it as is."""

contextualize_q_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", contextualize_q_system_prompt),
        MessagesPlaceholder("chat_history"),
        ("human", "{input}"),
    ]
)
history_aware_retriever = create_history_aware_retriever(llm, retriever, contextualize_q_prompt)

In [12]:
from langchain_core.messages import AIMessage, HumanMessage

contextualize_q_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", contextualize_q_system_prompt),
        MessagesPlaceholder("chat_history"),
        ("human", "{input}"),
    ]
)

chat_history = [
    HumanMessage(content='대통령의 임기는 몇년이야?'),
    AIMessage(content='대통령의 임기는 5년입니다.')
]

contextualize_q_prompt.invoke({"input":"국회의원은?", "chat_history" : chat_history})

ChatPromptValue(messages=[SystemMessage(content='Given a chat history and the latest user question which might reference context in the chat history, formulate a standalone question which can be understood without the chat history. Do NOT answer the question, just reformulate it if needed and otherwise return it as is.'), HumanMessage(content='대통령의 임기는 몇년이야?'), AIMessage(content='대통령의 임기는 5년입니다.'), HumanMessage(content='국회의원은?')])

In [13]:
history_aware_retriever = create_history_aware_retriever(llm, retriever, contextualize_q_prompt)
result = history_aware_retriever.invoke({"input":"국회의원은?", "chat_history" : chat_history})
for i in range(len(result)):
    print(f"{i+1}번째 유사 청크")
    print(result[i].page_content[:250])
    print("-"*100)

1번째 유사 청크
법제처                                                            5                                                       국가법령정보센터
대한민국헌법 
③국회의원의 선거구와 비례대표제 기타 선거에 관한 사항은 법률로 정한다.
 
제42조 국회의원의 임기는 4년으로 한다.
 
제43조 국회의원은 법률이 정하는 직을 겸할 수 없다.
 
제44조 ①국회의원은 
----------------------------------------------------------------------------------------------------
2번째 유사 청크
법제처                                                            5                                                       국가법령정보센터
대한민국헌법 
③국회의원의 선거구와 비례대표제 기타 선거에 관한 사항은 법률로 정한다.
 
제42조 국회의원의 임기는 4년으로 한다.
 
제43조 국회의원은 법률이 정하는 직을 겸할 수 없다.
 
제44조 ①국회의원은 
----------------------------------------------------------------------------------------------------
3번째 유사 청크
④헌법재판소의 장은 국회의 동의를 얻어 재판관 중에서 대통령이 임명한다.
 
제112조 ①헌법재판소 재판관의 임기는 6년으로 하며, 법률이 정하는 바에 의하여 연임할 수 있다.
②헌법재판소 재판관은 정당에 가입하거나 정치에 관여할 수 없다.
③헌법재판소 재판관은 탄핵 또는 금고 이상의 형의 선고에 의하지 아니하고는 파면되지 아니한다.
 
제113조 ①헌법재판소에서 법률의 위헌결정, 탄핵의 결정, 정당해산의 결정 또는 헌법소원에 관한 인용결정을 
---------------

**[RAG 체인 구축]**

In [14]:
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain

qa_system_prompt = """You are an assistant for question-answering tasks. \
Use the following pieces of retrieved context to answer the question. \
If you don't know the answer, just say that you don't know. \
Use three sentences maximum and keep the answer concise.\

{context}"""
qa_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", qa_system_prompt),
        MessagesPlaceholder("chat_history"),
        ("human", "{input}"),
    ]
)


question_answer_chain = create_stuff_documents_chain(llm, qa_prompt)

rag_chain = create_retrieval_chain(history_aware_retriever, question_answer_chain)

**[RAG 체인 사용 방법 및 채팅 히스토리 기록]**

In [15]:
from langchain_core.messages import HumanMessage
#채팅 히스토리를 적재하기 위한 리스트
chat_history = []

question = "대통령의 임기는 몇년이야?"
#첫 질문에 답변하기 위한 rag_chain 실행
ai_msg_1 = rag_chain.invoke({"input": question, "chat_history": chat_history})
#첫 질문과 답변을 채팅 히스토리로 저장
chat_history.extend([HumanMessage(content=question), ai_msg_1["answer"]])

second_question = "국회의원은?"
#두번째 질문 입력 시에는 첫번째 질문-답변이 저장된 chat_history가 삽입됨
ai_msg_2 = rag_chain.invoke({"input": second_question, "chat_history": chat_history})

print(ai_msg_2["answer"])

국회의원의 임기는 4년으로 정해져 있습니다. 국회의원은 법률이 정하는 직을 겸할 수 없습니다. 현행범인인 경우를 제외하고는 회기 중 국회의 동의 없이 체포 또는 구금되지 않습니다.


**[채팅 세션별 기록 자동 저장 RAG 체인 구축]**

In [16]:
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import BaseChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory

#채팅 세션별 기록 저장 위한 Dictionary 선언
store = {}

#주어진 session_id 값에 매칭되는 채팅 히스토리 가져오는 함수 선언
def get_session_history(session_id: str) -> BaseChatMessageHistory:
    if session_id not in store:
        store[session_id] = ChatMessageHistory()
    return store[session_id]


#RunnableWithMessageHistory 모듈로 rag_chain에 채팅 기록 세션별로 자동 저장 기능 추가
conversational_rag_chain = RunnableWithMessageHistory(
    rag_chain,
    get_session_history,
    input_messages_key="input",
    history_messages_key="chat_history",
    output_messages_key="answer",
)

In [17]:
conversational_rag_chain.invoke(
    {"input": "대통령의 임기는 몇년이야?"},
    config={
        "configurable": {"session_id": "240510101"}
    },  # constructs a key "abc123" in `store`.
)["answer"]

'대통령의 임기는 5년으로 하며, 중임할 수 없습니다.'

In [18]:
conversational_rag_chain.invoke(
    {"input": "국회의원은?"},
    config={"configurable": {"session_id": "240510101"}},
)["answer"]


'국회의원의 임기는 4년으로 하며, 법률이 정하는 직을 겸할 수 없습니다.'

### **Open Source LLM으로 RAG 시스템 구축하기**

**책에 명시된 Ollama 세팅 및 EEVE 모델 다운로드가 완료되어야 실행 가능한 셀입니다.**

In [19]:
from langchain_community.chat_models import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

llm = ChatOllama(model="EEVE-Korean-10.8B:latest")
prompt = ChatPromptTemplate.from_template("{topic}에 대한 짧은 농담을 들려주세요. ")

chain = prompt | llm | StrOutputParser()

print(chain.invoke({"topic": "우주여행"}))

알겠어요, 우주와 관련된 재미있는 이야기를 하나 해드릴게요:

옛날 어느 별자리에서, 외계 행성인 플라톤티아가 있었습니다. 그 행성은 매우 거대하고 가스 성분으로 이루어져 있어서, 거주 가능한 생명체는 존재하지 않았습니다. 하지만 그곳에는 천문학에 관심이 많은 호기심 많은 외계생명체들이 살고 있었어요. 그들은 우주를 여행하며 다양한 별과 행성을 연구하는 것을 좋아했습니다.

어느 날, 플라톤티아의 천문대는 가장 근접한 별로 향하던 중 이상한 신호를 포착했습니다. 그것은 마치 우주의 메아리처럼 들렸죠. 신호는 점점 강해져서 외계생명체들은 그 출처로 가보기로 결정했습니다. 그들은 곧 신호가 발신되는 원천을 찾아냈는데, 바로 작은 우주선이었습니다.

우주선의 주인인 외계인은 지구에서 온 인간이었어요! 그는 최초의 유인 달 착륙 임무에 참가한 우주비행사였습니다. 그는 달 표면에 착륙했을 때 우연히 신호를 방송했는데, 그것이 플라톤티아 행성에 있는 천문대까지 도달하게 된 것이죠.

우주선 안에서 외계인들은 지구라는 행성과 그 생명체들, 그리고 우주탐사에 대한 지식을 나눴습니다. 그들은 곧 친구가 되어 서로 다른 과학적 지식과 관점을 교환하며 시간을 보냈죠. 그들의 대화는 흥미로웠고, 우주는 더욱 친근해 보였습니다.

결국, 인간과 플라톤티아의 외계인들은 작별 인사를 나누고 각자의 집으로 돌아갔습니다. 하지만 우주 여행은 끝없이 계속되죠, 새로운 발견과 친구가 기다리고 있으니까요. 그리고 그때부터 우주선과 플라톤티아 행성 사이에는 특별한 유대감이 생겼습니다 - 그들은 우주의 별자리 속에서 서로를 찾았고, 이 세상 밖의 연결을 맺었습니다.


**모든 요소를 Open Source로 RAG 체인 구축하기**

In [21]:
Chroma().delete_collection()

In [22]:
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_community.chat_models import ChatOllama
from langchain import hub
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

loader = PyPDFLoader(r"C:\Users\gram\Downloads\대한민국헌법(헌법)(제00010호)(19880225).pdf")
pages = loader.load_and_split()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
docs = text_splitter.split_documents(pages)

model_name = "jhgan/ko-sbert-nli"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': True}

embedding = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

vectorstore = Chroma.from_documents(docs, embedding)
retriever = vectorstore.as_retriever()

prompt = hub.pull("rlm/rag-prompt")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)
    
rag_chain = (
    {"context": retriever|format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

**[rag_chain 답변 스트리밍하기]**

In [23]:
for chunk in rag_chain.stream("대통령의 임기는 몇년이야?"):
    print(chunk, end="", flush=True)

대통령의 임기는 5년입니다.

신뢰도: 90%