# [프로젝트] 의도 분류 기반 RAG 수행하기 (Part 2)

![Image](https://github.com/user-attachments/assets/1a16653d-fdb9-4980-8ac3-ed8e20a2be45)

파트 1의 코드에서 LLM은 단일 검색을 통해 답변을 생성했기 때문에,    
여러 개의 DB를 연속적으로 활용하지 못했습니다.

이번에는 LLM이 결과를 점검하며, 추가 질의를 수행할 수 있는지 확인해 보겠습니다.

---

이번 프로젝트의 데이터 구성은 다음과 같습니다:   
rag.zip 파일을 업로드해 주세요.

<br><br>
rag/templates/*.md : 사내 문서 작성을 위한 양식 목록 (markdown)       
rag/company_policies.pdf : 사내 규정 파일 (PDF)    
rag/employee_data.csv : 사내 구성원 정보(CSV)   

**벡터 데이터베이스 실행을 위해, T4 GPU를 설정해 주세요!**

In [None]:
!pip install langchain==1.0.3
!pip install unstructured pymupdf langgraph langchain_google_genai langchain_community langchain-huggingface python-dotenv -q

In [None]:
# RAG
!pip install langchain-chroma sentence_transformers kiwipiepy rank_bm25

**설치 후 런타임 --> 세션 다시 시작 해 주세요!**

이번 실습에서는 API 키를 입력하는 대신에,    
.env 파일에서 API 키를 불러옵니다.   
실제 API 키를 다음과 같이 넣어주세요!   

```
GOOGLE_API_KEY= 'AIzaSyAxxxxx'
LANGCHAIN_API_KEY='lsv2_pt_f3d94440f7d045c0a8dbe1f----'
```

**.env 파일은 숨김 파일이므로, 오른쪽 파일 탭의 눈(Eye) 표시를 클릭하시면 보입니다 :)**

업로드한 파일의 압축을 해제합니다.

In [None]:
import zipfile

with zipfile.ZipFile('rag.zip', 'r') as zip_ref:
    zip_ref.extractall('.')

LLM과 임베딩 모델을 설정합니다.

In [None]:
import os
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_huggingface import HuggingFaceEmbeddings
from dotenv import load_dotenv

# .env 파일 로드
load_dotenv()

os.environ['LANGCHAIN_PROJECT'] = 'LangGraph_FastCampus'
os.environ['LANGCHAIN_ENDPOINT'] = 'https://api.smith.langchain.com'
os.environ['LANGCHAIN_TRACING_V2']='true'

# 모델 설정
llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash",
    temperature=0.1
)

# 임베딩 모델 설정 (실제로 활용하실 때는 더 큰 임베딩 모델이 좋습니다!)
embeddings = HuggingFaceEmbeddings(
    model_name="intfloat/multilingual-e5-small"
)

In [None]:
from typing import TypedDict, List, Dict, Any, Optional, Literal
from pydantic import BaseModel, Field

from langgraph.graph import StateGraph, START, END

from langchain_chroma import Chroma
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.document_loaders import PyMuPDFLoader, CSVLoader, DirectoryLoader
from langchain_classic.text_splitter import RecursiveCharacterTextSplitter

class IntentResult(BaseModel):
    explanation: str
    retrieval_needed: bool = Field(description='DB 검색이 필요한지의 여부 ')
    target_db: Literal["policy", "user", "form"] = Field(
        description="""사용자 질의를 해결하기 위해, 추가로 검색해야 하는 DB의 종류:
policy: 사내 규정집
user: 직원 정보
form: 문서 양식 모음""")
    query: str = Field(description='벡터 데이터베이스에 검색할 쿼리')

# State 정의
class State(TypedDict):
    question: str  # 사용자 질의
    target_db: str  # 검색하고자 하는 DB
    query: str # 검색어
    retrieval_needed: bool # 검색이 필요한지의 여부
    context: List[str]  # RAG 검색 결과
    draft: str# 중간 응답
    error: Optional[str]  # 에러 메시지
    retrieval_count: int

In [None]:
from kiwipiepy import Kiwi
# kiwi 형태소 분석기 설정
kiwi = Kiwi()
def kiwi_tokenize(text):
    return [token.form for token in kiwi.tokenize(text)]

In [None]:
import json
import os
from langchain_classic.retrievers import BM25Retriever, EnsembleRetriever
import uuid
from langchain_core.documents import Document

def load_data():
    # 3000/300 청킹: 데이터에 따라 조정
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=3000,
        chunk_overlap=300,
    )

    policy_file = './rag/company_policies.pdf'
    print(f"[{policy_file}] 문서 로드 중...")

    # 벡터스토어 업데이트
    policy_vectorstore =  Chroma(
    persist_directory="./chroma_db_policy_"+str(uuid.uuid4())[:5],
    embedding_function=embeddings,
    collection_name="policy_collection"
    )
    docs = PyMuPDFLoader(policy_file).load()
    split_docs = text_splitter.split_documents(docs)
    policy_vectorstore.add_documents(split_docs)
    print(f"[{policy_file}] 청킹 완료: {len(split_docs)}개의 청크로 분할됨")


    # 벡터 + BM25 리트리버 생성 (Top 5)
    policy_vector_retriever = policy_vectorstore.as_retriever(search_kwargs={"k": 5})
    policy_bm25_retriever = BM25Retriever.from_documents(split_docs,
                                                          preprocess_func=kiwi_tokenize)
    policy_bm25_retriever.k = 5

    # 하이브리드 리트리버 생성
    policy_retriever = EnsembleRetriever(
        retrievers=[policy_bm25_retriever, policy_vector_retriever],
        weights=[0.5, 0.5]
    )
    print(f"[{policy_file}] 하이브리드 검색 설정됨")


    ###############


    # 사용자 정보 처리
    user_file = './rag/employee_data.csv'
    print(f"[{user_file}] 문서 로드 중...")


    try:
        docs = CSVLoader(user_file).load()
    except:
        docs = CSVLoader(user_file, encoding='cp949').load()
    # CSV 파일의 경우, 하나의 document가 작으므로 결합하여 청킹
    hr_info = Document(page_content="사용자 정보:")
    for doc in docs:
        hr_info.page_content += f"\n{doc.page_content}+\n"


    # 짧은 맥락으로 이해 가능한 경우, 청크 크기 줄이기
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=2000,
        chunk_overlap=200,
    )

    split_docs = text_splitter.split_documents([hr_info])

    # 벡터 DB 생성
    user_vectorstore =  Chroma(
    persist_directory="./chroma_db_user_"+str(uuid.uuid4())[:5],
    embedding_function=embeddings,
    collection_name="user_collection"
    )

    print(f"[{user_file}] 청킹 완료: {len(split_docs)}개의 청크로 분할됨")

    # 벡터 + BM25 리트리버 생성 (Top 5)
    user_vector_retriever = user_vectorstore.as_retriever(search_kwargs={"k": 5})
    user_bm25_retriever = BM25Retriever.from_documents(split_docs, preprocess_func=kiwi_tokenize)
    user_bm25_retriever.k = 5

    # 하이브리드 리트리버 생성
    user_retriever = EnsembleRetriever(
        retrievers=[user_bm25_retriever, user_vector_retriever],
        weights=[0.7, 0.3]
        # 이름 등의 고유명사가 중요한 경우 BM25 가중치 높임
    )

    print(f"[{user_file}] 하이브리드 검색 설정됨")

    # 양식 템플릿 처리
    form_dir = './rag/templates'
    print(f"[{form_dir}] 문서 로드 중...")

    docs = DirectoryLoader(form_dir, glob="*.md").load()
    print(f"[{form_dir}] 문서 로드 완료")

    # 벡터 DB 생성
    form_vectorstore =  Chroma(
    persist_directory="./chroma_db_form_"+str(uuid.uuid4())[:5],
    embedding_function=embeddings,
    collection_name="form_collection"
    )

    # 벡터 리트리버 생성
    form_vector_retriever = form_vectorstore.as_retriever(search_kwargs={"k": 4})

    # BM25 리트리버 생성
    form_bm25_retriever = BM25Retriever.from_documents(docs, preprocess_func=kiwi_tokenize)
    form_bm25_retriever.k = 4

    # 하이브리드 리트리버 생성
    form_retriever = EnsembleRetriever(
        retrievers=[form_bm25_retriever, form_vector_retriever],
        weights=[0.5, 0.5]
    )
    print(f"[{form_dir}] 하이브리드 검색 설정됨")

    # 리트리버 맵 반환
    return {
        "policy": policy_retriever,
        "user": user_retriever,
        "form": form_retriever
    }

# 2. 데이터 로드 및 리트리버 생성
retriever_map = load_data()

검색과 답변 모듈을 구성합니다.

In [None]:
retriever_map

In [None]:
def retrieve_context(state: State) -> State:

    query = state['query']
    target_db = state['target_db']

    # Retriever 선택
    retriever = retriever_map.get(target_db)
    if not retriever:
        state['error'] = f"Unknown DB: {target_db}"
        return state

    results = retriever.invoke(query)

    state['context'] = [doc.page_content for doc in results]
    state['retrieval_count']+=1
    return state

def generate_response(state: State) -> State:
    """검색 결과를 바탕으로 응답 생성 및 개선"""
    prompt = ChatPromptTemplate([
        ("system", """사용자의 [질의]와 이에 대한 [중간 답변], 그리고 [추가 정보]가 주어집니다.
이를 활용하여, 중간 답변을 개선하세요.
추가 정보에 포함된 내용만을 사용해 개선하세요.
개선된 답변만 출력하고, 질의에 관련된 내용만 개선하세요."""),
        ("user", """
[질의]: {question}
---
[중간 답변]: {draft}
---
[추가 정보]:{context}""")
    ])

    chain = prompt | llm
    draft = chain.invoke({
        "question": state['question'],
        "draft": state['draft'],
        "context": "\n".join(state['context'])
    })

    state['draft'] = draft.content
    return state

의도 분류 모듈을 작성합니다. IntentResult를 통해 간단히 구현합니다.

In [None]:
# 의도 분류
def classify_intent(state: State) -> State:
    """사용자 질의 의도 분류 및 검색어 생성"""
    prompt = ChatPromptTemplate([
        ("system", """당신은 다중 검색 엔진의 사전 분류기입니다.
사용자의 질문에 대해, 검색이 필요한지의 여부,
질문에 대해 답변하기 위해 필요한 DB의 이름과, 검색 쿼리를 생성하세요.
문서 작성의 경우 우선순위는 form>user 입니다."""),
        ("user", "질의: {question}")
    ])

    chain = prompt | llm.with_structured_output(IntentResult)
    result = chain.invoke({"question": state['question']})
    state['query'] = result.query
    state['target_db'] = result.target_db
    state['retrieval_needed'] = result.retrieval_needed
    return state

추가적으로, 결과물을 평가하는 단계를 추가합니다.

In [None]:
# 의도 분류
def evaluate(state: State) -> State:
    """출력 결과 평가 및 개선점 or 추가 검색 사항 찾기"""
    prompt = ChatPromptTemplate([
        ("system", """당신은 문서 작성 자동화를 돕는 에이전트입니다.
현재의 답변에서는 추가적인 DB 검색을 통해 채울 수 있는 내용이 들어있을 수 있습니다.
비어 있는 부분을 채우기 위해 다른 DB 검색을 통해 보완해야 하는지 판별하세요.
이미 충분한 정보가 주어진 경우에는, 추가로 검색할 필요가 없습니다.
양식과 정보가 주어지면, 실제 문서를 작성해 출력하세요."""),
        ("user", """질의: {question}
---
[이전 검색 DB]: {target_db}
[이전 검색 쿼리]: {query}
[이전 검색 결과]: {context}
---
현재 답변: {draft}""")
    ])

    chain = prompt | llm.with_structured_output(IntentResult)
    result = chain.invoke(state)
    state['retrieval_needed'] = result.retrieval_needed
    state['target_db'] = result.target_db
    state['query'] = result.query

    print('## Evaluation:', result)
    return state

Workflow의 라우터를 구성합니다.   
만약, 오류가 발생한 경우 에러 처리를 수행합니다.

In [None]:
def handle_error(state: State) -> State:
    """에러 처리"""
    if state.get('error'):
        state['draft'] = f"죄송합니다. 오류가 발생했습니다: {state['error']}"
    return state

def should_continue(state: State) -> List[str]:
    """워크플로우 계속 진행 여부 확인"""
    if state.get('error'):
        return ['handle_error']
    if state.get('retrieval_count')>=3:
        return ['END']
    if state.get('retrieval_needed'):
        return 'retrieve_context'

    else: return ['END']

그래프를 만들고, Compile합니다.

In [None]:
# 워크플로우 그래프 구성
builder = StateGraph(State)

# 노드 추가
builder.add_node('classify_intent', classify_intent)
builder.add_node('retrieve_context', retrieve_context)
builder.add_node('generate_response', generate_response)
builder.add_node('handle_error', handle_error)
builder.add_node('evaluate', evaluate)

# 엣지 연결
builder.add_edge(START,'classify_intent')
builder.add_edge('classify_intent', 'retrieve_context')
builder.add_edge('retrieve_context', 'generate_response')
builder.add_edge('generate_response', 'evaluate')
builder.add_conditional_edges(
    'evaluate',
    should_continue,
    {'END':END, 'handle_error':'handle_error', 'retrieve_context': 'retrieve_context'}
)

# 시작 노드 설정


# 그래프 컴파일
graph = builder.compile()

graph

기존의 플로우에 추가된 노드인   
 추가 검색을 판단하는 Evaluation 노드의 작동을 확인합니다.  


In [None]:
import pprint
test_questions = [
    "회사의 휴가 정책에 대해 알려주세요",
    "김지훈 직원의 스킬셋이 뭔가요?",
    "휴가신청서 양식을 보여주세요",
]

for question in test_questions:
    result = graph.invoke({'question': question, 'draft':'',
                           'retrieval_count':0})
    print('Question:', result['question'],"\nResult:", result['draft'])
    print('\n'+"-" * 50+'\n')

In [None]:
import pprint
test_questions = [
    "다음 달에 결혼하는데, 결혼 휴가는 며칠인가요?",
    "출장신청서 쓰는데, 지켜야 될 점 있나요?"
]

for question in test_questions:
    result = graph.invoke({'question': question, 'draft':'',
                           'retrieval_count':0})
    print('Question:', result['question'],"\nResult:", result['draft'])
    print('\n'+"-" * 50+'\n')

In [None]:
import pprint
test_questions = [
    "스킬셋에 Kubernetes 가 있는 직원 모두 알려줘.",
]

for question in test_questions:
    result = graph.invoke({'question': question, 'draft':'',
                           'retrieval_count':0})
    print('Question:', result['question'],"\nResult:", result['draft'])
    print('\n'+"-" * 50+'\n')

In [None]:
# 여러 개의 RAG가 모두 활용되어야 하는 경우
# + 반복 실행이 필요한 경우

test_questions = [
    "야 나 김지훈인데, 25년 3월 22일부터 26일까지 여행 가게 휴가 신청서 작성해줘.",
]

for question in test_questions:
    result = graph.invoke({'question': question, 'draft':'',
                           'retrieval_count':0})
    print('Question:', result['question'],"\nResult:", result['draft'])
    print('\n'+"-" * 50+'\n')

In [None]:
result