In [None]:
# 고객의 id 를 받아 고객 개인정보 테이블에 연결하는 DB
# 챗봇 : FAQ, 제품 설명서 등을 RAG 기반으로 검색 및 답변 | 개인 관련 내용은 history로 입력
# 배송 API를 어떻게 구성하지?

In [None]:
# 역할 분담

# 파일 로드 - 제품설명서 + FAQ 목록 -> vectorDB 에 넣을 거
# code/documents.ipynb
## 가져와서 metadata 랑 chunking 전처리하고 vectorDB에 넣기까지

# RAG 구조 + 모델링 - 메타 데이터 및 쿼리 재생성(HyDE) + vectorDB에서 검색
# code/main.ipynb
## retriever 생성, 문서 추출 함수 등 
## SQL Agent 까지 여기서 구성 

# 개인정보용 SQLDataBase 구성 - 고객 정보 테이블, 고객 장바구니?, 고객 주문내역
## 해당 정보 관련 query 일 경우 별도의 tool로 개인정보 가져오기

# RAG 평가 지표 구성
## RAGAS 이용, 지표 골라야함

In [1]:
# Retriever 생성
def get_retriever(k=10):
    vector_store = get_vector_store()
    retriever = vector_store.as_retriever(search_kwargs={"k":k})
    return retriever
retriever = get_retriever(k=3)

# 문서 내용 추출 함수 
def format_docs(docs:list[Document]) -> str:
    """
    Retriever가 검색한 문서들에서 page_content(문서 내용) 만 추출해서 반환.
    추출된 문서들의 내용을 "\n\n"로 연결한다.
    Args:
        docs(list[Document]) - 검색한 문서 리스트
    Returns:
        str - 문서1내용+\n\n문서2내용+\n\n .. 
    """
    return "\n\n".join(doc.page_content for doc in docs)

# HyDE 를 적용해 retriever 호출 함수
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from textwrap import dedent

def hyde_retriever(query:str, k=3):
    hyde_model = ChatOpenAI(model_name='gpt-4.1')   # 가상답변을 생성하는 모델은 좋은 모델을 사용해야함. 할루시네이션 방지
    hyde_prompt_template = PromptTemplate(
    template=dedent("""# Instruction
        다음 질문에 대해서 완전하고 상세한 답변을 실제 사실에 기반해서 작성해 주세요.
        질문과 관련된 내용만으로 답변을 작성합니다.
        답변과 직접적인 연관성이 없는 내용은 답변에 포함시키지 않습니다.

        # 질문 : 
        {query}
        """)
    )
    hyde_chain = hyde_prompt_template | hyde_model | StrOutputParser()
    retriever = get_retriever(k)
    dummy_answer = hyde_chain.invoke({"query":query})
    return retriever.invoke(dummy_answer)

NameError: name 'get_vector_store' is not defined

In [4]:
# 메인 챗봇 모델 구성
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableWithMessageHistory, RunnablePassthrough, RunnableLambda
from langchain_community.chat_message_histories import SQLChatMessageHistory
from sqlalchemy import create_engine
from dotenv import load_dotenv

load_dotenv()

# SQL 연결
session_id = 'user_1'
engine = create_engine("mysql+pymysql://jin:1111@localhost:3306/hr")
sql_store = {}
def get_session_history(session_id:str)->SQLChatMessageHistory:
    if session_id not in sql_store:
        sql_store[session_id] = SQLChatMessageHistory(
            session_id=session_id,
            connection=engine
        )
    return sql_store[session_id]

# 체인 구성
system_template = """### Instruction:
    당신은 AI 전문가입니다.
    
    ### Context
    {context}
    """
    
prompt_template = ChatPromptTemplate(
    [
        ("system", system_template),
        MessagesPlaceholder(variable_name="history", optional=True),
        ("human", '{query}')
    ]
)
model = ChatOpenAI(model="gpt-4.1")
parser = StrOutputParser()
chain = ({"context":RunnableLambda(lambda x: x["query"])|hyde_retriever|format_docs, 
        "query":RunnablePassthrough()} 
        | prompt_template
        | model
        | StrOutputParser()
        )
chain_with_history = RunnableWithMessageHistory(
    runnable=chain,
    get_session_history=get_session_history,
    input_messages_key="query",
    history_messages_key="history"
)


NameError: name 'hyde_retriever' is not defined

In [2]:
# 실행
query = input()
response = chain_with_history.invoke(
    {"query":query}, 
    {"configurable":{"session_id":session_id}})
print("query : ", query)
print("response : ", response)

NameError: name 'chain_with_history' is not defined