In [15]:
import os
import re
import time
import pickle
import asyncio
import nest_asyncio
import pandas as pd
from tqdm import tqdm
from collections import defaultdict
from IPython.display import clear_output

from dotenv import load_dotenv
from langchain.docstore.document import Document
from langchain.chains import RetrievalQA, LLMChain
from langchain.prompts import PromptTemplate
from langchain_community.embeddings import ClovaXEmbeddings
from langchain_community.chat_models import ChatClovaX
from pymilvus import connections, utility
from langchain_community.vectorstores.milvus import Milvus

In [None]:
# 환경 설정 및 Milvus/임베딩 초기화

load_dotenv(dotenv_path=r"C:\Kill_the_RAG\Project\Aiffel_final_project\.env")

os.environ["NCP_CLOVASTUDIO_API_KEY"] = os.getenv("NCP_CLOVASTUDIO_API_KEY")
os.environ["NCP_CLOVASTUDIO_API_URL"] = os.getenv(
    "NCP_CLOVASTUDIO_API_URL", "https://clovastudio.stream.ntruss.com/"
)

connections.connect(
    alias="default",
    host=os.getenv("MILVUS_HOST", "localhost"),
    port=os.getenv("MILVUS_PORT", "19530"),
)

ncp_embeddings = ClovaXEmbeddings(model="bge-m3")
llm_clova = ChatClovaX(model="HCX-003", max_tokens=2048)

In [3]:
# 임베딩 파일 및 문서 구성

embedding_file = r"C:\Kill_the_RAG\Project\Aiffel_final_project\Code\Data\semifinal_embedding\embedding_semifinal.pkl"
if os.path.exists(embedding_file):
    with open(embedding_file, "rb") as f:
        saved_data = pickle.load(f)
    all_text_embedding_pairs = saved_data["embeddings"]
    all_metadata_list = saved_data["metadata"]
    print("임베딩 데이터 불러오기")
else:
    raise FileNotFoundError(f"임베딩 파일을 찾을 수 없습니다: {embedding_file}")

metadata_mapping = {
    "ISBN": "ISBN",
    "페이지": "page",
    "가격": "price",
    "제목": "title",
    "저자": "author",
    "분류": "category",
    "저자소개": "author_intro",
    "책소개": "book_intro",
    "목차": "table_of_contents",
    "출판사리뷰": "publisher_review",
    "추천사": "recommendation",
}

all_metadata_list_mapped = []
for meta in all_metadata_list:
    mapped_meta = {metadata_mapping.get(key, key): value for key, value in meta.items()}
    all_metadata_list_mapped.append(mapped_meta)

documents = [
    Document(page_content=pair[0], metadata=meta)
    for pair, meta in zip(all_text_embedding_pairs, all_metadata_list_mapped)
]

임베딩 데이터 불러오기


In [None]:
# Milvus 벡터 DB 생성
collection_name = "book_rag_db"
if utility.has_collection(collection_name):
    utility.drop_collection(collection_name)

vectorstore = Milvus(
    embedding_function=ncp_embeddings,
    collection_name=collection_name,
    connection_args={"host": "localhost", "port": "19530"},
    auto_id=True,
)

texts = [pair[0] for pair in all_text_embedding_pairs]
embeds = [pair[1] for pair in all_text_embedding_pairs]


def precomputed_embed_documents(cls, input_texts):
    if input_texts != texts:
        raise ValueError(
            "ERROR : 입력 텍스트 순서가 사전 계산된 임베딩과 일치하지 않음"
        )
    return embeds


ClovaXEmbeddings.embed_documents = classmethod(precomputed_embed_documents)
vectorstore.add_texts(
    texts=texts, metadatas=all_metadata_list_mapped, embeddings=embeds
)

dense_retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
dpr_qa_chain = RetrievalQA.from_chain_type(
    llm=llm_clova, retriever=dense_retriever, return_source_documents=True
)

  vectorstore = Milvus(


In [None]:
# 유틸



def extract_field(text, field_name):

    pattern = rf"{re.escape(field_name)}\s*:\s*(.*)"

    match = re.search(pattern, text)

    return match.group(1).strip() if match else ""



MIN_INFO_LENGTH = 10

In [None]:
# 공용 & 페르소나별 프롬프트 템플릿

decision_prompt_template = PromptTemplate(
    template="""
[대화 맥락]
사용자 대화 내역:
{{ history }}
사용자의 최신 질문: "{{ query }}"

[역할 및 목표]
{{ role_instructions }}
현재 대화 상황과 질문의 맥락을 분석하여 아래 중 하나의 행동을 출력해라:
- "추천": 사용자가 책 추천을 명확히 요청한 경우, 추가 정보 없이 바로 추천을 진행.
- "추가 질문": 책 추천을 위해 더 세부적인 선호도 정보(예: 작가, 시대, 장르 등)가 필요하면, 구체적인 질문을 던져서 정보를 요청.
- "대화 유지": 책 추천이 필요하지 않거나, 단순 일상 대화로 이어지길 원하면, 추천 검색 없이 일반 대화 응답을 생성.

[최종 출력 형식 - 반드시 아래 내용만 출력]
{% raw %}
행동: "{{행동 (추천/추가 질문/대화 유지)}}"
추천 책 정보: "{{책 제목 및 상세 정보, 정보 충분 시; 정보 부족 시 빈 문자열}}"
추가 질문: "{{추가 질문, 정보 보완 필요 시; 충분하면 빈 문자열}}"
{% endraw %}
""",
    input_variables=["history", "query", "role_instructions"],
    template_format="jinja2",
)

final_query_generation_template = PromptTemplate(
    template="""
[대화 요약]
{{ history }}

[사용자 요청]
{{ query }}

[페르소나 정보]
{{ persona_info }}

[사용자 선호도]
{{ preferences }}

위 정보를 토대로, 책 추천에 유용한 핵심 사용자 선호도(예: 선호 장르, 관심 주제 등)만을 포함한 최종 검색 쿼리를 작성해라.
만약 필요한 정보가 부족하면 "추가 질문: <질문>" 형식으로 추가 정보를 요청해라.
최종 출력은 반드시 아래 형식 중 하나여야 한다:
1. "쿼리: <최종 검색 쿼리>"
2. "추가 질문: <추가 질문>"
""",
    input_variables=["history", "query", "persona_info", "preferences"],
    template_format="jinja2",
)

# 페르소나 프롬프트

literature_role = "너는 감성적이고 문학적인 도서 추천 챗봇이다. 사용자의 감정과 취향을 섬세하게 파악하여, 감성적인 언어로 책을 추천해라."
science_role = "너는 정확하고 논리적인 과학/기술 도서 추천 챗봇이다. 사용자의 관심 분야와 요구를 분석하여, 명확하고 구체적인 정보로 책을 추천해라."

In [None]:
# 비동기 체인 구성 & 디버깅 로깅 함수



async def async_invoke(chain: LLMChain, vars_dict: dict, step_name: str) -> dict:
    """

    체인 호출을 비동기로 수행하고, 단계별 디버깅 출력과 예외 처리를 수행합니다.
    """

    try:

        print(f"\n[디버그] {step_name} 호출 전 변수: {vars_dict}")

        # 동기 함수인 llm.invoke를 비동기로 실행 (to_thread 사용)

        result = await asyncio.to_thread(chain.invoke, vars_dict)

        print(f"[디버그] {step_name} 결과: {result}")

        return result

    except Exception as e:

        print(f"[에러] {step_name}에서 예외 발생: {str(e)}")

        return {"text": ""}



async def async_invoke_llm(prompt: str, step_name: str) -> str:
    """

    단일 프롬프트 문자열을 llm.invoke로 비동기 호출하여 결과를 반환합니다.
    """

    try:

        print(f"\n[디버그] {step_name} 프롬프트 호출:\n{prompt}")

        response = await asyncio.to_thread(llm_clova.invoke, prompt)

        result_text = response.text().strip()

        print(f"[디버그] {step_name} 응답: {result_text}")

        return result_text

    except Exception as e:

        print(f"[에러] {step_name}에서 예외 발생: {str(e)}")

        return ""

In [None]:
# BaseRAGPipeline 클래스 (체인 구성 추가 + 디버깅 방식 변경 + 비동기 방식)



class BaseRAGPipeline:

    def __init__(self, config, llm, retriever, qa_chain, documents):

        self.config = config

        self.llm = llm

        self.retriever = retriever

        self.qa_chain = qa_chain

        self.documents = documents

        self.query_history = []

        self.user_preferences = defaultdict(list)

        self.preferences_text = ""


        self.decision_chain = LLMChain(llm=self.llm, prompt=decision_prompt_template)

        self.final_query_generation_chain = LLMChain(

            llm=self.llm, prompt=final_query_generation_template
        )


    async def summarize_user_preferences(self, existing_preferences, new_input):

        prompt = (

            f"다음 사용자 선호도 내용들을 하나의 자연스러운 문장으로 요약해줘:\n"

            f"기존 선호도: {existing_preferences}\n"

            f"새로운 입력: {new_input}\n"

            f"요약된 선호도:"
        )

        return await async_invoke_llm(prompt, "사용자 선호도 요약")


    async def summarize_final_query(self, query):

        prompt = (

            f"다음 내용을 하나의 자연스러운 문장으로 정제해줘:\n"

            f"{query}\n"

            f"정제된 검색 쿼리:"
        )

        return await async_invoke_llm(prompt, "최종 쿼리 정제")


    def robust_parse_decision_response(self, response_text):

        action_match = re.search(r"행동\s*[:：]\s*\"?([^\"\n]+)\"?", response_text)

        action = action_match.group(1).strip() if action_match else None


        book_info_match = re.search(

            r"추천\s*책\s*정보\s*[:：]\s*\"?([^\"\n]+)\"?", response_text
        )

        book_info = book_info_match.group(1).strip() if book_info_match else ""


        follow_match = re.search(

            r"추가\s*질문\s*[:：]\s*\"?([^\"\n]+)\"?", response_text
        )

        additional_question = follow_match.group(1).strip() if follow_match else ""

        return action, book_info, additional_question


    async def generate_answer(self, query):

        # Keyword - author 기준 필터링 : 아직 미구현

        author_match = re.search(r"(?:저자|작가)\s*[:：]\s*(\S+)", query)

        if author_match:

            author_name = author_match.group(1).strip().lower()

            dense_results = self.qa_chain.invoke(query)["source_documents"]

            keyword_results = [
                doc

                for doc in self.documents

                if doc.metadata.get("author", "").strip().lower() == author_name

            ]

            source_docs = list(

                {

                    doc.metadata.get("ISBN"): doc

                    for doc in (dense_results + keyword_results)

                    if doc.metadata.get("ISBN")

                }.values()
            )

        else:

            result = self.qa_chain.invoke(query)

            source_docs = result["source_documents"]


        retrieved_isbns = set()

        for doc in source_docs:

            isbn = doc.metadata.get("ISBN")

            if isbn:

                retrieved_isbns.add(isbn)


        aggregated_docs = []

        for isbn in retrieved_isbns:

            book_docs = [

                doc for doc in self.documents if doc.metadata.get("ISBN") == isbn

            ]

            if not book_docs:
                continue

            aggregated_text = "\n".join([doc.page_content for doc in book_docs])

            aggregated_docs.append(

                Document(page_content=aggregated_text, metadata=book_docs[0].metadata)
            )


        formatted_answers = []

        for doc in aggregated_docs:

            metadata = doc.metadata

            title = metadata.get("title") or extract_field(doc.page_content, "제목")

            author = metadata.get("author") or extract_field(doc.page_content, "저자")

            aggregated_text = doc.page_content

            book_intro = extract_field(aggregated_text, "책소개")

            publisher_review = extract_field(aggregated_text, "출판사리뷰")

            recommendation_field = extract_field(aggregated_text, "추천사")


            if book_intro and len(book_intro.strip()) >= MIN_INFO_LENGTH:

                selected_info = book_intro

            elif publisher_review and len(publisher_review.strip()) >= MIN_INFO_LENGTH:

                selected_info = publisher_review
            elif (

                recommendation_field

                and len(recommendation_field.strip()) >= MIN_INFO_LENGTH

            ):

                selected_info = recommendation_field

            else:

                selected_info = ""


            if not selected_info:

                reason = "추천 정보 생성 불가"

            else:

                reason_prompt = (

                    f"다음 정보를 참고하여, 이 책이 추천되는 이유를 간결하고 명확하게 요약해라. "

                    f"책의 주요 특징과 강점을 중심으로 설명해라.\n\n정보:\n{selected_info}"
                )

                generated_reason = await async_invoke_llm(

                    reason_prompt, "추천 이유 생성"
                )
                if (

                    not generated_reason

                    or len(generated_reason) < 10

                    or "추천 정보 생성 불가" in generated_reason

                ):

                    reason = "추천 정보 생성 불가"

                else:

                    reason = generated_reason


            formatted = f"책 제목: {title}\n저자: {author}\n추천 이유: {reason}"

            formatted_answers.append(formatted)


        answer = "\n\n".join(formatted_answers)

        refined_answer = await async_invoke_llm(

            f"아래 원본 추천 결과를 읽고, 각 책의 정보를 다음 형식에 맞춰 재작성해라.\n\n형식:\n책 제목: <책 제목>\n저자: <저자>\n추천 이유: <추천 이유>\n\n원본 추천 결과:\n{answer}\n\n출력 시, 반드시 위 형식만을 사용하고 불필요한 안내 문구는 포함하지 말아라.",

            "추천 결과 재정제",
        )

        return refined_answer, None


    def print_chat_history(self):

        print("-" * 50)

        for line in self.query_history[-4:]:

            if line.startswith("사용자:"):

                print(f"[사용자] {line.split(':', 1)[1].strip()}")

            elif line.startswith("챗봇:"):

                print(f"[챗봇] {line.split(':', 1)[1].strip()}")

        print("-" * 50)


    async def search_and_generate_answer(self, user_query):

        self.preferences_text = " ".join(self.user_preferences["preferences"])

        query_summary = "\n".join(self.query_history[-5:])

        if self.config.get("persona") == "Literature":

            persona_info = "감성, 현재 기분, 선호하는 문학 장르 및 작가 정보"

        elif self.config.get("persona") == "Science":

            persona_info = "초심자 여부, 관심 분야, 구체적인 기술 정보"

        else:

            persona_info = ""

        prompt_vars = {

            "history": query_summary,

            "query": user_query,

            "role_instructions": self.config["role_instructions"],

        }

        decision_result = await async_invoke(

            self.decision_chain, prompt_vars, "행동 결정"
        )

        decision_text = decision_result.get("text", "").strip()

        print(f"\n[디버그] Decision 응답: {decision_text}")

        action, book_info, additional_question = self.robust_parse_decision_response(

            decision_text
        )

        print(f"[디버그] 행동: {action}")


        if action == "추가 질문":

            self.query_history.append(f"챗봇: {additional_question}")

            self.print_chat_history()

            raw_user_input = input("[사용자] ")

            self.query_history.append(f"사용자: {raw_user_input}")

            if self.preferences_text:

                updated_pref = await self.summarize_user_preferences(

                    self.preferences_text, raw_user_input
                )

            else:

                updated_pref = raw_user_input

            self.preferences_text = updated_pref

            print(f"\n[디버그] 업데이트된 사용자 선호도: {self.preferences_text}")

            updated_prompt_vars = {

                "history": "\n".join(self.query_history[-5:]),

                "query": user_query,

                "role_instructions": self.config["role_instructions"],

            }

            if len(self.preferences_text.split()) >= 10:

                print("[디버그] 충분한 선호도가 수집되어 추천으로 전환합니다.")

                action = "추천"

            else:

                decision_result = await async_invoke(

                    self.decision_chain, updated_prompt_vars, "재결정"
                )

                decision_text = decision_result.get("text", "").strip()

                print(f"\n[디버그] 재결정 응답: {decision_text}")

                action, book_info, additional_question = (

                    self.robust_parse_decision_response(decision_text)
                )

                print(f"[디버그] 재결정 행동: {action}")

            if action == "추가 질문":

                self.query_history.append(f"챗봇: {additional_question}")

                return additional_question

            elif action == "대화 유지":

                response_text = await async_invoke_llm(

                    f"대화 응답: {user_query}\n대화 내역: {updated_prompt_vars['history']}",

                    "대화 응답 생성",
                )

                return response_text

            elif action == "추천":

                final_query_vars = {

                    "history": updated_prompt_vars["history"],

                    "query": user_query,

                    "persona_info": persona_info,

                    "preferences": self.preferences_text,

                }

                final_query_result = await async_invoke(

                    self.final_query_generation_chain,

                    final_query_vars,

                    "최종 쿼리 생성",
                )

                final_response_text = final_query_result.get("text", "").strip()

                if final_response_text.startswith("쿼리:"):

                    final_query = final_response_text[len("쿼리:") :].strip()

                else:

                    final_query = final_response_text

                final_query = await self.summarize_final_query(final_query)

        elif action == "대화 유지":

            response_text = await async_invoke_llm(

                f"대화 응답: {user_query}\n대화 내역: {query_summary}", "대화 응답 생성"
            )

            return response_text

        elif action == "추천":

            final_query_vars = {

                "history": query_summary,

                "query": user_query,

                "persona_info": persona_info,

                "preferences": self.preferences_text,

            }

            final_query_result = await async_invoke(

                self.final_query_generation_chain, final_query_vars, "최종 쿼리 생성"
            )

            final_response_text = final_query_result.get("text", "").strip()

            if final_response_text.startswith("쿼리:"):

                final_query = final_response_text[len("쿼리:") :].strip()

            else:

                final_query = final_response_text

            final_query = await self.summarize_final_query(final_query)

        else:

            final_query_vars = {

                "history": query_summary,

                "query": user_query,

                "persona_info": persona_info,

                "preferences": self.preferences_text,

            }

            final_query_result = await async_invoke(

                self.final_query_generation_chain, final_query_vars, "최종 쿼리 생성"
            )

            final_response_text = final_query_result.get("text", "").strip()

            if final_response_text.startswith("쿼리:"):

                final_query = final_response_text[len("쿼리:") :].strip()

            else:

                final_query = final_response_text

            final_query = await self.summarize_final_query(final_query)


        print(f"\n[디버그] 최종 검색 쿼리: {final_query}")

        answer, _ = await self.generate_answer(final_query)

        return answer


    async def interactive_multi_turn_qa(self):

        self.print_chat_history()

        while True:

            user_query = input("[사용자] ")

            if user_query.lower() == "quit":

                print("\n[대화 저장 중...]")

                print("대화 저장 완료")

                import sys


                sys.exit()

            self.query_history.append(f"사용자: {user_query}")

            answer = await self.search_and_generate_answer(user_query)

            if answer is not None:

                self.query_history.append(f"챗봇: {answer}")

                print("-" * 50)

                print(f"[사용자] {user_query}")

                print(f"[챗봇] {answer}")

                print("-" * 50)

In [None]:
# 페르소나별 파이프라인 클래스


class LiteratureRAGPipeline(BaseRAGPipeline):
    def __init__(self, llm, retriever, qa_chain, documents):
        config = {"persona": "Literature", "role_instructions": literature_role}
        super().__init__(config, llm, retriever, qa_chain, documents)


class ScienceRAGPipeline(BaseRAGPipeline):
    def __init__(self, llm, retriever, qa_chain, documents):
        config = {"persona": "Science", "role_instructions": science_role}
        super().__init__(config, llm, retriever, qa_chain, documents)

In [None]:
# 추가 비동기 작업 허용
nest_asyncio.apply()


# 메인 함수 -비동기 실행
def main():
    print("페르소나 선택:")
    print("1. 예술/문학")
    print("2. 과학/기술")
    choice = input("원하는 페르소나 번호를 입력하세요 (1 또는 2): ").strip()
    if choice == "1":
        pipeline = LiteratureRAGPipeline(
            llm_clova, dense_retriever, dpr_qa_chain, documents
        )
        greeting = "안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?"
    elif choice == "2":
        pipeline = ScienceRAGPipeline(
            llm_clova, dense_retriever, dpr_qa_chain, documents
        )
        greeting = "안녕하십니까. 정확하고 논리적인 과학/기술 도서 추천 챗봇입니다. 관심 있는 분야에 대해 편하게 이야기해 주세요."
    else:
        print("잘못된 선택입니다. 기본 예술/문학 페르소나로 실행합니다.")
        pipeline = LiteratureRAGPipeline(
            llm_clova, dense_retriever, dpr_qa_chain, documents
        )
        greeting = "안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?"

    pipeline.query_history.append(f"챗봇: {greeting}")

    # nest_asyncio으로 비동기 작업을 추가?해야함 - asyncio.run() or get_event_loop().run_until_complete() 모두 사용 가능
    asyncio.run(pipeline.interactive_multi_turn_qa())


if __name__ == "__main__":
    main()

페르소나 선택:
1. 예술/문학
2. 과학/기술
--------------------------------------------------
[챗봇] 안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?
--------------------------------------------------

[디버그] 행동 결정 호출 전 변수: {'history': '챗봇: 안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?\n사용자: 심심해 죽겠어.', 'query': '심심해 죽겠어.', 'role_instructions': '너는 감성적이고 문학적인 도서 추천 챗봇이다. 사용자의 감정과 취향을 섬세하게 파악하여, 감성적인 언어로 책을 추천해라.'}
[디버그] 행동 결정 결과: {'history': '챗봇: 안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?\n사용자: 심심해 죽겠어.', 'query': '심심해 죽겠어.', 'role_instructions': '너는 감성적이고 문학적인 도서 추천 챗봇이다. 사용자의 감정과 취향을 섬세하게 파악하여, 감성적인 언어로 책을 추천해라.', 'text': '행동: 추가 질문\n추가 질문: 심심하실 때 주로 어떤 장르의 책을 읽으시나요? 예를 들어, 로맨스, 판타지, 추리 소설 등이 있습니다.'}

[디버그] Decision 응답: 행동: 추가 질문
추가 질문: 심심하실 때 주로 어떤 장르의 책을 읽으시나요? 예를 들어, 로맨스, 판타지, 추리 소설 등이 있습니다.
[디버그] 행동: 추가 질문
--------------------------------------------------
[챗봇] 안녕하세요! 감성적이고 문학적인 도서 추천 챗봇입니다. 어떤 책을 읽고 싶으신가요?
[사용자] 심심해 죽겠어.
[챗봇] 심심하실 때 주로 어떤 장르의 책을 읽으시나요? 예를 들어, 로맨스, 판타지, 추리 소설 등이 있습니다.
-----------

SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [11]:
# query = "코딩 관련 책?"
# vectorstore.similarity_search(query, k=1)