##### 1. 패키지 설치

In [None]:
## 추가 패키지 설치
pip install langchain-huggingface==0.1.2
pip install langgraph==0.2.34
pip install gradio==4.44.1
!pip install langchain-community==0.3.1

Collecting langchain-huggingface==0.1.2
  Obtaining dependency information for langchain-huggingface==0.1.2 from https://files.pythonhosted.org/packages/9d/f8/77a303ddc492f6eed8bf0979f2bc6db4fa6eb1089c5e9f0f977dd87bc9c2/langchain_huggingface-0.1.2-py3-none-any.whl.metadata
  Using cached langchain_huggingface-0.1.2-py3-none-any.whl.metadata (1.3 kB)
Collecting sentence-transformers>=2.6.0 (from langchain-huggingface==0.1.2)
  Obtaining dependency information for sentence-transformers>=2.6.0 from https://files.pythonhosted.org/packages/45/2d/1151b371f28caae565ad384fdc38198f1165571870217aedda230b9d7497/sentence_transformers-4.1.0-py3-none-any.whl.metadata
  Using cached sentence_transformers-4.1.0-py3-none-any.whl.metadata (13 kB)
Collecting transformers>=4.39.0 (from langchain-huggingface==0.1.2)
  Obtaining dependency information for transformers>=4.39.0 from https://files.pythonhosted.org/packages/a9/b6/5257d04ae327b44db31f15cce39e6020cc986333c715660b1315a9724d82/transformers-4.51.3-p


[notice] A new release of pip is available: 23.2.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
"""
Adaptive_self_rag
금융상품(예: 정기예금, 입출금자유예금) 관련 질의에 대해:
1. 질문 라우팅 → (금융상품 관련이면) 문서 검색 (병렬 서브 그래프) → 문서 평가 → (조건부) 질문 재작성 → 답변 생성
   / (금융상품과 무관하면) LLM fallback을 통해 바로 답변 생성
그리고 생성된 답변의 품질(환각, 관련성) 평가 후 필요시 재생성 또는 재작성하는 Adaptive Self-RAG 체인.
"""

#############################
# 1. 기본 환경 및 라이브러리
#############################

from dotenv import load_dotenv
load_dotenv()

import warnings
warnings.filterwarnings("ignore")

# 기타 유틸
import json
import uuid
from textwrap import dedent
from operator import add
from heapq import merge
from typing import List, Literal, Sequence, TypedDict, Annotated, Tuple

# 서치 알고리즘
from rank_bm25 import BM25Okapi

# LangChain, Chroma, LLM 관련
from langchain_core.documents import Document
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.tools import tool
from langchain_chroma import Chroma
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage
from langgraph.checkpoint.memory import MemorySaver

# Grader 평가지표용
from pydantic import BaseModel, Field

# 그래프 관련
from langgraph.graph import StateGraph, START, END

# Gradio 관련
import gradio as gr

from langchain_community.tools import TavilySearchResults
from langchain_core.runnables import RunnableLambda

##### 2. 임베딩 및 DB설정

In [None]:
#############################
# 2. 임베딩 및 DB 설정
#############################
from langchain_core.embeddings import Embeddings
from sentence_transformers import SentenceTransformer
import torch
 
class LangChainSentenceTransformer(Embeddings):
    def __init__(self, model_name: str):
        device = "cuda" if torch.cuda.is_available() else "cpu"
        print(f"[INFO] Using device: {device}")
        self.model = SentenceTransformer(model_name, device=device)

    def embed_documents(self, texts: List[str]) -> List[List[float]]:
        return self.model.encode(texts, show_progress_bar=False, convert_to_numpy=True).tolist()

    def embed_query(self, text: str) -> List[float]:
        return self.model.encode(text, show_progress_bar=False, convert_to_numpy=True).tolist()

embeddings_model_koMultitask = LangChainSentenceTransformer("jhgan/ko-sroberta-multitask") # 768차원 임배딩 모델로 변경 

# Chroma DB 경로
CHROMA_DIR = "./../findata/chroma_db"

# JSON 데이터 경로
FIXED_JSON_PATH = "./../findata/processed_fixed_deposit.json"
DEMAND_JSON_PATH = "./../findata/processed_demand_deposit.json"

# DB 이름
FIXED_COLLECTION = "processed_fixed_deposit"
DEMAND_COLLECTION = "processed_demand_deposit"

# 정기예금 DB
fixed_deposit_db = Chroma(
    embedding_function=embeddings_model,
    collection_name=FIXED_COLLECTION,
    persist_directory=CHROMA_DIR,
)

# 입출금자유예금 DB
demand_deposit_db = Chroma(
    embedding_function=embeddings_model,
    collection_name=DEMAND_COLLECTION,
    persist_directory=CHROMA_DIR,
)


# JSON -> Document 리스트 변환 함수
def load_documents_from_json(json_path: str) -> list[Document]:
    with open(json_path, "r", encoding="utf-8") as f:
        data = json.load(f)

    documents = []
    
    for entry in data.get("documents",[]):
        content = entry.get("content", "")
        metadata = entry.get("metadata", {})
        documents.append(Document(page_content=content, metadata=metadata))

    return documents


# 조건: DB가 비어 있으면 인제스천 (해당 조건이 없으면 계속 추가 됨..)
if not fixed_deposit_db._collection.count():  # Chroma 내부 count()로 확인
    print("[INFO] fixed_deposit DB is empty. Ingesting documents...")
    fixed_docs = load_documents_from_json(FIXED_JSON_PATH)
    fixed_deposit_db.add_documents(fixed_docs)
    print(f"[INFO] {len(fixed_docs)} fixed deposit docs ingested.")

if not demand_deposit_db._collection.count():
    print("[INFO] demand_deposit DB is empty. Ingesting documents...")
    demand_docs = load_documents_from_json(DEMAND_JSON_PATH)
    demand_deposit_db.add_documents(demand_docs)
    print(f"[INFO] {len(demand_docs)} demand deposit docs ingested.")

##### 3. 도구 정의

In [3]:
#############################
# 3. 도구(검색 함수) 정의
#############################

@tool
def search_fixed_deposit(query: str) -> List[Document]:
    """
    Search for relevant fixed deposit (정기예금) product information using semantic similarity.
    This tool retrieves products matching the user's query, such as interest rates or terms.
    """
    docs = fixed_deposit_db.similarity_search(query, k=1)
    if len(docs) > 0:
        return docs
    return [Document(page_content="관련 정기예금 상품정보를 찾을 수 없습니다.")]


@tool
def search_demand_deposit(query: str) -> List[Document]:
    """
    Search for demand deposit (입출금자유예금) product information using semantic similarity.
    This tool retrieves products matching the user's query, such as flexible withdrawal or interest features.
    """
    docs = demand_deposit_db.similarity_search(query, k=1)
    if len(docs) > 0:
        return docs
    return [Document(page_content="관련 입출금자유예금 상품정보를 찾을 수 없습니다.")]

@tool
def web_search(query: str) -> List[Document]:
    """
    This tool serves as a supplementary utility for the financial product recommendation model.
    It retrieves up-to-date external information via web search using the Tavily API, 
    especially when relevant data is not available in the local vector databases

    Unlike the RAG-based tools that query embedded product databases,
    this tool is designed to handle broader or real-time questions—such as current interest rates, financial trends,
    or general queries outside the scope of structured deposit data.

    It returns the top 2 semantically relevant documents from the web.
    """
@tool
def web_search(query: str) -> List[Document]:
    """
    Tavily API로 웹 검색 후 Document 리스트 반환
    """
    tavily_search = TavilySearchResults(max_results=2)

    try:
        docs = tavily_search.invoke(query)

        # 전체가 str 하나일 경우: 에러 메시지로 처리
        if isinstance(docs, str):
            return [Document(page_content=f"검색 실패: {docs}", metadata={})]

        # 문자열 리스트일 경우 (비정상 케이스일 수도 있음)
        if isinstance(docs, list) and all(isinstance(d, str) for d in docs):
            joined = "\n".join(docs)
            return [Document(page_content=joined, metadata={})]

        # dict로 된 정상적인 검색 결과 처리
        formatted_docs = []
        for doc in docs:
            if isinstance(doc, dict):
                url = doc.get("url", "")
                content = doc.get("content", "내용 없음")
                formatted_docs.append(
                    Document(
                        page_content=f"{content}\n\n 관련 링크: {url}",
                        metadata={"source": "web_search", "url": url}
                    )
                )

        return formatted_docs or [Document(page_content="웹 검색 결과 없음", metadata={})]

    except Exception as e:
        return [Document(page_content=f"예외 발생: {str(e)}", metadata={})]



tools = [search_fixed_deposit, search_demand_deposit, web_search]

##### 4. llm초기화 & 도구 바인딩

In [4]:
#############################
# 4. LLM 초기화 & 도구 바인딩
#############################

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0, streaming=True)

##### 5. LLM 체인 (Retrieval Grader / Answer Generator / Hallucination / Answer Graders / Question Re-writer)


In [None]:
#############################
# 5. LLM 체인 (Retrieval Grader / Answer Generator / Hallucination / Answer Graders / Question Re-writer)
#############################
print("\n===================================================================\n ")
print("LLM 체인\n")
print("# (1) Retrieval Grader\n")

# (1) Retrieval Grader (검색평가)
class BinaryGradeDocuments(BaseModel):
    """Binary score for relevance check on retrieved documents."""
    binary_score: str = Field(
        description="Documents are relevant to the question, 'yes' or 'no'"
    )

structured_llm_BinaryGradeDocuments = llm.with_structured_output(BinaryGradeDocuments)

system_prompt = """You are an expert in evaluating the relevance of search results to user queries.

[Evaluation criteria]
1. 키워드 관련성: 문서가 질문의 주요 단어나 유사어를 포함하는지 확인
2. 의미적 관련성: 문서의 전반적인 주제가 질문의 의도와 일치하는지 평가
3. 부분 관련성: 질문의 일부를 다루거나 맥락 정보를 제공하는 문서도 고려
4. 답변 가능성: 직접적인 답이 아니더라도 답변 형성에 도움될 정보 포함 여부 평가

[Scoring]
- Rate 'yes' if relevant, 'no' if not
- Default to 'no' when uncertain

[Key points]
- Consider the full context of the query, not just word matching
- Rate as relevant if useful information is present, even if not a complete answer

Your evaluation is crucial for improving information retrieval systems. Provide balanced assessments.
"""
# 채점 프롬프트 템플릿
grade_prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    ("human", "[Retrieved document]\n{document}\n\n[User question]\n{question}")
])

retrieval_grader_binary = grade_prompt | structured_llm_BinaryGradeDocuments

# question = "어떤 예금 상품이 있는지 설명해주세요."
# print(f'\nquestion : {question}\n')
# retrieved_docs = fixed_deposit_db.similarity_search(question, k=2)
# print(f"검색된 문서 수: {len(retrieved_docs)}")
# print("===============================================================================")
# print()

# relevant_docs = []
# for doc in retrieved_docs:
#     print("문서:\n", doc.page_content)
#     print("---------------------------------------------------------------------------")

#     relevance = retrieval_grader_binary.invoke({"question": question, "document": doc.page_content})
#     print(f"문서 관련성: {relevance}")

#     if relevance.binary_score == 'yes':
#         relevant_docs.append(doc)
    
#     print("===========================================================================")

# print("\n# (2) Answer Generator (일반 RAG) \n")

def generator_rag_answer(question, docs):
    template = """
    [Your task]
    You are a financial product expert and consultant who always responds in Korean.
    Your task is to answer the user's query based on the given product data.

    [Instructions]
    1. 질문과 관련된 정보를 문맥에서 신중하게 확인합니다.
    2. 답변에 질문과 직접 관련된 정보만 사용합니다.
    3. 문맥에 명시되지 않은 내용에 대해 추측하지 않습니다.
    4. 불필요한 정보를 피하고, 답변을 간결하고 명확하게 작성합니다.
    5. 문맥에서 정확한 답변을 생성할 수 없다면 최대한 필요한 답변을 생성한 뒤 마지막에 "더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다."라고 덧붙여 답변합니다.
    6. 적절한 경우 문맥에서 직접 인용하며, 따옴표를 사용합니다.
    7. 문서에 pdf_link가 있다면 답변 마지막에 상품설명서 링크를 제공하세요.

    [Context]
    {context}

    [Question]
    {question}

    [Answer]
    """

    prompt = ChatPromptTemplate.from_template(template)
    local_llm = ChatOpenAI(model='gpt-4o-mini', temperature=0)

    def format_docs(docs):
        formatted = []
        for doc in docs[:3]:  # 최대 3개 문서
            content = doc.page_content.strip()
            if "pdf_link" in doc.metadata:
                content += f"\n\n📎 상품설명서: {doc.metadata['pdf_link']}"
            formatted.append(content)
        return "\n\n---\n\n".join(formatted)

    rag_chain = prompt | local_llm | StrOutputParser()
    generation = rag_chain.invoke({"context": format_docs(docs), "question": question})
    return generation


generation = generator_rag_answer(question, docs=relevant_docs)
print("Generated Answer (일반 RAG):")
print(generation)

# (3) Hallucination Grader
print("\n# (3) Hallucination Grader\n")

class GradeHallucinations(BaseModel):
    """Binary score for hallucination present in generation answer."""
    binary_score: str = Field(
        description="Answer is grounded in the facts, 'yes' or 'no'"
    )

structured_llm_HradeHallucinations = llm.with_structured_output(GradeHallucinations)

# 환각 평가를 위한 시스템 프롬프트 정의
halluci_system_prompt = """
You are an expert evaluator assessing whether an LLM-generated answer is grounded in and supported by a given set of facts.

[Your task]
- Review the LLM-generated answer.
- Determine if the answer is generally supported by the content of the given facts.
- Allow for paraphrasing, restructuring, and factual summarization.

[Evaluation criteria]
- 'yes': If the answer is *reasonably inferred*, summarized, or paraphrased based on the documents.
- 'no': Only if the answer includes *information that cannot be derived at all* from the documents.

[Scoring]
- 'yes': Grounded and supported
- 'no': Unsupported or fabricated content
"""

hallucination_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", halluci_system_prompt),
        ("human", "[Set of facts]\n{documents}\n\n[LLM generation]\n{generation}"),
    ]
)

hallucination_grader = hallucination_prompt | structured_llm_HradeHallucinations
hallucination = hallucination_grader.invoke({
    "documents": relevant_docs, 
    "generation": generation
})
print(f"환각 평가: {hallucination}")

print("\n# (4) Answer Grader\n")

# (4) Answer Grader 
class BinaryGradeAnswer(BaseModel):
    """Binary score to assess answer addresses question."""
    binary_score: str = Field(
        description="Answer addresses the question, 'yes' or 'no'"
    )

structured_llm_BinaryGradeAnswer = llm.with_structured_output(BinaryGradeAnswer)
grade_system_prompt = """
You are an expert evaluator tasked with assessing whether an LLM-generated answer effectively addresses and resolves a user's question.

[Your task]
    - Carefully analyze the user's question to understand its core intent and requirements.
    - Determine if the LLM-generated answer sufficiently resolves the question.

[Evaluation criteria]
    - 관련성: 답변이 질문과 직접적으로 관련되어야 합니다.
    - 완전성: 질문의 모든 측면이 다뤄져야 합니다.
    - 정확성: 제공된 정보가 정확하고 최신이어야 합니다.
    - 명확성: 답변이 명확하고 이해하기 쉬워야 합니다.
    - 구체성: 질문의 요구 사항에 맞는 상세한 답변이어야 합니다.

[Scoring]
    - 'yes': The answer effectively resolves the question.
    - 'no': The answer fails to sufficiently resolve the question or lacks crucial elements.

Your evaluation plays a critical role in ensuring the quality and effectiveness of AI-generated responses. Strive for balanced and thoughtful assessments.
"""
answer_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", grade_system_prompt),
        ("human", "[User question]\n{question}\n\n[LLM generation]\n{generation}"),
    ]
)

answer_grader_binary = answer_prompt | structured_llm_BinaryGradeAnswer
# print("Question:", question)
# print("Generation:", generation)
# answer_score = answer_grader_binary.invoke({"question": question, "generation": generation})
# print(f"답변 평가: {answer_score}")


# print("\n# (5) Question Re-writer\n")

# 새롭게 추가한 함수
def generate_iteratively(state: "SelfRagOverallState") -> dict:
    print("--- 반복형 Self-RAG 답변 생성 시작 ---")

    all_docs = state.get("documents", []) + state.get("filtered_documents", [])
    seen_contents = set()
    unique_docs = []

    for doc in all_docs:
        if doc.page_content not in seen_contents:
            unique_docs.append(doc)
            seen_contents.add(doc.page_content)

    best_answer = None

    for k in range(1, 4):  # 최대 3회 반복
        print(f"--- [k={k}] 문서 누적 검색 ---")

        # 최대 문서 3개까지만 누적
        if len(unique_docs) < 3:
            new_docs = fixed_deposit_db.similarity_search(state["question"], k=1)
            for doc in new_docs:
                if doc.page_content not in seen_contents:
                    unique_docs.append(doc)
                    seen_contents.add(doc.page_content)
                    if len(unique_docs) >= 3:
                        break

        limited_docs = unique_docs[:3]

        generation = generator_rag_answer(state["question"], limited_docs)

        temp_state = {
            "question": state["question"],
            "generation": generation,
            "documents": limited_docs,
            "num_generations": k
        }

        result = grade_generation_self(temp_state)

        if result == "useful":
            print("--- 유용한 답변 발견 ---")
            return {
                "generation": [generation],
                "documents": limited_docs,
                "num_generations": k
            }

        if result == "not useful" and not best_answer:
            best_answer = generation

    print("--- 반복 3회 완료 → best answer 반환 ---")
    return {
        "generation": [best_answer if best_answer else "죄송합니다. 현재 제공된 문서만으로는 명확한 답변을 드리기 어렵습니다. 질문을 다시 해주시겠어요?"],
        "documents": limited_docs,
        "num_generations": 3,
        "force_end": True # 종료신호
    }


# (5) Question Re-writer
def rewrite_question(question: str) -> str:
    """
    입력 질문을 벡터 검색에 최적화된 형태로 재작성한다.
    """
    local_llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
    system_prompt = """
    You are an expert question re-writer. Your task is to convert input questions into optimized versions 
    for vectorstore retrieval. Analyze the input carefully and focus on capturing the underlying semantic 
    intent and meaning. Your goal is to create a question that will lead to more effective and relevant 
    document retrieval.

    [Guidelines]
        1. Identify and emphasize core concepts and key subjects.
        2. Expand abbreviations or ambiguous terms.
        3. Include synonyms or related terms that might appear in relevant documents.
        4. Maintain the original intent and scope.
        5. For complex questions, break them down into simpler, focused sub-questions.
    """
    re_write_prompt = ChatPromptTemplate.from_messages([
        ("system", system_prompt),
        ("human", "[Initial question]\n{question}\n\n[Improved question]\n")
    ])
    question_rewriter = re_write_prompt | local_llm | StrOutputParser()
    rewritten_question = question_rewriter.invoke({"question": question})
    return rewritten_question

print("\n# (6) Generation Evaluation & Decision Nodes\n")

# (6) Generation Evaluation & Decision Nodes
def grade_generation_self(state: "SelfRagOverallState") -> str:
    print("--- 답변 평가 (생성) ---")

    if state.get("force_end", False):
        print("--- 반복형 생성 종료 → 최종 출력 ---")
        return "useful" # 또는 END 직접반환가능
    
    generation = state["generation"]
    docs_text = "\n\n".join([d.page_content for d in state['documents']])
    
    hallucination_grade = hallucination_grader.invoke({
        "documents": docs_text,
        "generation": generation
    })

    if hallucination_grade.binary_score == "yes":
        relevance_grade = retrieval_grader_binary.invoke({
            "question": state['question'],
            "document": generation
        })

        if relevance_grade.binary_score == "yes":
            print("--- 생성된 답변이 질문을 잘 해결함 ---")
            return "useful"
        else:
            print("--- 관련성 부족 → transform_query ---")
            return "not useful"
    else:
        if state['num_generations'] > 2:
            print("--- 환각 + 3회 초과 → 반복형으로 전환 ---")
            return "generate_iteratively"
        else:
            print("--- 환각 → 일반 생성 재시도 ---")
            return "not supported"

    
def decide_to_generate_self(state: "SelfRagOverallState") -> str:
    print("--- 평가된 문서 분석 (초기 검색 후) ---")
    if not state['filtered_documents'] or len(state['filtered_documents']) < 3:
        print("--- 관련 문서가 부족함 → 반복형 생성으로 전환 ---")
        return "generate_iteratively"
    print("--- 문서 충분함 → 일반 생성 사용 ---")
    return "generate"


# (7) RoutingDecision 
class RoutingDecision(BaseModel):
    """Determines whether a user question should be routed to document search or LLM fallback."""
    route: Literal["search_data","llm_fallback"] = Field(
        description="Classify the question as 'search_data' (financial) or 'llm_fallback' (general)"
        )


 
LLM 체인

# (1) Retrieval Grader


question : 어떤 예금 상품이 있는지 설명해주세요.

검색된 문서 수: 2

문서:
 은행: 정보 없음
상품명: 정보 없음
기본금리(단리이자 %): 정보 없음
최고금리(우대금리포함, 단리이자 %): 정보 없음
은행 최종제공일: 정보 없음
만기 후 금리: 정보 없음
가입방법: 정보 없음
우대조건: 정보 없음
가입 제한조건: 정보 없음
가입대상: 정보 없음
기타 유의사항: 정보 없음
최고한도: 정보 없음
전월취급평균금리(만기 12개월 기준): 정보 없음
---------------------------------------------------------------------------
문서 관련성: binary_score='no'
문서:
 은행: BNK경남은행
상품명: BNK더조은정기예금
기본금리(단리이자 %): 2.55
최고금리(우대금리포함, 단리이자 %): 3.05
은행 최종제공일: 2025-01-24
만기 후 금리: 만기 후 1개월 이내: 일반정기예금 기본이율 Ⅹ50%
만기 후 1개월 초과: 일반정기예금 기본이율 Ⅹ20%
가입방법: 인터넷뱅킹,스마트뱅킹
우대조건: ①가입금액 20백만원 이상인 경우 0.20%
②이 예금 신규시 금리우대쿠폰 등록할 경우 0.20% 
③ 경남은행 오픈뱅킹 서비스에 가입되어 있는 경우
(만기시까지 해당서비스 유지하는 경우) 0.10%
④ 자동재예치 신청 0.05%
(단 금리우대쿠폰과 중복적용 불가)
가입 제한조건: 제한없음
가입대상: 거래대상자는 제한을 두지 아니한다. 다만, 국가 및 지방자치단체는 이 예금을 거래할 수 없다.
기타 유의사항: 1. 이 예금의 계약기간은 3개월 이상 2년 이내 월단위로 한다.
2. 가입금액은 1인당 최소 100만원 이상 5억원 이하이다.
최고한도: 500,000,000원
전월취급평균금리(만기 12개월 기준): 2.86
--------------------------------------------------------------

##### 6. 상태 정의 및 노드 함수 (전체 Adaptive 체인)


In [6]:
# 상태 통합: SelfRagOverallState (질문, 생성, 원본 문서, 필터 문서, 생성 횟수)
#TODO

# 메인 그래프 상태 정의
class SelfRagOverallState(TypedDict):
    """
    Adaptive Self-RAG 체인의 전체 상태를 관리    
    """
    question: str
    generation: Annotated[List[str], add]
    routing_decision: str = "" 
    num_generations: int = 0
    documents: List[Document] = []
    filtered_documents: List[Document] = []

# 질문 재작성 노드 (변경 후 검색 루프)
def transform_query_self(state: SelfRagOverallState) -> dict:
    print("--- 질문 개선 ---")
    new_question = rewrite_question(state['question'])
    print(f"--- 개선된 질문 : \n{new_question} ")
    state['num_generations'] += 1
    state['question'] = new_question  # 상태 업데이트
    print(f"num_generations : {state['num_generations']}")
    return {"question": new_question, "num_generations": state['num_generations']}

# 답변 생성 노드 (서브 그래프로부터 받은 필터 문서 우선 사용)
def generate_self(state: SelfRagOverallState) -> dict:
    print("--- 답변 생성 ---")
    docs = state['filtered_documents'] if state['filtered_documents'] else state['documents']
    generation = generator_rag_answer(state['question'], docs)
    state['num_generations'] += 1
    state['generation'] = generation
    return {
        "generation": [generation],         
        "num_generations": state['num_generations'] + 1,
    }


structured_llm_RoutingDecision = llm.with_structured_output(RoutingDecision)

question_router_system  = """
You are an AI assistant that routes user questions to the appropriate processing path.
Return one of the following labels:
- search_data
- llm_fallback
"""

question_router_prompt = ChatPromptTemplate.from_messages([
    ("system", question_router_system),
    ("human", "{question}")
])

question_router = question_router_prompt | structured_llm_RoutingDecision

# question route 노드 
def route_question_adaptive(state: SelfRagOverallState) -> dict:
    print("--- 질문 판단 (일반 or 금융) ---")
    print(f"질문: {state['question']}")
    decision = question_router.invoke({"question": state['question']})
    print("routing_decision:", decision.route)
    return {"routing_decision": decision.route}

# question route 분기 함수 
def route_question_adaptive_self(state: SelfRagOverallState) -> str:
    """
    질문 분석 및 라우팅: 사용자의 질문을 분석하여 '금융질문'인지 '일반질문'인지 판단
    """
    try:
        if state['routing_decision'] == "llm_fallback":
            print("--- 일반질문으로 라우팅 ---")
            return "llm_fallback"
        else:
            print("--- 금융질문으로 라우팅 ---")
            return "search_data"
    except Exception as e:
        print(f"--- 질문 분석 중 Exception 발생: {e} ---")
        return "llm_fallback"


fallback_prompt = ChatPromptTemplate.from_messages([
    ("system", """
    You are an AI assistant helping with various topics. 
    Respond in Korean.
    - Provide accurate and helpful information.
    - Keep answers concise yet informative.
    - Inform users they can ask for clarification if needed.
    - Let users know they can ask follow-up questions if needed.
    - End every answer with the sentence: "저는 금융상품 질문에 특화되어 있습니다. 금융상품관련 질문을 주세요."
    """),
    ("human", "{question}")
])

def llm_fallback_adaptive(state: SelfRagOverallState):
    """Generates a direct response using the LLM when the question is unrelated to financial products."""
    question = state['question']
    fallback_chain = fallback_prompt | llm | StrOutputParser()
    generation = fallback_chain.invoke({"question": question})
    return {"generation": [generation]}


##### 7. [서브 그래프 통합] - 병렬 검색 서브 그래프 구현


In [7]:
# --- 상태 정의 (검색 서브 그래프 전용) ---
class SearchState(TypedDict):
    question: str
    # generation: str
    documents: Annotated[List[Document], add]  # 팬아웃된 각 검색 결과를 누적할 것
    filtered_documents: List[Document]         # 관련성 평가를 통과한 문서들

# ToolSearchState: SearchState에 추가 정보(datasources) 포함
class ToolSearchState(SearchState):
    datasources: List[str]  # 참조할 데이터 소스 목록

# --- 서브그래프 노드 함수 ---
def search_fixed_deposit_subgraph(state: SearchState):
    """
    정기예금 상품 검색 (서브 그래프)
    """
    question = state["question"]
    print('--- 정기예금 상품 검색 --- ')
    docs = search_fixed_deposit.invoke(question)
    if len(docs) > 0:
        return {"documents": docs}
    else:
        return {"documents": [Document(page_content="관련 정기적금 상품정보를 찾을 수 없습니다.")]}

def search_demand_deposit_subgraph(state: SearchState):
    """
    입출금자유예금 상품 검색 (서브 그래프)
    """
    question = state["question"]
    print('--- 입출금자유예금 상품 검색 ---')
    docs = search_demand_deposit.invoke(question)
    if len(docs) > 0:
        return {"documents": docs}
    else:
        return {"documents": [Document(page_content="관련 입출금자유예금 상품정보를 찾을 수 없습니다.")]}

def filter_documents_subgraph(state: SearchState):
    """
    검색된 문서들에 대해 관련성 평가 후 필터링
    """
    print("--- 문서 관련성 평가 (서브 그래프) ---")
    question = state["question"]
    documents = state["documents"]
    
    filtered_docs = []
    for d in documents:
        score = retrieval_grader_binary.invoke({
            "question": question,
            "document": d.page_content
        })
        if score.binary_score == "yes":
            print("--- 문서 관련성: 있음 ---")
            filtered_docs.append(d)
        else:
            print("--- 문서 관련성: 없음 ---")
    return {"filtered_documents": filtered_docs}

def search_web_search_subgraph(state: SearchState):
    """
    웹 검색 기반 금융 정보 검색 (서브 그래프)
    """
    question = state["question"]
    print('--- 웹 검색 실행 ---')

    docs = web_search.invoke(question) 

    if len(docs) > 0:
        return {"documents": docs}
    else:
        return {"documents": [Document(page_content="관련 웹 정보를 찾을 수 없습니다.")]}

# --- 질문 라우팅 (서브 그래프 전용) ---
class SubgraphToolSelector(BaseModel):
    """Selects the most appropriate tool for the user's question."""
    tool: Literal["search_fixed_deposit", "search_demand_deposit", "web_search"] = Field(
        description="Select one of the tools: search_fixed_deposit, search_demand_deposit or web_search based on the user's question."
    )

class SubgraphToolSelectors(BaseModel):
    """Selects all tools relevant to the user's question."""
    tools: List[SubgraphToolSelector] = Field(
        description="Select one or more tools: search_fixed_deposit, search_demand_deposit or web_search based on the user's question."
    )

structured_llm_SubgraphToolSelectors = llm.with_structured_output(SubgraphToolSelectors)

subgraph_system  = dedent("""\
You are an AI assistant specializing in routing user questions to the appropriate tools.
Use the following guidelines:
- For fixed deposit product queries, use the search_fixed_deposit tool.
- For demand deposit product queries, use the search_demand_deposit tool.
- For general financial or real-time information queries, or when the user explicitly mentions 'web search',
  use the web_search tool.
  Always choose the appropriate tools based on the user's question.
""")
subgraph_route_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", subgraph_system),
        ("human", "{question}")
    ]
)
question_tool_router = subgraph_route_prompt  | structured_llm_SubgraphToolSelectors

def analyze_question_tool_search(state: ToolSearchState):
    """
    질문 분석 및 라우팅: 사용자의 질문에서 참조할 데이터 소스 결정
    """
    print("--- 질문 라우팅 ---")
    question = state["question"]
    result = question_tool_router.invoke({"question": question})
    datasources = [tool.tool for tool in result.tools]
    return {"datasources": datasources}

def route_datasources_tool_search(state: ToolSearchState) -> Sequence[str]:
    """
    라우팅 결과에 따라 실행할 검색 노드를 결정 (병렬로 팬아웃)
    """
    datasources = set(state['datasources'])

    # 명확히 하나만 선택된 경우
    if datasources == {'search_fixed_deposit'}:
        return ['search_fixed_deposit']
    elif datasources == {'search_demand_deposit'}:
        return ['search_demand_deposit']
    elif datasources == {'web_search'}:
        return ['web_search']

    # 도구가 전부 실행되거나 애매모호할 때는 도구 전부 실행
    return ['search_fixed_deposit', 'search_demand_deposit', 'web_search']


# --- 서브 그래프 빌더 구성 ---
search_builder = StateGraph(ToolSearchState)

# 노드 추가
search_builder.add_node("analyze_question", analyze_question_tool_search)
search_builder.add_node("search_fixed_deposit", search_fixed_deposit_subgraph)
search_builder.add_node("search_demand_deposit", search_demand_deposit_subgraph)
search_builder.add_node("web_search", search_web_search_subgraph)
search_builder.add_node("filter_documents", filter_documents_subgraph)

# 엣지 구성
search_builder.add_edge(START, "analyze_question")
search_builder.add_conditional_edges(
    "analyze_question",
    route_datasources_tool_search,
    {
        "search_fixed_deposit": "search_fixed_deposit",
        "search_demand_deposit": "search_demand_deposit",
        "web_search": "web_search"
    }
)
# 두 검색 노드 모두 실행한 후 각각의 결과는 filter_documents로 팬인(fan-in) 처리
search_builder.add_edge("search_fixed_deposit", "filter_documents")
search_builder.add_edge("search_demand_deposit", "filter_documents")
search_builder.add_edge("web_search", "filter_documents")
search_builder.add_edge("filter_documents", END)

# 서브 그래프 컴파일
tool_search_graph = search_builder.compile()

##### 8. [전체 그래프와 결합] - Self-RAG Overall Graph


In [8]:
# 전체 그래프 빌더 (rag_builder) 구성
rag_builder = StateGraph(SelfRagOverallState)

# 노드 추가: 검색 서브 그래프, 생성, 질문 재작성 등
rag_builder.add_node("route_question", route_question_adaptive)
rag_builder.add_node("llm_fallback", llm_fallback_adaptive)
rag_builder.add_node("search_data", tool_search_graph)         # 서브 그래프로 병렬 검색 및 필터링 수행
rag_builder.add_node("generate", generate_self)                # 답변 생성 노드
rag_builder.add_node("generate_iteratively", generate_iteratively)
rag_builder.add_node("transform_query", transform_query_self)  # 질문 개선 노드

# 전체 그래프 엣지 구성
rag_builder.add_edge(START, "route_question")
rag_builder.add_conditional_edges(
    "route_question",
    route_question_adaptive_self, 
    {
        "llm_fallback": "llm_fallback",
        "search_data": "search_data"
    }
)

rag_builder.add_edge("llm_fallback", END)
rag_builder.add_conditional_edges(
    "search_data",
    decide_to_generate_self, 
    {
        "transform_query": "transform_query",
        "generate": "generate",
        "generate_iteratively": "generate_iteratively",
    }
)

rag_builder.add_edge("transform_query", "search_data")
rag_builder.add_conditional_edges(
    "generate",
    grade_generation_self,
    {
        "useful": END,
        "not supported": "generate",      # 환각 발생 시 재생성
        "not useful": "transform_query",  # 관련성 부족 시 질문 재작성 후 재검색
        "generate_iteratively": "generate_iteratively",
    }
)

# generate_iteratively → 평가
rag_builder.add_conditional_edges(
    "generate_iteratively",
    grade_generation_self,
    {
        "useful": END,
        "not useful": "transform_query",
        "not supported": END,
        "generate_iteratively": "generate_iteratively",

    }
)


# MemorySaver 인스턴스 생성 (대화 상태를 저장할 in-memory 키-값 저장소)
memory = MemorySaver()
adaptive_self_rag_memory = rag_builder.compile(checkpointer=memory)
# adaptive_self_rag = rag_builder.compile()

# 그래프 파일 저장하기
# display(Image(adaptive_self_rag.get_graph().draw_mermaid_png()))
with open("adaptive_self_rag_memory.mmd", "w") as f:
    f.write(adaptive_self_rag_memory.get_graph(xray=True).draw_mermaid()) # 저장된 mmd 파일에서 코드 복사 후 https://mermaid.live 에 붙여넣기.


In [25]:
docs = web_search.invoke("2025년 5월 최신 금리 정보를 알려줘")
for i, doc in enumerate(docs, start=1):
    print(f"\n🔹 문서 {i}")
    print("내용:", doc.page_content[:300])
    print("메타데이터:", doc.metadata)


🔹 문서 1
내용: 경제지표 뉴스 채권 채권 경제지표 뉴스 채권 1인당 국내총생산 채권 Apps App Store 경제지표 미국의 기준 금리는 마지막 기록으로 4.50%입니다. | 은행의 대차 대조표 | 23964.10 | 23911.30 | USD - 억 | Mar 2025 | | 외환 보유고 | 35208.00 | 34865.00 | USD - 백만 | Jan 2025 | | Fed Interest Rate | 4.50 | 4.50 | 퍼센트 | Mar 2025 | 뉴스 국내 총생산 국내 총생산 고정가격 국내총생산 1인당 국내총생산 챌린저 해고자 
메타데이터: {'source': 'web_search', 'url': 'https://ko.tradingeconomics.com/united-states/interest-rate'}

🔹 문서 2
내용: 2025년 5월 기준, 24개월, 36개월 만기 은행 정기예금 이율 현황을 이어서 살펴보겠습니다. 앞서 6~12개월 만기 상품은 기본 이율 기준 연 2.50% 이상인

 관련 링크: https://blog.naver.com/rbeod1/223849321321?fromRss=true&trackingCode=rss
메타데이터: {'source': 'web_search', 'url': 'https://blog.naver.com/rbeod1/223849321321?fromRss=true&trackingCode=rss'}


##### 9. Gradio Chatbot 구성 및 실행


In [None]:
# 챗봇 클래스
class ChatBot:
    def __init__(self):
        self.thread_id = str(uuid.uuid4())

    def chat(self, message: str, history: List[Tuple[str, str]]) -> str:
        """
        입력 메시지와 대화 이력을 기반으로 Adaptive Self-RAG 체인을 호출하고,
        응답을 반환합니다.
        """
        config = {"configurable": {"thread_id": self.thread_id}}
        result = adaptive_self_rag_memory.invoke({
            "question": message,
            "num_generations": 0 
            },
            config=config
        )

        gen_list = result.get("generation", [])
        bot_response = gen_list[-1] if gen_list else "죄송합니다. 답변을 생성할 수 없습니다."

        return bot_response


# 챗봇 인스턴스 생성
chatbot = ChatBot()

# Gradio 인터페이스 생성
demo = gr.ChatInterface(
    fn=chatbot.chat,
    title="Adaptive Self-RAG 기반 RAG 챗봇 시스템",
    description="정기예금, 입출금자유예금 상품 및 기타 질문에 답변합니다.",
    examples=[
        "정기예금 상품 중 금리가 가장 높은 것은?",
        "정기예금과 입출금자유예금은 어떤 차이점이 있나요?",
        "은행의 예금 상품을 추천해 주세요."
    ],
    theme=gr.themes.Soft()
)

# Gradio 앱 실행
demo.launch(share=True)

Running on local URL:  http://127.0.0.1:7860
Running on public URL: https://d3902405382cfd6489.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




--- 질문 판단 (일반 or 금융) ---
질문: 수협은행에 관한 상품설명서를 줘봐
routing_decision: search_data
--- 금융질문으로 라우팅 ---
--- 질문 라우팅 ---
--- 웹 검색 실행 ---
--- 문서 관련성 평가 (서브 그래프) ---
--- 문서 관련성: 있음 ---
--- 문서 관련성: 있음 ---
--- 평가된 문서 분석 (초기 검색 후) ---
--- 관련 문서가 부족함 → 반복형 생성으로 전환 ---
--- 반복형 Self-RAG 답변 생성 시작 ---
--- [k=1] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변이 질문을 잘 해결함 ---
--- 유용한 답변 발견 ---
--- 답변 평가 (생성) ---
--- 생성된 답변이 질문을 잘 해결함 ---
--- 질문 판단 (일반 or 금융) ---
질문: 수협평생주거래 우대통장에 대해 설명해줘
routing_decision: llm_fallback
--- 일반질문으로 라우팅 ---
--- 질문 판단 (일반 or 금융) ---
질문: 수협평생주거래 우대통장 상품설명서를 줘봐
routing_decision: search_data
--- 금융질문으로 라우팅 ---
--- 질문 라우팅 ---
--- 입출금자유예금 상품 검색 ---
--- 문서 관련성 평가 (서브 그래프) ---
--- 문서 관련성: 있음 ---
--- 문서 관련성: 없음 ---
--- 문서 관련성: 없음 ---
--- 문서 관련성: 있음 ---
--- 평가된 문서 분석 (초기 검색 후) ---
--- 관련 문서가 부족함 → 반복형 생성으로 전환 ---
--- 반복형 Self-RAG 답변 생성 시작 ---
--- [k=1] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변이 질문을 잘 해결함 ---
--- 유용한 답변 발견 ---
--- 답변 평가 (생성) ---
--- 환각 → 일반 생성 재시도 ---
--- 질문 판단 (일반 or 금융) ---

In [21]:
query = "산업은행 적금상품 추천해줘"
docs = search_demand_deposit.invoke(query)

print(f"\n반환된 문서 수: {len(docs)}개\n")

for i, d in enumerate(docs, start=1):
    print(f"🔹 문서 {i}")
    print("내용:", d.page_content[:300])  # 길면 자르기
    print("PDF 링크:", d.metadata.get("pdf_link", "❌ 없음"))
    print("="*50)


반환된 문서 수: 1개

🔹 문서 1
내용: 은행: Sh수협은행
상품명: Sh평생주거래우대통장
(잔액구간별)
기본금리( %): 0.05
최고금리(우대금리포함,  %): 0.2
이자지급방식: 월지급
은행 최종제공일: 2025-01-20
가입방법: 영업점,스마트뱅킹
우대조건: 기본조건 만족시 매일 최종잔액에 대하여 예금잔액구간에 따라 구간별금리 적용
Ⅰ.매일최종잔액 100만원이하 : 0.05%
Ⅱ.매일최종잔액 100만원초과 300만원이하 : 0.10%
Ⅲ.매일최종잔액 300만원 초과 : 0.10%
*우대금리
-기본조건 충족시 Ⅱ구간에 대하여 0.10%우대적용
-대상:CIF신규고객
PDF 링크: http://localhost:8000/pdf/demand_deposit/수협_평생주거래우대통장.pdf


--- 질문 판단 (일반 or 금융) ---
질문: 안녕
routing_decision: llm_fallback
--- 일반질문으로 라우팅 ---
--- 질문 판단 (일반 or 금융) ---
질문: 정기예금 상품 중 금리가 가장 높은 것은?
routing_decision: search_data
--- 금융질문으로 라우팅 ---
--- 질문 라우팅 ---
--- 정기예금 상품 검색 --- 
--- 문서 관련성 평가 (서브 그래프) ---
--- 문서 관련성: 있음 ---
--- 평가된 문서 분석 (초기 검색 후) ---
--- 관련 문서가 부족함 → 반복형 생성으로 전환 ---
--- 반복형 Self-RAG 답변 생성 시작 ---
--- [k=1] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규 고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 답변 할루시네이션 평가 ---
--- 생성된 답변의 근거가 부족 -> generate 재시도 ---
--- [k=2] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규 고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 답변 할루시네이션 평가 ---
--- 생성된 답변의 근거가 부족 -> generate 재시도 ---
--

In [None]:
# 챗봇 클래스
class ChatBot:
    def __init__(self):
        self.thread_id = str(uuid.uuid4())

    def chat(self, message: str, history: List[Tuple[str, str]]) -> str:
        """
        입력 메시지와 대화 이력을 기반으로 Adaptive Self-RAG 체인을 호출하고,
        응답을 반환합니다.
        """
        config = {"configurable": {"thread_id": self.thread_id}}
        result = adaptive_self_rag_memory.invoke({
            "question": message,
            "num_generations": 0 
            },
            config=config
        )

        gen_list = result.get("generation", [])
        bot_response = gen_list[-1] if gen_list else "죄송합니다. 답변을 생성할 수 없습니다."

        return bot_response


# 챗봇 인스턴스 생성
chatbot = ChatBot()

# Gradio 인터페이스 생성
demo = gr.ChatInterface(
    fn=chatbot.chat,
    title="Adaptive Self-RAG 기반 RAG 챗봇 시스템",
    description="정기예금, 입출금자유예금 상품 및 기타 질문에 답변합니다.",
    examples=[
        "정기예금 상품 중 금리가 가장 높은 것은?",
        "정기예금과 입출금자유예금은 어떤 차이점이 있나요?",
        "은행의 예금 상품을 추천해 주세요."
    ],
    theme=gr.themes.Soft()
)

# Gradio 앱 실행
demo.launch(share=True)

Running on local URL:  http://127.0.0.1:7866
Running on public URL: https://308b98f146832f16f5.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




In [28]:
demo.close()

--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규 고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 생성 2회 초과 → 반복형 생성으로 전환 ---
--- 최대 반복 도달 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: ['문서 기반 답변을 생성할 수 없습니다.', '문서 기반 답변을 생성할 수 없습니다.', '문서 기반 답변을 생성할 수 없습니다.', '문서 기반 답변을 생성할 수 없습니다.', '문서 기반 답변을 생성할 수 없습니다.'] ---
--- 생성 2회 초과 → 반복형 생성으로 전환 ---
--- 반복형 Self-RAG 답변 생성 시작 ---
--- [k=1] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규 고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 답변 할루시네이션 평가 ---
--- 생성된 답변의 근거가 부족 -> generate 재시도 ---
--- [k=2] 문서 누적 검색 ---
Closing server running on port: 7863


--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 답변 할루시네이션 평가 ---
--- 생성된 답변의 근거가 부족 -> generate 재시도 ---
--- [k=3] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규 고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 생성 2회 초과 → 반복형 생성으로 전환 ---
--- [k=4] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금리로, 신규고객 우대이율과 이벤트 우대이율을 통해 최대 0.45%p의 추가 금리를 받을 수 있습니다. 따라서, 정기예금 상품 중에서 금리가 가장 높은 것은 이 상품입니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 생성 2회 초과 → 반복형 생성으로 전환 ---
--- [k=5] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: BNK부산은행의 "더(The) 특판 정기예금" 상품은 최고금리가 3.2%로 제공됩니다. 이 상품은 우대금리를 포함한 금

In [34]:
test_question = "입출금이 자유로운 예금 상품을 추천해주세요."

initial_state = {
    "question": test_question,
    "generation": [],
    "routing_decision": "",
    "num_generations": 0,
    "documents": [],
    "filtered_documents": []
}

# ✅ thread_id 추가로 checkpointer 오류 방지
final_state = adaptive_self_rag_memory.invoke(
    initial_state,
    config={"thread_id": "test-thread"}
)

# 결과 출력
print("\n✅ 최종 생성된 답변:\n")
print(final_state["generation"][0])


--- 질문 판단 (일반 or 금융) ---
질문: 입출금이 자유로운 예금 상품을 추천해주세요.
routing_decision: search_data
--- 금융질문으로 라우팅 ---
--- 질문 라우팅 ---
--- 입출금자유예금 상품 검색 ---
--- 문서 관련성 평가 (서브 그래프) ---
--- 문서 관련성: 없음 ---
--- 평가된 문서 분석 ---
--- 문서 부족 → 반복형 생성 ---
--- 반복형 Self-RAG 답변 생성 시작 ---
--- [k=1] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: Sh수협은행의 "Sh내가만든통장"은 입출금이 자유로운 예금 상품으로 적합합니다. 이 상품은 기본금리가 0.1%이며, 최대 금리는 우대금리를 포함해 1.0%입니다. 이자는 월 지급되며, 가입 방법은 영업점이나 스마트뱅킹을 통해 가능합니다. 

가입 시 최소 지정금액은 1천만원이며, 최대 고객 지정금액은 10억원입니다. 이 상품은 실명의 개인에게 제한 없이 가입할 수 있으며, 1인 1계좌로 운영됩니다. 

입출금이 자유로운 조건을 원하신다면 이 상품이 적합할 것입니다. 더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다. ---
--- 답변 할루시네이션 평가 ---
--- 생성된 답변의 근거가 부족 -> generate 재시도 ---
--- [k=2] 문서 누적 검색 ---
--- 답변 평가 (생성) ---
--- 생성된 답변: 입출금이 자유로운 예금 상품으로는 Sh수협은행의 "Sh내가만든통장"을 추천드립니다. 이 상품은 기본금리가 0.1%이며, 최대 금리는 1.0%로 우대금리를 포함하고 있습니다. 이자 지급 방식은 월 지급이며, 가입 방법은 영업점이나 스마트뱅킹을 통해 가능합니다. 

가입 시 최소 지정금액은 1천만원이며, 최대 고객 지정금액은 10억원입니다. 이 상품은 실명의 개인이 가입할 수 있으며, 가입 제한 조건은 없습니다. 

더 구체적인 정보를 알려주시면 더욱 명쾌한 답변을 할 수 있습니다.

In [29]:
raise SystemExit("Execution manually stopped.")


SystemExit: Execution manually stopped.