# 3주차 과제: Retriever와 RetrievalQA 체인으로 기술 문서 Q&A 챗봇 만들기

## 개요
- 2주차에서 구현한 Document Loader → Text Splitter → Embedding → Vector Store 파이프라인 활용
- Retriever와 RetrievalQA 체인을 통한 완전한 RAG 챗봇 구현
- 검색된 문서를 기반으로 자연어 답변 생성

## Part 1: 환경 설정 및 2주차 파이프라인 재구성

In [19]:
# ===============================================
# 환경 변수 및 설정
# ===============================================
import os
import warnings
from dotenv import load_dotenv

warnings.filterwarnings("ignore")

# .env 파일에서 환경 변수 로드
load_dotenv()

# OpenAI API 키 확인
if not os.getenv("OPENAI_API_KEY"):
    print(" * 경고: OPENAI_API_KEY가 .env 파일에 설정되지 않았습니다.")
else:
    # API 키의 처음 10자만 표시 (보안)
    api_key = os.getenv("OPENAI_API_KEY")
    print(f" * OpenAI API 키 로드 완료 !")


# 파일 경로 설정
DATA_DIRECTORY = r"D:\data"  # 문서가 저장된 디렉토리
PERSIST_DIRECTORY = r"D:\data\chroma_db"  # 벡터 DB 저장 경로

# Retriever 설정 파라미터 (쉽게 수정 가능)
RETRIEVER_CONFIG = {
    "search_type": "similarity",  # similarity, mmr, similarity_score_threshold
    "search_kwargs": {
        "k": 3,  # 검색할 문서 수
        # "score_threshold": 0.5  # similarity_score_threshold 사용 시
    },
}

# LLM 설정
LLM_CONFIG = {"model": "gpt-5-mini", "temperature": 1, "max_tokens": 1000}

print("환경 설정 완료")
print(f"- 데이터 디렉토리: {DATA_DIRECTORY}")
print(f"- 벡터 DB 경로: {PERSIST_DIRECTORY}")
print(f"- Retriever 설정: {RETRIEVER_CONFIG}")
print(f"- LLM 설정: {LLM_CONFIG}")

 * OpenAI API 키 로드 완료 !
환경 설정 완료
- 데이터 디렉토리: D:\data
- 벡터 DB 경로: D:\data\chroma_db
- Retriever 설정: {'search_type': 'similarity', 'search_kwargs': {'k': 3}}
- LLM 설정: {'model': 'gpt-5-mini', 'temperature': 1, 'max_tokens': 1000}


In [20]:
# ===============================================
# 유틸리티 함수 정의 (2주차 코드)
# ===============================================


def load_documents_safe(directory_path, file_types=None, verbose=True):
    """디렉토리에서 문서를 안전하게 로드하는 함수"""
    from langchain_community.document_loaders import (
        PyPDFLoader,
        Docx2txtLoader,
        TextLoader,
        UnstructuredMarkdownLoader,
        UnstructuredHTMLLoader,
    )
    import os

    if file_types is None:
        file_types = [".pdf", ".docx", ".txt", ".md", ".html"]

    documents = []
    error_files = []

    loader_map = {
        ".pdf": PyPDFLoader,
        ".docx": Docx2txtLoader,
        ".txt": TextLoader,
        ".md": UnstructuredMarkdownLoader,
        ".html": UnstructuredHTMLLoader,
    }

    for root, dirs, files in os.walk(directory_path):
        for file in files:
            file_path = os.path.join(root, file)
            file_ext = os.path.splitext(file)[1].lower()

            if file_ext not in file_types:
                continue

            try:
                loader_class = loader_map.get(file_ext)
                if loader_class:
                    if file_ext == ".txt":
                        loader = loader_class(file_path, encoding="utf-8")
                    else:
                        loader = loader_class(file_path)

                    docs = loader.load()

                    # 메타데이터 추가
                    for doc in docs:
                        doc.metadata["source"] = file_path
                        doc.metadata["file_name"] = file
                        doc.metadata["file_type"] = file_ext

                    documents.extend(docs)

                    if verbose:
                        print(f"  ✓ {file} 로드 완료 (문서 {len(docs)}개)")

            except Exception as e:
                error_files.append((file, str(e)))
                if verbose:
                    print(f"  ✗ {file} 로드 실패: {e}")

    return documents, error_files


def split_documents_optimized(
    documents, chunk_size=1000, chunk_overlap=200, separators=None
):
    """문서를 최적화된 방식으로 분할하는 함수"""
    from langchain.text_splitter import RecursiveCharacterTextSplitter

    if separators is None:
        separators = ["\n\n", "\n", ".", "!", "?", ",", " ", ""]

    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=chunk_size,
        chunk_overlap=chunk_overlap,
        separators=separators,
        length_function=len,
    )

    chunks = []
    for i, doc in enumerate(documents):
        doc_chunks = text_splitter.split_documents([doc])

        # 청크에 추가 메타데이터 추가
        for j, chunk in enumerate(doc_chunks):
            chunk.metadata["chunk_index"] = j
            chunk.metadata["total_chunks"] = len(doc_chunks)
            chunk.metadata["doc_index"] = i

        chunks.extend(doc_chunks)

    return chunks


def create_vectorstore_safe(chunks, embeddings, persist_dir, batch_size=100):
    """안전하게 벡터 저장소를 생성하는 함수"""
    import os
    import shutil
    from langchain_community.vectorstores import Chroma

    # 기존 DB가 있으면 삭제 (차원 불일치 문제 방지)
    if os.path.exists(persist_dir):
        print(f"  기존 벡터 DB 삭제 중...")
        shutil.rmtree(persist_dir)

    # 디렉토리 생성
    os.makedirs(persist_dir, exist_ok=True)

    vectorstore = None
    total_chunks = len(chunks)

    for i in range(0, total_chunks, batch_size):
        batch = chunks[i : i + batch_size]
        batch_end = min(i + batch_size, total_chunks)
        print(f"  처리 중: {i+1}-{batch_end}/{total_chunks}")

        if vectorstore is None:
            vectorstore = Chroma.from_documents(
                documents=batch,
                embedding=embeddings,
                persist_directory=persist_dir,
                collection_metadata={"hnsw:space": "cosine"},
            )
        else:
            vectorstore.add_documents(batch)

    if vectorstore:
        vectorstore.persist()

    return vectorstore


print("유틸리티 함수 정의 완료")

유틸리티 함수 정의 완료


## Part 2: 2주차 파이프라인 실행 (데이터 준비)

In [21]:
# ===============================================
# 셀 4: 문서 로드
# ===============================================
print("[Step 1] 문서 로드 시작")
print(f"디렉토리: {DATA_DIRECTORY}\n")

# 데이터 디렉토리 생성 및 확인
os.makedirs(DATA_DIRECTORY, exist_ok=True)

# 디렉토리에 파일이 있는지 확인
import glob

files_in_dir = glob.glob(f"{DATA_DIRECTORY}/**/*", recursive=True)
print(f"데이터 폴더의 파일 목록:")
for f in files_in_dir:
    if os.path.isfile(f):
        print(f"  - {f}")

if not files_in_dir:
    print("* data 폴더가 비어있습니다! PDF, DOCX, TXT 등의 파일을 추가하세요.")

documents, error_files = load_documents_safe(
    DATA_DIRECTORY, file_types=[".pdf", ".docx", ".txt", ".md", ".html"], verbose=True
)

print(f"\n로드 완료: 총 {len(documents)}개 문서")
if error_files:
    print(f"로드 실패: {len(error_files)}개 파일")

[Step 1] 문서 로드 시작
디렉토리: D:\data

데이터 폴더의 파일 목록:
  - D:\data\2023 당뇨병 진료지침_전문_240620.pdf
  - D:\data\rag_experiment_20251201_175820.json
  - D:\data\chroma_db\chroma.sqlite3
  - D:\data\chroma_db\689cdcf3-3181-41f7-82ce-5320b37b1411\data_level0.bin
  - D:\data\chroma_db\689cdcf3-3181-41f7-82ce-5320b37b1411\header.bin
  - D:\data\chroma_db\689cdcf3-3181-41f7-82ce-5320b37b1411\length.bin
  - D:\data\chroma_db\689cdcf3-3181-41f7-82ce-5320b37b1411\link_lists.bin
  ✓ 2023 당뇨병 진료지침_전문_240620.pdf 로드 완료 (문서 428개)

로드 완료: 총 428개 문서


In [22]:
# ===============================================
# 셀 5: 문서 분할
# ===============================================
print("[Step 2] 문서 분할")

chunks = split_documents_optimized(documents, chunk_size=1000, chunk_overlap=200)

print(f"분할 완료: 총 {len(chunks)}개 청크 생성")
print(
    f"평균 청크 크기: {sum(len(c.page_content) for c in chunks) / len(chunks):.0f} 문자"
)

[Step 2] 문서 분할
분할 완료: 총 925개 청크 생성
평균 청크 크기: 742 문자


In [23]:
# ===============================================
# 셀 6: 임베딩 모델 설정
# ===============================================
print("[Step 3] 임베딩 모델 로드")

from langchain_community.embeddings import HuggingFaceEmbeddings

# 한국어 특화 임베딩 모델 사용
embeddings = HuggingFaceEmbeddings(
    model_name="jhgan/ko-sroberta-multitask",
    model_kwargs={"device": "cpu"},
    encode_kwargs={"normalize_embeddings": True},
)

# 임베딩 차원 확인
test_embedding = embeddings.embed_query("테스트")
print(f"임베딩 모델 로드 완료")
print(f"임베딩 차원: {len(test_embedding)}")

[Step 3] 임베딩 모델 로드
임베딩 모델 로드 완료
임베딩 차원: 768


In [24]:
# ===============================================
# 셀 7: 벡터 DB 생성
# ===============================================
print("[Step 4] 벡터 DB 생성")

# 기존 벡터스토어가 있으면 먼저 정리
if "vectorstore" in globals():
    try:
        # 기존 연결 종료
        if hasattr(vectorstore, "_client"):
            vectorstore._client.close()
        del vectorstore
        print("  기존 벡터스토어 연결 종료")
    except:
        pass

# 잠시 대기 (Windows 파일 시스템 동기화)
import time
import gc

gc.collect()  # 가비지 컬렉션 강제 실행
time.sleep(1)

# 안전한 삭제 시도
if os.path.exists(PERSIST_DIRECTORY):
    try:
        import shutil

        shutil.rmtree(PERSIST_DIRECTORY)
        print(f"  기존 벡터 DB 삭제 완료")
    except PermissionError:
        # 삭제 실패 시 새로운 디렉토리 사용
        import datetime

        timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
        PERSIST_DIRECTORY = f"./chroma_db_korean_{timestamp}"
        print(f"  * 기존 DB 삭제 실패. 새 디렉토리 사용: {PERSIST_DIRECTORY}")

# 벡터 DB 생성
vectorstore = create_vectorstore_safe(
    chunks, embeddings, PERSIST_DIRECTORY, batch_size=50
)

print(f"\n벡터 DB 생성 완료")
print(f"  - 저장 위치: {PERSIST_DIRECTORY}")
print(f"  - 저장된 문서 수: {len(chunks)}")

[Step 4] 벡터 DB 생성
  * 기존 DB 삭제 실패. 새 디렉토리 사용: ./chroma_db_korean_20251208_204126
  처리 중: 1-50/925
  처리 중: 51-100/925
  처리 중: 101-150/925
  처리 중: 151-200/925
  처리 중: 201-250/925
  처리 중: 251-300/925
  처리 중: 301-350/925
  처리 중: 351-400/925
  처리 중: 401-450/925
  처리 중: 451-500/925
  처리 중: 501-550/925
  처리 중: 551-600/925
  처리 중: 601-650/925
  처리 중: 651-700/925
  처리 중: 701-750/925
  처리 중: 751-800/925
  처리 중: 801-850/925
  처리 중: 851-900/925
  처리 중: 901-925/925

벡터 DB 생성 완료
  - 저장 위치: ./chroma_db_korean_20251208_204126
  - 저장된 문서 수: 925


## Part 3: Retriever 설정 (3주차 신규)

In [25]:
# ===============================================
# 셀 8: Retriever 생성 및 설정
# ===============================================
print("[Step 5] Retriever 설정")

# 기존 벡터 DB 로드 (이미 생성된 경우)
from langchain_community.vectorstores import Chroma

# 벡터스토어가 None이면 다시 로드
if vectorstore is None:
    vectorstore = Chroma(
        persist_directory=PERSIST_DIRECTORY, embedding_function=embeddings
    )
    print("  기존 벡터 DB 로드 완료")

# Retriever 생성 (설정 파라미터 사용)
retriever = vectorstore.as_retriever(
    search_type=RETRIEVER_CONFIG["search_type"],
    search_kwargs=RETRIEVER_CONFIG["search_kwargs"],
)

print(f"\nRetriever 설정 완료:")
print(f"  - 검색 타입: {RETRIEVER_CONFIG['search_type']}")
print(f"  - 검색 파라미터: {RETRIEVER_CONFIG['search_kwargs']}")

# Retriever 테스트
test_query = "LangChain"
test_docs = retriever.get_relevant_documents(test_query)
print(f"\n테스트 검색 '{test_query}': {len(test_docs)}개 문서 검색됨")

[Step 5] Retriever 설정

Retriever 설정 완료:
  - 검색 타입: similarity
  - 검색 파라미터: {'k': 3}

테스트 검색 'LangChain': 3개 문서 검색됨


## Part 4: RetrievalQA 체인 구현 (3주차 핵심)

In [26]:
# ===============================================
# 셀 9: LLM 및 프롬프트 템플릿 설정
# ===============================================
print("[Step 6] LLM 및 프롬프트 설정")

from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate

# LLM 초기화
llm = ChatOpenAI(
    model=LLM_CONFIG["model"],
    temperature=LLM_CONFIG["temperature"],
    max_tokens=LLM_CONFIG["max_tokens"],
)

# 프롬프트 템플릿 정의
prompt_template = """당신은 주어진 문서에 기반해서만 답변하는 AI 어시스턴트입니다.

다음 규칙을 반드시 따라주세요:
1. 제공된 문서 내용을 기반으로만 답변하세요.
2. 문서에 없는 내용은 "제공된 문서에 해당 정보가 없습니다"라고 명확히 말씀해주세요.
3. 답변 시 근거가 된 문서의 출처를 명시해주세요.

참고 문서:
{context}

질문: {question}

답변 형식:
【답변】
(1줄 요약 답변을 먼저 제공)

【상세 설명】
(필요시 자세한 설명 추가)

【출처】
(근거가 된 문서 정보: 파일명, 청크 인덱스)

답변:"""

PROMPT = PromptTemplate(
    template=prompt_template, input_variables=["context", "question"]
)

print("LLM 및 프롬프트 설정 완료")
print(f"  - 모델: {LLM_CONFIG['model']}")
print(f"  - Temperature: {LLM_CONFIG['temperature']}")

[Step 6] LLM 및 프롬프트 설정
LLM 및 프롬프트 설정 완료
  - 모델: gpt-5-mini
  - Temperature: 1


In [27]:
# ===============================================
# 셀 10: RetrievalQA 체인 구현 (방법 1: LangChain RetrievalQA)
# ===============================================
print("[Step 7] RetrievalQA 체인 구현 (방법 1)")

from langchain.chains import RetrievalQA

# RetrievalQA 체인 생성
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",  # stuff, map_reduce, refine, map_rerank
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": PROMPT, "verbose": False},
)

print("RetrievalQA 체인 생성 완료 (LangChain 클래스 방식)")

[Step 7] RetrievalQA 체인 구현 (방법 1)
RetrievalQA 체인 생성 완료 (LangChain 클래스 방식)


In [28]:
# ===============================================
# 셀 11: RetrievalQA 체인 구현 (방법 2: LCEL 스타일)
# ===============================================
print("[Step 7-2] RetrievalQA 체인 구현 (방법 2: LCEL)")

from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser


def format_docs(docs):
    """검색된 문서를 포맷팅하는 함수"""
    formatted_docs = []
    for i, doc in enumerate(docs):
        source = doc.metadata.get("file_name", "Unknown")
        chunk_idx = doc.metadata.get("chunk_index", "Unknown")
        content = doc.page_content[:500]  # 내용 일부만 표시

        formatted = f"""[문서 {i+1}]
파일: {source}
청크: {chunk_idx}
내용: {content}...
"""
        formatted_docs.append(formatted)

    return "\n".join(formatted_docs)


# LCEL 스타일 체인 구성
lcel_qa_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | PROMPT
    | llm
    | StrOutputParser()
)

print("LCEL 스타일 RetrievalQA 체인 생성 완료")

[Step 7-2] RetrievalQA 체인 구현 (방법 2: LCEL)
LCEL 스타일 RetrievalQA 체인 생성 완료


## Part 5: Q&A 챗봇 인터페이스

In [29]:
# ===============================================
# 셀 12: 챗봇 헬퍼 함수
# ===============================================


def answer_question_v1(question, qa_chain):
    """LangChain RetrievalQA를 사용한 답변 생성"""
    try:
        result = qa_chain({"query": question})

        answer = result["result"]
        source_docs = result.get("source_documents", [])

        # 출처 정보 추가
        if source_docs:
            sources = []
            for doc in source_docs[:3]:  # 상위 3개만
                file_name = doc.metadata.get("file_name", "Unknown")
                chunk_idx = doc.metadata.get("chunk_index", "Unknown")
                sources.append(f"- {file_name} (청크 {chunk_idx})")

            if "【출처】" not in answer:
                answer += "\n\n【출처】\n" + "\n".join(sources)

        return answer

    except Exception as e:
        return f"답변 생성 중 오류 발생: {str(e)}"


def answer_question_v2(question, lcel_chain):
    """LCEL 체인을 사용한 답변 생성"""
    try:
        answer = lcel_chain.invoke(question)
        return answer
    except Exception as e:
        return f"답변 생성 중 오류 발생: {str(e)}"


print("챗봇 헬퍼 함수 정의 완료")

챗봇 헬퍼 함수 정의 완료


In [30]:
# ===============================================
# 셀 13: 대화형 Q&A 챗봇 인터페이스
# ===============================================
print("=" * 50)
print("*** 기술 문서 Q&A 챗봇 ***")
print("=" * 50)
print("질문을 입력하세요. 종료하려면 'exit', 'quit', 또는 '종료'를 입력하세요.\n")

# 방법 선택
use_lcel = False  # True :  LCEL 체인 사용, False : RetrievalQA 사용

if use_lcel:
    print("[LCEL 체인 모드]\n")
    chain_to_use = lcel_qa_chain
    answer_func = answer_question_v2
else:
    print("[LangChain RetrievalQA 모드]\n")
    chain_to_use = qa_chain
    answer_func = answer_question_v1

# 대화 루프
conversation_history = []

while True:
    question = input("\n Q: 질문- ").strip()

    if question.lower() in ["exit", "quit", "종료", "q"]:
        print("\n 챗봇을 종료합니다. 감사합니다!")
        break

    if not question:
        print("* 질문을 입력해주세요.")
        continue

    print("\n * 관련 문서를 검색 중...")

    # 답변 생성
    if use_lcel:
        answer = answer_func(question, chain_to_use)
    else:
        answer = answer_func(question, chain_to_use)

    print("\n A: 답변 -")
    print("-" * 40)
    print(answer)
    print("-" * 40)

    # 대화 기록 저장
    conversation_history.append({"question": question, "answer": answer})

*** 기술 문서 Q&A 챗봇 ***
질문을 입력하세요. 종료하려면 'exit', 'quit', 또는 '종료'를 입력하세요.

[LangChain RetrievalQA 모드]


 챗봇을 종료합니다. 감사합니다!


## Part 6: 테스트 시나리오 (최소 8문항)

In [31]:
# ===============================================
# 셀 14: 테스트 시나리오 정의
# ===============================================

# 테스트 질문 세트
test_questions = [
    # 카테고리 1: 문서에 답이 명확히 있는 질문 (5개)
    {
        "category": "명확한 답변",
        "question": "당뇨병의 진단 기준은 무엇인가요?",
        "expected": "공복혈당, 당화혈색소, 경구당부하검사 기준 설명",
    },
    {
        "category": "명확한 답변",
        "question": "당화혈색소(HbA1c)의 목표치는 얼마인가요?",
        "expected": "일반적으로 7% 미만, 개별화된 목표 설정",
    },
    {
        "category": "명확한 답변",
        "question": "메트포르민(Metformin)의 작용 기전과 용법은?",
        "expected": "1차 약제, 간 포도당 생성 억제, 용량 등",
    },
    {
        "category": "명확한 답변",
        "question": "당뇨병성 망막병증의 선별검사는 언제 시행하나요?",
        "expected": "제2형 당뇨병 진단 시, 제1형은 5년 후부터 매년",
    },
    {
        "category": "명확한 답변",
        "question": "저혈당의 정의와 증상은 무엇인가요?",
        "expected": "70mg/dL 미만, 떨림, 발한, 의식저하 등",
    },
    # 카테고리 2: 문서에 없거나 애매한 질문 (3개)
    {
        "category": "문서에 없음",
        "question": "2024년 노벨물리학상 수상자는 누구인가요?",
        "expected": "문서에 정보가 없다는 답변",
    },
    {
        "category": "문서에 없음",
        "question": "비트코인의 현재 가격은 얼마인가요?",
        "expected": "문서에 정보가 없다는 답변",
    },
    {
        "category": "문서에 없음",
        "question": "김치찌개 맛있게 끓이는 방법은?",
        "expected": "문서에 정보가 없다는 답변",
    },
    # 카테고리 3: 비교/응용형 질문 (2개)
    {
        "category": "비교/응용",
        "question": "SGLT2 억제제와 GLP-1 수용체 작용제의 차이점을 비교해주세요.",
        "expected": "작용 기전, 체중 감소, 심혈관 이익 등 비교",
    },
    {
        "category": "비교/응용",
        "question": "새로 진단받은 제2형 당뇨병 환자의 초기 치료 전략은 어떻게 수립하나요?",
        "expected": "생활습관 교정, 메트포르민, 개별화된 목표 설정 등",
    },
]

print(f"테스트 질문 {len(test_questions)}개 준비 완료")
print("\n카테고리별 분포:")
print("- 명확한 답변 가능: 5개")
print("- 문서에 없는 내용: 3개")
print("- 비교/응용형: 2개")

테스트 질문 10개 준비 완료

카테고리별 분포:
- 명확한 답변 가능: 5개
- 문서에 없는 내용: 3개
- 비교/응용형: 2개


In [None]:
# ===============================================
# 셀 15: 자동 테스트 실행
# ===============================================
print("=" * 60)
print("* 테스트 시나리오 실행")
print("=" * 60)

test_results = []

for i, test_case in enumerate(test_questions, 1):
    print(f"\n[테스트 {i}/{len(test_questions)}]")
    print(f"카테고리: {test_case['category']}")
    print(f"질문: {test_case['question']}")
    print("-" * 40)

    # 답변 생성
    answer = answer_func(test_case["question"], chain_to_use)

    # 답변 일부만 출력 (전체는 결과에 저장)
    print("답변 (요약):")
    print(answer[:300] + "..." if len(answer) > 300 else answer)

    # 결과 저장
    test_results.append(
        {
            "번호": i,
            "카테고리": test_case["category"],
            "질문": test_case["question"],
            "예상 답변": test_case["expected"],
            "실제 답변": answer,
            "답변 길이": len(answer),
        }
    )

    print("\n" + "=" * 60)

* 테스트 시나리오 실행

[테스트 1/10]
카테고리: 명확한 답변
질문: 당뇨병의 진단 기준은 무엇인가요?
----------------------------------------
답변 (요약):


【출처】
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)


[테스트 2/10]
카테고리: 명확한 답변
질문: 당화혈색소(HbA1c)의 목표치는 얼마인가요?
----------------------------------------
답변 (요약):


【출처】
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)


[테스트 3/10]
카테고리: 명확한 답변
질문: 메트포르민(Metformin)의 작용 기전과 용법은?
----------------------------------------
답변 (요약):


【출처】
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)
- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)


[테스트 4/10]
카테고리: 명확한 답변
질문: 당뇨병성 망막병증의 선별검사는 언제 시행하나요?
----------------------------------------
답변 (요약):
【답변】
1형당뇨병은 진단 후 5년 이내에, 2형당뇨병은 진단과 동시에 망막 주변부를 포함한 안저검사 및 포괄적 안과검진을 시행하고, 이후 보통 매년 검진하되 망막병증 소견이 없고 혈당조절이 잘되면 1–2년 간격으로 연장할 수 있습니다.

【상세 설명】
- 1형당뇨병: 당뇨병 진단 후 5년 이내에 산동안저검사(망막 주변부 포함) 및 포괄적 안과검진 권고.  
- 2형당뇨병: 

In [None]:
# ===============================================
# 셀 16: 테스트 결과 분석 및 리포트
# ===============================================
import pandas as pd

print("\n" + "=" * 60)
print(" 테스트 결과 분석")
print("=" * 60)

# DataFrame으로 변환
df_results = pd.DataFrame(test_results)

# 기본 통계
print("\n1. 답변 통계:")
print(f"  - 총 테스트 수: {len(df_results)}")
print(f"  - 평균 답변 길이: {df_results['답변 길이'].mean():.0f} 문자")
print(f"  - 최소 답변 길이: {df_results['답변 길이'].min()} 문자")
print(f"  - 최대 답변 길이: {df_results['답변 길이'].max()} 문자")

# 카테고리별 분석
print("\n2. 카테고리별 평균 답변 길이:")
category_stats = df_results.groupby("카테고리")["답변 길이"].mean()
for cat, avg_len in category_stats.items():
    print(f"  - {cat}: {avg_len:.0f} 문자")

# "문서에 없음" 검출 분석
print("\n3. '문서에 없음' 답변 검출:")
no_info_keywords = ["문서에", "정보가 없", "찾을 수 없", "제공된 문서"]
for _, row in df_results[df_results["카테고리"] == "문서에 없음"].iterrows():
    has_no_info = any(keyword in row["실제 답변"] for keyword in no_info_keywords)
    status = " O 올바름" if has_no_info else "X 할루시네이션 의심"
    print(f"  - 질문 {row['번호']}: {status}")

# 결과 요약 테이블
print("\n4. 전체 테스트 결과 요약:")
summary_df = df_results[["번호", "카테고리", "질문", "답변 길이"]].copy()
summary_df["답변 요약"] = df_results["실제 답변"].str[:100] + "..."
print(summary_df.to_string(index=False))


 테스트 결과 분석

1. 답변 통계:
  - 총 테스트 수: 10
  - 평균 답변 길이: 177 문자
  - 최소 답변 길이: 117 문자
  - 최대 답변 길이: 370 문자

2. 카테고리별 평균 답변 길이:
  - 명확한 답변: 117 문자
  - 문서에 없음: 316 문자
  - 비교/응용: 117 문자

3. '문서에 없음' 답변 검출:
  - 질문 6:  O 올바름
  - 질문 7:  O 올바름
  - 질문 8:  O 올바름

4. 전체 테스트 결과 요약:
 번호   카테고리                                       질문  답변 길이                                                                                                        답변 요약
  1 명확한 답변                       당뇨병의 진단 기준은 무엇인가요?    117 \n\n【출처】\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)\n- 2023 당뇨병 진료지침_전문_...
  2 명확한 답변                당화혈색소(HbA1c)의 목표치는 얼마인가요?    117 \n\n【출처】\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 0)\n- 2023 당뇨병 진료지침_전문_...
  3 명확한 답변            메트포르민(Metformin)의 작용 기전과 용법은?    117 \n\n【출처】\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)\n- 2023 당뇨병 진료지침_전문_240620.pdf (청크 1)\n- 2023 당뇨병 진료지침_전문_...
  4 명확한 답변               당뇨병성 망막병증의 선별검사는 언제 시행하나요?    117 \n

In [None]:
# ===============================================
# 셀 17: 결과 저장
# ===============================================
import json
from datetime import datetime

# 테스트 결과를 JSON으로 저장
output_dir = "./test_results"
os.makedirs(output_dir, exist_ok=True)

timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
output_file = os.path.join(output_dir, f"qa_test_results_{timestamp}.json")

# 결과 데이터 준비
save_data = {
    "test_date": timestamp,
    "config": {"retriever": RETRIEVER_CONFIG, "llm": LLM_CONFIG},
    "results": test_results,
    "summary": {
        "total_tests": len(test_results),
        "avg_answer_length": float(df_results["답변 길이"].mean()),
        "categories": df_results["카테고리"].value_counts().to_dict(),
    },
}

# JSON 파일로 저장
with open(output_file, "w", encoding="utf-8") as f:
    json.dump(save_data, f, ensure_ascii=False, indent=2)

print(f"\n* 테스트 결과 저장 완료: {output_file}")


* 테스트 결과 저장 완료: ./test_results\qa_test_results_20251208_193301.json


# 4주차 과제: 랭그래프와 메모리로 멀티턴 대화 챗봇 구현

## 개요
- 3주차에서 구현한 Retriever + RetrievalQA 기반 기술 문서 Q&A 챗봇 확장
- ConversationMemory(예: ConversationBufferMemory, ConversationSummaryMemory)를 사용해 대화 맥락을 유지하는 멀티턴 RAG 챗봇 구현
- 동일 시나리오에 대해 메모리 ON/OFF 결과를 비교하여 대화 품질·문맥 유지 능력 분석

In [None]:
# ===============================================
# Part 7: 메모리 적용 RAG 멀티턴 챗봇 구현 (4주차 핵심)
# ===============================================
from typing import List, Dict, Any

from langchain.memory import (
    ConversationBufferMemory,
    ConversationBufferWindowMemory,
    ConversationSummaryMemory,
)
from langchain.chains import LLMChain
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

# -----------------------------------------------
# 7-1. 메모리 타입 설정
#    - 필요에 따라 원하는 타입 하나를 골라 사용하면 됩니다.
#    - 실험을 위해 둘 이상 만들어서 비교해도 좋습니다.
# -----------------------------------------------

MEMORY_TYPE = "buffer"  # "buffer", "window", "summary" 중에서 선택

if MEMORY_TYPE == "buffer":
    memory = ConversationBufferMemory(
        memory_key="chat_history",
        input_key="question",
        return_messages=True,
    )
elif MEMORY_TYPE == "window":
    memory = ConversationBufferWindowMemory(
        memory_key="chat_history",
        input_key="question",
        return_messages=True,
        k=5,  # 최근 k턴만 유지
    )
elif MEMORY_TYPE == "summary":
    from langchain.chains import ConversationChain

    # Summary 메모리는 보통 별도의 요약 체인과 함께 쓰지만
    # 여기서는 간단하게 LLM 한 개로 요약하게 둡니다.
    memory = ConversationSummaryMemory(
        llm=llm,  # 3주차에서 사용하던 llm 객체 재사용
        memory_key="chat_history",
        input_key="question",
        return_messages=True,
    )
else:
    raise ValueError(
        "MEMORY_TYPE 은 'buffer' | 'window' | 'summary' 중 하나여야 합니다."
    )


# -----------------------------------------------
# 7-2. 메모리 + RAG를 함께 사용하는 프롬프트 정의
#    - chat_history + question + context 를 모두 프롬프트에 포함
# -----------------------------------------------

rag_with_memory_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            (
                "당신은 주어진 기술 문서들을 기반으로 질문에 답변하는 AI 어시스턴트입니다.\n"
                "반드시 제공된 문서(context) 안에서 답을 찾으려고 노력해야 합니다.\n"
                "문서에 정보가 없으면 '문서에 해당 정보가 없습니다.'라고 솔직하게 답변하세요.\n"
                "이전 대화 내용(chat_history)을 참고하여 사용자의 후속 질문도 자연스럽게 이해하고 답변해 주세요.\n"
            ),
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        (
            "human",
            (
                "다음은 기술 문서에서 검색된 관련 내용입니다:\n"
                "-----------------------\n"
                "{context}\n"
                "-----------------------\n\n"
                "질문: {question}\n"
                "위 문서 내용을 최대한 활용하여, 친절하고 명확하게 답변해 주세요.\n"
                "가능하다면 어떤 문단/내용을 근거로 삼았는지도 자연스럽게 언급해 주세요."
            ),
        ),
    ]
)

# LLMChain 생성 (여기서 llm은 3주차에서 사용한 ChatOpenAI 인스턴스)
chat_rag_chain = LLMChain(
    llm=llm,
    prompt=rag_with_memory_prompt,
    memory=memory,
    verbose=False,
)


# -----------------------------------------------
# 7-3. 실제로 RAG + 메모리를 호출하는 헬퍼 함수
# -----------------------------------------------


def answer_with_memory(question: str) -> str:
    """
    1) retriever로 관련 문서를 검색하고
    2) 메모리 + LLMChain 으로 답변을 생성하는 함수
    """
    # 3주차에서 사용하던 retriever 재사용
    retrieved_docs = retriever.get_relevant_documents(question)
    context_text = "\n\n".join([doc.page_content for doc in retrieved_docs])

    result = chat_rag_chain(
        {
            "question": question,
            "context": context_text,
        }
    )
    # LLMChain은 기본적으로 {"text": "..."} 형태로 결과 반환
    return result["text"]


# -----------------------------------------------
# 7-4. 멀티턴 대화 인터페이스 (메모리 ON)
# -----------------------------------------------


def chat_loop_with_memory() -> None:
    print("\n[4주차] 메모리 적용 멀티턴 RAG 챗봇입니다.")
    print("질문을 입력해 보세요. (종료: exit / quit)\n")

    while True:
        q = input("질문: ").strip()
        if q.lower() in ("exit", "quit"):
            print("대화를 종료합니다.")
            break

        answer = answer_with_memory(q)
        print("\n[답변]\n", answer)
        print("\n" + "-" * 60 + "\n")


# 필요하면 아래 줄을 주석 해제해서 바로 실행
# chat_loop_with_memory()

  memory = ConversationBufferMemory(
  chat_rag_chain = LLMChain(


In [None]:
# ===============================================
# Part 8: 메모리 ON/OFF 비교 실험 유틸 (4주차 필수)
# ===============================================

from dataclasses import dataclass
import pandas as pd


@dataclass
class TurnResult:
    시나리오: str
    턴번호: int
    질문: str
    답변: str
    메모리: str  # "ON" / "OFF"


# -----------------------------------------------
# 8-1. 메모리 OFF 버전 RAG (3주차 qa_chain 재사용)
#    - 3주차에서 사용하던 qa_chain.invoke({"query": ...}) 를 그대로 씁니다.
#    - 만약 함수 이름이 다르면 아래 부분만 네 코드에 맞게 바꿔 주세요.
# -----------------------------------------------


def answer_without_memory(question: str) -> str:
    """
    3주차의 단일 질문/응답 RAG 챗봇을 그대로 호출하는 함수.
    """
    result = qa_chain.invoke({"query": question})
    # RetrievalQA 의 결과 형식에 맞게 텍스트만 꺼내기
    if isinstance(result, dict) and "result" in result:
        return result["result"]
    return str(result)


# -----------------------------------------------
# 8-2. 시나리오 별 대화 실행 함수
#    - 같은 시나리오를 메모리 ON / OFF 두 번 돌려서 비교
# -----------------------------------------------


def run_scenario(
    scenario_name: str,
    turns: List[str],
    use_memory: bool,
) -> List[TurnResult]:
    """
    turns: ["질문1", "질문2", ...] 형태의 리스트
    use_memory: True = 메모리 ON (4주차), False = 메모리 OFF (3주차)
    """
    results: List[TurnResult] = []

    if use_memory:
        # 메모리 초기화 (각 시나리오마다 대화 히스토리 리셋)
        memory.clear()

    for i, q in enumerate(turns, start=1):
        if use_memory:
            ans = answer_with_memory(q)
            memory_flag = "ON"
        else:
            ans = answer_without_memory(q)
            memory_flag = "OFF"

        results.append(
            TurnResult(
                시나리오=scenario_name,
                턴번호=i,
                질문=q,
                답변=ans,
                메모리=memory_flag,
            )
        )

    return results


# -----------------------------------------------
# 8-3. 예시 시나리오 정의
# -----------------------------------------------

scenarios: Dict[str, List[str]] = {
    "시나리오1_진단_선별검사": [
        "이 문서에서 제시하는 당뇨병 진단 기준이 뭐야? 정상혈당, 당뇨병전단계, 당뇨병을 각각 어떻게 구분하는지 요약해줘.",
        "공복혈당, 경구포도당부하검사(OGTT), 당화혈색소(HbA1c)가 진단에서 각각 어떤 역할을 하는지도 같이 설명해줘.",
        "35세 이상 성인과 19세 이상 고위험군에서 당뇨병 선별검사를 어떻게, 얼마나 자주 해야 하는지 정리해줘.",
    ],
    "시나리오2_위험인자_예방": [
        "이 지침에서 말하는 2형당뇨병의 주요 위험인자들은 어떤 것들이 있어? 비만, 복부비만, 가족력 같은 것들을 정리해줘.",
        "당뇨병전단계(공복혈당장애, 내당능장애, 당화혈색소 5.7~6.4%) 단계에서 2형당뇨병으로 진행을 막기 위해 어떤 생활습관 교정을 권고하는지 알려줘.",
        "임신당뇨병 병력이 있는 여성은 출산 이후에 당뇨병 위험이 어떻게 달라지고, 이 문서에서는 추적검사와 예방을 어떻게 권고하고 있는지 설명해줘.",
    ],
    "시나리오3_치료목표_종합관리": [
        "성인 당뇨병환자에서 권고하는 혈당조절 목표를 정리해줘. 당화혈색소 목표와 혈당 모니터링 방법(자가혈당측정, 연속혈당측정 포함)까지 같이 설명해줘.",
        "당뇨병환자에서 혈압과 지질(특히 LDL 콜레스테롤) 조절 목표는 어떻게 제시되어 있어? 심혈관질환 동반 여부에 따라 어떻게 달라지는지도 알려줘.",
        "당뇨병환자의 종합적인 관리 측면에서 의학영양요법, 운동요법, 비만 관리에 대해 이 문서가 권고하는 핵심 내용을 ‘환자에게 설명하듯이’ 정리해줘.",
    ],
}


# -----------------------------------------------
# 8-4. 모든 시나리오 실행 (메모리 ON/OFF)
# -----------------------------------------------

all_results: List[TurnResult] = []

for scenario_name, turns in scenarios.items():
    # 메모리 OFF (3주차 버전)
    all_results.extend(run_scenario(scenario_name, turns, use_memory=False))

    # 메모리 ON (4주차 버전)
    all_results.extend(run_scenario(scenario_name, turns, use_memory=True))

# -----------------------------------------------
# 8-5. 결과를 DataFrame 으로 정리
# -----------------------------------------------

df_chat = pd.DataFrame([r.__dict__ for r in all_results])

# 답변 길이 컬럼 추가
df_chat["답변_길이"] = df_chat["답변"].apply(lambda x: len(str(x)))

print("\n[4주차] 메모리 ON/OFF 비교 결과 미리보기\n")
display(df_chat.head(12))

# 필요하면 CSV로 저장
OUTPUT_DIR = "results_4week"
os.makedirs(OUTPUT_DIR, exist_ok=True)

output_path = os.path.join(OUTPUT_DIR, "week4_memory_comparison.csv")
df_chat.to_csv(output_path, index=False, encoding="utf-8-sig")

print(f"\n* 메모리 비교 결과 CSV 저장 완료: {output_path}")


[4주차] 메모리 ON/OFF 비교 결과 미리보기



Unnamed: 0,시나리오,턴번호,질문,답변,메모리,답변_길이
0,시나리오1_기능_설명_후_추가질문,1,이 문서에서 설명하는 시스템의 주요 기능을 요약해줘.,,OFF,0
1,시나리오1_기능_설명_후_추가질문,2,방금 말해준 기능 중에서 두 번째 기능만 조금 더 자세히 설명해 줘.,,OFF,0
2,시나리오1_기능_설명_후_추가질문,3,해당 기능을 실제로 어디에 적용할 수 있을지 간단한 예시도 들어줘.,,OFF,0
3,시나리오1_기능_설명_후_추가질문,1,이 문서에서 설명하는 시스템의 주요 기능을 요약해줘.,,ON,0
4,시나리오1_기능_설명_후_추가질문,2,방금 말해준 기능 중에서 두 번째 기능만 조금 더 자세히 설명해 줘.,,ON,0
5,시나리오1_기능_설명_후_추가질문,3,해당 기능을 실제로 어디에 적용할 수 있을지 간단한 예시도 들어줘.,,ON,0
6,시나리오2_용어정의_비교,1,문서에서 정의하는 A 개념이 뭐야?,,OFF,0
7,시나리오2_용어정의_비교,2,그럼 B 개념이랑 어떤 차이가 있어?,,OFF,0
8,시나리오2_용어정의_비교,3,백엔드 개발자인 입장에서 이해하기 쉽게 다시 비교해서 정리해 줘.,,OFF,0
9,시나리오2_용어정의_비교,1,문서에서 정의하는 A 개념이 뭐야?,요청하신 “A 개념”에 대한 정의는 제공하신 문서(제시된 발췌) 안에 명시되어 있지...,ON,585



* 메모리 비교 결과 CSV 저장 완료: results_4week\week4_memory_comparison.csv
