# High-Context RAG Playground

이 노트북은 `HighContextRAGPipeline`을 대화형으로 테스트하기 위한 공간입니다.
아래 셀을 실행하여 파이프라인을 로드하고, 자유롭게 질문을 입력하여 답변을 확인해보세요.

In [1]:
import sys
import os

# Add root directory to sys.path
# In Jupyter Notebooks, __file__ is not defined. We assume the notebook is in '02_high_context_rag/'
current_dir = os.getcwd()
if os.path.basename(current_dir) == '02_high_context_rag':
    root_dir = os.path.dirname(current_dir)
else:
    # If running from root or elsewhere, try to find the project root relative to current dir
    root_dir = os.path.abspath(os.path.join(current_dir, '..'))

sys.path.append(root_dir)

from pipeline import HighContextRAGPipeline

print("Initializing Pipeline... (This may take a moment to load models)")
pipeline = HighContextRAGPipeline()
print("Pipeline Initialized!")

Initializing Pipeline... (This may take a moment to load models)
Pipeline Initialized!


## 🧪 테스트 쿼리 실행

아래 변수 `query`에 원하는 질문을 입력하고 실행하세요.

In [4]:
query = "연구노트 미작성 혹은 관리 부실로 인해 발생한 감사건들좀 조사해줘."

print(f"Question: {query}\n")
answer = pipeline.run(query)

print("\n=== Answer ===\n")
print(answer)

Question: 연구노트 미작성 혹은 관리 부실로 인해 발생한 감사건들좀 조사해줘.

1. [Router & Search] Searching for: '연구노트 미작성 혹은 관리 부실로 인해 발생한 감사건들좀 조사해줘.'
2. [ID Extraction] Found 16 unique groups: [4096, 4097, 3521, 4128, 3519, 778, 4235, 78, 2415, 4240, 1650, 1012, 1014, 2617, 830, 1215]
3. [Hydration] Fetching details for IDs from all collections...


2025-12-04 15:12:21,277 [ERROR][handler]: RPC error: [query], <MilvusException: (code=100, message=collection not found[database=db_6919b557b41d797][collection=metadata])>, <Time:{'RPC start': '2025-12-04 15:12:21.141837', 'RPC error': '2025-12-04 15:12:21.277133'}> (decorators.py:253)


4. [Reconstruction] Assembling 16 full documents...
5. [Reranking] Scoring 16 documents...
   Top-5 selected.
6. [Generation] Calling LLM...

=== Answer ===

다음은 연구노트 미작성 혹은 관리 부실로 인해 발생한 감사 건들에 대한 조사 결과입니다:

1. **토지주택공사의 연구원**
   - **사건 개요**: 토지주택공사 산하 연구원에서 국가연구개발혁신법에 따라 연구과제를 수행하면서 연구노트의 작성 및 관리가 의무였지만 일부 과제에서 이를 이행하지 않았습니다. 이는 기록의 신뢰성과 연구근거의 타당성을 저해하였으며, 감사 처분 요구 사항 이행이 소홀했습니다.
   - **문제점**: 연구노트 미작성, 지침 부재, 연구관리 시스템 내 RawData 및 관련 기초자료 등재 미비, 작성자 및 확인자 서명 누락 등으로 기록의 진실성 및 연구근거의 타당성이 훼손되었습니다.
   - **조치사항**: 인사관리처장이 국가연구개발혁신법 등 관련 법령 및 지침을 준수하지 않은 연구기획처에 대해 부서주의를 적용하였습니다.

2. **토지주택연구원**
   - **사건 개요**: 토지주택연구원은 연구개발 과제 수행 중 연구노트를 작성하고 관리할 의무가 있음에도 불구하고, 일부 과제에서 연구노트를 작성하지 않거나 작성 요건인 서명 및 기록일을 누락하는 등의 문제가 있었습니다.
   - **문제점**: 연구노트 미작성 다수 과제 확인, 연구노트 작성 요건 서명 누락 및 기록일 미기재, 연구노트의 내용이 과제 수행과 무관한 자료로 채워짐, 연구관리 시스템에 관련 자료 등재 미비, 지침 마련 부재 등이 확인되었습니다.
   - **조치사항**: 연구기획처장은 관련 법령 및 지침에 따라 연구노트 작성 및 관리 지침을 마련하고, 연구수행 중 취득한 RawData 및 관련 기초자료 등을 연구관리 시스템에 의무적으로 등재하도록 지침을 개정하였습니다.

3. **AA원과 B

## 🔍 중간 과정 확인 (Debug)

`search_and_merge` 메서드를 직접 호출하면, 재조립된 문서(Context)가 어떻게 생겼는지 확인할 수 있습니다.

In [3]:
docs = pipeline.search_and_merge(query, top_k=3)

print(f"Found {len(docs)} documents.\n")

for i, doc in enumerate(docs):
    print(f"--- Document {i+1} ---")
    print(doc)
    print("\n")

1. [Router & Search] Searching for: '직원 횡령 시 처분 기준은?'
2. [ID Extraction] Found 12 unique groups: [4289, 4130, 4012, 4687, 2864, 347, 4723, 4788, 850, 4859, 2876, 2175]
3. [Hydration] Fetching details for IDs from all collections...


2025-12-04 15:10:00,823 [ERROR][handler]: RPC error: [query], <MilvusException: (code=100, message=collection not found[database=db_6919b557b41d797][collection=metadata])>, <Time:{'RPC start': '2025-12-04 15:10:00.688662', 'RPC error': '2025-12-04 15:10:00.823261'}> (decorators.py:253)


4. [Reconstruction] Assembling 12 full documents...
5. [Reranking] Scoring 12 documents...
   Top-3 selected.
Found 3 documents.

--- Document 1 ---
[문서 ID: 347]
1. 제목: 대구광역시 동구청 장애인일자리사업 과태료 관리 비위 및 시스템 부정접근으로 9,029,570원 횡령
2. 사건개요: 대구광역시 동구청이 장애인일자리사업 및 주차구역 단속 관련 과태료 수입금 관리 업무를 기간제 근로자에게 위임하고 수입금 출납 업무의 감독이 부실했다. CA의 보조 인력이 업무분장과 다르게 관리되고 공인인증서를 복사해 지방세입정보시스템에 직접 접속해 과태료 업무를 처리하게 한 점이 확인됐다. 이로써 9,029,570원 규모의 임시보관금 및 환급금이 횡령됐고 관리감독의 부재와 재발 방지 미비가 드러났다.
3. 문제점: 과태료 수입금 출납 업무를 기간제 근로자 CA에 일임하여 직무 분리 원칙 위반, CA의 업무용 컴퓨터에 공인인증서를 복사하도록 허용하고 CA가 지방세입정보시스템에 직접 접속해 과태료 업무를 처리하게 한 점, 수입금 출납 업무를 CA에 맡기고 업무용통장을 관리하게 한 점, 임시보관금 및 환급금 횡령으로 총 9,029,570원이 발생한 점, CA의 개인적 사용 및 무단 결근에도 불구하고 참여 중단 조치가 지연된 점
4. 판단기준: 지방회계법 제22조, 지방회계법 제42조, 대구광역시 동구 예산 및 기금의 회계관리에 관한 규칙 제2조 제1항, 행정기관 정보시스템 접근권한 관리 규정 제12조 제2항
5. 조치사항: 대구광역시 동구청장은 앞으로 세입처리 권한이 없는 자에게 과태료 등 수입금 세입처리 업무를 일임하는 일이 없도록 지도 감독을 강화하고, 수입금 출납 관련 직무를 엄격히 분리하며 공금 관리 체계를 점검하라. 관련 직원에 대한 징계 및 교육을 강화하고 재발 방지를 위한 대책으로 감사 후 징계위원회 결정, 업무용통장 관리의 감사 도입, 교육