# Simple RAG Practice - 리팩토링 버전
모듈화된 rag_core를 사용하여 간소화된 노트북

In [None]:
# 시스템 경로 추가 (노트북에서 상위 디렉토리 모듈 import)
import sys
sys.path.append('../')

# LangSmith 추적 설정
from langchain_teddynote import logging

# 프로젝트 이름을 입력합니다.
logging.langsmith("=== 01.Simple-RAG-Practice ===")

## 모듈 import
이제 모든 설정과 클래스를 rag_core에서 가져옵니다.

In [None]:
# rag_core 모듈에서 필요한 것들 import
from rag_core import (
    SessionLocal,
    DenseRetriever,
    embeddings,
    Document,
    File
)

print("✅ 모듈 import 완료")

## Dense Retriever 실행
모듈화된 DenseRetriever 클래스를 사용하여 검색을 수행합니다.

In [3]:
# 세션 생성 및 검색 수행
with SessionLocal() as session:
    # DenseRetriever 인스턴스 생성
    retriever = DenseRetriever(session)
    
    # 검색 수행
    question = "주요 기술 행사일정에 대해 알려줘"
    results = retriever.search(
        question=question,
        top_k=20,
        similarity_threshold=0.5,
        min_results=5
    )
    
    # 결과 출력
    retriever.print_results(results, max_content_length=200)

질문: 주요 기술 행사일정에 대해 알려줘
임베딩 차원: 4000
Document 테이블: documents_4000
File 테이블: files_4000
스키마: rag
--------------------------------------------------------------------------------

검색 결과: 5개 문서

[1] 유사도: 0.4452
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 92
페이지: 21
섹션: None
내용: | 행사명 | 행사 주요 개요 | 행사 주요 개요 | 행사 주요 개요 |
| --- | --- | --- | --- |
| CES 2024 | ![image](/image/placeholder)
 | - 미국 소비자기술 협회(CTA)가 주관하는 세계 최대 가전·IT·소 비재 전시회로 5G, AR&VR, 디지털헬스, 교통·모빌리티 등 주요 카테고리 중심으로 ...
--------------------------------------------------------------------------------

[2] 유사도: 0.4121
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 99
페이지: 21
섹션: None
내용: # Ⅱ. 주요 행사 일정...
--------------------------------------------------------------------------------

[3] 유사도: 0.4011
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 94
페이지: 21
섹션: None
내용: <table> <title> 2024년 AI 및 기술 컨퍼런스 일정 </title> <details> 이 표는 2024년에 열리는 주요 기술 및 AI 컨퍼런스에 대한 정보를 보여줍니다. 첫 번째 행사는 CES 2024로, 기간은 2024.1.9-12이며, 장소는 미국 라스베가

## 커스텀 검색 예제
다른 질문으로 검색을 수행해봅니다.

In [None]:
# 다른 질문으로 검색
questions = [
    "AI 관련 최신 동향은?",
    "데이터베이스 성능 최적화 방법",
    "파이썬 프로그래밍 팁"
]

with SessionLocal() as session:
    retriever = DenseRetriever(session)
    
    for question in questions:
        print(f"\n{'='*100}")
        print(f"질문: {question}")
        print(f"{'='*100}")
        
        results = retriever.search(
            question=question,
            top_k=5,  # 상위 5개만
            similarity_threshold=0.5  # 더 엄격한 임계값
        )
        
        if results:
            retriever.print_results(results, max_content_length=150)
        else:
            print("관련 문서를 찾을 수 없습니다.")

## 모듈 정보 확인

In [None]:
# rag_core 모듈 정보 확인
import rag_core

print(f"RAG Core 버전: {rag_core.__version__}")
print(f"\n사용 가능한 컴포넌트:")
for item in rag_core.__all__:
    if not item.startswith('_'):
        print(f"  - {item}")