# Simple RAG Practice - 리팩토링 버전
모듈화된 rag_core를 사용하여 간소화된 노트북

In [1]:
# 시스템 경로 추가 (노트북에서 상위 디렉토리 모듈 import)
import sys
sys.path.append('../')

# LangSmith 추적 설정
from langchain_teddynote import logging

# 프로젝트 이름을 입력합니다.
logging.langsmith("=== 01.Simple-RAG-Practice ===")

LangSmith 추적을 시작합니다.
[프로젝트명]
=== 01.Simple-RAG-Practice ===


## 모듈 import
이제 모든 설정과 클래스를 rag_core에서 가져옵니다.

In [2]:
# rag_core 모듈에서 필요한 것들 import
from rag_core import (
    SessionLocal,
    DenseRetriever,
    embeddings,
    Document,
    File
)

print("✅ 모듈 import 완료")


검색 결과: 2개 문서

[1] 유사도: 0.5130
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 50
페이지: 12
섹션: None
내용: SPRi AI Brief | 2023-12월호 # 삼성전자, 자체 개발 생성 AI ‘삼성 가우스’ 공개 # KEY Contents n 삼성전자가 온디바이스에서 작동 가능하며 언어, 코드, 이미지의 3개 모델로 구성된 자체 개발 생성 AI 모델 ‘삼성 가우스’를 공개 n 삼성전자는 삼성 가우스를 다양한 제품에 단계적으로 탑재할 계획으로, 온디바이스 작동이 가...
--------------------------------------------------------------------------------

[2] 유사도: 0.5045
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 52
페이지: 12
섹션: None
내용: 사내 소프트웨어 개발에 최적화 ∙ 이미지 모델은 창의적인 이미지를 생성하고 기존 이미지를 원하는 대로 바꿀 수 있도록 지원하며 저해상도 이미지의 고해상도 전환도 지원 n IT 전문지 테크리퍼블릭(TechRepublic)은 온디바이스 AI가 주요 기술 트렌드로 부상했다며, 2024년부터 가우스를 탑재한 삼성 스마트폰이 메타의 라마(Llama)2를 탑재한 퀄컴...
--------------------------------------------------------------------------------


## Dense Retriever 실행
모듈화된 DenseRetriever 클래스를 사용하여 검색을 수행합니다.

In [4]:
# 세션 생성 및 검색 수행
with SessionLocal() as session:
    # DenseRetriever 인스턴스 생성
    retriever = DenseRetriever(session)
    
    # 검색 수행
    question = "주요 기술 행사일정에 대해 알려줘"
    results = retriever.search(
        question=question,
        top_k=20,
        similarity_threshold=0.5,
        min_results=5
    )
    
    # 결과 출력
    retriever.print_results(results, max_content_length=200)


검색 결과: 5개 문서

[1] 유사도: 0.0479
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 3
페이지: 1
섹션: None
내용: ▹ 삼성전자, 자체 개발 생성 AI ‘삼성 가우스’ 공개 ··························································· 10 ▹ 구글, 앤스로픽에 20억 달러 투자로 생성 AI 협력 강화 ················································ 11 ▹ IDC, 2027년 AI 소프...
--------------------------------------------------------------------------------

[2] 유사도: 0.0460
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 2
페이지: 1
섹션: None
내용: ▹ EU AI 법 3자 협상, 기반모델 규제 관련 견해차로 난항 ··················································· 6 2. 기업/산업 ▹ 미국 프런티어 모델 포럼, 1,000만 달러 규모의 AI 안전 기금 조성 ································ 7 ▹ 코히어, 데이터 투명성 확보를 위한 데...
--------------------------------------------------------------------------------

[3] 유사도: 0.0374
파일: ../data/SPRI_AI_Brief_2023년12월호_F.pdf
청크 인덱스: 50
페이지: 12
섹션: None
내용: SPRi AI Brief | 2023-12월호 # 삼성전자, 자체 개발 생성 AI ‘삼성 가우스’ 공개 # KEY Contents n 삼성전자가 온디바이스에서 작동 가능하며 언어, 코드, 이미지의 3개 모델로 구성된 자체 개발 생성 AI 모델 ‘삼성 가우스’를 공

## 커스텀 검색 예제
다른 질문으로 검색을 수행해봅니다.

In [None]:
# 다른 질문으로 검색
questions = [
    "AI 관련 최신 동향은?",
    "데이터베이스 성능 최적화 방법",
    "파이썬 프로그래밍 팁"
]

with SessionLocal() as session:
    retriever = DenseRetriever(session)
    
    for question in questions:
        print(f"\n{'='*100}")
        print(f"질문: {question}")
        print(f"{'='*100}")
        
        results = retriever.search(
            question=question,
            top_k=5,  # 상위 5개만
            similarity_threshold=0.5  # 더 엄격한 임계값
        )
        
        if results:
            retriever.print_results(results, max_content_length=150)
        else:
            print("관련 문서를 찾을 수 없습니다.")

## 모듈 정보 확인

In [None]:
# rag_core 모듈 정보 확인
import rag_core

print(f"RAG Core 버전: {rag_core.__version__}")
print(f"\n사용 가능한 컴포넌트:")
for item in rag_core.__all__:
    if not item.startswith('_'):
        print(f"  - {item}")