# 01. LlamaIndex Quickstart (RAG 기본) - 주석 포함 버전

In [1]:
# os 모듈과 dotenv 라이브러리를 불러옵니다. (환경 변수 관리)
import os
from dotenv import load_dotenv

# .env 파일에 저장된 API 키들을 불러옵니다.
load_dotenv()

# OPENAI_API_KEY 환경 변수를 가져옵니다.
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

# 키가 잘 불러와졌는지 확인 (True/False 출력)
print('OPENAI_API_KEY set:', bool(OPENAI_API_KEY))


OPENAI_API_KEY set: True


In [2]:
# LlamaIndex의 문서 로더와 인덱스를 불러옵니다.
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

# data/txt 폴더에 있는 문서를 모두 로드합니다.
docs = SimpleDirectoryReader('./data/txt').load_data()

# 문서 개수를 출력합니다.
print('docs:', len(docs))

# VectorStoreIndex를 사용해 문서 인덱스를 생성합니다.
index = VectorStoreIndex.from_documents(docs)

# 인덱스에서 쿼리엔진(QueryEngine)을 생성합니다.
qe = index.as_query_engine(similarity_top_k=5)

# 쿼리 실행: 문서 요약 요청
print(qe.query('핵심 정책을 요약해줘'))


docs: 3
핵심 정책 요약:
1) 내부 문서는 비식별화 후 외부 서비스에 업로드
2) 모델 응답 정확도 위해 근거 문서 함께 제시
3) 대외 커뮤니케이션은 경영지원팀 사전 검토


In [3]:
from llama_index.core.postprocessor import SimilarityPostprocessor

# 유사도 기반 후처리기 설정 (유사도 0.35 이하 결과 필터링)
postprocessor = SimilarityPostprocessor(similarity_cutoff=0.35)

# 쿼리 엔진 생성
query_engine = index.as_query_engine(
    similarity_top_k=8,  # 상위 8개 유사 노드 검색
    node_postprocessors=[postprocessor]  # 후처리기 적용
)

# 쿼리 실행
query = "이 문서는 어떻게 구성되어 있는지 알려줘"
response = query_engine.query(query)

# 결과 출력
print(response)


이 문서는 LlamaIndex에 대한 상세 가이드로 구성되어 있습니다. 주요 개념과 아키텍처, 데이터 로딩과 전처리, 인덱스 종류와 특성, 검색 및 생성 과정 등으로 구성되어 있습니다.
