### 1. RAG 관련 pdf 예제 데이터 로딩

In [None]:
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

# 문서 로드 및 인덱스 생성
documents = SimpleDirectoryReader(input_files=["../data/pdf_example.pdf"]).load_data()
index = VectorStoreIndex.from_documents(documents)


### 2. 가장 기본적인 쿼리 엔진

In [None]:
# 쿼리 엔진 생성
query_engine = index.as_query_engine()

# 쿼리 실행
query = "RAG에 대해서 설명해줘"
response = query_engine.query(query)

# 응답 출력
print(response)

### 3. as_query_engine() 주요 파라미터


In [None]:
from llama_index.core.postprocessor import SimilarityPostprocessor


query_engine = index.as_query_engine(
    # 기본적인 설정
    similarity_top_k=3,                # 상위 3개 문서 사용
    response_mode="tree_summarize",    # 트리 구조로 요약
    streaming=True,                    # 스트리밍 응답 활성화
    # 유사도 0.7 이상만 선택 (후처리)
    node_postprocessors=[SimilarityPostprocessor(similarity_cutoff=0.7)]
    )

query = "RAG의 장점에 대해서 설명해줘"

# 스트리밍 쿼리 실행
streaming_response = query_engine.query(query)
streaming_response.print_response_stream()

In [None]:
# 2.테스트할 응답 모드 리스트
response_modes = ["tree_summarize", "refine", "compact"]


# 3.동일한 질문에 대해 응답 모드별로 실행
question = "RAG에 대해서 설명해줘"

for mode in response_modes:
    print(f"\n ========== 응답 모드: {mode} ==========")
    
    # Query Engine 생성 및 실행
    query_engine = index.as_query_engine(response_mode=mode)
    response = query_engine.query(question)
    
    # 응답 출력
    print(response)