RetrieverQueryEngine

In [81]:
# 관련 모듈 및 클래스 임포트
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, get_response_synthesizer
from llama_index.core.postprocessor import SimilarityPostprocessor
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.node_parser import SentenceSplitter

# 문서 로드 및 인덱스 생성
documents = SimpleDirectoryReader(input_files=["../data/txt_example.txt"]).load_data()

# 2. 노드 파서 설정 수정
node_parser = SentenceSplitter(
    chunk_size=100,        # 청크 크기 증가
    chunk_overlap=20,        # 오버랩 제거
    separator="\n"        # 빈 줄을 기준으로 분할
)

# 문서 분할
nodes = node_parser.get_nodes_from_documents(documents)

# 총 노드 수 확인
print(f"총 노드 수: {len(nodes)}")


총 노드 수: 10


In [76]:
# 벡터 인덱스 생성
index = VectorStoreIndex(nodes)


검색된 노드 수: 2


--- 노드 1 ---
인공지능(AI)의 개요와 주요 분야

1. 인공지능의 정의
인공지능은 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술입니다.

--- 노드 2 ---
현대 사회에서 인공지능은 다양한 분야에서 혁신을 이끌고 있습니다.

2. 머신러닝
머신러닝은 인공지능의 한 분야로, 데이터로부터 패턴을 학습하여 의사결정을 내리는 기술입니다.


In [79]:
# 리트리버 생성 (벡터 유사도 검색)
retriever = index.as_retriever(similarity_top_k=5)

# 리트리버 테스트
retrieved_nodes = retriever.retrieve("인공지능에 대해서 요약해줘")
print(f"\n검색된 노드 수: {len(retrieved_nodes)}\n")

for i, node in enumerate(retrieved_nodes, 1):
    print(f"\n--- 노드 {i} ---")
    print(node.text)



검색된 노드 수: 5


--- 노드 1 ---
인공지능(AI)의 개요와 주요 분야

1. 인공지능의 정의
인공지능은 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술입니다.

--- 노드 2 ---
현대 사회에서 인공지능은 다양한 분야에서 혁신을 이끌고 있습니다.

2. 머신러닝
머신러닝은 인공지능의 한 분야로, 데이터로부터 패턴을 학습하여 의사결정을 내리는 기술입니다.

--- 노드 3 ---
앞으로 다음과 같은 분야에서 더 큰 혁신이 예상됩니다:
- 범용 인공지능(AGI) 개발
- 인간-AI 협력 시스템
- 윤리적 AI 프레임워크

--- 노드 4 ---
학습자 분석

5. 인공지능의 미래
인공지능 기술은 계속해서 발전하고 있으며,

--- 노드 5 ---
인공지능의 응용 분야
인공지능은 다양한 산업 분야에서 활용되고 있습니다:
- 의료: 질병 진단, 신약 개발
- 금융: 주식 거래,


In [89]:
# 후처리기 생성 (유사도 0.7 이상만 필터링)
postprocessor = SimilarityPostprocessor(similarity_cutoff=0.8)

# 응답 생성기 생성 (트리 요약 모드, 상세 로깅)
response_synthesizer = get_response_synthesizer(
    response_mode="compact",
    verbose=True
)

# 쿼리 엔진 생성
query_engine = RetrieverQueryEngine(
    retriever=retriever,
    response_synthesizer=response_synthesizer,
    node_postprocessors=[postprocessor]
)

# 쿼리 실행
response = query_engine.query("인공지능에 대해서 요약해줘")
print(response)


인공지능은 인간의 학습능력, 추론능력, 지각능력, 자연어 이해능력 등을 컴퓨터 프로그램으로 구현한 기술이며, 현대 사회에서 다양한 분야에서 혁신을 이끌고 있습니다. 머신러닝은 인공지능의 한 분야로, 데이터로부터 패턴을 학습하여 의사결정을 내리는 기술이며, 앞으로는 범용 인공지능(AGI) 개발, 인간-AI 협력 시스템, 윤리적 AI 프레임워크 등에서 더 큰 혁신이 예상됩니다. 인공지능 기술은 계속 발전하고 있으며, 다양한 산업 분야에서 의료(질병 진단, 신약 개발), 금융(주식 거래) 등에서 활용되고 있습니다.
