In [None]:
# 라마인덱스 패키지 임포트
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
from llama_index.llms.openai import OpenAI
from llama_index.core import Settings

# 환경변수 설정 (api key)
import os
from dotenv import load_dotenv

# .env 파일에서 환경 변수 로드
load_dotenv()

# OpenAI API 키 설정
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# LLM 설정
Settings.llm = OpenAI(model="gpt-4o", temperature=0.5)

# 데이터 로드 (data가 있는 경로 입력)
documents = SimpleDirectoryReader("../data/pdf_sample2").load_data()

# 파일이름 확인
for doc in documents:
    print(doc.metadata["file_name"])

# 인덱스 생성 및 데이터 임베딩
index = VectorStoreIndex.from_documents(documents, show_progress=True)

In [None]:
# 벡터 DB 관련 라마인덱스 패키지 임포트
from llama_index.core import StorageContext, load_index_from_storage

# 저장할 디렉토리 지정
persist_dir = "./saved_index"

# 인덱스 저장
index.storage_context.persist(persist_dir)

In [None]:
# 저장된 인덱스 로드 준비
storage_context = StorageContext.from_defaults(persist_dir=persist_dir)

# 저장된 인덱스 로드
loaded_index = load_index_from_storage(storage_context)

In [None]:
# 로드된 인덱스로 쿼리 엔진 생성
loaded_query_engine = loaded_index.as_query_engine()

# 다른 쿼리 실행
query = "이 논문에서 제안하는 모델의 장점은 무엇인가요?"
response = loaded_query_engine.query(query)

# 응답 출력
print("\n질문:", query)
print("답변:", response)