In [None]:
!pip install python-dotenv

In [None]:
# API 키 설정
import os
from dotenv import load_dotenv

load_dotenv()

open_api_key = os.getenv('OPEN_API_KEY')

In [4]:
!pip install llama-index

Collecting llama-index
  Downloading llama_index-0.12.37-py3-none-any.whl.metadata (12 kB)
Collecting llama-index-agent-openai<0.5,>=0.4.0 (from llama-index)
  Downloading llama_index_agent_openai-0.4.7-py3-none-any.whl.metadata (438 bytes)
Collecting llama-index-cli<0.5,>=0.4.1 (from llama-index)
  Downloading llama_index_cli-0.4.1-py3-none-any.whl.metadata (1.5 kB)
Collecting llama-index-core<0.13,>=0.12.36 (from llama-index)
  Downloading llama_index_core-0.12.37-py3-none-any.whl.metadata (2.4 kB)
Collecting llama-index-embeddings-openai<0.4,>=0.3.0 (from llama-index)
  Downloading llama_index_embeddings_openai-0.3.1-py3-none-any.whl.metadata (684 bytes)
Collecting llama-index-indices-managed-llama-cloud>=0.4.0 (from llama-index)
  Downloading llama_index_indices_managed_llama_cloud-0.6.11-py3-none-any.whl.metadata (3.6 kB)
Collecting llama-index-llms-openai<0.4,>=0.3.0 (from llama-index)
  Downloading llama_index_llms_openai-0.3.42-py3-none-any.whl.metadata (3.0 kB)
Collecting llam

In [5]:
# '꽃말의 비밀 정원 이야기' 문서 적제
from llama_index.core import SimpleDirectoryReader

documents = SimpleDirectoryReader("data").load_data()

- `"data"` 폴더 안에 있는 문서들을 자동으로 불러옵니다.
- `SimpleDirectoryReader`는 `.txt`, `.pdf`, `.md` 등의 텍스트 파일을 파싱해서 사용할 수 있게 변환해줍니다.

In [6]:
# 문서의 색인 작성
from llama_index.core import VectorStoreIndex

index = VectorStoreIndex.from_documents(documents)

- 문서들을 벡터로 변환해 색인(Index)을 생성합니다.
- 이 벡터 색인을 기반으로, 나중에 사용자의 질문과 문서 내용을 비교해서 관련 내용을 찾아낼 수 있게 됩니다.

In [7]:
# 요청 엔진 생성
agent = index.as_query_engine()

- 색인을 요청 엔진(Query Engine)으로 변환합니다.
- 이제 사용자는 자연어로 질문을 던지면, 문서 내용 중 관련된 부분을 찾아 응답하게 됩니다.

In [8]:
response = agent.query("꽃말의 비밀 정원의 직원에게는 몇 가지 역할이 있나요?")
print("꽃말의 비밀 정원의 직원들에게는 몇 가지 역할이 있나요?", response)

꽃말의 비밀 정원의 직원들에게는 몇 가지 역할이 있나요? 직원들에게는 마케팅 전문가, 기술 천재, 고객 서비스의 천사 등 다양한 역할이 있습니다. 이 모험에서 각 직원은 중요한 영웅으로서 빠질 수 없습니다.


- 첫 번째 질문: "직원의 역할은 몇 가지 있나요?"
- LLM은 벡터 색인을 검색해 가장 관련 있는 문단을 찾아 요약/답변해 줍니다.

In [9]:
response = agent.query("꽃말의 비밀 정원의 에이전트 이름은 무엇인가요?")
print("꽃말의 비밀 정원의 에이전트 이름은 무엇인가요?", response)

꽃말의 비밀 정원의 에이전트 이름은 무엇인가요? 꽃말의 비밀 정원의 에이전트 이름은 "꽃말 요정"입니다.


- 두 번째 질문: "에이전트 이름은 무엇인가요?"
- 같은 방식으로 문서에서 해당 내용을 찾아 응답합니다.

In [10]:
index.storage_context.persist()

- 생성한 색인을 로컬에 저장합니다.
- 다음 번에 실행할 때 이걸 다시 불러오면 문서를 다시 분석하지 않아도 됩니다.

## 전체적인 구조
1. `.env`에서 API 키 불러오기
2. `data` 폴더에서 문서 로딩
3. 문서를 벡터로 인덱싱 (VectoreStoreIndex 사용)
4. 사용자 질문을 기반으로 문서 내용을 검색하고 응답
5. 색인을 로컬에 저장

## 실전에서는?
이 구조는 다음과 같은 응용에 사용될 수 있습니다.
- 사내 문서를 AI가 자동으로 응답해주는 사내 챗봇
- 논문이나 자료에 기반한 AI 요약·질의 시스템
- 책이나 매뉴얼을 질문하면 찾아주는 AI 도우미