# 라마인덱스 사전 준비

In [1]:
# 패키지 설치
!pip install llama-index==0.6.12 langchain==0.0.181 openai==0.28



In [3]:
# 환경변수 준비
import os
os.environ["OPENAI_API_KEY"] = 'YOUR_KEY'

In [4]:
import logging
import sys

# 로그 레벨 설정
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

# 라마인덱스의 질의응답

In [6]:
from llama_index import SimpleDirectoryReader

# 문서 로드(data 폴더에 문서를 넣어 두세요)
documents = SimpleDirectoryReader("data").load_data()

DEBUG:llama_index.readers.file.base:> [SimpleDirectoryReader] Total files added: 7


In [7]:
from llama_index import GPTVectorStoreIndex, ServiceContext, LLMPredictor
from langchain.chat_models import ChatOpenAI

# LLMPredictor 준비
llm_predictor = LLMPredictor(llm=ChatOpenAI(
    temperature=0, # 온도
    model_name="gpt-3.5-turbo" # 모델명
))

# ServiceContext 준비
service_context = ServiceContext.from_defaults(
    llm_predictor=llm_predictor,
)

# 인덱스 생성
index = GPTVectorStoreIndex.from_documents(
    documents,
    service_context=service_context,
)

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): openaipublic.blob.core.windows.net:443
DEBUG:urllib3.connectionpool:https://openaipublic.blob.core.windows.net:443 "GET /gpt-2/encodings/main/vocab.bpe HTTP/1.1" 200 456318
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): openaipublic.blob.core.windows.net:443
DEBUG:urllib3.connectionpool:https://openaipublic.blob.core.windows.net:443 "GET /gpt-2/encodings/main/encoder.json HTTP/1.1" 200 1042301
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의

In [8]:
# 쿼리 엔진 생성
query_engine = index.as_query_engine()

In [9]:
# 질의응답
print(query_engine.query("미코의 소꿉친구 이름은?"))

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\ubbf8\\ucf54\\uc758 \\uc18c\\uafc9\\uce5c\\uad6c \\uc774\\ub984\\uc740?"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=20 request_id=req_9920d1ff1dbc3f104f68975083cad336 response_code=200
DEBUG:llama_index.indices.utils:> Top 2 nodes:
> [Node 80056819-8cbf-4125-ba3b-1dad88a5a86b] [Similarity score:             0.832094] 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인 교활한 울프 박사와 대면한다. 울프 박사는 시민을 지배하려는 사악한 야망을 드러내며 자신...
> [Node fd6816a0-3273-49a2-aa24-0e8162be568d] [Similarity score:             0.828235] 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기다리고 있었다. 료는 그녀의 어릴 적 친구이자 그 역시 울프 코퍼레이션과 싸우는 해커 집단...
I

In [10]:
# 질의응답
print(query_engine.query("울프 코퍼레이션의 CEO의 이름은?"))

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\uc6b8\\ud504 \\ucf54\\ud37c\\ub808\\uc774\\uc158\\uc758 CEO\\uc758 \\uc774\\ub984\\uc740?"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=31 request_id=req_c4981730b024b3bbb7f5f6cc492bc747 response_code=200
DEBUG:llama_index.indices.utils:> Top 2 nodes:
> [Node 80056819-8cbf-4125-ba3b-1dad88a5a86b] [Similarity score:             0.859243] 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인 교활한 울프 박사와 대면한다. 울프 박사는 시민을 지배하려는 사악한 야망을 드러내며 자신...
> [Node d23aa09d-4a83-4916-9c10-19704303b507] [Similarity score:             0.832126] 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서하고 다시 우정을 회복한다. 미코는 데이터카우리아를 그만두고 료와 

In [11]:
# 질의응답
print(query_engine.query("미코의 성격은?"))

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\ubbf8\\ucf54\\uc758 \\uc131\\uaca9\\uc740?"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=19 request_id=req_1461e8cfb4ddf12a57fe8e263decbd41 response_code=200
DEBUG:llama_index.indices.utils:> Top 2 nodes:
> [Node 80056819-8cbf-4125-ba3b-1dad88a5a86b] [Similarity score:             0.839282] 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인 교활한 울프 박사와 대면한다. 울프 박사는 시민을 지배하려는 사악한 야망을 드러내며 자신...
> [Node d23aa09d-4a83-4916-9c10-19704303b507] [Similarity score:             0.833225] 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서하고 다시 우정을 회복한다. 미코는 데이터카우리아를 그만두고 료와 함께 새로운 길을 걷기 ...
INFO:llama_index.token_counter

# 인덱스 저장 및 로드

In [12]:
# 인덱스 저장
index.storage_context.persist()

DEBUG:fsspec.local:open file: /content/storage/docstore.json
DEBUG:fsspec.local:open file: /content/storage/index_store.json
DEBUG:fsspec.local:open file: /content/storage/vector_store.json


In [13]:
from llama_index import StorageContext, load_index_from_storage

# 인덱스 로드
storage_context = StorageContext.from_defaults(persist_dir="./storage")
index = load_index_from_storage(storage_context)

DEBUG:llama_index.storage.kvstore.simple_kvstore:Loading llama_index.storage.kvstore.simple_kvstore from ./storage/docstore.json.
DEBUG:fsspec.local:open file: /content/storage/docstore.json
DEBUG:llama_index.storage.kvstore.simple_kvstore:Loading llama_index.storage.kvstore.simple_kvstore from ./storage/index_store.json.
DEBUG:fsspec.local:open file: /content/storage/index_store.json
DEBUG:llama_index.vector_stores.simple:Loading llama_index.vector_stores.simple from ./storage/vector_store.json.
DEBUG:fsspec.local:open file: /content/storage/vector_store.json
INFO:llama_index.indices.loading:Loading all indices.
