# LlamaIndex의 사전 준비

In [1]:
# 패키지 설치
!pip install llama-index==0.6.12

Collecting llama-index==0.6.12
  Using cached llama_index-0.6.12-py3-none-any.whl (422 kB)
Installing collected packages: llama-index
  Attempting uninstall: llama-index
    Found existing installation: llama-index 0.7.11.post1
    Uninstalling llama-index-0.7.11.post1:
      Successfully uninstalled llama-index-0.7.11.post1
Successfully installed llama-index-0.6.12


In [2]:
# 환경 변수 준비
import os
os.environ["OPENAI_API_KEY"] = "<OpenAI_API의_API_키>"

In [3]:
import logging
import sys

# 로그 레벨 설정
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

# 문서 불러오기


In [4]:
from llama_index import SimpleDirectoryReader

# 문서 불러오기
documents = SimpleDirectoryReader("data").load_data()
print("documents :", documents)

INFO:numexpr.utils:Note: NumExpr detected 20 cores but "NUMEXPR_MAX_THREADS" not set, so enforcing safe limit of 8.
INFO:numexpr.utils:NumExpr defaulting to 8 threads.
DEBUG:llama_index.readers.file.base:> [SimpleDirectoryReader] Total files added: 7
documents : [Document(text="제1장: 데이터 프론트\n\n밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온사인이 거리를 수놓는다. 그 거리에서 빨간 두건을 쓴 소녀 미코는 불법 데이터 카우리아를 운반하는 배달원으로 일하고 있었다. 그녀는 어머니가 병에 걸려 치료비를 벌기 위해 데이터카우리아에 몸을 던지고 있었다.\n\n그러던 어느 날, 미코는 중요한 데이터를 운반하는 임무를 맡게 된다. 그 데이터에는 거대 기업 '울프 코퍼레이션'의 시민에 대한 악랄한 지배를 폭로하는 정보가 담겨 있었다. 그녀는 데이터를 받아 목적지로 향한다.\n", doc_id='b57c0a71-e32e-4d34-bbb9-f28b911aa093', embedding=None, doc_hash='52510777650f4b413312795352941f6a82bd21691af4f6174f027fed858966f6', extra_info=None), Document(text="제2장: 울프 코퍼레이션의 함정\n\n미코는 목적지인 술집 '할머니의 집'으로 향하는 길에 울프 코퍼레이션의 요원들에게 쫓기게 된다. 그들은 '빨간 망토'라는 데이터 카우리아에 대한 소문을 듣고 데이터를 탈취하려 했다. 미코는 교묘하게 요원들을 흩뿌리고 술집에 도착한다.\n", doc_id='5b4b03a7-5adf-46e3-b4ec-f2a4e6c94144', embedding=None, doc_hash='4f93a5aac9870e2050dad030493

In [5]:
from llama_index import Document

# 수동으로 문서 작성
texts = ["text1", "text2", "text3"]
documents = [Document(t) for t in texts]
print("documents :", documents)

documents : [Document(text='text1', doc_id='de9fcd5b-247e-4185-b06b-744cbcf275d1', embedding=None, doc_hash='4acd4b774fffdaf45630897b01c4f68316c5da9e1f5d2f1b34ec46aba14ecf4f', extra_info=None), Document(text='text2', doc_id='69b43910-b690-4d9e-a375-ee00d943497d', embedding=None, doc_hash='5af33d0dbd3518bcf38d390e29fb8ca581518ac5ab9c9ead68e118c2c351013c', extra_info=None), Document(text='text3', doc_id='3d481cda-288a-4188-a45d-85ac88077c19', embedding=None, doc_hash='4ade7a9005a517e64504d1979d3bc5d3bc2cbc91c322d5f200213664a3e53c4b', extra_info=None)]


In [6]:
from llama_index import GPTVectorStoreIndex

# 인덱스 생성
index = GPTVectorStoreIndex.from_documents(documents)

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): openaipublic.blob.core.windows.net:443
DEBUG:urllib3.connectionpool:https://openaipublic.blob.core.windows.net:443 "GET /gpt-2/encodings/main/vocab.bpe HTTP/1.1" 200 456318
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): openaipublic.blob.core.windows.net:443
DEBUG:urllib3.connectionpool:https://openaipublic.blob.core.windows.net:443 "GET /gpt-2/encodings/main/encoder.json HTTP/1.1" 200 1042301
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: text1...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: text2...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: text3...
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["text1", "text2", "text3"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.util.retry:Converted retries value: 2 -> Retry(t

In [7]:
from llama_index import GPTVectorStoreIndex

# 빈 인덱스 생성
index = GPTVectorStoreIndex.from_documents([])

# 문서를 인덱스에 삽입
for doc in documents:
    index.insert(doc)

INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total embedding token usage: 0 tokens
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: text1...
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["text1"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=97 request_id=faefc652384a90258c347497b05a90af response_code=200
INFO:llama_index.token_counter.token_counter:> [insert] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [insert] Total embedding token usage: 2 tokens
DEBUG:llama_index.node_parser.node

In [8]:
from llama_index import SimpleDirectoryReader

# 문서 불러오기
documents = SimpleDirectoryReader("data").load_data()
print("documents :", documents)

DEBUG:llama_index.readers.file.base:> [SimpleDirectoryReader] Total files added: 7
documents : [Document(text="제1장: 데이터 프론트\n\n밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온사인이 거리를 수놓는다. 그 거리에서 빨간 두건을 쓴 소녀 미코는 불법 데이터 카우리아를 운반하는 배달원으로 일하고 있었다. 그녀는 어머니가 병에 걸려 치료비를 벌기 위해 데이터카우리아에 몸을 던지고 있었다.\n\n그러던 어느 날, 미코는 중요한 데이터를 운반하는 임무를 맡게 된다. 그 데이터에는 거대 기업 '울프 코퍼레이션'의 시민에 대한 악랄한 지배를 폭로하는 정보가 담겨 있었다. 그녀는 데이터를 받아 목적지로 향한다.\n", doc_id='ce33bbcd-d6a6-4c2c-91c8-706a06eaeb05', embedding=None, doc_hash='52510777650f4b413312795352941f6a82bd21691af4f6174f027fed858966f6', extra_info=None), Document(text="제2장: 울프 코퍼레이션의 함정\n\n미코는 목적지인 술집 '할머니의 집'으로 향하는 길에 울프 코퍼레이션의 요원들에게 쫓기게 된다. 그들은 '빨간 망토'라는 데이터 카우리아에 대한 소문을 듣고 데이터를 탈취하려 했다. 미코는 교묘하게 요원들을 흩뿌리고 술집에 도착한다.\n", doc_id='59baf4d5-9f49-4697-810a-ed47d745b9ed', embedding=None, doc_hash='4f93a5aac9870e2050dad030493eb2191cca1bf0d3ee1ae07c4c3c19efe0b58e', extra_info=None), Document(text="제3장: 배신과 재회\n\n술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기다리고 있었다. 료는 그녀의 어릴 적 친구이자 그 역시 울프 코퍼레이션과 싸우는 해

In [9]:
from llama_index import LLMPredictor, ServiceContext
from langchain.chat_models import ChatOpenAI

# LLMPredictor 준비
llm_predictor = LLMPredictor(llm=ChatOpenAI(
    temperature=0,  # 온도
    model_name="gpt-3.5-turbo" # 모델명
))

# ServiceContext 준비
service_context = ServiceContext.from_defaults(
    llm_predictor=llm_predictor, 
)

# 인덱스 생성
index = GPTVectorStoreIndex.from_documents(
    documents, 
    service_context=service_context, 
)

DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제6장: 진실의 해방

미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서...
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\uc81c1\\uc7a5: \\ub370\\uc774\\ud130 \\ud504\\ub860\\ud2b8  \\ubc24\\uc774 \\ub418\\uba74 \\ubc

DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=82 request_id=2acdda58d77abdb8596a6551fad31c19 response_code=200
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total embedding token usage: 2888 tokens


In [10]:
from llama_index import GPTVectorStoreIndex, PromptHelper, ServiceContext

# PromptHelper 준비
prompt_helper=PromptHelper(
    max_input_size=4096,  # LLM 입력의 최대 토큰 수
    num_output=256,  # LLM 출력의 토큰 수
    max_chunk_overlap=20,  # 청크 오버랩의 최대 토큰 개수
)

# ServiceContext 준비
service_context = ServiceContext.from_defaults(
    prompt_helper=prompt_helper
)

# 인덱스 생성
index = GPTVectorStoreIndex.from_documents(
    documents,
    service_context=service_context,
)

DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제6장: 진실의 해방

미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서...
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\uc81c1\\uc7a5: \\ub370\\uc774\\ud130 \\ud504\\ub860\\ud2b8  \\ubc24\\uc774 \\ub418\\uba74 \\ubc

DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=125 request_id=c9d347c6ada23df48a0d7ea2459433b7 response_code=200
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total embedding token usage: 2888 tokens


In [11]:
# sentence_transformers 패키지 설치
!pip install sentence_transformers



In [12]:
from langchain.embeddings import HuggingFaceEmbeddings
from llama_index import GPTVectorStoreIndex, ServiceContext, LangchainEmbedding

# 임베딩 모델 준비
embed_model = LangchainEmbedding(HuggingFaceEmbeddings(
    model_name="bongsoo/moco-sentencedistilbertV2.1"
))

# ServiceContext 준비
service_context = ServiceContext.from_defaults(
    embed_model=embed_model
)

# 인덱스 생성
index = GPTVectorStoreIndex.from_documents(
    documents, # 문서
    service_context=service_context, # ServiceContext
)

INFO:sentence_transformers.SentenceTransformer:Load pretrained SentenceTransformer: bongsoo/moco-sentencedistilbertV2.1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): huggingface.co:443
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /api/models/bongsoo/moco-sentencedistilbertV2.1 HTTP/1.1" 200 2089
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/.gitattributes HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855164112 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\.gitattributes.lock
DEBUG:filelock:Lock 2747855164112 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\.gitattributes.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/.gitattributes HTTP/1.1" 200

Downloading (…)d621b/.gitattributes:   0%|          | 0.00/1.38k [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855164112 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\.gitattributes.lock
DEBUG:filelock:Lock 2747855164112 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\.gitattributes.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/1_Pooling/config.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855213712 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\1_Pooling\config.json.lock
DEBUG:filelock:Lock 2747855213712 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\1_Pooling\config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/1_Pooling/config.json H

Downloading (…)_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855213712 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\1_Pooling\config.json.lock
DEBUG:filelock:Lock 2747855213712 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\1_Pooling\config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/README.md HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855166224 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\README.md.lock
DEBUG:filelock:Lock 2747855166224 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\README.md.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/README.md HTTP/1.1" 200 10644


Downloading (…)b3d84d621b/README.md:   0%|          | 0.00/10.6k [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855166224 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\README.md.lock
DEBUG:filelock:Lock 2747855166224 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\README.md.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/config.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855261648 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config.json.lock
DEBUG:filelock:Lock 2747855261648 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/config.json HTTP/1.1" 200 600


Downloading (…)d84d621b/config.json:   0%|          | 0.00/600 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855261648 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config.json.lock
DEBUG:filelock:Lock 2747855261648 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/config_sentence_transformers.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855221712 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config_sentence_transformers.json.lock
DEBUG:filelock:Lock 2747855221712 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config_sentence_transformers.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d8

Downloading (…)ce_transformers.json:   0%|          | 0.00/118 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855221712 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config_sentence_transformers.json.lock
DEBUG:filelock:Lock 2747855221712 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\config_sentence_transformers.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/pytorch_model.bin HTTP/1.1" 302 0
DEBUG:filelock:Attempting to acquire lock 2747855621968 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\pytorch_model.bin.lock
DEBUG:filelock:Lock 2747855621968 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\pytorch_model.bin.lock
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): cdn-lfs.huggingface.co:443
DEBUG:urllib3.connectionpool:https://cdn-lfs.huggingf

Downloading pytorch_model.bin:   0%|          | 0.00/640M [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855621968 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\pytorch_model.bin.lock
DEBUG:filelock:Lock 2747855621968 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\pytorch_model.bin.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/sentence_bert_config.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855731600 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\sentence_bert_config.json.lock
DEBUG:filelock:Lock 2747855731600 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\sentence_bert_config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/sente

Downloading (…)nce_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855731600 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\sentence_bert_config.json.lock
DEBUG:filelock:Lock 2747855731600 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\sentence_bert_config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/similarity_evaluation_sts-test_results.csv HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855731600 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\similarity_evaluation_sts-test_results.csv.lock
DEBUG:filelock:Lock 2747855731600 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\similarity_evaluation_sts-test_results.csv.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedi

Downloading (…)sts-test_results.csv:   0%|          | 0.00/300 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855731600 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\similarity_evaluation_sts-test_results.csv.lock
DEBUG:filelock:Lock 2747855731600 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\similarity_evaluation_sts-test_results.csv.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/special_tokens_map.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855589328 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\special_tokens_map.json.lock
DEBUG:filelock:Lock 2747855589328 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\special_tokens_map.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/83

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/125 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855589328 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\special_tokens_map.json.lock
DEBUG:filelock:Lock 2747855589328 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\special_tokens_map.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/tokenizer.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855258384 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer.json.lock
DEBUG:filelock:Lock 2747855258384 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/tokenizer.json HTTP/1.1" 2

Downloading (…)d621b/tokenizer.json:   0%|          | 0.00/3.77M [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855258384 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer.json.lock
DEBUG:filelock:Lock 2747855258384 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/tokenizer_config.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855831120 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer_config.json.lock
DEBUG:filelock:Lock 2747855831120 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer_config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/tokenizer_config.json H

Downloading (…)okenizer_config.json:   0%|          | 0.00/504 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855831120 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer_config.json.lock
DEBUG:filelock:Lock 2747855831120 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\tokenizer_config.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/vocab.txt HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855729424 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\vocab.txt.lock
DEBUG:filelock:Lock 2747855729424 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\vocab.txt.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/vocab.txt HTTP/1.1" 200 1283327


Downloading (…)b3d84d621b/vocab.txt:   0%|          | 0.00/1.28M [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855729424 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\vocab.txt.lock
DEBUG:filelock:Lock 2747855729424 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\vocab.txt.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "HEAD /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/modules.json HTTP/1.1" 200 0
DEBUG:filelock:Attempting to acquire lock 2747855729424 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\modules.json.lock
DEBUG:filelock:Lock 2747855729424 acquired on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\modules.json.lock
DEBUG:urllib3.connectionpool:https://huggingface.co:443 "GET /bongsoo/moco-sentencedistilbertV2.1/resolve/833552d2a5421a8756ed6e1301dac4b3d84d621b/modules.json HTTP/1.1" 200 229


Downloading (…)84d621b/modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

DEBUG:filelock:Attempting to release lock 2747855729424 on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\modules.json.lock
DEBUG:filelock:Lock 2747855729424 released on C:\Users\yong/.cache\torch\sentence_transformers\bongsoo_moco-sentencedistilbertV2.1\modules.json.lock
INFO:sentence_transformers.SentenceTransformer:Use pytorch device: cpu
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 제6장: 진실의 해방

미코는 울프 박

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total embedding token usage: 2888 tokens


In [13]:
# 쿼리 엔진 생성
query_engine = index.as_query_engine()

In [14]:
# 질의응답
response = query_engine.query("미코의 소꿉친구 이름은?")
print(response)

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

DEBUG:llama_index.indices.utils:> Top 2 nodes:
> [Node 918b4386-2290-4158-9ebe-0ed8e2babb12] [Similarity score:             0.37449] 제6장: 진실의 해방

미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다. 그리고 해커 집단과 함께 울프 코퍼레이션의 악행을 세상에 공개하고 시민들을 해방시킨다....
> [Node 4aec19c1-4ffd-4785-aba0-7edbe2dab539] [Similarity score:             0.358397] 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인 교활한 울프 박사와 대면한다. 울프 박사는 시민을 지배하려는 사악한 야망을 드러내며 자신...
INFO:llama_index.token_counter.token_counter:> [retrieve] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [retrieve] Total embedding token usage: 29 tokens
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/completions
DEBUG:openai:api_version=None data='{"prompt": ["Context information is below. \\n---------------------\\n\\uc81c6\\uc7a5: \\uc9c4\\uc2e4\\uc758 \\ud574\\ubc29\\n\\n\\ubbf8\\ucf54\\ub294 \\uc6b8\\ud504 \\ubc15\\uc0ac\\uc758 \\uc57d\\uc810\\uc744 \\ud30c\\uace0\\ub4e4\\uc5b4 \\uadf8\\ub97c \

In [15]:
# 응답
print("response :", response.response, "\n")

# 소스
print("source_nodes :", response.source_nodes, "\n")

response : 
료. 

source_nodes : [NodeWithScore(node=Node(text='제6장: 진실의 해방\n\n미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다. 그리고 해커 집단과 함께 울프 코퍼레이션의 악행을 세상에 공개하고 시민들을 해방시킨다. 이 승리로 미코의 어머니의 치료법도 찾아내고, 그녀의 병은 완치된다.\n', doc_id='918b4386-2290-4158-9ebe-0ed8e2babb12', embedding=None, doc_hash='72f641a4cbb6be35a1452c6b10682d11e7dfe9d4e6166608786416766fd3b8ef', extra_info=None, node_info={'start': 0, 'end': 137}, relationships={<DocumentRelationship.SOURCE: '1'>: 'e0569aae-88cf-491f-9355-2335cdccb88e'}), score=0.374489925612153), NodeWithScore(node=Node(text='제5장: 결전의 순간\n\n미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인 교활한 울프 박사와 대면한다. 울프 박사는 시민을 지배하려는 사악한 야망을 드러내며 자신의 압도적인 힘을 과시한다. 하지만 미코와 료는 서로를 도와가며 울프 박사와 싸우고 그의 약점을 찾아낸다.\n', doc_id='4aec19c1-4ffd-4785-aba0-7edbe2dab539', embedding=None, doc_hash='751d8b9d08df98417fd7c46dcb76c654e86a83a222af81815360ab1a6586ba52', extra_info=None, node_info={'start': 0, 'end': 157}, relationships={<DocumentRelationship.SOURCE: '1'>: '49e15b8f-9a07-41fc-8ea6-cfa5166a6d49'}), sco