In [37]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
# 설치: pip install python-dotenv
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [38]:
import logging
import sys
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

In [39]:
#pip install llama_index
from llama_index.core import ( VectorStoreIndex, 
                               SimpleDirectoryReader, 
                               StorageContext)
reader = SimpleDirectoryReader(input_dir="./sub/")
documents = reader.load_data()
print(f"Loaded {len(documents)} docs")

DEBUG:llama_index.core.readers.file.base:> [SimpleDirectoryReader] Total files added: 7
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin1.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin2.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin3.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin4.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin5.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin6.txt
DEBUG:fsspec.local:open file: C:/LLM_env/sub/akazukin7.txt
Loaded 7 docs


In [40]:
#Indexing
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()

#쿼리 실행
r = query_engine.query("미코의 소꿉친구 이름은?")
print(r)

DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제6장: 진실의 해방

미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서...
DEBUG:openai._base_client:Request options: {'method': 'post', 'url': '/embeddings', 'files': None, 'post_parser': <function Embeddings.create.<locals>.parser at 0x00000223F0DE2C00>, 'json_data': {'input': ["fi

In [41]:
# 메모리에 존재하는 인덱스 데이터를 디스크와 같은 물리적인 저장 장치에 저장
index.storage_context.persist()

DEBUG:fsspec.local:open file: C:/LLM_env/storage/docstore.json
DEBUG:fsspec.local:open file: C:/LLM_env/storage/index_store.json
DEBUG:fsspec.local:open file: C:/LLM_env/storage/graph_store.json
DEBUG:fsspec.local:open file: C:/LLM_env/storage/default__vector_store.json
DEBUG:fsspec.local:open file: C:/LLM_env/storage/image__vector_store.json


In [42]:
# 저장된 인덱스를 로드해서 쿼리 실행
from llama_index.core import load_index_from_storage

storage_context = StorageContext.from_defaults(persist_dir="./storage")
index = load_index_from_storage(storage_context)
print(query_engine.query("료의 성별은?"))


DEBUG:llama_index.core.storage.kvstore.simple_kvstore:Loading llama_index.core.storage.kvstore.simple_kvstore from ./storage\docstore.json.
DEBUG:fsspec.local:open file: C:/LLM_env/storage/docstore.json
DEBUG:llama_index.core.storage.kvstore.simple_kvstore:Loading llama_index.core.storage.kvstore.simple_kvstore from ./storage\index_store.json.
DEBUG:fsspec.local:open file: C:/LLM_env/storage/index_store.json
DEBUG:llama_index.core.graph_stores.simple:Loading llama_index.core.graph_stores.simple from ./storage\graph_store.json.
DEBUG:fsspec.local:open file: C:/LLM_env/storage/graph_store.json
DEBUG:fsspec.local:open file: C:/LLM_env/storage/property_graph_store.json
DEBUG:llama_index.core.vector_stores.simple:Loading llama_index.core.vector_stores.simple from ./storage\default__vector_store.json.
DEBUG:fsspec.local:open file: C:/LLM_env/storage/default__vector_store.json
DEBUG:llama_index.core.vector_stores.simple:Loading llama_index.core.vector_stores.simple from ./storage\image__vecto

In [43]:
print(query_engine.query("울프 코퍼레이션의 CEO의 이름은?"))

DEBUG:openai._base_client:Request options: {'method': 'post', 'url': '/embeddings', 'files': None, 'post_parser': <function Embeddings.create.<locals>.parser at 0x00000223F0DE0AE0>, 'json_data': {'input': ['울프 코퍼레이션의 CEO의 이름은?'], 'model': 'text-embedding-ada-002', 'encoding_format': 'base64'}}
DEBUG:openai._base_client:Sending HTTP Request: POST https://api.openai.com/v1/embeddings
DEBUG:httpcore.http11:send_request_headers.started request=<Request [b'POST']>
DEBUG:httpcore.http11:send_request_headers.complete
DEBUG:httpcore.http11:send_request_body.started request=<Request [b'POST']>
DEBUG:httpcore.http11:send_request_body.complete
DEBUG:httpcore.http11:receive_response_headers.started request=<Request [b'POST']>
DEBUG:httpcore.http11:receive_response_headers.complete return_value=(b'HTTP/1.1', 200, b'OK', [(b'Date', b'Wed, 22 Jan 2025 05:15:00 GMT'), (b'Content-Type', b'application/json'), (b'Transfer-Encoding', b'chunked'), (b'Connection', b'keep-alive'), (b'access-control-allow-ori

In [56]:
# VectorDB에 document의 index 구축
# pip install llama_index.vector_stores
from llama_index.vector_stores.faiss import FaissVectorStore
import faiss

faiss_index = faiss.IndexFlatL2(1536)
vector_store = FaissVectorStore(faiss_index=faiss_index)
storage_context = StorageContext.from_defaults(vector_store=vector_store)
index = VectorStoreIndex.from_documents(documents, storage_context=storage_context)

query_engine = index.as_query_engine()

#쿼리 실행
r = query_engine.query("미코의 성격은?")
print(r)

DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제1장: 데이터 프론트

밤이 되면 반짝이는 네오 도쿄. 고층 빌딩이 늘어서고, 네온...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제2장: 울프 코퍼레이션의 함정

미코는 목적지인 술집 '할머니의 집'으로 향하는 길...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제3장: 배신과 재회

술집 '할머니의 집'에서 미코는 데이터를 받을 사람인 료를 기...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제4장: 울프 코퍼레이션의 붕괴

미코와 료는 해커 집단과 함께 울프 코퍼레이션에 대...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제5장: 결전의 순간

미코와 료는 마침내 울프 코퍼레이션의 최상층에 도착해 CEO인...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제6장: 진실의 해방

미코는 울프 박사의 약점을 파고들어 그를 쓰러뜨리는데 성공한다...
DEBUG:llama_index.core.node_parser.node_utils:> Adding chunk: 제7장: 새로운 시작

울프 코퍼레이션이 무너진 후, 미코와 료는 서로의 과거를 용서...
DEBUG:openai._base_client:Request options: {'method': 'post', 'url': '/embeddings', 'files': None, 'post_parser': <function Embeddings.create.<locals>.parser at 0x0000022409705260>, 'json_data': {'input': ["fi

In [62]:
# 웹 페이지 로드 , 질의 응답
from llama_index.core import download_loader

BeautifulSoupWebReader = download_loader("BeautifulSoupWebReader")
loader = BeautifulSoupWebReader()

# 웹페이지 로드
documents = loader.load_data(urls=["http://openai.com/blog/planning-for-agi-and-beyond"])

# 인덱스 생성
index = VectorStoreIndex.from_documents(documents)

# 쿼리 엔진 생성
query_engine = index.as_query_engine()

# 쿼리 실행
print(query_engine.query("이 웹페이지에서 전하고 싶은 말은 무엇인가요? 한국어로 대답해주세요"))


  BeautifulSoupWebReader = download_loader("BeautifulSoupWebReader")


INFO:httpx:HTTP Request: POST https://api.openai.com/v1/embeddings "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.openai.com/v1/embeddings "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
이 웹페이지는 인공 일반 지능(AGI)에 대한 계획과 미래에 대한 고려사항에 대해 설명하고 있습니다.


In [66]:
# 유튜브 로드, 질의 응답
YoutubeTranscriptReader = download_loader("YoutubeTranscriptReader")
loader = YoutubeTranscriptReader()

documents = loader.load_data(ytlinks=["https://youtu.be/ZEc_brtd6RU"])
index = VectorStoreIndex.from_documents(documents)

# 쿼리 엔진 생성
query_engine = index.as_query_engine()

# 쿼리 실행
print(query_engine.query("이 유투브는 전하고 싶은 말은 무엇인가요? 한국어로 대답해주세요"))

  YoutubeTranscriptReader = download_loader("YoutubeTranscriptReader")


INFO:httpx:HTTP Request: POST https://api.openai.com/v1/embeddings "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.openai.com/v1/embeddings "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
이 유투브 영상에서는 하원이가 일상적인 아르바이트 경험을 솔직하게 공유하고, 자신의 성격과 취향을 유쾌하게 드러내며 즐거운 대화를 펼치는 모습을 보여줍니다.
