# LlamaIndex - シンプルな例

# 準備

In [1]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv

# 環境変数の読み込み
load_dotenv()
os.environ['OPENAI_API_KEY']  = os.environ['API_KEY']

# Indexの構築

In [2]:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

# ドキュメントからテキスト情報を読込
documents = SimpleDirectoryReader('data').load_data()
# Indexの構築
index = VectorStoreIndex.from_documents(documents)

# ユーザーからの質問に回答

In [3]:
# Query Engineの作成
query_engine = index.as_query_engine()
# 「ユーザーからの質問」を渡して回答を得る
response = query_engine.query("キノコストレージについて日本語で説明して")
# 言語モデルからの回答を表示
print(response)

キノコストレージは、容量の大きなデータストレージ装置を指す架空のIT用語であり、その形状がキノコに似ていることから名付けられました。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができるとされています。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保すると説明されます。


# 詳細なログの表示

In [4]:
import logging
import sys

logging.basicConfig(stream=sys.stdout, level=logging.DEBUG)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

In [5]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて日本語で説明して")
print(response)

DEBUG:openai._base_client:Request options: {'method': 'post', 'url': '/embeddings', 'files': None, 'post_parser': <function Embeddings.create.<locals>.parser at 0x10a81e5c0>, 'json_data': {'input': ['キノコストレージについて説明して'], 'model': 'text-embedding-ada-002', 'encoding_format': 'base64'}}
Request options: {'method': 'post', 'url': '/embeddings', 'files': None, 'post_parser': <function Embeddings.create.<locals>.parser at 0x10a81e5c0>, 'json_data': {'input': ['キノコストレージについて説明して'], 'model': 'text-embedding-ada-002', 'encoding_format': 'base64'}}
DEBUG:httpcore.connection:close.started
close.started
DEBUG:httpcore.connection:close.complete
close.complete
DEBUG:httpcore.connection:connect_tcp.started host='api.openai.com' port=443 local_address=None timeout=60.0 socket_options=None
connect_tcp.started host='api.openai.com' port=443 local_address=None timeout=60.0 socket_options=None
DEBUG:httpcore.connection:connect_tcp.complete return_value=<httpcore._backends.sync.SyncStream object at 0x162fe7

In [6]:
# もとに戻す（ログを出力しない）
logging.basicConfig(stream=sys.stdout, level=logging.WARNING)
# ログハンドラー出力を除去
while len(logging.getLogger().handlers) > 0:
  logging.getLogger().removeHandler(logging.getLogger().handlers[0])

In [7]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて日本語で説明して")
print(response)

キノコストレージは、容量の大きなデータストレージ装置を指す架空のIT用語であり、その形状がキノコに似ていることから名付けられました。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができるとされています。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保すると説明されます。


# ストレージに保存

In [8]:
# ストレージに保存
index.storage_context.persist("./storage01")

In [9]:
from llama_index.core import StorageContext, load_index_from_storage

# ストレージコンテキストの作成
storage_context = StorageContext.from_defaults(persist_dir="./storage01")
# Indexのロード
index = load_index_from_storage(storage_context)

In [10]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて日本語で説明して")
print(response)

キノコストレージは、容量の大きなデータストレージ装置を指す架空のIT用語であり、その形状がキノコに似ていることから名付けられました。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができるとされています。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保すると説明されます。
