# LlamaIndex - シンプルな例

# 準備

In [3]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
import openai

# 環境変数の読み込み
load_dotenv()
os.environ['OPENAI_API_KEY']  = os.environ['API_KEY']
openai.api_key = os.environ['API_KEY'] # これを追記しないとエラーになる

# Indexの構築

In [4]:
from llama_index import VectorStoreIndex, SimpleDirectoryReader

# ドキュメントからテキスト情報を読込
documents = SimpleDirectoryReader('data').load_data()
# Indexの構築
index = VectorStoreIndex.from_documents(documents)

# ユーザーからの質問に回答

In [5]:
# Query Engineの作成
query_engine = index.as_query_engine()
# 「ユーザーからの質問」を渡して回答を得る
response = query_engine.query("キノコストレージについて説明して")
# 言語モデルからの回答を表示
print(response)


キノコストレージは、その形状がキノコに似ていることから名付けられた容量の大きなデータストレージ装置です。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができます。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保すると説明されています。


# 詳細なログの表示

In [6]:
import logging
import sys

logging.basicConfig(stream=sys.stdout, level=logging.DEBUG)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

In [7]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて説明して")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u30ad\\u30ce\\u30b3\\u30b9\\u30c8\\u30ec\\u30fc\\u30b8\\u306b\\u3064\\u3044\\u3066\\u8aac\\u660e\\u3057\\u3066"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
api_version=None data='{"input": ["\\u30ad\\u30ce\\u30b3\\u30b9\\u30c8\\u30ec\\u30fc\\u30b8\\u306b\\u3064\\u3044\\u3066\\u8aac\\u660e\\u3057\\u3066"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=25 request_id=7fd27afcfc71f47715d5005b80ff47c2 response_code=2

In [8]:
# もとに戻す（ログを出力しない）
logging.basicConfig(stream=sys.stdout, level=logging.WARNING)
# ログハンドラー出力を除去
while len(logging.getLogger().handlers) > 0:
  logging.getLogger().removeHandler(logging.getLogger().handlers[0])

In [9]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて説明して")
print(response)


キノコストレージは、その形状がキノコに似ていることから名付けられた容量の大きなデータストレージ装置です。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができます。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保するとされています。


# ストレージに保存

In [10]:
# ストレージに保存
index.storage_context.persist("./storage01")

In [11]:
from llama_index import StorageContext, load_index_from_storage

# ストレージコンテキストの作成
storage_context = StorageContext.from_defaults(persist_dir="./storage01")
# Indexのロード
index = load_index_from_storage(storage_context)

In [12]:
query_engine = index.as_query_engine()
response = query_engine.query("キノコストレージについて説明して")
print(response)


キノコストレージは、その形状がキノコに似ていることから名付けられた容量の大きなデータストレージ装置です。この装置は非常に小さなサイズでありながら、膨大なデータを保持することができます。また、キノコストレージは高い耐久性を持ち、データの保護と安全性を確保するとされています。
