In [1]:
import openai
import os
import sys
from dotenv import load_dotenv
import numpy as np
import logging
from llama_index import SimpleDirectoryReader, GPTVectorStoreIndex, StorageContext, load_index_from_storage

#ログレベルの設定
logging.basicConfig(stream=sys.stdout, level=logging.INFO, force=True)

In [2]:
#環境変数からOpenAIのAPIキー読み込み
load_dotenv(override=True)
openai.api_key = os.getenv("openai_api_key")

In [3]:
def create_new_index(input_dir="./data", save_dir="./storage"):
    """input_dirのディレクトリ内のデータを基にインデックスを作成し、save_dirのディレクトリ内に保存する
    """
    # ドキュメント読み込み
    logging.info("----Start: loading documents-----")
    documents = SimpleDirectoryReader(input_dir=input_dir).load_data()
    logging.debug(f"documents: {documents}")
    logging.info("----End: loading documents-----\n")

    # インデックスの作成：時間がかかるので注意
    logging.info("----Start: making index-----")
    index = GPTVectorStoreIndex.from_documents(documents)
    logging.info(f"index:{index}")
    logging.info("----End: making index-----\n")

    # インデックスの保存
    logging.info("----Start: saving index-----")
    index.storage_context.persist(persist_dir=save_dir)
    logging.info("----End: saving index-----\n")

    return index

In [4]:
def send_query_and_response(query_engine, query):
    response = query_engine.query(query)
    print(f"query:{query}")
    print(f"response:{response}")
    return response

In [5]:
# 保存したインデックスがある場合には読み込み。なければインデックスの新規作成を実行
try:
    logging.info("----Start: loading index-----")
    storage_context = StorageContext.from_defaults(persist_dir="./storage")
    index = load_index_from_storage(storage_context)
    logging.info("----End: loading index-----\n")
except Exception as e:
     logging.info(f"Loading index failed.")
     logging.info(f"Try to create index...")
     index = create_new_index()


INFO:root:----Start: loading index-----
INFO:llama_index.indices.loading:Loading all indices.


[nltk_data] Downloading package punkt to /tmp/llama_index...


INFO:root:----End: loading index-----



[nltk_data]   Unzipping tokenizers/punkt.zip.


In [6]:
# query engineの作成
logging.info("----Start: making query engine-----")
query_engine = index.as_query_engine()
logging.info("----End: making query engine-----\n")

INFO:root:----Start: making query engine-----
INFO:root:----End: making query engine-----



In [13]:
# クエリの設定
query = "Azure OpenAI Serviceで使用できるモデルの種類を教えてください"

In [14]:
# クエリに対するレスポンスを表示
send_query_and_response(query_engine, query)

query:Azure OpenAI Serviceで使用できるモデルの種類を教えてください
response:基本モデルと微調整されたモデルの2種類のモデルがAzure OpenAI Serviceで使用できます。


Response(response='基本モデルと微調整されたモデルの2種類のモデルがAzure OpenAI Serviceで使用できます。', source_nodes=[NodeWithScore(node=TextNode(id_='b4b2883c-9a02-4545-9bb6-38f8dbe9f0cb', embedding=None, metadata={'page_label': '4', 'file_name': 'azure-ai-services-openai.pdf'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='93b2dfa8-0cf3-41c7-8989-0e9338332eab', node_type=None, metadata={'page_label': '4', 'file_name': 'azure-ai-services-openai.pdf'}, hash='44de5526b0376d780cf887294ab5e8fcf4cb0732007f1c1b41f2fa8edfa6121c'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='deb7319e-63ba-4bb4-9743-1f3327b481ca', node_type=None, metadata={'page_label': '4', 'file_name': 'azure-ai-services-openai.pdf'}, hash='6e2f6536cbad461915f6e7b1c4fd5885e8472b7b8d763853bffed6296a478f33')}, hash='8c246cddca60826dfc14f794f1cfd5de7a8494f88cf86ea9f5af13b12ca7f9cb', text='Microsoft は、⼈を第⼀に考える原則に基づいて、 AI の発展に取り組んでいます。\nAzure OpenAI で利⽤可能なもののよ