# LlamaIndexの前準備

In [None]:
# パッケージのインストール
!pip install llama-index==0.6.12

In [None]:
# 環境変数の準備
import os
os.environ["OPENAI_API_KEY"] = "<OpenAI_APIのAPIキー>"

In [None]:
import logging
import sys

# ログレベルの設定
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

# ドキュメントの読み込み


In [None]:
from llama_index import SimpleDirectoryReader

# ドキュメントの読み込み
documents = SimpleDirectoryReader("data").load_data()
print("documents :", documents)

In [None]:
from llama_index import Document

# ドキュメントを手動で作成
texts = ["text1", "text2", "text3"]
documents = [Document(t) for t in texts]
print("documents :", documents)

In [None]:
from llama_index import GPTVectorStoreIndex

# インデックスの作成
index = GPTVectorStoreIndex.from_documents(documents)

In [None]:
from llama_index import GPTVectorStoreIndex

# 空のインデックスの作成
index = GPTVectorStoreIndex.from_documents([])

# インデックスへのドキュメントの挿入
for doc in documents:
    index.insert(doc)

In [None]:
from llama_index import SimpleDirectoryReader

# ドキュメントの読み込み
documents = SimpleDirectoryReader("data").load_data()
print("documents :", documents)

In [None]:
from llama_index import LLMPredictor, ServiceContext
from langchain.chat_models import ChatOpenAI

# LLMPredictorの準備
llm_predictor = LLMPredictor(llm=ChatOpenAI(
    temperature=0,  # 温度
    model_name="gpt-3.5-turbo" # モデル目
))

# ServiceContextの準備
service_context = ServiceContext.from_defaults(
    llm_predictor=llm_predictor, 
)

# インデックスの生成
index = GPTVectorStoreIndex.from_documents(
    documents, 
    service_context=service_context, 
)

In [None]:
from llama_index import GPTVectorStoreIndex, PromptHelper, ServiceContext

# PromptHelperの準備
prompt_helper=PromptHelper(
    max_input_size=4096,  # LLM入力の最大トークン数
    num_output=256,  # LLM出力のトークン数
    max_chunk_overlap=20,  # チャンクオーバーラップの最大トークン数
)

# ServiceContextの準備
service_context = ServiceContext.from_defaults(
    prompt_helper=prompt_helper
)

# インデックスの生成
index = GPTVectorStoreIndex.from_documents(
    documents,
    service_context=service_context,
)

In [None]:
from llama_index import GPTVectorStoreIndex, PromptHelper, ServiceContext

# PromptHelperの準備
prompt_helper=PromptHelper(
    max_input_size=4096,  # LLM入力の最大トークン数
    num_output=256,  # LLM出力のトークン数
    max_chunk_overlap=20,  # チャンクオーバーラップの最大トークン数
)

# ServiceContextの準備
service_context = ServiceContext.from_defaults(
    prompt_helper=prompt_helper
)

# インデックスの生成
index = GPTVectorStoreIndex.from_documents(
    documents, # ドキュメント
    service_context=service_context, # ServiceContext
)

In [None]:
# sentence_transformersパッケージのインストール
!pip install sentence_transformers

In [None]:
from langchain.embeddings import HuggingFaceEmbeddings
from llama_index import GPTVectorStoreIndex, ServiceContext, LangchainEmbedding

# 埋め込みモデルの準備
embed_model = LangchainEmbedding(HuggingFaceEmbeddings(
    model_name="oshizo/sbert-jsnli-luke-japanese-base-lite"
))

# ServiceContextの準備
service_context = ServiceContext.from_defaults(
    embed_model=embed_model
)

# インデックスの生成
index = GPTVectorStoreIndex.from_documents(
    documents, # ドキュメント
    service_context=service_context, # ServiceContext
)

In [None]:
# クエリエンジンの作成
query_engine = index.as_query_engine()

In [None]:
# 質問応答
response = query_engine.query("ミコの幼馴染の名前は？")
print(response)

In [None]:
# レスポンス
print("response :", response.response, "\n")

# ソース
print("source_nodes :", response.source_nodes, "\n")