# 概要
* GPT_indexの実装を確認する
* 複数インデックスを見てるっぽくも見える
* そもそもインデックスは何種類あって、それぞれどう特徴があるのかがまず不明である

# 参考
* https://gpt-index.readthedocs.io/en/latest/how_to/custom_llms.html

In [1]:
import os
import openai

openai.api_key = os.getenv("OPENAI_API_KEY")

In [2]:
#Jupyterでも実行できるのは知らんかった...
import logging
import sys
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

# GPT-indexを用いた場合

In [9]:
from llama_index import (
    GPTSimpleVectorIndex, 
    GPTSimpleKeywordTableIndex, 
    GPTListIndex, 
    SimpleDirectoryReader
)

from llama_index import (
    GPTKeywordTableIndex, 
    SimpleDirectoryReader, 
    LLMPredictor,
    PromptHelper
)

from gpt_index.indices.knowledge_graph.base import GPTKnowledgeGraphIndex
from langchain import OpenAI

documents = SimpleDirectoryReader('story/dragonball').load_data()

# define prompt helper
# set maximum input size
max_input_size = 4096
# set number of output tokens
num_output = 2048
# set maximum chunk overlap
max_chunk_overlap = 0
prompt_helper = PromptHelper(max_input_size, num_output, max_chunk_overlap, separator="\n\n", chunk_size_limit=512)

# define LLM
llm_predictor = LLMPredictor(llm=OpenAI(temperature=0, model_name="text-davinci-003", max_tokens=num_output))

# build index
index = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)

DEBUG:root:> [SimpleDirectoryReader] Total files added: 1
DEBUG:root:> Adding chunk: 孫悟空少年編
地球の人里離れた山奥に住む尻尾の生えた少年・孫悟空はある日、西の都からやって来た...
DEBUG:root:> Adding chunk: その後、悟空は旅の途中に知り合った武術の達人・亀仙人の下で、後に親友となるクリリンと共に8か月...
DEBUG:root:> Adding chunk: ピッコロ大魔王編
天下一武道会終了後、ピラフ一味によって復活したピッコロ大魔王によって、クリリ...
DEBUG:root:> Adding chunk: その約3年後、少年から青年へと成長した悟空は、天下一武道会の会場で仲間たちと再会。試合では、少...
DEBUG:root:> Adding chunk: サイヤ人編
ピッコロ（マジュニア）との闘いから約5年後、息子の孫悟飯を儲けて平和な日々を過ごし...
DEBUG:root:> Adding chunk: 悟空はドラゴンボールによって生き返るまでの間、あの世の界王の下で修業し、仲間と共に地球に強襲し...
DEBUG:root:> Adding chunk: フリーザ編
地球の神と殺された仲間たちを甦らせるため、重傷で入院中の悟空に代わり、悟飯、クリリ...
DEBUG:root:> Adding chunk: 出し抜かれて願いが叶えられなかったフリーザは激怒し、一行は対決を強いられる。フリーザの持つ圧倒...
DEBUG:root:> Adding chunk: 人造人間・セル編
ナメック星での闘いから約1年後、密かに生き延びていたフリーザとその一味が地球...
DEBUG:root:> Adding chunk: 人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セ...
DEBUG:root:> Adding chunk: 魔人ブウ編
セルゲームより約7年後、高校生に成長した悟飯が天下一武道会に出場することを知った悟...
DEBUG:root:> Adding chunk: 一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトランクスが「フュ...
DEBUG:

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (3): api.openai.com:443
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 82889
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=140 request_id=5587a780313c5c391a7c4b7539e6644b response_code=200
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u5b6b\\u609f\\u7a7a\\u5c11\\u5e74\\u7de8 \\u5730\\u7403\\u306e\\u4eba\\u91cc\\u96e2\\u308c\\u305f\\u5c71\\u5965\\u306b\\u4f4f\\u3080\\u5c3b\\u5c3e\\u306e\\u751f\\u3048\\u305f\\u5c11\\u5e74\\u30fb\\u5b6b\\u609f\\u7a7a\\u306f\\u3042\\u308b\\u65e5\\u3001\\u897f\\u306e\\u90fd\\u304b\\u3089\\u3084\\u3063\\u3066\\u6765\\u305f\\u5c11\\u5973\\u30fb\\u30d6\\u30eb\\u30de\\u3068\\u51fa\\u4f1a\\u3046\\u3002\\u305d\\u3053\

DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 99439
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=194 request_id=243f0cad7c3ff34072b2529284cb0ea5 response_code=200
INFO:root:> [build_index_from_documents] Total LLM token usage: 0 tokens
INFO:root:> [build_index_from_documents] Total embedding token usage: 4358 tokens


In [10]:
summary = index.query("フリーザに関して日本語で教えてください")
summary

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u30d5\\u30ea\\u30fc\\u30b6\\u306b\\u95a2\\u3057\\u3066\\u65e5\\u672c\\u8a9e\\u3067\\u6559\\u3048\\u3066\\u304f\\u3060\\u3055\\u3044"], "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 8419
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=19 request_id=a0cfb139deb50befe2dc9e78e056d025 response_code=200
DEBUG:llama_index.indices.utils:> Top 1 nodes:
> [Node 2bb47b2b-0e33-44c2-966f-c625694f58bc] [Similarity score:             0.844719] 出し抜かれて願いが叶えられなかったフリーザは激怒し、一行は対決を強いられる。フリーザの持つ圧倒的な力の前にはベジータやピッコロ、悟空すら歯が立たず仲間たちが次々と命を落としていった。怒りを爆発さ...
DEBUG:root:> Searching in chunk: 出し抜かれて願いが叶えられなかったフリーザは激怒し、一行は対決を強いられる。フリーザ

Response(response='\nフリーザはドラゴンボールの主要な敵キャラクターで、サイヤ人の最高位の将軍であり、悪の天才科学者です。彼は悪の行動を行い、地球を滅ぼそうとしましたが、悟空と仲間たちによって最終的に倒されました。', source_nodes=[SourceNode(source_text='出し抜かれて願いが叶えられなかったフリーザは激怒し、一行は対決を強いられる。フリーザの持つ圧倒的な力の前にはベジータやピッコロ、悟空すら歯が立たず仲間たちが次々と命を落としていった。怒りを爆発させた悟空は伝説の戦士・超（スーパー）サイヤ人へと覚醒。フルパワーを解放したフリーザに勝利する。ポルンガによって地球に帰還した悟飯たちは復活したドラゴンボールによりサイヤ人やフリーザ一味に殺された人々を蘇生させた。一方の悟空も爆発するナメック星を辛くも脱出、ヤードラット星に漂着し一命を取り留めた。', doc_id='40dd4a79-d309-4029-9b0a-a469d8f5dd0a', extra_info=None, node_info={'start': 1590, 'end': 1835}, similarity=0.8447192532514392)], extra_info=None)

In [11]:
summary = index.query("魔人ブウに関して日本語で教えてください")
summary

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u9b54\\u4eba\\u30d6\\u30a6\\u306b\\u95a2\\u3057\\u3066\\u65e5\\u672c\\u8a9e\\u3067\\u6559\\u3048\\u3066\\u304f\\u3060\\u3055\\u3044"], "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 8419
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=215 request_id=cd4dc51198cc17eb4e17ee8040599361 response_code=200
DEBUG:llama_index.indices.utils:> Top 1 nodes:
> [Node 492185c5-f4f1-409e-8336-7068a9f17589] [Similarity score:             0.860198] 一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトランクスが「フュージョン（融合）」して誕生した戦士・ゴテンクスや、潜在能力を解放し、パワーアップを遂げて帰ってきた悟...
DEBUG:root:> Searching in chunk: 一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトラン

Response(response='\n魔人ブウはドラゴンボールの主要な敵であり、悟空や悟飯らとの戦いを繰り広げました。彼は様々な人間との出会いからより邪悪で強力な魔人へと変貌し、悟天とトランクスが「フュージョン（融合）」して誕生した戦士・ゴテンクスや、潜在能力を解放し、パワーアップを遂げて帰ってきた悟飯らを次々と吸収していきました。最終的には、ドラゴンボールの協力を得て、地球・ナメック星・あの世の人々のエネルギーによって作り上げられた超特大の元気玉によって完全に消滅しました。10年後、悟空は孫のパンと共に天下一武道会に久しぶりに出場し、魔人ブウの生まれ変わりである少年・ウーブと出会いました。', source_nodes=[SourceNode(source_text='一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトランクスが「フュージョン（融合）」して誕生した戦士・ゴテンクスや、潜在能力を解放し、パワーアップを遂げて帰ってきた悟飯らが応戦するが、戦士たちを次々と吸収し姿を変えていく魔人ブウに苦戦を強いられる。危機に陥った悟飯らを救うため現世に舞い戻った悟空とベジータは、界王神界で真の姿となった魔人ブウとの最終決戦に臨む。ドラゴンボールの協力もあり、地球・ナメック星・あの世の人々のエネルギーによって作り上げられた超特大の元気玉によって魔人ブウは完全に消滅する。\n\nそれから10年後、悟空は孫のパンと共に天下一武道会に久しぶりに出場し、魔人ブウの生まれ変わりである少年・ウーブと出会う。悟空はウーブと共に見果てぬ強さを追い求めて修行に旅立ち、物語は幕を閉じる。\n\n', doc_id='40dd4a79-d309-4029-9b0a-a469d8f5dd0a', extra_info=None, node_info={'start': 2706, 'end': 3072}, similarity=0.8601979240571969)], extra_info=None)

In [12]:
summary = index.query("セルを倒したのは誰ですか。日本語で教えて下さい。")
summary

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u30bb\\u30eb\\u3092\\u5012\\u3057\\u305f\\u306e\\u306f\\u8ab0\\u3067\\u3059\\u304b\\u3002\\u65e5\\u672c\\u8a9e\\u3067\\u6559\\u3048\\u3066\\u4e0b\\u3055\\u3044\\u3002"], "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 8419
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=21 request_id=050d889971aac163d69bdcbd23f4c46e response_code=200
DEBUG:llama_index.indices.utils:> Top 1 nodes:
> [Node 168e27b2-fb77-4121-b3f1-10d4f4dde141] [Similarity score:             0.807953] 人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セルゲーム」の開催を全世界に宣言する。悟空らは天界にある1日で1年の修行が行えるも過酷な環境に晒される...
DEBUG:root:> Searching in chunk: 人造人間17号

Response(response='\n悟飯がセルを倒したのです。', source_nodes=[SourceNode(source_text='人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セルゲーム」の開催を全世界に宣言する。悟空らは天界にある1日で1年の修行が行えるも過酷な環境に晒される「精神と時の部屋」で修行し、強さを増してセルゲームに臨むが、悟空はこのセルとの闘いの中で地球を守るために命を落とす。だが、その遺志を受け継いだ息子・悟飯が超サイヤ人2へと覚醒、父・悟空の幻影と共にかめはめ波を放ちセルを撃破。セルゲームを制した悟飯たちは、ドラゴンボールによりセルに殺された人々を蘇生させるが、悟空は自分が悪人を引き寄せているという理由で生き返りを拒否し、あの世に残ることを選ぶ。', doc_id='40dd4a79-d309-4029-9b0a-a469d8f5dd0a', extra_info=None, node_info={'start': 2187, 'end': 2481}, similarity=0.8079534709757767)], extra_info=None)

In [13]:
summary = index.query("セルに関して日本語で教えてください")
summary

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u30bb\\u30eb\\u306b\\u95a2\\u3057\\u3066\\u65e5\\u672c\\u8a9e\\u3067\\u6559\\u3048\\u3066\\u304f\\u3060\\u3055\\u3044"], "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 8419
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=19 request_id=115fad04523e2b2e6a14ea8e9be2ecf2 response_code=200
DEBUG:llama_index.indices.utils:> Top 1 nodes:
> [Node 168e27b2-fb77-4121-b3f1-10d4f4dde141] [Similarity score:             0.804292] 人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セルゲーム」の開催を全世界に宣言する。悟空らは天界にある1日で1年の修行が行えるも過酷な環境に晒される...
DEBUG:root:> Searching in chunk: 人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セ...
DEBUG

Response(response='\nセルはドラゴンボールの主要な悪役であり、人造人間17号と人造人間18号を吸収して完全体となった超級人造人間です。セルは地球の命運を賭けた武道会「セルゲーム」を開催し、悟空らが精神と時の部屋で修行を行い、セルとの闘いの中で地球を守るために命を落としました。悟飯が超サイヤ人2へと覚醒し、父・悟空の幻影と共にかめはめ波を放ちセルを撃破し、セルゲームを制しました。ドラゴンボールによりセルに殺された人々を蘇生させることもできましたが、悟空は自分が悪人を引き寄せているという理由で生き返りを拒否し、あの世に残ることを選びました。', source_nodes=[SourceNode(source_text='人造人間17号と人造人間18号を吸収することで完全体となったセルは地球の命運を賭けた武道会「セルゲーム」の開催を全世界に宣言する。悟空らは天界にある1日で1年の修行が行えるも過酷な環境に晒される「精神と時の部屋」で修行し、強さを増してセルゲームに臨むが、悟空はこのセルとの闘いの中で地球を守るために命を落とす。だが、その遺志を受け継いだ息子・悟飯が超サイヤ人2へと覚醒、父・悟空の幻影と共にかめはめ波を放ちセルを撃破。セルゲームを制した悟飯たちは、ドラゴンボールによりセルに殺された人々を蘇生させるが、悟空は自分が悪人を引き寄せているという理由で生き返りを拒否し、あの世に残ることを選ぶ。', doc_id='40dd4a79-d309-4029-9b0a-a469d8f5dd0a', extra_info=None, node_info={'start': 2187, 'end': 2481}, similarity=0.8042915305570552)], extra_info=None)

In [14]:
summary = index.query("魔人ブウの生まれりは誰ですか。日本語で教えて下さい。")
summary

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u9b54\\u4eba\\u30d6\\u30a6\\u306e\\u751f\\u307e\\u308c\\u308a\\u306f\\u8ab0\\u3067\\u3059\\u304b\\u3002\\u65e5\\u672c\\u8a9e\\u3067\\u6559\\u3048\\u3066\\u4e0b\\u3055\\u3044\\u3002"], "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/engines/text-embedding-ada-002/embeddings HTTP/1.1" 200 8419
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/engines/text-embedding-ada-002/embeddings processing_ms=18 request_id=aca68ba171fae9c6af5917baf076ac11 response_code=200
DEBUG:llama_index.indices.utils:> Top 1 nodes:
> [Node 492185c5-f4f1-409e-8336-7068a9f17589] [Similarity score:             0.864717] 一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトランクスが「フュージョン（融合）」して誕生した戦士・ゴテンクスや、潜在能力を解放し、パワーアップを遂げて帰ってきた悟...
DEBUG:root:> Searching in 

Response(response='\n魔人ブウの生まれ変わりは、少年のウーブです。', source_nodes=[SourceNode(source_text='一方、魔人ブウは様々な人間との出会いからより邪悪で強力な魔人へと変貌。悟天とトランクスが「フュージョン（融合）」して誕生した戦士・ゴテンクスや、潜在能力を解放し、パワーアップを遂げて帰ってきた悟飯らが応戦するが、戦士たちを次々と吸収し姿を変えていく魔人ブウに苦戦を強いられる。危機に陥った悟飯らを救うため現世に舞い戻った悟空とベジータは、界王神界で真の姿となった魔人ブウとの最終決戦に臨む。ドラゴンボールの協力もあり、地球・ナメック星・あの世の人々のエネルギーによって作り上げられた超特大の元気玉によって魔人ブウは完全に消滅する。\n\nそれから10年後、悟空は孫のパンと共に天下一武道会に久しぶりに出場し、魔人ブウの生まれ変わりである少年・ウーブと出会う。悟空はウーブと共に見果てぬ強さを追い求めて修行に旅立ち、物語は幕を閉じる。\n\n', doc_id='40dd4a79-d309-4029-9b0a-a469d8f5dd0a', extra_info=None, node_info={'start': 2706, 'end': 3072}, similarity=0.864716776516476)], extra_info=None)