# Building Performant RAG Applications for Production

概述了一些通用技巧--这些技巧按照从最简单到最具挑战性的顺序排列。最终目标是优化检索和生成性能，以便准确地回答更复杂数据集上的更多查询，而不会产生错误。

## General Techniques for Building Production-Grade RAG

- 将用于检索的数据块与用于合成的数据块分离开来**（检索retriever和合成synthesizer分离）**
- 针对**较大文档集**的结构化检索
- 根据任务**动态检索**数据块
- 优化**Context Embedding**

### Decoupling Chunks Used for Retrieval vs. Chunks Used for Synthesis
![img](https://gpt-index.readthedocs.io/en/latest/_images/decouple_chunks.png)

在查询时和在合成回答时用的chunk考量是不一样的，合成就为了让LLMs能合成出更加细节的回答而非常繁琐，但是相应的这会增加很多的不必要的内容这会让在查询的embedding的时候产生很多误差，不便于查询

## Key Techniques(分离检索用node和查询用node)

如何实现分离：

1. 嵌入文档摘要，先检索摘要，再检索文档 **（Document Summary Index）**

2. Recursive Retriever递归检索器+Query Engine Demo查询引擎展示 **(Recursive Retriever)**

### **递归检索器Recursive Retriever概念：**

不仅要探索直接最相关的节点(Node)，还要探索节点（Node）与其他检索器retrievers/查询引擎query engines的关系，并执行它们

Node(=concise summary)————>pandas/SQL query engine

when get Node, so get pandas/SQL query engine


#### 准备子层次的index engine

1.  为嵌入 PDF 和文本其余部分的表格/图像建模。
2. 对大量异构文件进行建模--首先通过摘要编制索引，然后链接到其内容。
3. 提高复杂数据的搜索精度--将用于合成的文本块与搜索方法（更小的块、元数据、摘要等）分开，以实现更好的搜索。
4. 模拟代码块 + 遍历 AST。

在要查询的节点列表中，不仅包括 "文本块"，还包括 "索引链接"，以此来表达分层结构。

In [5]:
import os
os.environ["OPENAI_API_KEY"]="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"

In [6]:
import logging
import sys

# ログレベルの設定
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, force=True)

In [7]:
from pathlib import Path
import requests

# Wikipediaからのデータ読み込み
wiki_titles = ["魔法少女まどか☆マギカ", "ぼっち・ざ・ろっく!"]
for title in wiki_titles:
    response = requests.get(
        "https://ja.wikipedia.org/w/api.php",
        params={
            "action": "query",
            "format": "json",
            "titles": title,
            "prop": "extracts",
            # 'exintro': True,
            "explaintext": True,
        },
    ).json()
    page = next(iter(response["query"]["pages"].values()))
    wiki_text = page["extract"]

    data_path = Path("data")
    if not data_path.exists():
        Path.mkdir(data_path)

    with open(data_path / f"{title}.txt", "w") as fp:
        fp.write(wiki_text)

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): ja.wikipedia.org:443
DEBUG:urllib3.connectionpool:https://ja.wikipedia.org:443 "GET /w/api.php?action=query&format=json&titles=%E9%AD%94%E6%B3%95%E5%B0%91%E5%A5%B3%E3%81%BE%E3%81%A9%E3%81%8B%E2%98%86%E3%83%9E%E3%82%AE%E3%82%AB&prop=extracts&explaintext=True HTTP/1.1" 200 None
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): ja.wikipedia.org:443
DEBUG:urllib3.connectionpool:https://ja.wikipedia.org:443 "GET /w/api.php?action=query&format=json&titles=%E3%81%BC%E3%81%A3%E3%81%A1%E3%83%BB%E3%81%96%E3%83%BB%E3%82%8D%E3%81%A3%E3%81%8F%21&prop=extracts&explaintext=True HTTP/1.1" 200 None


In [8]:
from llama_index import SimpleDirectoryReader

# ドキュメントの読み込み
anime_docs = []
for wiki_title in wiki_titles:
    docs = SimpleDirectoryReader(input_files=[f"data/{wiki_title}.txt"]).load_data()
    docs[0].doc_id = wiki_title
    anime_docs.extend(docs)

1) 准备 QA 模板。
这将是 LlamaIndex QA 提示英文版的直接翻译。

In [9]:
from llama_index.llms.base import ChatMessage, MessageRole
from llama_index.prompts.base import ChatPromptTemplate

In [10]:
# QAシステムプロンプト(set prompt)
TEXT_QA_SYSTEM_PROMPT = ChatMessage(
    content=(
        "あなたは世界中で信頼されているQAシステムです。\n"
        "事前知識ではなく、常に提供されたコンテキスト情報を使用してクエリに回答してください。\n"
        "従うべきいくつかのルール:\n"
        "1. 回答内で指定されたコンテキストを直接参照しないでください。\n"
        "2. 「コンテキストに基づいて、...」や「コンテキスト情報は...」、またはそれに類するような記述は避けてください。"
    ),
    role=MessageRole.SYSTEM,
)

# QAプロンプトテンプレートメッセージ(prompt for send message)
TEXT_QA_PROMPT_TMPL_MSGS = [
    TEXT_QA_SYSTEM_PROMPT,
    ChatMessage(
        content=(
            "コンテキスト情報は以下のとおりです。\n"
            "---------------------\n"
            "{context_str}\n"
            "---------------------\n"
            "事前知識ではなくコンテキスト情報を考慮して、クエリに答えます。\n"
            "Query: {query_str}\n"
            "Answer: "
        ),
        role=MessageRole.USER,
    ),
]

# チャットQAプロンプト
CHAT_TEXT_QA_PROMPT = ChatPromptTemplate(message_templates=TEXT_QA_PROMPT_TMPL_MSGS)

(2) 创建索引和查询引擎。

In [11]:
from llama_index import VectorStoreIndex

indexes = []
query_engines = []


for document in anime_docs:
    # インデックスの作成
    index = VectorStoreIndex.from_documents(
        [document],
    )
    indexes.append(index)

    # クエリエンジンの作成
    query_engine = index.as_query_engine(
        similarity_top_k=3,
        text_qa_template=CHAT_TEXT_QA_PROMPT,
    )
    query_engines.append(query_engine)

DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 『魔法少女まどか☆マギカ』（まほうしょうじょまどかマギカ）は、シャフト制作による日本のテレビア...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 「マギカ（Magica）」は、「魔法の」を意味する形容詞「magicus」の女性形。
2000...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 同作品はテレビアニメ化も行われており、2020年1月から3月に第1期が、2021年8月・9月に...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: == 物語の内容 ==


=== 舞台設定 ===
架空の都市、見滝原（みたきはら）が作品の...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 本作品における魔法少女とはどんな願いでも1つ叶えることと引き換えにキュゥべえと契約を結び、魔女...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 魔法少女の持つソウルジェムは魔法を使用するたびに穢れが貯まり輝きが失われる。全く魔法を使わずに...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: そのすぐ後にほむらはまどかと同じクラスの転校生として現れ、ほむらはまどかに「魔法少女になっては...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 一方で、当初はさやかと対立していた杏子は態度を軟化させ、さやかに過去の自分を重ねて心を寄せてい...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: そして最終話で告げられたまどかの願いにより、魔女を生み出すルールそのものが覆され、「ワルプルギ...
DEBUG:llama_index.node_parse

In [12]:
# まどか☆マギカの質問応答
response = query_engines[0].query("まどか☆マギカの主題歌を歌っている歌手は？")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u307e\\u3069\\u304b\\u2606\\u30de\\u30ae\\u30ab\\u306e\\u4e3b\\u984c\\u6b4c\\u3092\\u6b4c\\u3063\\u3066\\u3044\\u308b\\u6b4c\\u624b\\u306f\\uff1f"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=65 request_id=cf3ad76d29530919d5572a443b19208a response_code=200
DEBUG:llama_index.indices.utils:> Top 3 nodes:
> [Node 243ae916-87fb-49f4-958e-c2f1c0bd6860] [Similarity score:             0.86052] 「まどかが店長に!?」をコンセプトにした「魔法少女まどかマギカショップ」が、2012年より全国で順次開催された。2012年10月に静岡、11月に仙台、12月に広島、2013年1月に福岡、3月にA...
> [Node a30cd9bc-f8d7-4f81-8cb6-c9acb96fa1ef] [Similarity score:             0.856985] 『魔法少女まどか☆マギカ』（まほうしょうじょまどかマギカ）は、シャ

In [13]:
# ぼっち・ざ・ろっく！の質問応答
response = query_engines[1].query("ぼっち・ざ・ろっく！の作者の名前は？")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u307c\\u3063\\u3061\\u30fb\\u3056\\u30fb\\u308d\\u3063\\u304f\\uff01\\u306e\\u4f5c\\u8005\\u306e\\u540d\\u524d\\u306f\\uff1f"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=31 request_id=73202e3087acb72273f1d4aec0189bb6 response_code=200
DEBUG:llama_index.indices.utils:> Top 3 nodes:
> [Node 7da2521e-abbb-410d-8177-4994f0d5a08a] [Similarity score:             0.865326] == 参考文献 ==


=== 原作漫画 ===
はまじあき『ぼっち・ざ・ろっく！』 1巻、芳文社〈まんがタイムKRコミックス〉、2019年2月27日。ISBN 978-4-8322-7072...
> [Node 22d6befa-6b66-4f43-8bf7-300c2ecb339a] [Similarity score:             0.865049] == 書誌情報 ==


=== 単行本 ===
はまじあき『ぼっち・ざ・ろっく！』芳文社〈まんがタイムK

### 准备父层次结构查询引擎
在 Colab 中准备父层次结构查询引擎的步骤如下。

(1) 准备父层次结构节点列表和查询引擎字典。
对于 IndexNode，用 text 指定摘要，用 index_id 指定索引 ID。

In [14]:
from llama_index.schema import IndexNode

# 要約
summaries = [
    "「魔法少女まどか☆マギカ」は、新しいアプローチで魔法少女もののジャンルを刷新したダーク・ファンタジー作品です。物語は魔法少女たちの運命や苦悩、絶望を描いており、彼女たちが魔女と戦う姿が中心です。作品は複数の解釈がありますが、明確な情報は提供されていません。また、複数の会社が関与しており、新房昭之監督とシャフト制作のタッグによるオリジナル作品として注目されています。作品は多くのファンを獲得し、様々な賞を受賞しました。劇場版『新編』叛逆の物語も高い評価を受けています。さまざまなイベントやコラボレーションも行われました。",
    "提供されたテキストには、『ぼっち・ざ・ろっく！』という4コマ漫画の情報が含まれています。物語は主人公の後藤ひとりがバンド活動を通じて成長していく様子を描いています。彼は対人コミュニケーションが苦手であり、自己肯定感の低さやコンプレックスを抱えていますが、バンド活動を通じて成長していきます。彼はギターの演奏技術が高く、作詞も行っていますが、バンドでの実力を存分に発揮することができていません。また、ひとり以外のメンバーには虹夏、郁代、リョウというキャラクターがいます。彼らもバンド活動を通じて成長し、夢を追い求めています。",
]

# ノードリスト
nodes = [
    IndexNode(text=summaries[0], index_id=anime_docs[0].doc_id),
    IndexNode(text=summaries[1], index_id=anime_docs[1].doc_id),
]

# クエリエンジン辞書
query_engine_dict = {
    anime_docs[0].doc_id: query_engines[0],
    anime_docs[1].doc_id: query_engines[1],
}

(2) 准备 VectorStoreIndex 和 VectorRetriever。

对于 VectorStoreIndex，设置之前准备好的节点列表。

In [15]:
# VectorStoreIndexの準備
vector_index = VectorStoreIndex(nodes)

# VectorRetrieverの準備
vector_retriever = vector_index.as_retriever(
    similarity_top_k=3
)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u300c\\u9b54\\u6cd5\\u5c11\\u5973\\u307e\\u3069\\u304b\\u2606\\u30de\\u30ae\\u30ab\\u300d\\u306f\\u3001\\u65b0\\u3057\\u3044\\u30a2\\u30d7\\u30ed\\u30fc\\u30c1\\u3067\\u9b54\\u6cd5\\u5c11\\u5973\\u3082\\u306e\\u306e\\u30b8\\u30e3\\u30f3\\u30eb\\u3092\\u5237\\u65b0\\u3057\\u305f\\u30c0\\u30fc\\u30af\\u30fb\\u30d5\\u30a1\\u30f3\\u30bf\\u30b8\\u30fc\\u4f5c\\u54c1\\u3067\\u3059\\u3002\\u7269\\u8a9e\\u306f\\u9b54\\u6cd5\\u5c11\\u5973\\u305f\\u3061\\u306e\\u904b\\u547d\\u3084\\u82e6\\u60a9\\u3001\\u7d76\\u671b\\u3092\\u63cf\\u3044\\u3066\\u304a\\u308a\\u3001\\u5f7c\\u5973\\u305f\\u3061\\u304c\\u9b54\\u5973\\u3068\\u6226\\u3046\\u59ff\\u304c\\u4e2d\\u5fc3\\u3067\\u3059\\u3002\\u4f5c\\u54c1\\u306f\\u8907\\u6570\\u306e\\u89e3\\u91c8\\u304c\\u3042\\u308a\\u307e\\u3059\\u304c\\u3001\\u660e\\u78ba\\u306a\\u60c5\\u5831\\u306f\\u63d0\\u4f9b\\u3055\\u308

(3) 准备 RecursiveRetriever 和查询引擎。
对于 RecursiveRetriever，设置刚刚准备好的 VectorRetriever 和查询引擎字典。

In [16]:
from llama_index.retrievers import RecursiveRetriever

# RecursiveRetrieverの準備
recursive_retriever = RecursiveRetriever(
    "vector",
    retriever_dict={"vector": vector_retriever},
    query_engine_dict=query_engine_dict,
)

(4) クエリエンジンの準備。

In [17]:
from llama_index.query_engine import RetrieverQueryEngine
from llama_index.response_synthesizers import get_response_synthesizer

# ResponseSynthesizerの準備
response_synthesizer = get_response_synthesizer(
    # service_context=service_context,
    response_mode="compact",
    text_qa_template=CHAT_TEXT_QA_PROMPT,
)

# クエリエンジンの準備
query_engine = RetrieverQueryEngine.from_args(
    recursive_retriever, 
    response_synthesizer=response_synthesizer
)

(5) まどか☆マギカの質問応答。

In [19]:
# まどか☆マギカの質問応答
response = query_engine.query("ぼっち・ざ・ろっく！の作者の名前は？")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u307c\\u3063\\u3061\\u30fb\\u3056\\u30fb\\u308d\\u3063\\u304f\\uff01\\u306e\\u4f5c\\u8005\\u306e\\u540d\\u524d\\u306f\\uff1f"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=32 request_id=c360e827d91ad5350df91f56e12ac623 response_code=200
DEBUG:llama_index.indices.utils:> Top 2 nodes:
> [Node 4fb1fd16-77ce-4ee0-8605-60c38c1d0594] [Similarity score:             0.863585] 提供されたテキストには、『ぼっち・ざ・ろっく！』という4コマ漫画の情報が含まれています。物語は主人公の後藤ひとりがバンド活動を通じて成長していく様子を描いています。彼は対人コミュニケーションが苦...
> [Node 30118835-34b1-4b10-a6e2-584c3c657234] [Similarity score:             0.756495] 「魔法少女まどか☆マギカ」は、新しいアプローチで魔法少女もののジャンルを刷新したダーク・ファンタジー作品で

### Document Summary Index
文档摘要索引Summary Index将从每篇文档中提取摘要，并存储该摘要以及与文档相对应的所有节点。

检索可以通过 LLM 或嵌入（这是一个 TODO）进行。我们首先根据摘要选择与查询相关的文档。与所选文档相对应的所有检索节点都会被检索出来。

In [1]:
import os
os.environ["OPENAI_API_KEY"]="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"

启用异步处理。

启用是因为 "tree_summarize "需要它。

In [2]:
import nest_asyncio

# 异步处理有效化
nest_asyncio.apply()

In [3]:
import logging
import sys

#日志设定
logging.basicConfig(stream=sys.stdout,level=logging.DEBUG,force=True)

ドキュメントをダウンロードしたから、直接的に読み込む

In [5]:
from llama_index import SimpleDirectoryReader
wiki_titles = ["魔法少女まどか☆マギカ", "ぼっち・ざ・ろっく!"]

# 读入文件
anime_docs=[]
for wiki_title in wiki_titles:
    docs = SimpleDirectoryReader(input_files=[f"data/{wiki_title}.txt"]).load_data()
    docs[0].doc_id = wiki_title
    anime_docs.extend(docs)

开始编制DocumentSummaryIndex

（1）QA的prompt的准备

In [6]:
from llama_index.llms.base import ChatMessage, MessageRole
from llama_index.prompts.base import ChatPromptTemplate

# QAシステムプロンプト
TEXT_QA_SYSTEM_PROMPT = ChatMessage(
    content=(
        "あなたは世界中で信頼されているQAシステムです。\n"
        "事前知識ではなく、常に提供されたコンテキスト情報を使用してクエリに回答してください。\n"
        "従うべきいくつかのルール:\n"
        "1. 回答内で指定されたコンテキストを直接参照しないでください。\n"
        "2. 「コンテキストに基づいて、...」や「コンテキスト情報は...」、またはそれに類するような記述は避けてください。"
    ),
    role=MessageRole.SYSTEM,
)

# QAプロンプトテンプレートメッセージ
TEXT_QA_PROMPT_TMPL_MSGS = [
    TEXT_QA_SYSTEM_PROMPT,
    ChatMessage(
        content=(
            "コンテキスト情報は以下のとおりです。\n"
            "---------------------\n"
            "{context_str}\n"
            "---------------------\n"
            "事前知識ではなくコンテキスト情報を考慮して、クエリに答えます。\n"
            "Query: {query_str}\n"
            "Answer: "
        ),
        role=MessageRole.USER,
    ),
]

# チャットQAプロンプト
CHAT_TEXT_QA_PROMPT = ChatPromptTemplate(message_templates=TEXT_QA_PROMPT_TMPL_MSGS)

Tree_Summarize的prompt的定义

In [7]:
from llama_index.llms.base import ChatMessage, MessageRole
from llama_index.prompts.base import ChatPromptTemplate

# QAシステムプロンプト
TEXT_QA_SYSTEM_PROMPT = ChatMessage(
    content=(
        "あなたは世界中で信頼されているQAシステムです。\n"
        "事前知識ではなく、常に提供されたコンテキスト情報を使用してクエリに回答してください。\n"
        "従うべきいくつかのルール:\n"
        "1. 回答内で指定されたコンテキストを直接参照しないでください。\n"
        "2. 「コンテキストに基づいて、...」や「コンテキスト情報は...」、またはそれに類するような記述は避けてください。"
    ),
    role=MessageRole.SYSTEM,
)

# ツリー要約プロンプトメッセージ
TREE_SUMMARIZE_PROMPT_TMPL_MSGS = [
    TEXT_QA_SYSTEM_PROMPT,
    ChatMessage(
        content=(
            "複数のソースからのコンテキスト情報を以下に示します。\n"
            "---------------------\n"
            "{context_str}\n"
            "---------------------\n"
            "予備知識ではなく、複数のソースからの情報を考慮して、質問に答えます。\n"
            "疑問がある場合は、「情報無し」と答えてください。\n"
            "Query: {query_str}\n"
            "Answer: "
        ),
        role=MessageRole.USER,
    ),
]

# ツリー要約プロンプト
CHAT_TREE_SUMMARIZE_PROMPT = ChatPromptTemplate(
    message_templates=TREE_SUMMARIZE_PROMPT_TMPL_MSGS
)

唯一区别的tree_summarize会告诉LLM这个信息是来源于多个数据源的

In [8]:
#摘要查询
SUMMARY_QUERY="提供されたテキストの内容を要約してください。"

DocumentSummaryIndex 准备。
指定 response_mode ="tree_summarize" 和 use_async=True。此外，还要设置日语提示。

用于文档细化的摘要将自动生成。

In [9]:
from llama_index import (
    ServiceContext,
    get_response_synthesizer
)
from llama_index.indices.document_summary import DocumentSummaryIndex

# サービスコンテキストの準備
service_context = ServiceContext.from_defaults(
    chunk_size=1024
)

# レスポンスシンセサイザーの準備
response_synthesizer = get_response_synthesizer(
    response_mode="tree_summarize",
    use_async=True,
    text_qa_template=CHAT_TEXT_QA_PROMPT,  # QAプロンプト
    summary_template=CHAT_TREE_SUMMARIZE_PROMPT,  # TreeSummarizeプロンプト
)

# DocumentSummaryIndexの準備
doc_summary_index = DocumentSummaryIndex.from_documents(
    anime_docs,
    service_context=service_context,
    response_synthesizer=response_synthesizer,
    summary_query=SUMMARY_QUERY,  # 要約クエリ
)

DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 『魔法少女まどか☆マギカ』（まほうしょうじょまどかマギカ）は、シャフト制作による日本のテレビア...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 「マギカ（Magica）」は、「魔法の」を意味する形容詞「magicus」の女性形。
2000...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 同作品はテレビアニメ化も行われており、2020年1月から3月に第1期が、2021年8月・9月に...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: == 物語の内容 ==


=== 舞台設定 ===
架空の都市、見滝原（みたきはら）が作品の...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 本作品における魔法少女とはどんな願いでも1つ叶えることと引き換えにキュゥべえと契約を結び、魔女...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 魔法少女の持つソウルジェムは魔法を使用するたびに穢れが貯まり輝きが失われる。全く魔法を使わずに...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: そのすぐ後にほむらはまどかと同じクラスの転校生として現れ、ほむらはまどかに「魔法少女になっては...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: 一方で、当初はさやかと対立していた杏子は態度を軟化させ、さやかに過去の自分を重ねて心を寄せてい...
DEBUG:llama_index.node_parser.node_utils:> Adding chunk: そして最終話で告げられたまどかの願いにより、魔女を生み出すルールそのものが覆され、「ワルプルギ...
DEBUG:llama_index.node_parse

In [10]:
print(doc_summary_index.get_document_summary("魔法少女まどか☆マギカ"))

提供されたテキストには、アニメ作品「魔法少女まどか☆マギカ」に関する情報が含まれています。この作品は2011年に放送され、日本国内外で人気を博しました。物語の内容やキャラクターの設定、作品のテーマや表現手法について説明されています。また、作品の制作プロセスや関係者のインタビューなども含まれています。音楽に関しては、オープニングテーマがClariSの「コネクト」、エンディングテーマがKalafinaの「Magia」であり、劇伴曲にはスキャットが多く使用されています。放送前にはストーリーの情報が伏せられ、予測不可能な展開が視聴者を楽しませることが方針とされました。放送後も長く展開が続き、関連作品や映画版も制作されました。世界展開も行われ、売上も好調でした。


In [11]:
print(doc_summary_index.get_document_summary("ぼっち・ざ・ろっく!"))

提供されたテキストには、『ぼっち・ざ・ろっく！』という4コマ漫画の物語や主人公の後藤ひとりの成長が描かれています。彼女は結束バンドに参加し、ライブハウスでの演奏や学校の文化祭でのパフォーマンスを経験します。彼女の演奏がネットに投稿され、音楽ライターに注目されます。また、バンドメンバーのプロフィールや性格、バンド活動に関する情報も提供されています。バンドの拠点である下北沢のライブハウス「STARRY」や、バンドメンバーの苗字が「ASIAN KUNG-FU GENERATION」のメンバーの苗字に由来していることも明らかになっています。さらに、他のバンドや漫画作品に関する情報も含まれています。


保存DocumentSummaryIndex的方法

In [12]:
# DocumentSummaryIndexの保存
doc_summary_index.storage_context.persist("index")

DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/docstore.json
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/index_store.json
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/vector_store.json
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/graph_store.json


In [13]:
from llama_index.indices.loading import load_index_from_storage
from llama_index import StorageContext

# DocumentSummaryIndexの読み込み
storage_context = StorageContext.from_defaults(persist_dir="index")
doc_summary_index = load_index_from_storage(storage_context)

DEBUG:llama_index.storage.kvstore.simple_kvstore:Loading llama_index.storage.kvstore.simple_kvstore from index\docstore.json.
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/docstore.json
DEBUG:llama_index.storage.kvstore.simple_kvstore:Loading llama_index.storage.kvstore.simple_kvstore from index\index_store.json.
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/index_store.json
DEBUG:llama_index.vector_stores.simple:Loading llama_index.vector_stores.simple from index\vector_store.json.
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/vector_store.json
DEBUG:llama_index.graph_stores.simple:Loading llama_index.graph_stores.simple from index\graph_store.json.
DEBUG:fsspec.local:open file: d:/文件/留学/入学後/LLM/LLaMaIndex/introduction/index/graph_store.json
INFO:llama_index.indices.loading:Loading all indices.


如何对summaryindex进行提问？

In [14]:
from llama_index.prompts.base import PromptTemplate
from llama_index.prompts.prompt_type import PromptType

# ChoiceSelectプロンプトテンプレート
DEFAULT_CHOICE_SELECT_PROMPT_TMPL = (
    "書類の一覧を以下に示します。各文書の横には文書の要約とともに番号が付いています。"
    "質問に答えるために参照する必要がある文書の番号を、関連性の高い順に答えてください。"
    "関連性スコアは、文書が質問に対してどの程度関連していると思われるかに基づいて1～10の数値で表します。\n\n"
    "必ず以下の書式で記述してください。"
    "それ以外の文章は絶対に記述しないでください。\n\n"
    "Document 1:\n<summary of document 1>\n\n"
    "Document 2:\n<summary of document 2>\n\n"
    "...\n\n"
    "Document 10:\n<summary of document 10>\n\n"
    "Question: <question>\n"
    "Answer:\n"
    "Doc: 9, Relevance: 7\n"
    "Doc: 3, Relevance: 4\n"
    "Doc: 7, Relevance: 3\n\n"
    "では、はじめましょう。\n\n"
    "{context_str}\n"
    "Question: {query_str}\n"
    "Answer:\n"
)

# ChoiceSelectプロンプト
DEFAULT_CHOICE_SELECT_PROMPT = PromptTemplate(
    DEFAULT_CHOICE_SELECT_PROMPT_TMPL, prompt_type=PromptType.CHOICE_SELECT
)

(2) 查询引擎准备。
这次也要在查询引擎中指定 "tree_summarize "作为响应模式。

In [15]:
# レスポンスシンセサイザーの準備
response_synthesizer = get_response_synthesizer(
    response_mode="tree_summarize",
    use_async=True,
    summary_template=CHAT_TREE_SUMMARIZE_PROMPT,  # TreeSummarizeプロンプト
)

# クエリエンジンの準備
query_engine = doc_summary_index.as_query_engine(
    choice_select_prompt=DEFAULT_CHOICE_SELECT_PROMPT, # ChoiceSelectプロンプト
    response_synthesizer=response_synthesizer,
)

In [16]:
# 質問応答
response = query_engine.query("まどか☆マギカの主題歌を歌っている歌手は？")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u307e\\u3069\\u304b\\u2606\\u30de\\u30ae\\u30ab\\u306e\\u4e3b\\u984c\\u6b4c\\u3092\\u6b4c\\u3063\\u3066\\u3044\\u308b\\u6b4c\\u624b\\u306f\\uff1f"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.util.retry:Converted retries value: 2 -> Retry(total=2, connect=None, read=None, redirect=None, status=None)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): api.openai.com:443
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=18 request_id=d3f8acbab271698cdb2fdd63937c91fd response_code=200
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/chat/completions
DEBUG:openai:api_version=None data='{"messa

In [20]:
# 質問応答
response = query_engine.query("ぼっち・ざ・ろっく！の作者の名前は？")
print(response)

DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/embeddings
DEBUG:openai:api_version=None data='{"input": ["\\u307c\\u3063\\u3061\\u30fb\\u3056\\u30fb\\u308d\\u3063\\u304f\\uff01\\u306e\\u4f5c\\u8005\\u306e\\u540d\\u524d\\u306f\\uff1f"], "model": "text-embedding-ada-002", "encoding_format": "base64"}' message='Post details'
DEBUG:urllib3.connectionpool:https://api.openai.com:443 "POST /v1/embeddings HTTP/1.1" 200 None
DEBUG:openai:message='OpenAI API response' path=https://api.openai.com/v1/embeddings processing_ms=22 request_id=388a9ab0023e2c845502821e17f1cf3d response_code=200
DEBUG:openai:message='Request to OpenAI API' method=post path=https://api.openai.com/v1/chat/completions
DEBUG:openai:api_version=None data='{"messages": [{"role": "system", "content": "\\u3042\\u306a\\u305f\\u306f\\u4e16\\u754c\\u4e2d\\u3067\\u4fe1\\u983c\\u3055\\u308c\\u3066\\u3044\\u308bQA\\u30b7\\u30b9\\u30c6\\u30e0\\u3067\\u3059\\u3002\\n\\u4e8b\\u524d\\u77e5\\u8b58\\