# RAGを用いた文章検索

このハンズオンでは、GoogleのGemini Proを用いた会話応答文の生成方法と、  
RAGを用いて特定の文章を参照して応答するようにする方法を学んでいきます。

まず必要なライブラリをインストールします。

In [None]:
!pip install langchain==0.1.13 langchain-google-vertexai==0.1.2 chromadb sentence-transformers lark

notebook全体で使うライブラリを読み込んでおきます。

In [None]:
from IPython.display import Markdown, display
from gcs_utils import GcsUtils
import pandas as pd
import os

データセットが一部GCSにあるので、GCSを読み込む部分も予め定義しておきます。

In [None]:
# 研修用gcs環境が使える場合のみTrueにしてください
use_image = False
# use_image = True

In [None]:
PROJECT_ID = "hr-mixi"
BUCKET_NAME = "mixi-ml-handson-2024"
bucket = GcsUtils(
    project_id=PROJECT_ID,
    bucket_name=BUCKET_NAME
)

# Google Gemini Pro 1.5を用いた文章生成
では、試しにGemini Proを用いて文章生成を行ってみましょう。  
なお、今回はLLMsを用いた開発でよく使われるLangChainを使ってGeminiを呼び出しています。

In [None]:
from langchain_google_vertexai import ChatVertexAI
from langchain.schema.messages import HumanMessage

model_name = "gemini-1.5-pro-preview-0409"
gemini_model = ChatVertexAI(model_name=model_name, location='asia-northeast1')

In [None]:
def get_message(text, model=gemini_model):
    return model([HumanMessage(content=[text])])

In [None]:
# questionを任意で変更して、モンストのキャラクターについての質問をしてみてください。また、参考文献を明示するような指示も入れてください。
question = 'モンストのパンドラについて教えてください。 また、参考にした情報を明示してください。'

response = get_message(question)
Markdown(response.content)

文章の生成はできましたでしょうか？ 生成できた場合、内容は正しそうですか？

# 文章生成の問題点

文章生成の結果は、一見正しそうな結果が返ってきてそうに見えるかと思います。  
しかし、この生成された文章には以下の問題点があります。  

1. **検索結果に精度が左右される**  
デフォルトのquestionで生成した結果には、`参考情報`として、モンスト公式サイトやAppMedia、GameWithなどが  
挙げられていました。この結果から、Gemini Proは、モンストの情報を学習していたのではなく、  
質問を応答する前に検索を行い、その結果の情報を渡しているため、返答ができていると考えられます。  
これらの検索はこちらが指定したものではく、間違っていたり、古いものを参照してしまう可能性があり、  
正確な情報を求められる検索では適切ではなくなってしまいます。


2. **ハルシネーションが起こる**  
デフォルトのquestionで生成した結果を正確に見てみると、一部間違っている情報があることがよくあります。  
一例を挙げると、例えば`パンドラ`が、闇属性なのに`火属性のガチャ限定キャラクター`となっていたり、  
`進化`に実際は所持していないギミックである`アンチダメージウォール`が入ってしまっていることなどがあります。  
このように、文章生成で返答する文は、一見違和感のない文章で、間違っている内容を出力してしまうので注意が必要です。  
またこのような現象のことを、ハルシネーションといいます。  

このような問題に対するアプローチとして、前のセクションで取り組んだTransfer Learningや  
Fine-Tuningといった手法もありますが、LLMはモデルのパラメータが膨大なため、一部の層を  
再学習させるだけでも、相当なコストがかかります。  

そのため、このパートでは、LLMで特定文章を参照してもらいたい時によく使われる  
`RAG(Retrieval-Augmented Generation)`という手法を用いていきます。  
RAGは関連するドメインの文章を予めベクトル化し、質問文のベクトルと照らし合わせて類似度検索を行い、  
関連するドメインの文章を質問文と一緒にLLMの入力に与えることで、その情報を考慮した回答を生成します。  

では、その仕組みをみていきましょう。  

# データセットの確認
まず、今回RAGを使って覚えさせる情報が入っているcsvを読み込みます。

In [None]:
# 今回使うデータセットの読み込み
df = pd.read_csv('monst_char_dict.csv')

In [None]:
# 中身の確認
df.head()

中身を見てみると、モンストのキャラクター情報や、一言メッセージ、
キャラの説明、性格や誕生日等の情報があります。  
また、image_summariesには、キャラクターの画像を説明しているテキストがあります。  
これらのデータセットは、[モンストディクショナリー](https://dic.xflag.com/monsterstrike/)を参考に作られているので、確認してみてください。

# 各要素におけるdictの作成

次に、RAGに合わせて、データの分割をおこなっていきます。  
ここでは、構成する要素に合わせてcsv(df)データから、  
text_dict、image_dict、metadata_dictの3つを作っていきます。  
それぞれの役割は以下の通りです。  

- **text_dict**  
キャラクター毎のテキスト情報がまとめられており、主にこれをベクトル化していくことで検索を行う。
- **image_dict**  
キャラクター毎の画像の名前と説明が入っており、関連画像を参考情報としてgemini proに入力することで検索を補助する。
- **metadata_dict**  
metadataとして使われるものがまとめられており、主に検索時に、metadataを使うことでフィルタリングを行う。

では、実行していきましょう。

In [None]:
def create_dicts_from_csv(df):
    image_name_list = []
    desc_list = []
    text_list = []
    metadata_name_list = []
    metadata_birthday_list = []
    metadata_sex_list = [] 

    for index, row in df.iterrows():         
        # image_dict の作成 (既にあるsummariesとnameだけなので、名前だけ作成)
        image_name_list.append(f"{row['name']}" if pd.notnull(row['name']) else "")

        # text_dict
        text_elements = [
            f"名前: {row['name']}" if pd.notnull(row['name']) else "",
            f"一言: {row['voice']}" if pd.notnull(row['voice']) else "",
            f"性格: {row['personality']}" if pd.notnull(row['personality']) else "",
            f"誕生日: {row['birthday']}" if pd.notnull(row['birthday']) else "",
            f"好きなもの: {row['favorite']}" if pd.notnull(row['favorite']) else "",
            f"苦手なもの: {row['weak_point']}" if pd.notnull(row['weak_point']) else "",
            f"性別: {row['sex']}" if pd.notnull(row['sex']) else "",
            f"プロフィール: {row['description']}" if pd.notnull(row['description']) else "",
            f"容姿: {row['image_summaries']}" if pd.notnull(row['image_summaries']) else ""                
        ]
        text = ', \n '.join(filter(None, text_elements))
        text_list.append(text)
        
        # metadata_dict
        metadata = {}
        metadata_name_list.append(f"{row['name']}" if pd.notnull(row['name']) else "")
        metadata_birthday_list.append(f"{row['birthday']}" if pd.notnull(row['birthday']) else "")
        metadata_sex_list.append(f"{row['sex']}" if pd.notnull(row['sex']) else "")
    
    image_dict = {'name': image_name_list, 'summaries': df['image_summaries'].values.tolist()}
    text_dict = {'texts': text_list}
    metadata_dict = {'name': metadata_name_list, 'birthday': metadata_birthday_list, 'sex': metadata_sex_list}
    
    return image_dict, text_dict, metadata_dict

In [None]:
image_dict, text_dict, metadata_dict = create_dicts_from_csv(df)

これで、各構成要素に合わせたdictが用意できました。

# Retrieverの作成

データが用意できたので、RAGを定義していきます。  
RAGでは、Retrieverというものを使って、ドメインに関連情報する情報を検索します。　　

今回は`ParentDocumentRetriever`と`SelfQueryRetriever`の2つを使って、関連情報の検索を行います。  
ではそれぞれ、実装をみていきましょう。

## ParentDocumentRetriever
ParentDocumentRetrieverは、検索する際にドキュメントの文章から検索するのではなく、  
検索用の文章を使って検索し、その検索用の文章に紐づいたドキュメントをLLMに渡すという  
仕組みを実現するために定義されたRetrieverです。

なぜこのような仕組みが用意されているかというと、一般的に、LLMに文章を渡す際は  
詳細な情報も含めた文章を渡した方が精度が上がりやすいのですが、逆に検索用の文章は長すぎると、  
特徴が平均化されてしまうため検索精度が下がってしまうという問題があります。  
こういった問題に対処するために用意されているRetrieverとなります。

今回はtext_dictのtextsに対して改行毎に区切って、それを検索用の文章としたいので、  
textsを要素毎に改行で区切るように、修正していきましょう。

In [None]:
# 改行で区切る
# テキストデータを要素ごとに改行で区切る
def reformat_text(text_list):
    formatted_texts = []
    for text in text_list:
        formatted_text = ""
        attributes = text.split(', \n')
        for attribute in attributes:
            key, value = attribute.split(': ', 1)
            # 余計な改行をスペースに置き換え
            value = value.replace('\r\n', ' ').replace('\n', '')
            # カンマで区切られた値を結合
            value = value.replace('、', '、 ')
            key = key.replace(' ', '')
            # 。で終わっている場合は改行
            value = value.replace('。', '。\n')
            formatted_text += f"{key}: {value}\n"
        formatted_texts.append(formatted_text.strip())  # 末尾の不要な改行を削除
    return formatted_texts

# 整理されたテキストデータを取得
formatted_texts = reformat_text(text_dict['texts'])
text_dict['texts'] = formatted_texts

うまく要素毎に改行で分割できているか確認してみましょう

In [None]:
print(str(text_dict['texts'][0]))

これで、データの準備は完了しました。

次に、ドキュメントをベクトル化(embedding)するためのモデルを用意します。  
今回は、多言語対応モデルで日本語に対しての精度が高いと言われている[multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large)を使用します。

In [None]:
from huggingface_hub import snapshot_download

model_name = "intfloat/multilingual-e5-large"
download_path = snapshot_download(
    repo_id=model_name,
    local_dir = f"model/{model_name.split('/')[-1]}",
    local_dir_use_symlinks=False 
)

In [None]:
from langchain.embeddings import HuggingFaceEmbeddings

model_path = 'model/multilingual-e5-large'
embeddings = HuggingFaceEmbeddings(model_name=model_path)

これでデータとベクトル化用のモデルの用意が終わったので、`ParentDocumentRetriever`を定義していきます。  
まず、必要なmoduleをimportします。

In [None]:
import uuid

from langchain.embeddings import VertexAIEmbeddings
from langchain.storage import InMemoryStore
from langchain.vectorstores import Chroma
from langchain_core.documents import Document
from langchain.retrievers import ParentDocumentRetriever
from langchain.text_splitter import CharacterTextSplitter

次に、ParentDocumentRetrieverを取得するためのメソッドを定義します。  
ここでは、主に3つの変数を定義し、ParentDocumentRetrieverに渡しています。
- **vectorstore**  
ベクトルで検索する時に使用される文章を`ChromaDB`を用いて格納する
- **docstore**  
ドキュメント単位での文章を`InMemoryStore`を用いて格納する
- **splitter**  
ドキュメントを改行で分割するために、`CharacterTextSplitter`を用いて定義する

これら3つの変数をParentDocumentRetrieverに渡すことで、  
Retriever内でドキュメントの改行毎にsubdocを作成し、vectorestoreに格納してくれるようになります。  

最後にドキュメントをRetrieverに追加して、retrieverを返すまでがこのメソッドの全貌となります。  
では、実際にメソッドを実行してみてみましょう。

## TODO
ParentDocumentRetrieverに適切なクラスインスタンスを指定してください。

In [None]:
def get_parent_retriever(text_dict, embeddings=embeddings):
    vectorstore = Chroma(
        collection_name="gemini-pro-text-rag",
        embedding_function=embeddings
    )

    # 元の文章を保存するためのストレージ
    store = InMemoryStore()
    id_key = "doc_id"
    
    # inputを改行で区切ってsubdocを作成するためのsplitterを定義する
    child_splitter = CharacterTextSplitter(separator="\n", chunk_size=1, chunk_overlap=0)
    
    # TODO
    retriever = ParentDocumentRetriever(
        vectorstore=____, 
        docstore=____,
        child_splitter=____,
        id_key=id_key,
        search_kwargs={"k": 10},
    )
    
    # テキストデータをembedding、vectorstoreに格納する
    doc_ids = [str(uuid.uuid4()) for _ in text_dict["texts"]]
    # チャンクを保存する
    for i, s in enumerate(text_dict["texts"]):
        if s != "":
            retriever.add_documents(
                [Document(page_content=s, metadata={id_key: doc_ids[i]})]
            )

    return retriever

In [None]:
# 下記コードはsplit毎にlogが流れるので、実行後に最小化しても問題ないです。
parent_retriever = get_parent_retriever(text_dict)

実行が完了したら、試しに投げてみましょう  
textsの一番目のキャラクターのプロフィールを参考に、正しい検索ができているかクエリを投げてみます。

In [None]:
print(text_dict['texts'][0])

In [None]:
parent_retriever.get_relevant_documents("工場現場巡りが好きなキャラクターを教えてください")

一番類似度が高いものとtextsに入っているもの(クラフト)が一致しているでしょうか？

## SelfQueryRetriever
SelfQueryRetrieverは主にMetadataフィルタイングをしたい時に使用されるRetrieverとなります。  
このRetrieverを使うと、metadataを含む質問がされた場合に、中のLLMがその質問を解析し、  
metadataに応じたフィルタを作ってくれるようになります。  
LLMでの検索は、一致検索の精度に難があるので、このようにフィルタリングを行うことで、  
`誕生日`や`性別`といったものの一致検索に対しても高い精度を保てるようになります。  

では、実装を見ていきます。

In [1]:
from datetime import datetime

from langchain.chains.query_constructor.base import AttributeInfo
from langchain.retrievers.self_query.base import SelfQueryRetriever

検索の精度の関係上、日付に当たるbirthdayを、`mm-dd`方式にし、また、月や日にち単体でも  
検索できるようにそれぞれを別のものとして再定義します。

In [None]:
def format_date(date_str):
    # 日付を mm-dd, month, dayを出力する
    try:
        date = datetime.strptime(date_str, '%m/%d')
        return date.strftime('%m-%d'), str(int(date.strftime('%m'))), str(int(date.strftime('%d')))
    except ValueError:
        # 日付の形式が正しくない場合はNoneを返す
        return "", "", ""

では、SelfQueryRetrieverを取得するためのメソッドを定義します。  
今回はドキュメントを格納するvectoresotreのみ定義し、その中にドキュメントを追加していくのですが、  
そこでmetadataを定義するようにします。　　

metadataは以下の5つを定義しています。
- **name** 名前
- **birthday** 誕生日
- **birthday_month** 誕生月
- **birthday_day** 誕生日の日にち
- **sex** 性別

また、同時に画像の検索を行っているので、画像の要約もvectorestoreに追加しており、  
その際metadataに`容姿`という情報を追加しています。  
後の処理で、LLMでの検索時に`容姿`を含むmetadataの情報が関連する資料として取得できた場合、  
そのキャラクターの画像を出力するという構成をとっているため、このようなmetadataを追加しています。

これら3つの変数をParentDocumentRetrieverに渡すことで、  
Retriever内でドキュメントの改行毎にsubdocを作成し、vectorestoreに格納してくれるようになります。  

また、metadataとして登録したものはAttributeInfoを使って属性の定義をする必要があるので、  
メソッド内でその定義を行い、metadataのフィルタ生成をするためのLLMとして`gemini pro`を指定します。  
最後に定義したものをRetrieverに渡し、そのRetrieverを返すまでがこのメソッドの処理になります。  

では、このメソッドも実行していきましょう。

## TODO
SelfQueryRetrieverに適切なクラスインスタンスを指定してください。

In [None]:
def get_self_query_retriever(text_dict, image_dict, metadata_dict, examples, model_name=""):
    vectorstore = Chroma(
        collection_name="gemini-pro-multi-rag",
        embedding_function=embeddings,
    )

    # 元の文章を保存するためのストレージ
    store = InMemoryStore()
    id_key = "doc_id"
    
    # テキストデータをembedding、vectorstoreに格納する
    doc_ids = [str(uuid.uuid4()) for _ in text_dict["texts"]]
    
    # チャンクを保存する
    # この時、metadataとして定義したものをtextと一緒にdocumentに追加しておく
    for i, s in enumerate(text_dict["texts"]):
        if s != "":
            birthday, birthmonth, birthday_day = format_date(metadata_dict['birthday'][i])
            vectorstore.add_documents(
                [Document(page_content=s, metadata={
                    id_key: doc_ids[i],
                    "name": metadata_dict['name'][i],
                    "birthday": birthday,
                    "birthday_month": birthmonth,
                    "birthday_day": birthday_day,                    
                    "sex": metadata_dict['sex'][i]                   
                })]
            )
            
    print("Text Data Stored!!")

    # 画像の要約をembedding、vectorstoreに格納する
    img_sum_ids = [str(uuid.uuid4()) for _ in image_dict["summaries"]]
    
    # チャンクを保存する
    # この時、metadataとして名前と'容姿'という情報を追加しておく
    for i, summary in enumerate(image_dict["summaries"]):
        if s != "":
            vectorstore.add_documents(
                [Document(page_content=summary, metadata={
                    id_key: img_sum_ids[i],
                    "name": image_dict['name'][i],
                    "appearance": '容姿'
                })]
            )
    print("Image Summaries Data Stored!!")    
    
    # metadataとして登録したもののattributeを定義
    metadata_field_info = [
        AttributeInfo(
            name="name",
            description="Character Name",
            type="string",
        ),
        AttributeInfo(
            name="birthday",
            description="Character Birthday",
            type="string",
        ),
        AttributeInfo(
            name="birthday_month",
            description="Character Birthday Month",
            type="string",
        ),
        AttributeInfo(
            name="birthday_day",
            description="Character Birthday Day",
            type="string",
        ),         
        AttributeInfo(
            name="sex",
            description="Character Sex",
            type="string",
        ),
        AttributeInfo(
            name="appearance",
            description="Character Image Description",
            type="string",
        ),          
    ]
    
    # フィルタ作成に使用するLLMの定義
    document_content_description = "モンスターストライク(モンスト)におけるキャラクターの情報と容姿についての説明"
    if model_name == "":
        model_name = "gemini-1.5-pro-preview-0409"
        llm = ChatVertexAI(model_name=model_name)
    
    # TODO
    return SelfQueryRetriever.from_llm(
        llm=____,
        vectorstore=____,
        document_contents=___, 
        metadata_field_info=____,
        verbose=True,
        chain_kwargs={
            "examples": examples
        },
        search_kwargs={
            "k": 4
        }
    )

また、変数としてメソッド内で定義されていないexamplesを引数として受け取り、  
Retrieverに渡していますが、これは、filter作成の精度向上のため、  
いくつかの事例を用意して渡すための変数となります。  
下記の形で、いくつか定義しておきます。  

In [None]:
examples = [
    (
        "誕生日が03月01日のキャラクターはなんですか？",
        {
            "query": "誕生日が3月1日のキャラクター",
            "filter": 'and(eq("birthday_month", "3"), eq("birthday_day", "1"))',
        },
    ),
    (
        "ルシファーについて教えてください",
        {
            "query": "ルシファーについて教えてください",
            "filter": 'eq("name", "ルシファー")',
        },
    ),    
    (
        "ルシファーの画像をください",
        {
            "query": "ルシファーの画像",
            "filter": 'and(eq("name", "ルシファー"), eq("appearance", "容姿"))',
        },
    ),
    (
        "ルシファーの容姿を教えてください",
        {
            "query": "ルシファーの容姿",
            "filter": 'and(eq("name", "ルシファー"), eq("appearance", "容姿"))',
        },
    )    
]

それでは、self_query_retrieverを作っていきましょう

In [None]:
self_query_retriever = get_self_query_retriever(
    text_dict, image_dict, metadata_dict, examples
)

完成したら、関連するドキュメントをとって精度を確認してみましょう

In [None]:
self_query_retriever.invoke("誕生日が7月7日のキャラクターを教えてください")

精度はどうでしょうか  
問題なければ、これでretrieverの定義は完了です。

# Chainの作成  
では、最後に質問からドキュメントの検索を行い、関連情報を含めたプロンプトを作成し  
LLMから回答を受け取るまでのフローを作成していきます。

In [None]:
from langchain_google_vertexai import VertexAI, HarmCategory, HarmBlockThreshold
from vertexai import generative_models

モンストディクショナリーの情報を使った検索にあたり、強めのワードに関する制限をオフにする設定を定義します。  
これは、モンストの世界はあくまでゲームの世界のため、強い表現があり(「下僕」など)、  
それが制限に引っかかる可能性があるためです。  
しかし、実際にサービスに入れるときなどはこれらの設定を適切に設定することを心に留めておいてください。  
また、今回のモデルに置いても **社会良俗に反することは入力しない** ようにしてください。  

In [None]:
safety_settings = {
    generative_models.HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_NONE,
    generative_models.HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_NONE,
    generative_models.HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,
    generative_models.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_NONE,
}

Chainを作る際に呼び出すメソッドを定義していきます。  
まず、generate_promptメソッドを用意します。  
このメソッドは、各retrieverから受け取った関連情報を使い最終的なLLMへの入力となるテキストのプロンプトを作成します。  
また、受け取った関連情報に画像の要約の情報が含まれていたら、画像を出力するようにすると同時に、  
LLMの入力に画像を含んだデータを渡すようにします。

In [None]:
from base64 import b64encode

import matplotlib.pyplot as plt
import numpy as np
from PIL import Image


def plt_image(image_data):
    image = Image.open(image_data)
    # 画像を表示
    plt.imshow(image)
    plt.axis("off")
    plt.show()


def generate_prompt(data):
    prompt_template = f"""
        contextや画像には、モンスターストライク(通称モンスト)のキャラクター情報が与えられます。
        以下の質問に対して、モンストと関連する質問に対しては、contextおよび写真を参考にして質問に答えてください。
        なお、contextには質問と関係ないものが入ることもありますので、その場合は無視をしてください。
        画像に対しても、関係ない場合は無視をしてください。
        モンストと関連する質問に対し、contextや内容を使ってもわからなかった場合は、分かりませんという回答をしてください。
        モンストに関連する質問でないと判断した場合は、contextの情報や画像の情報を使わず、内容に対しての回答をしてください。

        内容:
        {data["question"]}

        context1:
        {data["context1"]}
        
        context2:
        {data["context2"]}    
        """
    text_message = {"type": "text", "text": prompt_template}

    # 画像がRetrivalで取得された場合には画像を追加,エンコードしてmatplotlibで表示する
    # context2の関連性が最も高い要素が'容姿'だった場合モデルに画像を含めて入力する
    if len(data["context2"]) > 0 and use_image:
        doc = data["context2"][0]
        if 'appearance' in doc.metadata:
            name = doc.metadata['name']
            name_path = f"monst_dic/images/{name}.png"
            print(name_path)
            try:
                image_data = bucket.read_file_from_gcs(name_path)
            except:
                print("gcsのbucketが認識できていません。　設定するか、use_imageをfalseにしてください・")
            plt_image(image_data)
            image_b64 = b64encode(image_data.getvalue()).decode("utf-8")
            image_url = f"data:image/jpeg;base64,{image_b64}"
            image_message = {"type": "image_url", "image_url": {"url": image_url}}
            return [HumanMessage(content=[text_message, image_message])]
    return [HumanMessage(content=[text_message])]

次に、get_response_from_modelを定義します。  
これは、generate_promptで生成されたpromptを使ってGemini Proに質問を投げ、  
返ってきた返答を返しているだけのメソッドとなります。

## TODO
事前に定義したVertexAIのgeminiモデルを埋めてください

In [1]:
# モデルにqueryを投げて返答を受け取る
def get_response_from_model(message, model_name = ""):
    if model_name == "":
        model_name = "gemini-1.5-pro-preview-0409"
    # TODO
    model = ____(model_name=model_name, safety_settings=safety_settings)
    response = model(message)
    return response

最後にこれらのメソッドを使ってチェインを定義していきましょう。

## TODO
穴あき箇所に定義した関数を埋めてchainを完成させてください

In [None]:
from langchain.schema.output_parser import StrOutputParser
from langchain_core.runnables import RunnableLambda, RunnablePassthrough


# Chainを作成、実行する
def multimodal_rag(parent_retriever, self_query_retriever , question: str) -> str:
    chain = (
        {
            "context1": parent_retriever,
            "context2": self_query_retriever,
            "question": RunnablePassthrough(),
        }
        # TODO
        | RunnableLambda(____)
        | RunnableLambda(____)
        | StrOutputParser()
    )
    answer = chain.invoke(question)
    return answer

これで、RAGを用いた文書検索部分の実装は完了です。

# 結果の確認

では、questionに質問を用意し、結果の確認をしてみましょう

In [None]:
question_1 = "誕生日が1/1のキャラクターを教えてください"
answer_1 = multimodal_rag(parent_retriever, self_query_retriever, question_1)
Markdown(answer_1)

In [None]:
question_2 = "モンストのネオについて、画像も含めて詳細に教えてください。"
answer_2 = multimodal_rag(parent_retriever, self_query_retriever, question_2)
Markdown(answer_2)

モンストディクショナリーを参考に、正しい情報を出力することができたでしょうか？

好きな質問を入れて、どんな出力を得られるか試してみましょう！

In [None]:
# todo 好きな検索を入れてみよう
question = "モンストにおいて、容姿が金髪である女性キャラクターを教えてください。"
answer = multimodal_rag(parent_retriever, self_query_retriever, question)
Markdown(answer)