# ChatGPTとあなたのデータを使って製品をパワーアップさせる

本書は、ChatGPT APIと自分のデータを使って、Q&Aやチャットボットのアプリを構築する方法を紹介するウォークスルーです。

このようなセクションにレイアウトされている：
- **セットアップ:**
    - 変数の初期化、データのソース化
- **基礎を作る:**
    - ベクターデータベースを設定し、ベクターとデータを受け付けるようにする。
    - データセットを読み込み、埋め込み用にデータを切り分け、ベクターデータベースに保存する。
- **製品化する:**
    - ユーザーがクエリを提示すると、最も関連性の高い項目を返す検索ステップの追加
    - GPT-3を使って検索結果をまとめる。
    - Streamlitでこの基本的なQ&Aアプリを試してみる
- **モートを作る：**
    - 文脈を管理し、ボットと連携するアシスタントクラスを作成する
    - セマンティック検索のコンテキストを用いて、チャットボットを使って質問に答える
    - Streamlitでこの基本的なChatbotアプリをテストする
    
完了すると、OpenAI API とベクトル データベースを使用して、独自の本番チャットボットまたは Q&A アプリケーションを作成するための構成要素が得られます。

このノートブックは、元々[これらのスライド](https://drive.google.com/file/d/1dB-RQhZC_Q1iAsHkNNdkqtxxXqYODFYy/view?usp=share_link)とともに発表されました。このスライドは、この道のりに視覚的な背景を提供しています。

In [1]:
%load_ext autoreload
%autoreload 2

## セットアップ

まず、ライブラリと環境変数を設定します。

In [2]:
import openai
import os
import pandas as pd
import tiktoken
import textract

from database import get_redis_connection
openai.api_key = "-----------------------------"

# デフォルトのモデルとチャンキングの大きさを設定します。
from config import COMPLETIONS_MODEL, CHAT_MODEL

# 閉じられていないSSLソケットの警告を無視する - これらのエラーが発生した場合に備えてオプションとします。
import warnings

warnings.filterwarnings(action="ignore", message="unclosed", category=ImportWarning)
warnings.filterwarnings("ignore", category=DeprecationWarning) 

In [3]:
pd.set_option('display.max_colwidth', 0)

In [4]:
data_dir = os.path.join(os.curdir,'data')
pdf_files = sorted([x for x in os.listdir(data_dir) if 'DS_Store' not in x])
pdf_files

["FIA Practice Directions - Competitor's Staff Registration System.pdf",
 'fia_2022_formula_1_sporting_regulations_-_issue_9_-_2022-10-19_0.pdf',
 'fia_2023_formula_1_technical_regulations_-_issue_4_-_2022-12-07.pdf',
 'fia_f1_power_unit_financial_regulations_issue_1_-_2022-08-16.pdf',
 'fia_formula_1_financial_regulations_iss.13.pdf']

## 土台を作る

### ストレージ

ここでは、ドキュメントの内容とベクトルの埋め込みの両方のデータベースとして、Redisを使用することにします。セマンティック検索を可能にするモジュールであるRedisearchを利用するためには、Redis Stackが必要です。詳細については、[docs for Redis Stack](https://redis.io/docs/stack/get-started/install/docker/) に記載されています。

これをローカルで設定するには、Dockerをインストールして、以下のコマンドを実行する必要があります： ``docker run -d --name redis-stack -p 6379:6379 -p 8001:8001 redis/redis-stack:latest``.

ここで使われているコードは、[このレポ](https://github.com/RedisAI/vecsim-demo)を大いに参考にしています。

Redis StackのDockerインスタンスをセットアップしたら、以下の手順でRedisへの接続を開始し、セマンティック検索用のHNSW（Hierarchical Navigable Small World）インデックスを作成することができます。

In [5]:
# Setup Redis
from redis.commands.search.field import (
    TextField,
    VectorField,
    NumericField
)
from redis.commands.search.indexDefinition import (
    IndexDefinition,
    IndexType
)

redis_client = get_redis_connection()

In [6]:
# 定数
VECTOR_DIM = 1536 #len(data['title_vector'][0]) # ベクトルの長さ
#VECTOR_NUMBER = len(data)                 # 初期状態のベクトル数
PREFIX = "sportsdoc"                            # 文書キーの接頭辞
DISTANCE_METRIC = "COSINE"                # ベクトルの距離指標（例：COSINE、IP、L2)

In [7]:
# 検索インデックスの作成

# Index
INDEX_NAME = "f1-index"           # 検索インデックス名
VECTOR_FIELD_NAME = 'content_vector'

# データセット内にある各カラムに対してRediSearchフィールドを定義する。
# ここで、キャプチャしたいメタデータを追加してください
filename = TextField("filename")
text_chunk = TextField("text_chunk")
file_chunk_index = NumericField("file_chunk_index")

# HNSWインデックスを使用するRediSearchベクトルフィールドを定義する。

text_embedding = VectorField(VECTOR_FIELD_NAME,
    "HNSW", {
        "TYPE": "FLOAT32",
        "DIM": VECTOR_DIM,
        "DISTANCE_METRIC": DISTANCE_METRIC
    }
)
# インデックスとして作成するリストに、すべてのフィールドオブジェクトを追加します
fields = [filename,text_chunk,file_chunk_index,text_embedding]

In [8]:
redis_client.ping()

True

In [9]:
# インデックスが既に存在する場合、それを削除するオプションステップ
#redis_client.ft(INDEX_NAME).dropindex()

# インデックスが存在するか確認する
try:
    redis_client.ft(INDEX_NAME).info()
    print("Index already exists")
except Exception as e:
    print(e)
    # RediSearchインデックスの作成
    print('Not there yet. Creating')
    redis_client.ft(INDEX_NAME).create_index(
        fields = fields,
        definition = IndexDefinition(prefix=[PREFIX], index_type=IndexType.HASH)
    )

Index already exists


### 消化・吸収

PDFを読み込んで、次のようにします。
- トークナイザーを起動する
- 処理パイプラインを実行する：
    - 各PDFからテキストを抽出する
    - 塊に分割して埋め込みます
    - Redisに保管する

In [10]:
# transformers.pyファイルには、データのチャンク、埋め込み、読み込みを含む、すべての変換関数が含まれています。
# 詳細については、このファイルを参照し、各関数を個別に操作してください。
from transformers import handle_file_string

In [11]:
%%time
# このステップにかかる時間は約5分です

# トークナイザーの初期化
tokenizer = tiktoken.get_encoding("cl100k_base")

# 各PDFファイルを処理し、埋め込みの準備をする。
for pdf_file in pdf_files:
    
    pdf_path = os.path.join(data_dir,pdf_file)
    print(pdf_path)
    
    # textractを使って各PDFから生のテキストを取り出す
    text = textract.process(pdf_path, method='pdfminer')
    
    # 各ドキュメントをチャンクし、コンテンツを埋め込み、Redisに読み込ませる。
    handle_file_string((pdf_file,text.decode("utf-8")),tokenizer,redis_client,VECTOR_FIELD_NAME,INDEX_NAME)

.\data\FIA Practice Directions - Competitor's Staff Registration System.pdf
.\data\fia_2022_formula_1_sporting_regulations_-_issue_9_-_2022-10-19_0.pdf
.\data\fia_2023_formula_1_technical_regulations_-_issue_4_-_2022-12-07.pdf
.\data\fia_f1_power_unit_financial_regulations_issue_1_-_2022-08-16.pdf
.\data\fia_formula_1_financial_regulations_iss.13.pdf
CPU times: total: 43.3 s
Wall time: 1min 3s


In [12]:
# 私たちのドキュメントが挿入されたことを確認する
redis_client.ft(INDEX_NAME).info()['num_docs']

'660'

## 商品化する

これで、検索が意図したとおりに動くかどうか、以下の方法でテストできます：
- Redisにあるデータをセマンティック検索で検索し、結果を確認する。
- GPT-3に結果を渡してまとめるステップの追加

In [13]:
from database import get_redis_results

In [14]:
%%time

f1_query='what are the criteria for disqualification'

result_df = get_redis_results(redis_client,f1_query,index_name=INDEX_NAME)
result_df.head(2)

CPU times: total: 0 ns
Wall time: 798 ms


Unnamed: 0,id,result,certainty
0,0,"The IT will, therefore, be competent to establish the existence, or not, of a breach of the FIA regulations and to impose any sanction upon the person and Competitor concerned (see the process governed by the FIA Judicial and Disciplinary Rules). The President of the FIA, in its capacity as prosecuting authority, will ask, in respect of every disciplinary procedure: - - for the imposition of a suspension upon Competitor’s Staff Certificate of Registration holders who have contravened the FIA Code of Good Standing or the withdrawal of the Competitor’s Staff Certificate of Registration (any withdrawal can only be imposed for the remaining period of the current season of the FIA Formula One World Championship) and that these same people not be fined. The person and/or Competitor sanctioned may bring an appeal before the ICA against the IT’s decision. ********* The FIA will inform the relevant Competitor of any proceedings instigated against any member of its staff. It is the responsibility to the relevant Competitor to send the IT a written request to be heard, and if granted, it shall be permitted to submit written observations. The FIA undertakes to support before the IT and/or the ICA any request from the Competitor to intervene as a third party within the framework of a disciplinary procedure. The right to deprive any duly registered member of a Competitor’s staff of access to the Reserved Areas at events forming part of the FIA Formula One World Championship is subject to the procedure set forth in the FIA Judicial and Disciplinary Rules. The Stewards during the course of an Event or otherwise will have no authority to suspend or withdraw a Competitor’s Staff Certificate of Registration for any breach or alleged breach of the FIA Code of Good Standing.",0.205652177334
1,1,"The following sets out examples of the type of behaviours which might constitute an infringement of the FIA Code of Good Standing (non-exhaustive list of examples) in relation to a person who is subject to the Code of Good Standing: - - - - giving instructions to a driver or other member of a Competitor’s staff with the intention or with the likely result of causing an accident, collision or crash or a race to be stopped or suspended any action which is likely to endanger or materially compromise the safety of any driver, other members of the Competitor’s staff, other participants in a race, Officials or any spectators or other members of the public who attend an event giving instructions to make any changes to a car in breach of any safety requirements or regulations giving instructions to tamper with or adversely affect the set-up or performance of the car of any other Competitor 4 / 5 FIA Legal Department Practice Directions - Competitor’s Staff Registration System 17 March 2011 - - giving instructions to a driver or otherwise taking any action by which the result or course of a race may be influenced or affected for the purpose of profiting or assisting someone to profit through betting on the outcome of a race or any part of a race or being convicted of a criminal offence (other than a driving offence) which carries a maximum prison sentence of five years. VII. AMENDMENTS TO THE COMPETITOR’S STAFF REGISTRATION SYSTEM The FIA will not make any amendments with regard to the Competitor’s Staff Registration System, either to the International Sporting Code or to the Practice Directions, prior consultation with the Competitors entered in the FIA Formula One World Championship and adequate opportunity to provide input on the proposed amendments.",0.206435859203


In [15]:
# 元のクエリと結果を提供し、ユーザーに要約を求めるプロンプトを作成します。
summary_prompt = '''この結果を箇条書きにして、顧客が送信した検索クエリに回答する。
検索クエリ: SEARCH_QUERY_HERE
検索結果: SEARCH_RESULT_HERE
要約:
'''
summary_prepped = summary_prompt.replace('SEARCH_QUERY_HERE',f1_query).replace('SEARCH_RESULT_HERE',result_df['result'][0])
summary = openai.Completion.create(engine=COMPLETIONS_MODEL,prompt=summary_prepped,max_tokens=500)
# GPT-3から提供されるレスポンス
print(summary['choices'][0]['text'])

- FIAは競技規則に違反したとき、参加者および顧客についての制裁を課す権限を持つ。
- FIAは、コードオブゴースタンディングまたは顧客のスタッフ証明書の登録抹消（現在のFIAフォーミュラワン世界選手権シーズン残存期間中にのみ実行できる）に関する、当該刑事手続き内でそれを要求する。
- 監督はイベントの一部とするFIAフォーミュラワン世界選手権内の予約済みエリアへのアクセスを奪う権利を持っている。
- 刑事手続き中に顧客が第三者としての参加を許可する場合、FIAはサポートを行って支持します。
- 監督はブレーキまたはコードオブゴースタンディングのいかなる違反または恐れのある違反についても、顧客のスタッフ証明書の登録抹消を決定する権限を持たない。

顧客の検索クエリに対する回答:
- 除


### 検索
さて、知識を埋め込み、Redisに保存したところで、内部検索アプリケーションを作成することができます。洗練されたものではありませんが、これで仕事は完了です。

このアプリがあるディレクトリで、``streamlit run search.py`` を実行します。これでブラウザにStreamlitアプリが表示され、埋め込みデータに対して質問をすることができます。

__質問例__:
- 2023年のパワーユニットのコスト上限は？
- 競争者がアプリケーションに記載すべきこと

## モートを作る

Q&Aは便利ですが、ユーザーが最適でない質問をした場合、できる対話の複雑さはかなり制限されます、 このような場合、システムからの支援はなく、より詳しい情報を求めたり、正しい方向に導くための会話をしたりすることはできません。

次のステップでは、Chat Completionsというエンドポイントを使ってChatbotを作ってみます：
- どのように行動すべきか、ユーザーの目標は何かという指示を与える
- 集めるべき必要な情報が与えられる。
- その情報が入力されるまで、顧客と何度もやり取りをする。
- セマンティック検索と応答の要約を呼び起こすトリガーワードを言う

Chat Completionsエンドポイントの詳細と対話方法については、ドキュメント[こちら](https://platform.openai.com/docs/guides/chat)を参照してください。

### フレームワーク

このセクションでは、APIを使用して、以前の会話における "ターン "のコンテキストを保存するための基本的なフレームワークの概要を説明します。これが確立されたら、私たちの検索エンドポイントを使用するように拡張します。

In [16]:
# AChatCompletionエンドポイントと対話する基本的な例です
# "role" （システム、ユーザー、アシスタントのいずれか）と "content" からなる "message" のリストが必要です。

question = 'どのように私を助けてくれますか？'


completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "user", "content": question}
  ]
)
print(f"{completion['choices'][0]['message']['role']}: {completion['choices'][0]['message']['content']}")

assistant: 私は、あなたの質問に答えたり、情報を提供したり、タスクを完了したり、アドバイスをしたり、リソースを紹介したりすることで、あなたをサポートすることができます。また、あなたに必要な情報に応じて、専門家や専門家の意見を提供することもできます。


In [17]:
from termcolor import colored

# チャット用の辞書としてメッセージを作成するための基本クラスです。
class Message:
    
    
    def __init__(self,role,content):
        
        self.role = role
        self.content = content
        
    def message(self):
        
        return {"role": self.role,"content": self.content}
        
# ボットと会話するためのアシスタントクラスです。
class Assistant:
    
    def __init__(self):
        self.conversation_history = []

    @staticmethod
    def _get_assistant_response(prompt):
        
        try:
            completion = openai.ChatCompletion.create(
              model="gpt-3.5-turbo",
              messages=prompt
            )
            
            response_message = Message(completion['choices'][0]['message']['role'],completion['choices'][0]['message']['content'])
            return response_message.message()
            
        except Exception as e:
            
            return f'Request failed with exception {e}'

    def ask_assistant(self, next_user_prompt, colorize_assistant_replies=True):
        [self.conversation_history.append(x) for x in next_user_prompt]
        assistant_response = self._get_assistant_response(self.conversation_history)
        self.conversation_history.append(assistant_response)
        return assistant_response
            
        
    def pretty_print_conversation_history(self, colorize_assistant_replies=True):
        for entry in self.conversation_history:
            if entry['role'] == 'system':
                pass
            else:
                prefix = entry['role']
                content = entry['content']
                output = colored(prefix +':\n' + content, 'green') if colorize_assistant_replies and entry['role'] == 'assistant' else prefix +':\n' + content
                print(output)

In [24]:
# アシスタントクラスを開始する
conversation = Assistant()

# メッセージを格納するリストを作成し、動作を指示するシステムメッセージと、最初のユーザーの質問の両方を挿入します。
messages = []
system_message = Message('system',' あなたは革新的なアイデアを持つ、役に立つビジネスアシスタントです')
user_message = Message('user',' あなたにできることは何ですか ')
messages.append(system_message.message())
messages.append(user_message.message())
messages

[{'role': 'system', 'content': ' あなたは革新的なアイデアを持つ、役に立つビジネスアシスタントです'},
 {'role': 'user', 'content': ' あなたにできることは何ですか '}]

# こちらの質問に対してチャットボットから回答を返す

In [27]:
response_message = conversation.ask_assistant(messages)
print(response_message['content'])

以下のようなことができます:

1. スケジュール管理: スケジュール作成、予定調整、リマインダーの設定など、スケジュール全般の管理を行います。

2. データ入力や資料作成: ワードやエクセルなどのソフトを使って、文書作成や表の作成、データの入力、整理、集計、フォーマット設定、振り分けなどをお手伝いします。

3. 電子メール管理: メールの整理、フィルタリング、役に立つ情報の抽出や返答の自動化、スパムメールのフィルタリングなど。

4. 顧客との連絡、予約調整: 顧客との連絡や調整を行い、スムーズな会議や予約の確保などに役立ちます。

5. 研究と市場調査: 情報収集や市場調査を手伝います。業界の最新情報や動向、競合情報などを調べ、社内でのビジネス分析に活用します。

6. 社内外のコミュニケーション: スケジュール調整や会議の設定、社員や顧客とのコミュニケーションを円滑に行い、ビジネスの効率化に貢献します。

以上の業務を自動化するためのソリューションも提供することができます。


In [28]:
next_question = '選択肢2について詳しく教えてください'

# 新しいメッセージリストを作成し、次の質問を挿入します。
messages = []
user_message = Message('user',next_question)
messages.append(user_message.message())
response_message = conversation.ask_assistant(messages)
print(response_message['content'])

データ入力や資料作成に関して、以下のようなサポートを提供することができます。

1. 文書作成: ワードなどのソフトを使い、報告書、プレゼンテーション、クライアント向けプロポーザル、契約書などの文書作成支援を行います。必要な情報をリサーチし、具体的かつ分かりやすい文章を作成することで、ビジネスの効率化を図ります。

2. 表やチャートの作成: エクセルなどのソフトを使い、金額や数量などのデータを元に、表やグラフの作成を支援します。資料を見やすくすることで、効率的な意思決定を支援します。

3. データ入力や整理: 取引先や商品などのデータを入力し、整理します。また、データ加工ソフトを使い、集計や分析に必要なフォーマットなどの設定も対応いたします。これにより、重要なデータをタイムリーかつ正確に扱うことができます。

4. 社内共有資料の作成: 社内で共有する資料の作成を支援します。社員が情報を共有しながら業務を進めることで、ビジネスの生産性を高めます。

これらの業務を効率的かつ正確に行うことができるため、貴社のビジネスプロセスを改善し、ビジネスの効率性を向上させることができます。


# 今までの会話のログをプリントアウトする

In [29]:
conversation.pretty_print_conversation_history()

user:
 あなたにできることは何ですか 
[32massistant:
以下のようなことができます:

1. スケジュールや予定管理: スケジュールや予定の調整、スケジュールの確認、 相手との自動振り返りの設定など、スケジュールの管理を手伝います。

2. データ入力や資料作成: 帳票や表の作成,スプレッドシートファイルの作成,データの入力、整理、集計、フォーマット設定、振り分けなどをお手伝いします。

3. 電子メール管理: メールの整理、フィルタリング、役に立つ情報の抽出や返答の自動化、スパムメールのフィルタリングなど。

4. 顧客との連絡、予約調整: 顧客との連絡や調整を行い、スムーズな会議や予約の確保などに役立ちます。

5. 研究と市場調査: 情報収集や市場調査を手伝います。業界の最新情報や動向、競合情報などを調べ、社内でのビジネス分析に活用します。

6. 社内外のコミュニケーション: スケジュール調整や会議の設定、社員や顧客とのコミュニケーションを円滑に行い、ビジネスの効率化に貢献します。

これらの業務を自動化するためのソリューションも提供することができます。[0m
user:
 あなたにできることは何ですか 
[32massistant:
以下のようなことができます:

1. スケジュール管理: スケジュール作成、予定調整、リマインダーの設定など、スケジュール全般の管理を行います。

2. データ入力や資料作成: ワードやエクセルなどのソフトを使って、文書作成や表の作成、データの入力、整理、集計、フォーマット設定、振り分けなどをお手伝いします。

3. 電子メール管理: メールの整理、フィルタリング、役に立つ情報の抽出や返答の自動化、スパムメールのフィルタリングなど。

4. 顧客との連絡、予約調整: 顧客との連絡や調整を行い、スムーズな会議や予約の確保などに役立ちます。

5. 研究と市場調査: 情報収集や市場調査を手伝います。業界の最新情報や動向、競合情報などを調べ、社内でのビジネス分析に活用します。

6. 社内外のコミュニケーション: スケジュール調整や会議の設定、社員や顧客とのコミュニケーションを円滑に行い、ビジネスの効率化に貢献します。

以上の業務を自動化するためのソリューションも提供することができます。[0m
user

### 知識検索

ここで、チャットボットからストップシーケンスが話されたときに、下流のサービスを呼び出すようにクラスを拡張します。

主な変更点は以下の通りです：
- システムメッセージはより包括的で、チャットボットが会話を進めるための基準を示しています。
- 必要な情報を得たときに使用する明示的なストップシーケンスを追加する
- Redisの検索結果を取得する関数 ``_get_search_results`` でクラスを拡張する。

In [30]:
# ユーザーから質問と年を抽出するシステムプロンプトを更新しました。
system_prompt = '''
あなたは、役に立つフォーミュラ 1 の知識ベースのアシスタントです。各顧客から「質問」と「年」を取得する必要があります。
質問はフォーミュラ1に関する質問で、「年」は該当するフォーミュラ1のシーズンの年です。
年を提供していない場合は、再度、年を尋ねてください。
年がわかったら、「答えを探しています」と言います。

例1:

ユーザー：パワーユニットのコスト上限を知りたい

アシスタント：かしこまりました。何年のものをご希望ですか？

ユーザー：2023年でお願いします。

アシスタント：答えを探しています。
'''

# ベクターデータベースの呼び出しをレスポンスに追加する新しいアシスタントクラス
class RetrievalAssistant:
    
    def __init__(self):
        self.conversation_history = []  

    def _get_assistant_response(self, prompt):
        
        try:
            completion = openai.ChatCompletion.create(
              model=CHAT_MODEL,
              messages=prompt,
              temperature=0.1
            )
            
            response_message = Message(completion['choices'][0]['message']['role'],completion['choices'][0]['message']['content'])
            return response_message.message()
            
        except Exception as e:
            
            return f'Request failed with exception {e}'
    
    # Redisの検索結果を取得する関数
    @staticmethod
    def _get_search_results(prompt):
        latest_question = prompt
        search_content = get_redis_results(redis_client,latest_question,INDEX_NAME)['result'][0]
        return search_content
        

    def ask_assistant(self, next_user_prompt):
        [self.conversation_history.append(x) for x in next_user_prompt]
        assistant_response = self._get_assistant_response(self.conversation_history)
        
        # トリガーシーケンスの "searching_for_answers "を使用しない限り、正常に回答する。
        if 'searching for answers' in assistant_response['content'].lower():
            question_extract = openai.Completion.create(model=COMPLETIONS_MODEL,prompt=f"この会話からユーザーの最新の質問とその質問の年を抽出する： {self.conversation_history}. 質問と年を記載した文章として抽出する。")
            search_result = self._get_search_results(question_extract['choices'][0]['text'])
            
            # チャットボットがRedisの結果をどのように使うか、最新のコンテキストを提供するために、ここで追加のシステムプロンプトを挿入します。
            # この例では会話履歴に追加していますが、実際の製品では非表示にした方が良い場合もあります。
            self.conversation_history.insert(-1,{"role": 'system',"content": f"このコンテンツを使ってユーザーの質問に答える: {search_result}. 質問に答えられない場合は、「すみません、この答えはわかりません」と言ってください"})
            #[self.conversation_history.append(x) for x in next_user_prompt]
            
            assistant_response = self._get_assistant_response(self.conversation_history)
            print(next_user_prompt)
            print(assistant_response)
            self.conversation_history.append(assistant_response)
            return assistant_response
        else:
            self.conversation_history.append(assistant_response)
            return assistant_response
            
        
    def pretty_print_conversation_history(self, colorize_assistant_replies=True):
        for entry in self.conversation_history:
            if entry['role'] == 'system':
                pass
            else:
                prefix = entry['role']
                content = entry['content']
                output = colored(prefix +':\n' + content, 'green') if colorize_assistant_replies and entry['role'] == 'assistant' else prefix +':\n' + content
                #prefix = entry['role']
                print(output)

In [31]:
conversation = RetrievalAssistant()
messages = []
system_message = Message('system',system_prompt)
user_message = Message('user','競技者の失格はどのようにして決まるのか')
messages.append(system_message.message())
messages.append(user_message.message())
response_message = conversation.ask_assistant(messages)
response_message

{'role': 'assistant',
 'content': '競技者の失格は、レース中に行われた違反行為によって決定されます。フォーミュラ1では、レース中に行われた違反行為に対して、レースディレクターが調査を行い、違反が確認された場合は、競技者に対してペナルティを科します。ペナルティには、タイムペナルティ、グリッド降格、失格などがあります。また、競技者がレース中に行った違反行為が特に重大な場合は、レース後に審議が行われ、失格処分が科されることもあります。'}

In [32]:
messages = []
user_message = Message('user', '2023 年のものをお願いします')
messages.append(user_message.message())
response_message = conversation.ask_assistant(messages)
print(response_message)

{'role': 'assistant', 'content': '2023年のフォーミュラ1シーズンにおいて、パワーユニットのコスト上限はまだ発表されていません。フォーミュラ1は、2023年から新しいエンジン規定を導入する予定であり、現在、その詳細がまだ発表されていません。エンジン規定が発表され次第、パワーユニットのコスト上限に関する情報も明らかになるでしょう。'}


In [33]:
conversation.pretty_print_conversation_history()

user:
競技者の失格はどのようにして決まるのか
[32massistant:
競技者の失格は、レース中に行われた違反行為によって決定されます。フォーミュラ1では、レース中に行われた違反行為に対して、レースディレクターが調査を行い、違反が確認された場合は、競技者に対してペナルティを科します。ペナルティには、タイムペナルティ、グリッド降格、失格などがあります。また、競技者がレース中に行った違反行為が特に重大な場合は、レース後に審議が行われ、失格処分が科されることもあります。[0m
user:
2023 年のものをお願いします
[32massistant:
2023年のフォーミュラ1シーズンにおいて、パワーユニットのコスト上限はまだ発表されていません。フォーミュラ1は、2023年から新しいエンジン規定を導入する予定であり、現在、その詳細がまだ発表されていません。エンジン規定が発表され次第、パワーユニットのコスト上限に関する情報も明らかになるでしょう。[0m


### チャットボット

では、実際に（基本的な）チャットボットを使って、これらのことを実践してみましょう。

このアプリがあるディレクトリで、``streamlit run chat.py`` を実行します。すると、ブラウザ上でStreamlitアプリが開き、埋め込みデータに対して質問することができます。

__質問の例__:
- 2023年、パワーユニットのコスト上限は？
- 競争者がアプリケーションに記載すべきことは何か
- 競技者が失格になるのはなぜか。

### まとめ

このノートブックであなたは:
- 知識ベースを埋め込むことで、製品の土台を作る。
- 基本的なユースケースに対応したQ&Aアプリケーションの作成
- これを拡張して対話型チャットボットにする

これらは、APIを使用したQ&Aやチャットアプリケーションの基本的な構成要素です。これらは、あなたの出発点であり、あなたがこれらを使って何を作るかを楽しみにしています！