# Chat API

# 準備

In [1]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
from openai import OpenAI

# 環境変数の取得
load_dotenv()
# OpenAI APIクライアントを生成
client = OpenAI(api_key=os.environ['API_KEY'])

# モデル名
model_name = "gpt-3.5-turbo-1106"

# 基本のAPIリクエスト

In [2]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ]
)

response

ChatCompletion(id='chatcmpl-9Gk4R9bxtuRVJ78Z6Yn8xFmXBcKIG', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='、\n\n1. データの質：言語モデルのトレーニングに使用するデータの質は重要です。正確で幅広い情報を含むデータセットを使用することで、言語モデルの性能を向上させることができます。\n\n2. トレーニングの方法：言語モデルをトレーニングする際には、適切なアルゴリズムやハイパーパラメータを選択する必要があります。さまざまなトレーニング方法を試し、最適なモデルを見つけることが重要です。\n\n3. 文脈の理解：言語モデルは文脈を理解する能力が求められるため、言葉の使い方や意味の推定において文脈を適切に捉えることが重要です。\n\n4. 評価と改善：トレーニング後には言語モデルの性能を評価し、改善点を特定する必要があります。定期的な評価と改善作業を行うことで、モデルの性能を向上させることができます。', role='assistant', function_call=None, tool_calls=None))], created=1713777371, model='gpt-3.5-turbo-1106', object='chat.completion', system_fingerprint='fp_77a673219d', usage=CompletionUsage(completion_tokens=356, prompt_tokens=24, total_tokens=380))

In [3]:
# 言語モデルからの回答を表示
print(response.choices[0].message.content.strip())

、

1. データの質：言語モデルのトレーニングに使用するデータの質は重要です。正確で幅広い情報を含むデータセットを使用することで、言語モデルの性能を向上させることができます。

2. トレーニングの方法：言語モデルをトレーニングする際には、適切なアルゴリズムやハイパーパラメータを選択する必要があります。さまざまなトレーニング方法を試し、最適なモデルを見つけることが重要です。

3. 文脈の理解：言語モデルは文脈を理解する能力が求められるため、言葉の使い方や意味の推定において文脈を適切に捉えることが重要です。

4. 評価と改善：トレーニング後には言語モデルの性能を評価し、改善点を特定する必要があります。定期的な評価と改善作業を行うことで、モデルの性能を向上させることができます。


# 役割や前提の設定、パラメーター：n、max_tokens

In [4]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなんかがええやん！お腹いっぱいになって、元気が出るで！
--------------------
おすすめの昼食は、たこ焼きやお好み焼きなんやで。大阪に来たらぜひ食べてみてや。特にどちらもおいしいお店がたくさんあるから、選ぶのが楽しいでええで。
--------------------
昼飯なら、たこ焼きやお好み焼きがいいやん。大阪やし、美味しいお店がたくさんあるで。それと、串カツもオススメやで。街中で気軽に食べれるし、ボリュームもあって満足すること間違いなし


# パラメーター：temperature, top_p

### temperature=1.4の場合

In [5]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    temperature=1.4
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめは「たこ焼きやお好み焼き」やで。関西人の私が思うに、「たこ焼き」や「お好み焼き」は大阪らしい昼食やと思うで。ちょっとした醤油やソースをかけて味わうと、美味しいで。特にお店
--------------------
おすすめの昼食は、やっぱりお好み焼きやたこ焼きやねん！もしくは、うどんやそばもええで！関西食の味わいを楽しめるお店に行ってみてや！
--------------------
おすすめの昼食は、やっぱりたこ焼きやお好み焼きがオススメやで！

関西ならではのソウルフードやから、ぜひ食べてみてや～。それに、おいしいといったら食べて満足すること間違いなしやで。


### temperature=0.0の場合

In [6]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    temperature=0.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。お好み焼きは、お好みの具材を入れて焼いたもので、大阪ではたくさんのお店で
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。お好み焼きは、お好みの具材を入れて焼いたもので、大阪ではたくさんのお店で
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。お好み焼きは、お好みの具材を入れて焼いたもので、大阪ではたくさんのお店で


### top_p=0.4の場合

In [7]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    top_p=0.4
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、もんじゃ焼きなんかはどうやろか？関西らしいもんを食べてみてはどうやろか？
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、もんじゃ焼きなんかはどうやろか？お好み焼き屋さんやたこ焼き屋さんで美味しいもんを食べてみてはどうやろか？
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、もんじゃ焼きなんかはどうやろか？関西のソウルフードやし、美味しいで。それとも、うどんやそばもええで。どれも美味しい食べ物ばっかりやから、迷うで


### top_p=0.0の場合

In [8]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    top_p=0.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。焼きそばや豚肉、キャベツなどを生地で混ぜて焼いたもので、ソ
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。焼きそばや豚肉、キャベツなどを生地で混ぜて焼いたもので、ソ
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、ラーメンなどの大阪の名物料理です。特に、お好み焼きはおすすめですよ。焼きそばや豚肉、キャベツなどを生地で混ぜて焼いたもので、ソ


# パラメーター：presence_penalty、frequency_penalty

In [11]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    presence_penalty=-2.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
以下のポイントが言語モデルを使う上で重要です。

1. データの質と量：言語モデルの性能は、訓練データの質と量に大きく依存します。訓練データが豊富で、様々な言語やジャンルがカバ
--------------------
、正確なデータセットを用いること、適切な文脈を考慮すること、モデルのハイパーパラメータを適切に調整すること、過学習を避けること、文脈を理解した正確な予測をすることなどが
--------------------
以下の通りです：

1. データの品質を確保すること：言語モデルを構築するためのデータは品質の高いものでなければなりません。品質の低いデータを使用するとモデルの性能が低下する可能性があります。そのため、


In [10]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    presence_penalty=2.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
、以下の通りです。

1. データの質と量：言語モデルを構築する上で、豊富な品質の高いデータが必要です。大規模かつ多様なデータセットを使用することで、より優れた言語モデルを構築するこ
--------------------
、以下の点に注意することが重要です。

1. データの品質: 言語モデルを構築するためのデータは品質が重要です。文法や意味の正確性、多様性、コーパスサイズなどがポイントになります。

2. モデルの
--------------------
、以下のようなポイントが考えられます。

1. データセットの品質：言語モデルを構築するためには大規模で高品質なデータセットが必要です。文法的に正確な文章や自然な表現が含まれるデータセットを利用することが


# トークナイザー：tiktoken

In [16]:
import tiktoken
from tiktoken.core import Encoding

# OpenAI APIの特定のモデルに対応するトークナイザーを取得
encoding: Encoding = tiktoken.encoding_for_model(model_name)

In [13]:
# テキストをトークンIDのリストに変換
tokens = encoding.encode("こんにちは！言語モデル")
tokens_count = len(tokens)
# トークンの長さとトークンを表示
print(f"{tokens_count=}")
print(f"{tokens=}")

tokens_count=9
tokens=[90115, 6447, 78244, 45918, 252, 2845, 95, 68408, 33710]


In [17]:
# トークンの単位を確認
for token in tokens:
    # トークンをバイト列にデコード
    bytes = encoding.decode_tokens_bytes([token])[0]
    # 文字に変換できるものは変換して表示
    try:
        print(bytes.decode('utf-8'), end=", ")
    except UnicodeDecodeError:
        print(bytes, end=", ")

こんにちは, ！, 言, b'\xe8\xaa', b'\x9e', b'\xe3\x83', b'\xa2', デ, ル, 

# パラメーター：logit_bias

In [18]:
# メッセージの設定
message = """
AさんとBさんで会話してください。
A:おはよう！
B:
"""

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    max_tokens=300,
    n=3,
    logit_bias = {90115:8, 6447:8}
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
こんにちは！元気？
--------------------
こんにちは！元気？
--------------------
こんにちは！元気？


## パラメーター：stop

In [19]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    stop="たこ焼き"
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice.message.content.strip())

--------------------
おすすめの昼食は、
--------------------
まずは、「てっぱん焼きそば」がおすすめやで！関西のソウルフードやから、ぜひ食べてみてや。それとも、「
--------------------
昼食のおすすめはやっぱりお好み焼きや


## パラメーター：stream

In [20]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
stream = client.chat.completions.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    stream=True,
)

for chunk in stream:
    if chunk.choices:
        if chunk.choices[0].delta.content is not None:
            print(chunk.choices[0].delta.content, end="")

、さまざまなポイントが挙げられますが、その中でも重要なポイントは以下の通りです。

1. テキストデータの品質: 言語モデルを訓練するためのテキストデータの品質が重要です。品質の高いデータを使用することで、モデルの性能が向上し、より正確な予測が可能となります。

2. モデルの選択: どの種類の言語モデルを使用するかを選択する必要があります。例えば、双方向のリカレントニューラルネットワーク（RNN）やトランスフォーマーなどのモデルがあります。

3. ハイパーパラメータの調整: 言語モデルのハイパーパラメータ（学習率、バッチサイズ、エポック数など）の調整が重要です。これにより、モデルの性能を最適化することができます。

4. モデルの評価: 言語モデルの性能を評価し、不正確な予測を修正するためのフィードバックメカニズムを確立する必要があります。

5. テストデータの使用: 言語モデルのテストデータを使用して、モデルの汎用性や性能を確認することが重要です。

これらのポイントを考慮することで、言語モデルを効果的に活用することができます。

## 会話を続ける

In [19]:
# メッセージを格納するリスト
messages=[]

while(True):
    # ユーザーからの質問を受付
    message = input("メッセージを入力:")
    # 質問が入力されなければ終了
    if message.strip()=="":
        break
    display(f"質問:{message}")

    # メッセージにユーザーからの質問を追加
    messages.append({"role": "user", "content": message.strip()})
    # やりとりが8を超えたら古いメッセージから削除
    if len(messages) > 8:
        del_message = messages.pop(0)

    # APIへリクエスト
    stream = client.chat.completions.create(
        model=model_name,
        messages=messages,
        stream=True,
    )

    # 言語モデルからの回答を表示
    response_message = ""
    for chunk in stream:
        if chunk.choices:
            next = chunk.choices[0].delta.content
            if next is not None:
                response_message += next
                print(next, end='')

    # メッセージに言語モデルからの回答を追加
    messages.append({"role": "assistant", "content": response_message})

print("\n---ご利用ありがとうございました！---")

'質問:こんにちは！'

こんにちは！ごきげんよう！お困りごとがありましたら、何でもお手伝いいたしますのでお知らせくださいね。

'質問:おすすめのランチを教えて'

もちろんです！ランチといえば、沢山の美味しい選択肢がありますね。具体的な場所や料理の好みによっても異なりますが、以下のような選択肢がオススメです：

1. 寿司：新鮮なネタを楽しむなら、お寿司がおすすめです。握り寿司や巻き寿司、ちらし寿司など様々なスタイルが楽しめます。

2. ラーメン：濃厚なスープとコシのある麺が魅力のラーメンは、多くの人に愛される人気のランチメニューです。

3. カレーライス：ホクホクのルーに盛りだくさんの野菜と、お肉や魚が乗ったカレーライスは、ボリュームたっぷりで満足感が得られます。

4. サラダ・スープ：軽めの食事を希望する方には、新鮮な野菜がたっぷり楽しめるサラダや、温かいスープがおすすめです。

どれも美味しい選択肢ですが、好みや場所によって選択が異なると思います。お近くのお店で、ぜひご自分の好みに合った美味しいランチをお楽しみください！
---ご利用ありがとうございました！---
