# Chat API

# 準備

In [2]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
import openai

# 環境変数の読み込み
load_dotenv()
openai.api_key = os.environ['API_KEY']
model_name = "gpt-3.5-turbo"

# 基本のAPIリクエスト

In [11]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ]
)

response

<OpenAIObject chat.completion id=chatcmpl-7WBswt8eRIIKMAlutTPZoa685088R at 0x22cd8ec1c70> JSON: {
  "id": "chatcmpl-7WBswt8eRIIKMAlutTPZoa685088R",
  "object": "chat.completion",
  "created": 1687906538,
  "model": "gpt-3.5-turbo-0301",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "\u4ee5\u4e0b\u306e\u901a\u308a\u3067\u3059\u3002\n\n1. \u5927\u91cf\u306e\u30c7\u30fc\u30bf\u304c\u5fc5\u8981\uff1a\u8a00\u8a9e\u30e2\u30c7\u30eb\u306f\u5927\u91cf\u306e\u30c6\u30ad\u30b9\u30c8\u30c7\u30fc\u30bf\u3092\u5b66\u7fd2\u3059\u308b\u305f\u3081\u3001\u305d\u306e\u305f\u3081\u306e\u30c7\u30fc\u30bf\u304c\u5fc5\u8981\u3067\u3059\u3002\n\n2. \u30e2\u30c7\u30eb\u306e\u7cbe\u5ea6\u306b\u95a2\u3059\u308b\u30c8\u30ec\u30fc\u30c9\u30aa\u30d5\uff1a\u8a00\u8a9e\u30e2\u30c7\u30eb\u306f\u3001\u3088\u308a\u6b63\u78ba\u306a\u4e88\u6e2c\u3092\u884c\u3046\u305f\u3081\u306b\u6c42\u3081\u3089\u308c\u308b\u8a08\u7b97\u91cf\u304c\u5897\u52a0\u3059\u308b\u305f

In [12]:
# 言語モデルからの回答を表示
print(response.choices[0]["message"]["content"].strip())

以下の通りです。

1. 大量のデータが必要：言語モデルは大量のテキストデータを学習するため、そのためのデータが必要です。

2. モデルの精度に関するトレードオフ：言語モデルは、より正確な予測を行うために求められる計算量が増加するため、精度と速度のトレードオフを考慮する必要があります。

3. 言語特性の考慮：言語モデルはその言語の特性に合わせて設計する必要があります。たとえば、アジアの言語では文章の形式が異なり、言葉の表現に独自の特徴があるため、それらを特別な扱いをする必要があります。

4. モデルの対象とする目的に応じた用途：言語モデルの利用目的に応じた分野ごとのモデルを選択することで、精度を高めることができます。たとえば、医療分野では専門用語が頻繁に使われることが多く、それを含むようにモデルを調整する必要があるかもしれません。

5. モデルの評価や改善に対する追跡：言語モデルによる精度改善のために、適切な指標を選択してモデルの評価や改善の追跡を行うことが必要です。一般的な指標は、言語モデルのパフォーマンスを評価するための開発用データセットの検証であり、そのためには、予測結果と正解を比較する必要があります。


# 役割や前提の設定、パラメーター：n、max_tokens

In [13]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おおきに！昼食にはたこ焼き、お好み焼き、串カツなどの関西名物がおすすめです。ご飯ものであれば、カツ丼や天丼、うどん、そばも美味しいですよ。もちろん、たくさんの美味しいお店があるので、お
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、焼きそば、うどんやそば、おにぎりなどの軽食から、お寿司や天ぷら、牛丼などの定食まで様々です。特に、大阪のソウルフードであるたこ
--------------------
お昼ご飯ですかぁ〜。せやなぁ〜。私がおすすめするのは、大阪王将の餃子定食やで！餃子がとっても美味しいでぇー！他にも、たこ焼きやお好み焼きもオススメや！大阪に来たら、ぜひ


# パラメーター：temperature, top_p

### temperature=1.4の場合

In [8]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    temperature=1.4
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おおきに！昼食おすすめはなにもんがある！

一番クラシックなランチョンセットでもアリよ。たとえば、とんかつ定食やカレー、焼き肉定食などはどうですか？店によってセットの内容が違うと思うけど、全部が大盛のオプシ
--------------------
おおきに！私がおすすめする昼食は、たこ焼きやたい焼き、明石焼き、お好み焼き、串カツ、焼きそば、うどん、天ぷらなど、関西で人気のあるお好みのメニューです！せっかく関西に来たのですから、ぜ
--------------------
やっぱり、大阪といえばたこ焼きやお好み焼きなどがとても有名ですね。でもお昼には少し重たいかもしれませんね。

そこで、あまり重たくないけど大阪らしいお昼ごはんというと、たとえば「串カツ」がお


### temperature=0.0の場合

In [9]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    temperature=0.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色


### top_p=0.4の場合

In [16]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    top_p=0.4
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、焼きそばなどの大阪名物の屋台料理がおすすめです。また、カツカレーやうどん、そばなどの定番の日本食も美味しいですよ。どこかおすすめのお店があれば、
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。どれも美味しいので、お好みに合わせて選んでみてください。また、大
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、焼きそばなどの大阪名物の屋台料理がおすすめです。また、カツカレーやうどん、そばなどの定番の日本食も美味しいですよ。大阪にはたくさんの飲食店があり


### top_p=0.0の場合

In [21]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    top_p=0.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色
--------------------
おすすめの昼食は、たこ焼きやお好み焼き、うどん、そば、カツ丼、天丼、焼きそば、焼き鳥、おにぎり、お弁当などがあります。大阪には美味しい食べ物がたくさんあるので、ぜひ色


# パラメーター：presence_penalty、frequency_penalty

In [17]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    presence_penalty=-2.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
以下のようなポイントがあります。

1. データの品質：言語モデルの品質は、モデルが学習するデータの品質に大きく依存します。品質の高い大規模なデータセットを使用することが重要です。

2. ハイパーパラメータ
--------------------
以下の通りです。

1. データの質を確保すること: 言語モデルの性能は、トレーニングに使われるデータの質に大きく依存します。データの収集やラベリングには注意を払い、精度の高いデータを集めることが重
--------------------
次のとおりです。

1.トレーニングデータの品質向上：トレーニングデータの品質が言語モデルの性能に直接関係しており、品質が向上すると、モデルの性能も向上します。

2.データの前処理：言語モデルに必要な


In [18]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    presence_penalty=2.0
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
以下のようなポイントがあります。

1. データセットの選択と前処理

言語モデルを構築するためには、十分な量の適切に整形されたテキストデータが必要です。このため、まずはデータセットの選択と前処理が重
--------------------
以下の通りです。

1.データセットの品質を確認する：言語モデルは、学習に使用されたデータセットに基づいてテキストを生成します。したがって、良質なデータセットが必要であり、入力テキストが文法的に正しく、意味があるこ
--------------------
以下の通りです：

1. データセットをよく理解すること：言語モデルは、訓練に使用する大量のテキストデータが非常に重要です。したがって、データセットを選択し、分析してからモデルをトレーニングする必要があります。

2. サイズ


# トークナイザー：tiktoken

In [3]:
import tiktoken
from tiktoken.core import Encoding

# OpenAI APIの特定のモデルに対応するトークナイザーを取得
encoding: Encoding = tiktoken.encoding_for_model(model_name)

In [5]:
# テキストをトークンIDのリストに変換
tokens = encoding.encode("こんにちは！言語モデル")
tokens_count = len(tokens)
# トークンの長さとトークンを表示
print(f"{tokens_count=}")
print(f"{tokens=}")

tokens_count=9
tokens=[90115, 6447, 78244, 45918, 252, 2845, 95, 68408, 33710]


In [6]:
# トークンの単位を確認
for token in tokens:
    # トークンをバイト列にデコード
    bytes = encoding.decode_tokens_bytes([token])[0]
    # 文字に変換できるものは変換して表示
    try:
        print(bytes.decode('utf-8'), end=", ")
    except UnicodeDecodeError:
        print(bytes, end=", ")

こんにちは, ！, 言, b'\xe8\xaa', b'\x9e', b'\xe3\x83', b'\xa2', デ, ル, 

# パラメーター：logit_bias

In [12]:
# メッセージの設定
message = """
AさんとBさんで会話してください。
A:おはよう！
B:
"""

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    max_tokens=300,
    n=3,
    logit_bias = {90115:8, 6447:8}
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おはよう！こんにちは！元気そうだね！最近何か面白いことがあった？
--------------------
おはよう！元気そうだね！最近どうしてたの？
--------------------
こんにちは！こんにちは！お元気ですか？


## パラメーター：stop

In [22]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": message},
    ],
    n=3,
    max_tokens=100,
    stop="たこ焼き"
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["message"]["content"].strip())

--------------------
おっしゃる通りやで！昼食のおすすめは、
--------------------
おすすめの昼食といえば、
--------------------
お昼ご飯におすすめなのは、「


## パラメーター：stream

In [14]:
# メッセージの設定
message = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[
        {"role": "user", "content": message},
    ],
    stream=True,
)

for chunk in response:
    next = chunk['choices'][0]['delta'].get('content', '')
    print(next, end='')

いくつかのポイントがあります。以下にいくつかのポイントを挙げます。

1. データセットの選択: 言語モデルを訓練するためには大量のテキストデータが必要です。より多様なテキストデータを用いることで、より一般的な言語モデルを構築することができます。

2. モデルのアーキテクチャ: 言語モデルのアーキテクチャは、RNN（再帰型ニューラルネットワーク）、Transformerなどのいくつかの選択肢があります。特定のタスクや要件に応じて、最適なモデルを選択する必要があります。

3. ハイパーパラメータのチューニング: 学習率、バッチサイズ、隠れ層の数などのハイパーパラメータは、言語モデルのパフォーマンスに重要な影響を与えます。適切なハイパーパラメータを選択するために、モデルを評価し、チューニングする必要があります。

4. トレーニングと評価: モデルをトレーニングするときには、トレーニングデータセットを使用してモデルを学習させます。一般的に、データセットをトレーニング用と検証用に分け、モデルのパフォーマンスを評価します。トレーニング中に過学習にならないように注意する必要があります。

5. 転移学習とファインチューニング: 予め他の大規模なデータセットでトレーニングされた言語モデルを使用することで、より効率的にモデルをトレーニングできます。その後、ターゲットタスクに関連するデータセットでさらにトレーニングを行うことで、モデルを特定のタスクに適応させることができます。

6. データの前処理: テキストデータをモデルに入力する前に、適切な前処理が必要です。これには、トークン化、単語の埋め込み表現、パディングなどが含まれます。適切な前処理を行うことで、モデルのパフォーマンスを向上させることができます。

7. モデルの評価とチューニング: 言語モデルのパフォーマンスを評価するために、適切な評価指標（例：パープレキシティ、BLEUスコアなど）を選択し、モデルを評価する必要があります。また、必要に応じてモデルをチューニングするための反復的なプロセスを行うことも重要です。

## 会話を続ける

In [17]:
# メッセージを格納するリスト
messages=[]

while(True):
    # ユーザーからの質問を受付
    message = input("メッセージを入力:")
    # 質問が入力されなければ終了
    if message.strip()=="":
        break
    display(f"質問:{message}")

    # メッセージにユーザーからの質問を追加
    messages.append({"role": "user", "content": message.strip()})
    # やりとりが8を超えたら古いメッセージから削除
    if len(messages) > 8:
        del_message = messages.pop(0)

    # APIへリクエスト
    response = openai.ChatCompletion.create(
        model=model_name,
        messages=messages,
        stream=True,
    )

    # 言語モデルからの回答を表示
    response_message = ""
    for chunk in response:
        next = chunk['choices'][0]['delta'].get('content', '')
        response_message += next
        print(next, end='')

    # メッセージに言語モデルからの回答を追加
    messages.append({"role": "assistant", "content": response_message})

print("\n---ご利用ありがとうございました！---")

'質問:こんにちは！'

こんにちは！お元気ですか？何かお手伝いできますか？

'質問:おすすめのランチを教えて'

もちろんです！どのような料理が好きですか？和食、洋食、中華料理など、お好みのジャンルを教えていただけると、より具体的なおすすめをお伝えできますよ！

'質問:和食'

和食がお好きですね！以下にいくつかのおすすめのランチをご紹介します。

1. 寿司ランチ: 新鮮なネタの盛り合わせや、お好みの寿司を選べるセットランチはいかがですか？寿司職人の技が光る美味しい一品を楽しめます。

2. 丼もの: 牛丼、親子丼、天丼など、お好きな丼ものを選んでみてください。具材がたっぷりと乗っていて、ごはんとの相性も抜群です。

3. 焼肉ランチ: カルビやハラミ、ロースなどの焼肉をランチセットで楽しむのもおすすめです。焼き立てのお肉の香りとジューシーさがたまりません。

4. お蕎麦: 温かいお蕎麦やざる蕎麦、天ぷらを添えた蕎麦など、季節に応じて楽しめるお蕎麦もおすすめです。さっぱりとした味わいが優雅なランチタイムを演出してくれます。

これらの和食のランチメニューは、地域やお店によって多様性がありますので、お近くのお店でぜひお試しください！
---ご利用ありがとうございました！---
