# Completions API

# 準備

In [11]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
import openai

# 環境変数の読み込み
load_dotenv()
openai.api_key = os.environ['API_KEY']
model_name = "text-davinci-003"

# パラメーター：prompt、echo

In [15]:
# プロンプトの設定
prompt = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.Completion.create(
    model=model_name,
    prompt=prompt,
    max_tokens=300,
    echo=True
)

# 結果を表示
print(response.choices[0]["text"].strip())

言語モデルを使う上でのポイントは？

1. 言語モデルは言葉の順序を学習し、そこに搭載されたパターンを特定できるようになっている。

2. テキストを埋め込んでモデルを訓練する場合、テキストのサイズが大きいほど、より複雑なパターンを認識できる可能性が高い。

3. ニューラルネットワークの活性化関数をよく理解することが重要である。

4. 導入した層、および活性化関数を試行錯誤して調節し、複雑なパターンを捕らえる精度の良いモデルを作成する必要がある。

5.


# パラメーター：suffix

In [13]:
# プロンプトの設定
prompt = "言語モデルを使う上でのポイントは"
# 末尾文字の設定
suffix = "を続けることです。"

# APIへリクエスト
response = openai.Completion.create(
    model=model_name,
    prompt=prompt,
    max_tokens=300,
    suffix=suffix
)

# 結果を表示
print(response.choices[0]["text"].strip())

、正しい語彙のリストを確認することと、正しい使い方をして学習し続けていくことです。具体的には、正しい単語を使えるようになるためには、辞書や文法などを通じて正しい語彙リストを確認する必要があります。そして、その語彙リストで正しい文章を正しくかけるように学習


# パラメーター：best_of


### 指定しない場合

In [46]:
# プロンプトの設定
prompt = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.Completion.create(
    model=model_name,
    prompt=prompt,
    max_tokens=50,
    n=2,
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["text"].strip())

print(response.usage)

--------------------
２点です。

1. 単語の分散表現を学習して、意味的な距離
--------------------
なんですか

1. 言語モデルでは、処理できるテキストデータ量が増えると、より正
{
  "prompt_tokens": 20,
  "completion_tokens": 97,
  "total_tokens": 117
}


### 指定した場合

In [45]:
# プロンプトの設定
prompt = "言語モデルを使う上でのポイントは"

# APIへリクエスト
response = openai.Completion.create(
    model=model_name,
    prompt=prompt,
    max_tokens=50,
    n=2,
    best_of=4
)

# 結果を表示
for choice in response.choices:
    print("-" * 20)
    print(choice["text"].strip())

print(response.usage)

--------------------
？

1. 言語モデルを正しく構築するためには、十分なデータ量が必要で
--------------------
、コーパスの選び方である。
なぜなら、モデルの言語処理能力はコーパスの種類
{
  "prompt_tokens": 20,
  "completion_tokens": 199,
  "total_tokens": 219
}


# パラメーター：logprobs

In [25]:
# プロンプトの設定
prompt = "こんにちは！"

# APIへリクエスト
response = openai.Completion.create(
    model=model_name,
    prompt=prompt,
    max_tokens=100,
    logprobs=3
)

# 結果を表示
# response

<OpenAIObject text_completion id=cmpl-7WbaxAkrUlJBQd0xSoZ3oJlh4mpPw at 0x2044ac15790> JSON: {
  "id": "cmpl-7WbaxAkrUlJBQd0xSoZ3oJlh4mpPw",
  "object": "text_completion",
  "created": 1688005367,
  "model": "text-davinci-003",
  "choices": [
    {
      "text": "\n\n\u304a\u5143\u6c17\u3067\u3059\u304b\uff1f\n\n\u306f\u3044\u3001\u5143\u6c17\u3067\u3059\uff01\u6700\u8fd1\u3068\u3066\u3082\u5fd9\u3057\u304f\u3066\u3001\u3069\u3046\u3057\u3066\u3082\u4f11\u3080\u6642\u9593\u304c\u53d6\u308c\u307e\u305b\u3093\u304c\u3001\u6c17\u6301\u3061\u306f\u5143\u6c17\u3067\u3059\uff01",
      "index": 0,
      "logprobs": {
        "tokens": [
          "\n",
          "\n",
          "bytes:\\xe3\\x81",
          "bytes:\\x8a",
          "bytes:\\xe5\\x85",
          "bytes:\\x83",
          "bytes:\\xe6\\xb0",
          "bytes:\\x97",
          "\u3067",
          "\u3059",
          "\u304b",
          "bytes:\\xef",
          "bytes:\\xbc",
          "bytes:\\x9f",
          "\n",
          "\n"

In [26]:
# 結果を表示
print(response.choices[0]["text"].strip())

お元気ですか？

はい、元気です！最近とても忙しくて、どうしても休む時間が取れませんが、気持ちは元気です！


In [27]:
import tiktoken
from tiktoken.core import Encoding

# OpenAI APIの特定のモデルに対応するトークナイザーを取得
encoding: Encoding = tiktoken.encoding_for_model(model_name)

In [37]:
# 回答をトークンごとに確認
for token in response.choices[0]["logprobs"]["tokens"]:
    print("[", token.replace("\n",""), "]", end=" ")

[  ] [  ] [ bytes:\xe3\x81 ] [ bytes:\x8a ] [ bytes:\xe5\x85 ] [ bytes:\x83 ] [ bytes:\xe6\xb0 ] [ bytes:\x97 ] [ で ] [ す ] [ か ] [ bytes:\xef ] [ bytes:\xbc ] [ bytes:\x9f ] [  ] [  ] [ は ] [ い ] [ 、 ] [ bytes:\xe5\x85 ] [ bytes:\x83 ] [ bytes:\xe6\xb0 ] [ bytes:\x97 ] [ で ] [ す ] [ bytes:\xef ] [ bytes:\xbc ] [ bytes:\x81 ] [ bytes:\xe6\x9c ] [ bytes:\x80 ] [ bytes:\xe8\xbf ] [ bytes:\x91 ] [ と ] [ て ] [ も ] [ bytes:\xe5\xbf ] [ bytes:\x99 ] [ し ] [ く ] [ て ] [ 、 ] [ bytes:\xe3\x81 ] [ bytes:\xa9 ] [ う ] [ し ] [ て ] [ も ] [ bytes:\xe4\xbc ] [ bytes:\x91 ] [ bytes:\xe3\x82 ] [ bytes:\x80 ] [ bytes:\xe6 ] [ bytes:\x99\x82 ] [ bytes:\xe9\x96 ] [ bytes:\x93 ] [ が ] [ bytes:\xe5\x8f ] [ bytes:\x96 ] [ れ ] [ ま ] [ bytes:\xe3\x81 ] [ bytes:\x9b ] [ ん ] [ が ] [ 、 ] [ bytes:\xe6\xb0 ] [ bytes:\x97 ] [ bytes:\xe6 ] [ bytes:\x8c ] [ bytes:\x81 ] [ bytes:\xe3\x81 ] [ bytes:\xa1 ] [ は ] [ bytes:\xe5\x85 ] [ bytes:\x83 ] [ bytes:\xe6\xb0 ] [ bytes:\x97 ] [ で ] [ す ] [ bytes:\xef ] [ bytes:\xbc ] [

In [35]:
# 選択されたトークンの確率を表示
response.choices[0]["logprobs"]["token_logprobs"][:5]

[-0.089331955, -0.05422803, -0.56343424, -0.030248633, -0.028849766]

In [34]:
# トークン上位logprobs個の確率を表示
response.choices[0]["logprobs"]["top_logprobs"][:5]

[<OpenAIObject at 0x2044ad94a70> JSON: {
   "\n": -0.089331955,
   "bytes:\\xef": -5.0989366,
   "bytes:\\xe7": -5.358016
 },
 <OpenAIObject at 0x2044ad94410> JSON: {
   "\n": -0.05422803,
   " \u00a7\u00a7": -4.5301123,
   "<|endoftext|>": -5.289935
 },
 <OpenAIObject at 0x2044ad940b0> JSON: {
   "bytes:\\xe3\\x81": -0.56343424,
   "\u306f": -2.2628295,
   "\u3053": -2.2917762
 },
 <OpenAIObject at 0x2044ad96210> JSON: {
   "bytes:\\x8a": -0.030248633,
   "bytes:\\xa9": -3.8872237,
   "bytes:\\x94": -4.7345276
 },
 <OpenAIObject at 0x2044ad94050> JSON: {
   "bytes:\\xe5\\x85": -0.028849766,
   "\u306f": -3.7662191,
   "\u304b": -6.529132
 }]