# Tutorial for OpenAI API
目次
- OpenAI APIのインストール
- 環境変数の設定
- シンプルな文章生成
- オープンデータセットを用いた文章分類
- 課題1. 文章分類タスクの評価
- Extra課題

注意点
- この演習はGoogle Colaboratyで実行することを想定しています

## OpenAI APIのインストール
- [公式ドキュメント](https://platform.openai.com/docs/api-reference?lang=python)
- [GitHub](https://github.com/openai/openai-python)

In [None]:
# ライブラリのインストール
!pip install openai==1.54.3

## 環境変数の設定
左のタブの`シークレット`から`OPENAI_API_KEY`を設定


<img width=500 src="https://github.com/HarmoLab/aitr/blob/main/2023/exercise_04/colab_secret.png?raw=true">

In [None]:
from google.colab import userdata
from openai import OpenAI

client = OpenAI(
    api_key= userdata.get('OPENAI_API_KEY')
)

In [None]:
# promptから料金を出力する関数
def calculate_credit(model:str, input_tokens:int, output_tokens:int) -> float:
    yen_rate = 150 # $1 = 150円で計算
    if model == "gpt-4o-mini-2024-07-18":
        input_credit = (0.0015 * yen_rate) / 1000
        output_credit = (0.003 * yen_rate) / 1000
    elif model == "gpt-4o-2024-08-06":
        input_credit = (0.0025 * yen_rate) / 1000
        output_credit = (0.01 * yen_rate) / 1000
    else:
        assert False, f"モデル名: {model}の料金計算はできません。modelは'gpt-4o-2024-08-06',または'gpt-4o-mini-2024-07-18'を使用してください。"
    total_credit = round(input_credit * input_tokens + output_credit * output_tokens, 2)
    print(f"使用したモデル: {model}, 料金: {total_credit}円")
    return total_credit


## シンプルな文章生成
- 公式ドキュメント
    - 文章生成(text-generation): https://platform.openai.com/docs/guides/text-generation


In [None]:
user_prompt = "ChatGPTについて簡潔に3文で教えてください。" # ここを修正
model = "gpt-4o-mini-2024-07-18"

response = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": user_prompt
        },
    ],
    model=model,
    max_tokens=500,
    n=1,
    temperature=1,

)

In [None]:
print("--- レスポンス全体 ---")
print(response)

calculate_credit(model, response.usage.prompt_tokens, response.usage.completion_tokens)

print()
print("--- 質問 ---")
print(user_prompt)
print("--- 回答 ---")
print(response.choices[0].message.content)

--- レスポンス全体 ---
ChatCompletion(id='chatcmpl-AQ5DFhxY3kkYIgYmheIPzg1ed6Jwr', choices=[Choice(finish_reason='stop', index=0, message=ChatCompletionMessage(content='ChatGPTは、自然言語処理を用いた会話エージェントです。人工知能を活用して、ユーザーとの会話を通じて質問に答えたり、情報を提供したりします。また、さまざまなトピックについて深い会話を行うことができます。', role='assistant', function_call=None, tool_calls=None, refusal=None), logprobs=None)], created=1730779929, model='gpt-3.5-turbo-1106', object='chat.completion', system_fingerprint='fp_e7d4a5f731', usage=CompletionUsage(completion_tokens=95, prompt_tokens=29, total_tokens=124, prompt_tokens_details={'cached_tokens': 0}, completion_tokens_details={'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}))
使用したモデル: gpt-3.5-turbo-1106, 料金: 0.03円

--- 質問 ---
ChatGPTについて簡潔に3文で教えてください。
--- 回答 ---
ChatGPTは、自然言語処理を用いた会話エージェントです。人工知能を活用して、ユーザーとの会話を通じて質問に答えたり、情報を提供したりします。また、さまざまなトピックについて深い会話を行うことができます。


### chat.completions.createに使用する引数について
公式ドキュメント: https://platform.openai.com/docs/api-reference/chat/create

### 主要な引数
- model (必須)
    - 使用する学習モデル (本演習では"gpt-3.5-turbo-1106"を使用)
- messages (必須)
    - role
        - system: アシスタントの動作を設定
        - assistant: アシスタントの望ましい動作を設定 (ユーザも作成可)
        - user: ユーザの指示
    - content
        - roleに対して入力する文章
- max_tokens: int or null
    - 生成するトークンの最大数。出力の長さを制限することが可能
- n: int or null
    - 生成するレスポンスの数 (デフォルト: 1)
- temperature: number or null
    - 0～2の間で指定
    - 0に近づくにつれて決定論的になり、2に近づくにつれて生成文が多様でランダムになる（デフォルト: 1）
        - 詳しい説明: https://techblog.a-tm.co.jp/entry/2023/04/24/181232

## オープンデータセットを用いた文章分類
- 今回使用するデータセット
    - Amazon Reviews Multi:
https://huggingface.co/datasets/mteb/amazon_reviews_multi/viewer/ja

In [None]:
!pip install datasets

In [None]:
import datasets
# Amazonレビューのデータセット(日本語)をダウンロード
# 今回はダウンロード時間を減らすために検証データ (validation)のみ取得
dataset = datasets.load_dataset("mteb/amazon_reviews_multi", "ja", split="validation")
print(dataset)

In [None]:
# 実際のデータセットを確認
dataset[0]["text"]

In [None]:
system_prompt = "以下のレビュー文を評価してください"
user_prompt = dataset[0]["text"] # レビュー文のみ

response = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": system_prompt
        },
        {
            "role": "user",
            "content": user_prompt
        },
    ],
    model="gpt-4o-mini-2024-07-18",
)

In [None]:
print("--- 全体の出力 ---")
print(response)

calculate_credit(model, response.usage.prompt_tokens, response.usage.completion_tokens)

print()
print("--- 質問 ---")
print(user_prompt)
print("--- 回答 ---")
print(response.choices[0].message.content)

In [None]:
from tenacity import (
    retry,
    stop_after_attempt,
    wait_random_exponential,
)

# forでループするために関数化 (RateLimit対策のためtenacityのデコーダを採用)
# 参考: https://cookbook.openai.com/examples/how_to_handle_rate_limits
@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))
def simple_completion(model_name:str, system_prompt:str, user_prompt:str):
    response = client.chat.completions.create(
        messages=[
            {
                "role": "system",
                "content": system_prompt
            },
            {
                "role": "user",
                "content": user_prompt
            },
        ],
        model=model_name,
        timeout=15
    )
    # 料金の計算
    credit = calculate_credit(model_name, response.usage.prompt_tokens, response.usage.completion_tokens)
    return response, credit

## 課題1. 文章分類タスクの評価
system_promptを変更してレビュー文章を用いた評価値推定を行いましょう。

In [None]:
model_name = "gpt-4o-mini-2024-07-18" # モデル名
k = 10 # k件のレビュー文に対する評価
shuffled_dataset = dataset.shuffle(seed=70) # データセットをシャッフル
review_list = shuffled_dataset[:k]["text"]
label_list = shuffled_dataset[:k]["label"]
print(review_list)
print(label_list)

# 課題1: 正答率と評価値を上げるためのsystem_promptを考えましょう。
system_prompt = """
以下のレビュー文を5段階で評価してください。0~4の数字のみを出力してください。
"""

predict_label_list = [] # -1(出力形式のエラー), 0, 1, 2, 3, 4
total_credit = 0
for i, (review, label) in enumerate(zip(review_list, label_list)):
    print(f"\n^^^^^^^^^^ {i+1}件目のレビュー ^^^^^^^^^^")
    print("--- レビュー文 ---")
    print(review)
    print("--- 実際の評価 ---")
    print(label)
    response, credit = simple_completion(model_name, system_prompt, review)
    total_credit += credit
    print("--- ChatGPTの回答 ---")
    print(response)
    print(response.choices[0].message.content)

    try:
        response_int = int(response.choices[0].message.content)
        predict_label_list.append(response_int)
    except ValueError:
        print("--- Error ---")
        print("回答がint型に変換できませんでした。")
        predict_label_list.append(-1)
        continue
print(f"合計金額: {total_credit}円")

In [None]:
print("--- 実際の評価 ---")
print(label_list)
print("--- 予測した評価--- ")
print(predict_label_list)

# 評価
## 実際の評価と予測した評価の差の合計を評価値 (loss)
## 予測した評価が-1（出力形式のエラー）の場合は+6

validation_score = 0 # 評価値
correct_answer = 0 # 正解数
for actual, predict in zip(label_list, predict_label_list):
    if not actual == predict:
        if predict == -1:
            validation_score += 6
            continue
        validation_score += abs(actual - predict)
    else:
        correct_answer += 1
print("\n--- 正答率 ---")
print(f"{correct_answer/len(label_list)*100} %")
print("--- 評価値 (低いほうが良い結果) ---")
print(validation_score)

## Extra課題


In [None]:
user_prompt = "2泊3日の札幌観光旅行のプランを考えてください。"

# Extra課題
system_prompt = """
ユーザの質問に回答してください。
"""

response = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": system_prompt
        },
        {
            "role": "user",
            "content": user_prompt
        },
    ],
    model="gpt-4o-mini-2024-07-18",
)

In [None]:
print("--- 全体の出力 ---")
print(response)

calculate_credit(model, response.usage.prompt_tokens, response.usage.completion_tokens)

print()
print("--- 質問 ---")
print(user_prompt)
print("--- 回答 ---")
print(response.choices[0].message.content)