# OpenAI 參數設定

In [1]:
import os
import openai
from dotenv import load_dotenv

load_dotenv()
openai.api_type = "azure"
openai.api_version = "2023-05-15"

API_KEY = os.getenv("OPENAI_API_KEY")
assert API_KEY, "ERROR: Azure OpenAI Key is missing"
openai.api_key = API_KEY

RESOURCE_ENDPOINT = os.getenv("OPENAI_API_BASE")
assert RESOURCE_ENDPOINT, "ERROR: Azure OpenAI Endpoint is missing"
assert "openai.azure.com" in RESOURCE_ENDPOINT.lower(), "ERROR: Azure OpenAI Endpoint should be in the form: \n\n\t<your unique endpoint identifier>.openai.azure.com"
openai.api_base = RESOURCE_ENDPOINT

# temperature

預設值 1

決定採樣時的溫度 (sampling temperature)，參數值介於 0 與 2 之間。 數值越高意味著模型產生的文字內容越多樣化，對於更需要產生具備創意之文案的相關應用，可以嘗試使用 0.9，對於具有明確答案應用情境，建議嘗試使用 0 ( 使用 argmax 函數來採樣)。

temperature 參數或 top_p 參數有著類似效果，但不要同時調整這兩個參數以避免無法確認內容產出的變化是因為哪一個參數調整所造成的。

In [5]:
def call_openai(num_times, prompt, temperature):
    for i in range(num_times):
        
        response = openai.Completion.create(
            engine=os.getenv('DEPLOYMENT_NAME'),
            prompt=prompt,
            max_tokens=60,
            temperature = temperature,
            stop='\n'
        )
        print(response['choices'][0]['text'])

In [6]:
call_openai(10, '用正體中文一句話精簡回覆\nQ:最佳的寵物是什麼?\nA:', temperature = 0)

沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。


In [7]:
call_openai(10, '用正體中文一句話精簡回覆\nQ:最佳的寵物是什麼?\nA:', temperature = 1)

完美的寵物並不存在，但是不同個體的需要不一樣，只要找到適合自己的照顧方式與寵物，給彼此充分的關
貓狗(土法煉鋼Python建構)
每個人的喜好不盡相同，沒有唯一最佳的寵物，重點是好好領養、照顧牠們，提供充足的食、水
因人而異。
沒有最佳的，因為每種寵物都有自己的特色。
眼鏡蛇
無法回答(僅一個字)。
視個人需求而定。
依照您的喜好和需求，最佳寵物因人而異，請自行選擇。 --- 例：依照您的喜好和需求，最佳寵物因



# top_p

預設值 1

控制採樣溫度 (sampling temperature) 之外的另一種控制產生內容多樣性的參數，temperature 參數控制產生的內容之隨機性，而 top_p  則決定可供選擇的 Token 範圍有多大，top_p 參數使用 nucleus sampling 採樣方式，一般而言候選的 Token 機率依據高低會以長尾的方式分布，top_p 決定了只有多少百分比之候選 Token 應該被納入考慮，例如 top_p 參數設為 0.1 代表只有前 10% 的候選 Token 有機會被隨機選用。對於 temperature 與 top_p 參數背後所代表的意義可以參考 https://towardsdatascience.com/how-to-sample-from-language-models-682bceb97277

temperature 參數或 top_p 參數有著類似效果，但不要同時調整這兩個參數以避免無法確認內容產出的變化是因為哪一個參數調整所造成的。

In [12]:
def call_openai(num_times, prompt, top_p):
    for i in range(num_times):
        
        response = openai.Completion.create(
            engine=os.getenv('DEPLOYMENT_NAME'),
            prompt=prompt,
            max_tokens=60,
            top_p = top_p,
            stop='\n'
        )
        print(response['choices'][0]['text'])

In [13]:
call_openai(10, '用正體中文一句話精簡回覆\nQ:最佳的寵物是什麼?\nA:', top_p = 1)

沒有最棒的寵物，每種寵物都有各自的特色。
沒有，每個寵物都有他的獨特之處。
因人而異，適合自己的才是最好的。 
以主人的喜好或生活環境為準，最適合並且可以負責養育的才是最佳的寵物。 英文回覆:The best pet
沒有一個絕對的答案，最適合自己和生活方式的才是最好的。
依據需要而定。
因人而異，無法一概而論
依個人喜好而定。
貓咪與狗狗都是很好的萌寵。
沒有最佳寵物,每種寵物都有其值得飼養的優點。


In [14]:
call_openai(10, '用正體中文一句話精簡回覆\nQ:最佳的寵物是什麼?\nA:', top_p = 0.1)

沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。
沒有最佳的寵物，只有最適合自己的寵物。


# n

預設值 1

為每個提示 (prompt) 產生多少個自動完成的回應內容。

請注意：由於此參數會生成多個回應內容，因此它會快速消耗 Token 配額。 請謹慎使用並確認有設定妥 max_tokens 參數與停止產生內容的 stop 字串。本範例嘗試使用 gpt-35-turbo 與 gpt-4 方支援的 ChatCompletion API 來進行自動完成


In [22]:
response  = openai.ChatCompletion.create( 
  engine = os.getenv('DEPLOYMENT_NAME'),  
  messages = [ 
    {'role': 'user', 'content': "用正體中文一句話精簡回覆\nQ:最佳的寵物是什麼?\nA:"      
    }
  ],
  n=3, # 產生三個自動完成的回覆
  temperature=0.6,
  max_tokens=200
)

print(response['choices'][0]['message']['content'])    
print(response['choices'][1]['message']['content'])     
print(response['choices'][2]['message']['content'])   

寵物的品種並非最重要，最佳的寵物是一個忠心耿耿的伴侶。
這取決於個人喜好。
寵物因人而異，沒有絕對的最佳寵物。


# logprobs

預設值 null

logprobs 會列出最有可能的 Token 以及其他候選之 Token 的機率。 例如如果 logprobs 設為 5，則 API 呼叫後將會回傳 5 個最可能 Token 的清單。 API 仍將傳會機率最高的 Token。 logprobs 的最大值為 5。如果您需要更高的參數值，請聯繫微軟技術支援中心以便讓微軟了解您的需求。由於 gpt5-turbo-3 與 gpt-4 模型已經不再支援 logprobs 參數，本範例仍使用 text-davinci-003 模型

In [23]:
response = openai.Completion.create(
            engine= 'text-davinci-003', # 必須使用 GPT-3 模型
            prompt='Q:What is the best pet name?\nA:',
            max_tokens=10,
            temperature = 0,
            logprobs=2,
            stop='\n'
        )
# 顯示完整回應內容
print(response['choices'][0]['text'])
# 顯示機率最高的 2 個英文字清單
print(response['choices'][0]['logprobs']["top_logprobs"])

That depends on the pet and the owner's preference
[<OpenAIObject at 0x1ec186ae630> JSON: {
  "That": -0.8687504,
  "The": -1.7687309
}, <OpenAIObject at 0x1ec186ae090> JSON: {
  " depends": -0.65903336,
  " really": -0.858195
}, <OpenAIObject at 0x1ec186ad550> JSON: {
  " entirely": -3.9665174,
  " on": -0.023734413
}, <OpenAIObject at 0x1ec186ae8d0> JSON: {
  " personal": -1.4807402,
  " the": -0.7061696
}, <OpenAIObject at 0x1ec186ae930> JSON: {
  " individual": -1.2972732,
  " pet": -0.69998693
}, <OpenAIObject at 0x1ec186ae150> JSON: {
  " and": -0.13035342,
  "!": -3.034318
}, <OpenAIObject at 0x1ec186ae510> JSON: {
  " its": -2.3742461,
  " the": -0.1815296
}, <OpenAIObject at 0x1ec186aebd0> JSON: {
  " owner": -0.9856221,
  " person": -1.4627779
}, <OpenAIObject at 0x1ec186aecf0> JSON: {
  "'s": -0.26141384,
  ".": -1.998791
}, <OpenAIObject at 0x1ec186aed50> JSON: {
  " preference": -0.8667084,
  " preferences": -0.8938538
}]


# max_tokens

預設值 無上限

生成內容允許之 token 數上限。此外包含提示 (prompt) 耗用的 token 數與生成內容耗用的 token 之數總和不能超過所選用模型允許之 token 數上限。

# stop

預設值 null

讓自動完成 API 停止產生語句的特定字串，只要遇到此參數指定的字串就會結束內容生成，最多可以設定 4 組 Stop 字串。

# presence_penalty

預設值 0

參數值可介於 -2.0 和 2.0 之間的數字，數值大於 0 的設定值會開始在取樣時懲罰使用過的 token，也就是增加產生新的語句或新的主題之可能性。

# frequency_penalty

預設值 0

參數值可介於 -2.0 和 2.0 之間的數字。數值大於 0 的設定值會開始在產生的文本中已經出現過的詞彙時在取樣時進行懲罰，進而降低模型產生重複詞彙的可能性。presence_penalty 參數與 frequency_penalty 參數之間的區別很微妙，frequency_penalty 可以視為控制單詞重複的方法，而將 presence_penalty 視為避免模型產生重複的主題。

# stream

預設值 false

OpenAI 自動完成 API 預設是整個生成內容完成後才會回傳結果，如果您生成內容的時間很長，用戶等待時間就會很久。當 stream 參數設為 true 時，可以在內容生成時以串流 (stream) 方式將目前生成的最新字句立即傳送回來，相關範例可參閱 [OpenAI Cookbook](https://github.com/openai/openai-cookbook/blob/main/examples/How_to_stream_completions.ipynb)


# best_of

預設值 1

依據參數值在伺服器端生成多個自動完成的結果，將 "最佳" 的結果回傳，當設定值大於 1 的就無法啟用與使用 streame 功能。若 best_of 參數與 n 參數一起使用時，best_of 決定了有多少個候選生成出來的內容數量，n 則決定了最終回傳幾個生成的內容數量，也因 best_of 參數值必須大於 n 的參數值。 此外 gpt-35-turbo 與 gpt-4 模型已經不再支援 best_of 參數。
請注意：由於此參數會生成多個回應內容，因此它會快速消耗 Token 配額。 請謹慎使用並確認有設定妥 max_tokens 參數與停止產生內容的 stop 字串。


# logit_bias

預設值 null

修改特定 tokens 出現在自動生成 (completion) 產生之文句中的可能性。OpenAI GPT 模型每個字代表之絕對為一之 token ID 是多少? 則可利用　https://platform.openai.com/tokenizer　查詢查詢得知

利用 JSON 格式來設定特定 token ID 與配套之 -100 之間 100 數值，數值 -100 表示絕對不會產生出該 token ID 所代表的字。

例如您可以設定參數值 {"16108": -100} 來避免 token ID 為 50256 所代表的字 "Apple" 被模型產生出來。

參考資料 : [OpenAI API Reference](https://platform.openai.com/docs/api-reference/completions)