# Models API

使用 Models API 查看和访问 OpenAI 提供的预训练大语言模型

## List Models

列出当前可用的模型，并提供每个模型的基本信息，如所有者和可用性。

`data`: 目前OpenAI提供的大语言模型列表，列表中的每一项都对应着一个模型实例。

In [1]:
import os
from openai import OpenAI
client = OpenAI()

models = client.models.list()

In [2]:
print(models)

SyncPage[Model](data=[Model(id='curie-search-query', created=1651172509, object='model', owned_by='openai-dev'), Model(id='babbage-search-query', created=1651172509, object='model', owned_by='openai-dev'), Model(id='dall-e-3', created=1698785189, object='model', owned_by='system'), Model(id='babbage-search-document', created=1651172510, object='model', owned_by='openai-dev'), Model(id='dall-e-2', created=1698798177, object='model', owned_by='system'), Model(id='gpt-3.5-turbo-0301', created=1677649963, object='model', owned_by='openai'), Model(id='text-embedding-ada-002', created=1671217299, object='model', owned_by='openai-internal'), Model(id='davinci-search-query', created=1651172505, object='model', owned_by='openai-dev'), Model(id='tts-1-hd-1106', created=1699053533, object='model', owned_by='system'), Model(id='gpt-4-0613', created=1686588896, object='model', owned_by='openai'), Model(id='tts-1-hd', created=1699046015, object='model', owned_by='system'), Model(id='ada-search-docum

In [3]:
models.data

[Model(id='curie-search-query', created=1651172509, object='model', owned_by='openai-dev'),
 Model(id='babbage-search-query', created=1651172509, object='model', owned_by='openai-dev'),
 Model(id='dall-e-3', created=1698785189, object='model', owned_by='system'),
 Model(id='babbage-search-document', created=1651172510, object='model', owned_by='openai-dev'),
 Model(id='dall-e-2', created=1698798177, object='model', owned_by='system'),
 Model(id='gpt-3.5-turbo-0301', created=1677649963, object='model', owned_by='openai'),
 Model(id='text-embedding-ada-002', created=1671217299, object='model', owned_by='openai-internal'),
 Model(id='davinci-search-query', created=1651172505, object='model', owned_by='openai-dev'),
 Model(id='tts-1-hd-1106', created=1699053533, object='model', owned_by='system'),
 Model(id='gpt-4-0613', created=1686588896, object='model', owned_by='openai'),
 Model(id='tts-1-hd', created=1699046015, object='model', owned_by='system'),
 Model(id='ada-search-document', crea

### 获取模型 ID 列表

In [4]:
models.data[0].id

'curie-search-query'

In [5]:
model_list = [model.id for model in models.data]

In [6]:
print(model_list)

['curie-search-query', 'babbage-search-query', 'dall-e-3', 'babbage-search-document', 'dall-e-2', 'gpt-3.5-turbo-0301', 'text-embedding-ada-002', 'davinci-search-query', 'tts-1-hd-1106', 'gpt-4-0613', 'tts-1-hd', 'ada-search-document', 'ada-code-search-code', 'davinci-002', 'babbage-002', 'gpt-4-vision-preview', 'davinci-search-document', 'curie-search-document', 'gpt-4', 'whisper-1', 'ada-search-query', 'ada-code-search-text', 'gpt-3.5-turbo-1106', 'gpt-4-1106-preview', 'gpt-3.5-turbo-16k', 'gpt-3.5-turbo', 'gpt-3.5-turbo-0613', 'gpt-3.5-turbo-16k-0613', 'gpt-3.5-turbo-instruct', 'gpt-3.5-turbo-instruct-0914', 'tts-1-1106', 'tts-1']


## Retrieve Model

获取模型实例，提供有关模型的基本信息，例如所有者和权限设置。

以`gpt-3.5-turbo-1106`模型为例，解释说明各项参数：

1. `created`: 这是模型创建的时间戳，单位为 Unix 时间戳（自1970年1月1日（00:00:00 GMT）以后的秒数）。
2. `id`: 这是模型的唯一标识符。在这个例子中，模型的 ID 是 "gpt-3.5-turbo-1106"。
3. `object`: 这个字段表示的是当前对象的类型，在这个例子中，对象是 "model"，说明这个 JSON 对象是一个模型。
4. `owned_by`: 这个字段表示的是模型的所有者，在这个例子中，模型的所有者是 "openai-internal"。

In [8]:
from openai import OpenAI
client = OpenAI()

gpt_3point5 = client.models.retrieve("gpt-3.5-turbo-1106")

In [9]:
print(gpt_3point5)

Model(id='gpt-3.5-turbo-1106', created=1698959748, object='model', owned_by='system')


### 获取指定模型，如 GPT-4V

In [10]:
client.models.retrieve("gpt-4-vision-preview")

Model(id='gpt-4-vision-preview', created=1698894917, object='model', owned_by='system')

# 文本内容补全初探（Completions API）[Legacy]

使用 Completions API 实现各类文本生成任务


主要请求参数说明：


- **`model`** （string，必填）

  要使用的模型的 ID。可以参考 **模型端点兼容性表**。

- **`prompt`** （string or array，必填，Defaults to ）

  生成补全的提示，编码为字符串、字符串数组、token数组或token数组数组。

  注意，这是模型在训练过程中看到的文档分隔符，所以如果没有指定提示符，模型将像从新文档的开头一样生成。

- **`stream`** （boolean，选填，默认 false）

  当它设置为 true 时，API 会以 SSE（ Server Side Event ）方式返回内容，即会不断地输出内容直到完成响应，流通过 `data: [DONE]` 消息终止。

- **`max_tokens`** （integer，选填，默认是 16）

  补全时要生成的最大 token 数。

  提示 `max_tokens` 的 token 计数不能超过模型的上下文长度。大多数模型的上下文长度为 2048 个token（最新模型除外，它支持 4096）

- **`temperature`** （number，选填，默认是1）

  使用哪个采样温度，在 **0和2之间**。

  较高的值，如0.8会使输出更随机，而较低的值，如0.2会使其更加集中和确定性。

  通常建议修改这个（`temperature` ）或 `top_p` 但两者不能同时存在，二选一。

- **`n`** （integer，选填，默认为 1）

  每个 `prompt` 生成的补全次数。

  注意：由于此参数会生成许多补全，因此它会快速消耗token配额。小心使用，并确保对 `max_tokens` 和 `stop` 进行合理的设置。


## 生成英文文本

In [20]:
import os
from openai import OpenAI

client = OpenAI()

data = client.completions.create(
  model="gpt-3.5-turbo-instruct",
  prompt="tell me how to understand gpt model",
  max_tokens=500,
  temperature=0
)

In [21]:
print(data)

Completion(id='cmpl-8k6bvZKFefud77IqXpHZ59KL4eQ8e', choices=[CompletionChoice(finish_reason='stop', index=0, logprobs=None, text='\n\nGPT (Generative Pre-trained Transformer) is a type of deep learning model that uses a transformer architecture to generate text. It is pre-trained on a large corpus of text data and can then be fine-tuned for specific tasks such as language translation, text summarization, and question-answering.\n\nTo understand how GPT works, it is important to have a basic understanding of the transformer architecture. A transformer is a neural network that uses attention mechanisms to process sequential data, such as text. It consists of an encoder and a decoder, which work together to process input data and generate output.\n\nIn the case of GPT, the encoder takes in a sequence of words and converts them into a series of vectors, each representing a word in the sequence. These vectors are then passed to the decoder, which uses them to generate the next word in the s

In [22]:
text = data.choices[0].text

In [23]:
print(text)



GPT (Generative Pre-trained Transformer) is a type of deep learning model that uses a transformer architecture to generate text. It is pre-trained on a large corpus of text data and can then be fine-tuned for specific tasks such as language translation, text summarization, and question-answering.

To understand how GPT works, it is important to have a basic understanding of the transformer architecture. A transformer is a neural network that uses attention mechanisms to process sequential data, such as text. It consists of an encoder and a decoder, which work together to process input data and generate output.

In the case of GPT, the encoder takes in a sequence of words and converts them into a series of vectors, each representing a word in the sequence. These vectors are then passed to the decoder, which uses them to generate the next word in the sequence. This process is repeated until the desired length of text is generated.

One of the key features of GPT is its ability to gener

## 生成中文文本

调整 `max_tokens` 

In [24]:
data = client.completions.create(
  model="gpt-3.5-turbo-instruct",
  prompt="讲10个给程序员听得笑话",
  max_tokens=1000,
  temperature=0.5
)

In [25]:
text = data.choices[0].text
print(text)



1. 为什么程序员喜欢用黑色背景？因为黑色背景可以减少眼睛的疲劳，让他们可以更长时间地盯着屏幕。

2. 为什么程序员总是喜欢用鼠标滚轮？因为他们习惯了滚动条。

3. 为什么程序员总是说“这不可能”？因为他们经常被要求在不可能的时间内完成不可能的任务。

4. 为什么程序员总是用英文来命名变量？因为他们不想让非程序员能够读懂他们的代码。

5. 为什么程序员总是喜欢喝咖啡？因为咖啡可以让他们的代码更有活力。

6. 为什么程序员总是喜欢用奇怪的变量名？因为他们喜欢挑战自己，看看谁能读懂他们的代码。

7. 为什么程序员总是喜欢用逗号分隔的方式来写代码？因为他们喜欢让代码看起来像一串数字。

8. 为什么程序员总是喜欢用注释？因为他们知道，即使是他们自己也可能在几个月后忘记自己写的代码是干什么的。

9. 为什么程序员总是喜欢用自己的电脑？因为他们知道自己的电脑里有什么程序，而不是像别人的电脑一样，可能装了各种奇怪的软件。

10. 为什么程序员总是喜欢用键盘快捷键？因为他们知道，每按一次快捷键就能节省几秒钟的时间，长期下来就能节省几个小时。


## 生成 Python 代码，并执行和验证

以面试中考察的典型的试题 `快速排序` 为例

In [26]:
data = client.completions.create(
  model="gpt-3.5-turbo-instruct",
  prompt="生成可执行的快速排序 Python 代码",
  max_tokens=1000,
  temperature=0
)


In [27]:
text = data.choices[0].text
print(text)



def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = [x for x in arr[1:] if x <= pivot]
    right = [x for x in arr[1:] if x > pivot]
    return quick_sort(left) + [pivot] + quick_sort(right)


#### Prompt：Jupyter Notebook 中执行生成的代码

Prompt：

```
我现在用 Completion API 生成了 Python 代码，并以字符串形式存放在 text 中，如下所示：

text = data.choices[0].text
print(text)

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = [x for x in arr[1:] if x <= pivot]
    right = [x for x in arr[1:] if x > pivot]
    return quick_sort(left) + [pivot] + quick_sort(right)

如何在 Jupyter notebook 中执行text中存放的这段代码
```


In [28]:
# `exec` 函数会执行传入的字符串作为 Python 代码。
# 在这个例子中，我们使用 `exec` 来定义了一个 `quick_sort` 函数，然后你就可以调用这个函数了。
# 请注意，`exec` 可以执行任何 Python 代码，因此在使用它的时候一定要小心，特别是当你执行的代码来自不可信的来源时。
exec(text)

In [29]:
# 现在你可以调用这个函数了
print(quick_sort([12,3,6,8,10,1,2,1,0,4,5]))

[0, 1, 1, 2, 3, 4, 5, 6, 8, 10, 12]


# 聊天机器人初探（Chat Completions API）

使用 Chat Completions API 实现对话任务

聊天补全(Chat Completions API)以消息列表作为输入，并返回模型生成的消息作为输出。尽管聊天格式旨在使多轮对话变得简单，但它同样适用于没有任何对话的单轮任务。

主要请求参数说明：


- **`model` （string，必填）**

  要使用的模型ID。有关哪些模型适用于Chat API的详细信息

- **`messages` （array，必填）**

  迄今为止描述对话的消息列表
    - **`role` （string，必填）**

  发送此消息的角色。`system` 、`user` 或 `assistant` 之一（一般用 user 发送用户问题，system 发送给模型提示信息）

    - **`content` （string，必填）**
    
      消息的内容
    
    - **`name` （string，选填）**
    
      此消息的发送者姓名。可以包含 a-z、A-Z、0-9 和下划线，最大长度为 64 个字符

- **`stream` （boolean，选填，是否按流的方式发送内容）**

  当它设置为 true 时，API 会以 SSE（ Server Side Event ）方式返回内容。SSE 本质上是一个长链接，会持续不断地输出内容直到完成响应。如果不是做实时聊天，默认false即可。

- **`max_tokens` （integer，选填）**

  在聊天补全中生成的最大 **tokens** 数。

  输入token和生成的token的总长度受模型上下文长度的限制。

- **`temperature` （number，选填，默认是 1）**

  采样温度，在 0和 2 之间。

  较高的值，如0.8会使输出更随机，而较低的值，如0.2会使其更加集中和确定性。

  通常建议修改这个（`temperature` ）或者 `top_p` ，但两者不能同时存在，二选一。


## 开启聊天模式

使用 `messages` 记录迄今为止对话的消息列表

In [30]:
from openai import OpenAI
client = OpenAI()

messages=[
    {
        "role": "user", 
        "content": "hello, how are you!"
    }
]


data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages = messages
)


In [31]:
print(data)

ChatCompletion(id='chatcmpl-8k7icAL2CXgZWkFRcuOx9o6JLXfn6', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?", role='assistant', function_call=None, tool_calls=None))], created=1706003450, model='gpt-3.5-turbo-0613', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=31, prompt_tokens=13, total_tokens=44))


In [32]:
# 从返回的数据中获取生成的消息
new_message = data.choices[0].message
# 打印 new_message
print(new_message)

ChatCompletionMessage(content="Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?", role='assistant', function_call=None, tool_calls=None)


In [33]:
# 将消息追加到 messages 列表中
messages.append(new_message)
print(messages)

[{'role': 'user', 'content': 'hello, how are you!'}, ChatCompletionMessage(content="Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?", role='assistant', function_call=None, tool_calls=None)]


In [34]:
type(new_message)

openai.types.chat.chat_completion_message.ChatCompletionMessage

In [35]:
new_message.role

'assistant'

In [36]:
new_message.content

"Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?"

In [37]:
messages.pop()

ChatCompletionMessage(content="Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?", role='assistant', function_call=None, tool_calls=None)

In [38]:
print(messages)

[{'role': 'user', 'content': 'hello, how are you!'}]


#### Prompt: OpenAIObject -> Dict

```
打印 messages 列表后发现数据类型不对，messages 输出如下：

print(messages)

[{'role': 'user', 'content': 'hello, how are you!'}, ChatCompletionMessage(content="Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?", role='assistant', function_call=None, tool_calls=None)]

将OpenAIObject 转换为一个如下数据类型格式：

    {
        "role": "user", 
        "content": "Hello, how are you!"
    }
```

In [39]:
new_message = data.choices[0].message
new_message_dict = {"role": new_message.role, "content": new_message.content}
type(new_message_dict)

dict

In [40]:
print(new_message_dict)

{'role': 'assistant', 'content': "Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?"}


In [41]:
# 将消息追加到 messages 列表中
messages.append(new_message_dict)

In [42]:
print(messages)

[{'role': 'user', 'content': 'hello, how are you!'}, {'role': 'assistant', 'content': "Hello! I'm an AI, so I don't have feelings, but I'm here and ready to assist you. How can I help you today?"}]


#### 新一轮对话

In [43]:
new_chat = {
    "role": "user",
    "content": "1.讲一个程序员才听得懂的冷笑话；2.今天是几号？3.明天星期几？"
}

In [46]:
messages.append(new_chat)

In [47]:
from pprint import pprint

pprint(messages)

[{'content': 'hello, how are you!', 'role': 'user'},
 {'content': "Hello! I'm an AI, so I don't have feelings, but I'm here and "
             'ready to assist you. How can I help you today?',
  'role': 'assistant'},
 {'content': '1.讲一个程序员才听得懂的冷笑话；2.今天是几号？3.明天星期几？', 'role': 'user'},
 {'content': '1.讲一个程序员才听得懂的冷笑话；2.今天是几号？3.明天星期几？', 'role': 'user'}]


In [48]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)

In [49]:
new_message = data.choices[0].message
# 打印 new_messages 
print(new_message)

ChatCompletionMessage(content='1. 冷笑话来啦：为什么程序员只在十进制的时候才会哭？因为在二进制中，他们只会表示一位（哭）。\n2. 今天的日期是根据您的当地时间来定的，请告诉我您所在的时区或当前城市，以便我可以提供准确的答案。\n3. 明天的星期几也需要您提供当前的日期，位置或时区信息。如果您可以提供这些信息，我将很高兴为您回答。', role='assistant', function_call=None, tool_calls=None)


In [50]:
# 打印 new_messages 内容
print(new_message.content)

1. 冷笑话来啦：为什么程序员只在十进制的时候才会哭？因为在二进制中，他们只会表示一位（哭）。
2. 今天的日期是根据您的当地时间来定的，请告诉我您所在的时区或当前城市，以便我可以提供准确的答案。
3. 明天的星期几也需要您提供当前的日期，位置或时区信息。如果您可以提供这些信息，我将很高兴为您回答。


## 使用多种身份聊天对话

目前`role`参数支持3类身份： `system`, `user` `assistant`:


![](images/chat_completion_api.png)



In [51]:
# 构造聊天记录
messages=[
    {"role": "system", "content": "你是一个乐于助人的体育界专家。"},
    {"role": "user", "content": "2008年奥运会是在哪里举行的？"},
]

In [52]:
import openai

data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)


In [53]:
message = data.choices[0].message.content
print(message)

2008年奥运会是在中国的北京市举行的。


In [54]:
# 添加 GPT 返回结果到聊天记录
messages.append({"role": "assistant", "content": message})

In [43]:
messages

[{'role': 'system', 'content': '你是一个乐于助人的体育界专家。'},
 {'role': 'user', 'content': '2008年奥运会是在哪里举行的？'},
 {'role': 'assistant', 'content': '2008年奥运会是在中国的北京市举行的。有什么其他的问题我可以回答吗？'}]

In [55]:
# 第二轮对话
messages.append({"role": "user", "content": "1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？"})

In [45]:
messages

[{'role': 'system', 'content': '你是一个乐于助人的体育界专家。'},
 {'role': 'user', 'content': '2008年奥运会是在哪里举行的？'},
 {'role': 'assistant', 'content': '2008年奥运会是在中国的北京市举行的。有什么其他的问题我可以回答吗？'},
 {'role': 'user', 'content': '1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？'}]

In [56]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)

In [57]:
message = data.choices[0].message.content
print(message)

1. 金牌最多的国家是中国。在2008年北京奥运会上，中国赢得了51枚金牌。
2. 奖牌最多的国家是美国。美国在2008年北京奥运会上共获得110枚奖牌，其中包括36枚金牌。


In [58]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[{'role': 'user', 'content': '1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？'}]
)

In [59]:
data.choices[0].message.content

'1.在奥运会历史上，金牌最多的国家是美国。\n2.在奥运会历史上，奖牌最多的国家是美国。'