# Models API

使用 Models API 查看和访问 OpenAI 提供的预训练大语言模型


## List Models

列出当前可用的模型，并提供每个模型的基本信息，如所有者和可用性。


In [23]:
import os
from openai import OpenAI
client = OpenAI(base_url="https://aihubmix.com/v1")

models = client.models.list()

In [2]:
print(models)

SyncPage[Model](data=[Model(id='gpt-3.5-turbo-1106', created=1698959748, object='model', owned_by='system'), Model(id='dall-e-3', created=1698785189, object='model', owned_by='system'), Model(id='gpt-4-0613', created=1686588896, object='model', owned_by='openai'), Model(id='dall-e-2', created=1698798177, object='model', owned_by='system'), Model(id='gpt-3.5-turbo-0125', created=1706048358, object='model', owned_by='system'), Model(id='gpt-4', created=1687882411, object='model', owned_by='openai'), Model(id='whisper-1', created=1677532384, object='model', owned_by='openai-internal'), Model(id='tts-1-hd-1106', created=1699053533, object='model', owned_by='system'), Model(id='gpt-3.5-turbo', created=1677610602, object='model', owned_by='openai'), Model(id='tts-1-hd', created=1699046015, object='model', owned_by='system'), Model(id='gpt-4-0125-preview', created=1706037612, object='model', owned_by='system'), Model(id='gpt-4-turbo-preview', created=1706037777, object='model', owned_by='syst

#### 查看 OpenAI 最新提供的模型 API 信息

`models.data`: 目前 OpenAI 提供的大语言模型列表，列表中的每一项都对应着一个模型实例。

以`GPT-3.5-Turbo`模型为例，解释说明各项参数：

1. `created`: 这是模型创建的时间戳，单位为 Unix 时间戳（自 1970 年 1 月 1 日（00:00:00 GMT）以后的秒数）。
2. `id`: 这是模型的唯一标识符。在这个例子中，模型的 ID 是 "text-davinci-003"。
3. `object`: 这个字段表示的是当前对象的类型，在这个例子中，对象是 "model"，说明这个 JSON 对象是一个模型。
4. `owned_by`: 这个字段表示的是模型的所有者，在这个例子中，模型的所有者是 "openai-internal"。


In [3]:
models.data

[Model(id='gpt-3.5-turbo', created=1626777600, object='model', owned_by='OpenAI', permission=[{'id': 'modelperm-LwHkVFn8AcMItP432fKKDIKJ', 'object': 'model_permission', 'created': 1626777600, 'allow_create_engine': True, 'allow_sampling': True, 'allow_logprobs': True, 'allow_search_indices': False, 'allow_view': True, 'allow_fine_tuning': False, 'organization': '*', 'group': None, 'is_blocking': False}], root='gpt-3.5-turbo', parent=None),
 Model(id='gpt-3.5-turbo-0613', created=1626777600, object='model', owned_by='OpenAI', permission=[{'id': 'modelperm-LwHkVFn8AcMItP432fKKDIKJ', 'object': 'model_permission', 'created': 1626777600, 'allow_create_engine': True, 'allow_sampling': True, 'allow_logprobs': True, 'allow_search_indices': False, 'allow_view': True, 'allow_fine_tuning': False, 'organization': '*', 'group': None, 'is_blocking': False}], root='gpt-3.5-turbo-0613', parent=None),
 Model(id='gpt-3.5-turbo-1106', created=1626777600, object='model', owned_by='OpenAI', permission=[{'i

### 获取模型 ID 列表


In [4]:
models.data[0].id

'gpt-3.5-turbo'

In [5]:
model_list = [model.id for model in models.data]

In [6]:
print(model_list)

['gpt-3.5-turbo', 'gpt-3.5-turbo-0613', 'gpt-3.5-turbo-1106', 'gpt-3.5-turbo-0125', 'gpt-3.5-turbo-16k', 'gpt-3.5-turbo-instruct', 'gpt-4', 'gpt-4-0613', 'gpt-4-1106-preview', 'gpt-4-0125-preview', 'gpt-4-32k', 'gpt-4-turbo-preview', 'gpt-4-turbo', 'gpt-4-turbo-2024-04-09', 'gpt-4o', 'gpt-4o-2024-05-13', 'gpt-4o-2024-08-06', 'gpt-4o-2024-11-20', 'chatgpt-4o-latest', 'gpt-4o-mini', 'gpt-4o-mini-2024-07-18', 'gpt-4-vision-preview', 'text-embedding-ada-002', 'text-embedding-3-small', 'text-embedding-3-large', 'text-curie-001', 'text-babbage-001', 'text-ada-001', 'text-davinci-002', 'text-davinci-003', 'text-moderation-latest', 'text-moderation-stable', 'text-davinci-edit-001', 'davinci-002', 'babbage-002', 'dall-e-2', 'dall-e-3', 'whisper-1', 'tts-1', 'tts-1-hd', 'o1', 'o1-2024-12-17', 'o1-preview', 'o1-preview-2024-09-12', 'o1-mini', 'o1-mini-2024-09-12', 'claude-3-haiku-20240307', 'claude-3-5-haiku-20241022', 'claude-3-sonnet-20240229', 'claude-3-opus-20240229', 'claude-3-5-sonnet-20240

## Retrieve Model

根据前面查询到当前支持的模型 ID 列表，获取指定模型实例，如`gpt-3.5-turbo`。


In [7]:
from openai import OpenAI
client = OpenAI(base_url="https://aihubmix.com/v1")

# 将模型 ID 传入 retrieve 接口
gpt_3 = client.models.retrieve("gpt-3.5-turbo")

In [8]:
print(gpt_3)

Model(id='gpt-3.5-turbo', created=1626777600, object='model', owned_by='OpenAI', permission=[{'id': 'modelperm-LwHkVFn8AcMItP432fKKDIKJ', 'object': 'model_permission', 'created': 1626777600, 'allow_create_engine': True, 'allow_sampling': True, 'allow_logprobs': True, 'allow_search_indices': False, 'allow_view': True, 'allow_fine_tuning': False, 'organization': '*', 'group': None, 'is_blocking': False}], root='gpt-3.5-turbo', parent=None)


### 获取指定模型，如 GPT-4V


In [9]:
client.models.retrieve("gpt-4-vision-preview")

Model(id='gpt-4-vision-preview', created=1626777600, object='model', owned_by='OpenAI', permission=[{'id': 'modelperm-LwHkVFn8AcMItP432fKKDIKJ', 'object': 'model_permission', 'created': 1626777600, 'allow_create_engine': True, 'allow_sampling': True, 'allow_logprobs': True, 'allow_search_indices': False, 'allow_view': True, 'allow_fine_tuning': False, 'organization': '*', 'group': None, 'is_blocking': False}], root='gpt-4-vision-preview', parent=None)

# 文本内容补全初探（Completions API）[Legacy]

使用 Completions API 实现各类文本生成任务

主要请求参数说明：

- **`model`** （string，必填）

  要使用的模型的 ID。可以参考 **模型端点兼容性表**。

- **`prompt`** （string or array，必填，Defaults to ）

  生成补全的提示，编码为字符串、字符串数组、token 数组或 token 数组数组。

  注意，这是模型在训练过程中看到的文档分隔符，所以如果没有指定提示符，模型将像从新文档的开头一样生成。

- **`stream`** （boolean，选填，默认 false）

  当它设置为 true 时，API 会以 SSE（ Server Side Event ）方式返回内容，即会不断地输出内容直到完成响应，流通过 `data: [DONE]` 消息终止。

- **`max_tokens`** （integer，选填，默认是 16）

  补全时要生成的最大 token 数。

  提示 `max_tokens` 的 token 计数不能超过模型的上下文长度。大多数模型的上下文长度为 2048 个 token（最新模型除外，它支持 4096）

- **`temperature`** （number，选填，默认是 1）

  使用哪个采样温度，在 **0 和 2 之间**。

  较高的值，如 0.8 会使输出更随机，而较低的值，如 0.2 会使其更加集中和确定性。

  通常建议修改这个（`temperature` ）或 `top_p` 但两者不能同时存在，二选一。

- **`n`** （integer，选填，默认为 1）

  每个 `prompt` 生成的补全次数。

  注意：由于此参数会生成许多补全，因此它会快速消耗 token 配额。小心使用，并确保对 `max_tokens` 和 `stop` 进行合理的设置。

## 生成英文文本


In [None]:
import os
from openai import OpenAI

client = OpenAI(base_url="https://aihubmix.com/v1")

data = client.completions.create(
  model="gpt-3.5-turbo-instruct",
  prompt="Say this is a test",
  max_tokens=7,
  temperature=0
)

NotFoundError: Error code: 404 - {'error': {'message': 'This is a chat model and not supported in the v1/completions endpoint. Did you mean to use v1/chat/completions? (request id: 2025030803330737896604468383860)', 'type': 'invalid_request_error', 'param': 'model', 'code': None}}

In [11]:
print(data)

Completion(id='cmpl-B8fD8DuKJcJW4xitganB6HvZz4C8P', choices=[CompletionChoice(finish_reason='stop', index=0, logprobs=None, text='\n\nThis is a test.', content_filter_results={'hate': {'filtered': False, 'severity': 'safe'}, 'self_harm': {'filtered': False, 'severity': 'safe'}, 'sexual': {'filtered': False, 'severity': 'safe'}, 'violence': {'filtered': False, 'severity': 'safe'}})], created=1741404738, model='gpt-3.5-turbo-instruct', object='text_completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=6, prompt_tokens=5, total_tokens=11, completion_tokens_details=None, prompt_tokens_details=None), prompt_filter_results=[{'prompt_index': 0, 'content_filter_results': {'hate': {'filtered': False, 'severity': 'safe'}, 'self_harm': {'filtered': False, 'severity': 'safe'}, 'sexual': {'filtered': False, 'severity': 'safe'}, 'violence': {'filtered': False, 'severity': 'safe'}}}])


In [12]:
text = data.choices[0].text

In [13]:
print(text)



This is a test.


## 生成中文文本

调整 `max_tokens`


In [None]:
data = client.completions.create(
  model="Qwen/QwQ-32B",
  prompt="讲5个给程序员听得笑话",
  max_tokens=1000,
  temperature=0.5
)

BadRequestError: Error code: 400 - {'error': {'message': 'The completion operation does not work with the specified model, gpt-4o-mini. Please choose different model and try again. You can learn more about which models can be used with each operation here: https://go.microsoft.com/fwlink/?linkid=2197993. (request id: 2025030803500273704160591661553)', 'type': '', 'param': '', 'code': 'OperationNotSupported'}}

In [20]:
text = data.choices[0].text
print(text)


当然，以下是五个适合程序员的笑话，希望你喜欢：

---

### 1. **二进制笑话**
**程序员**走进一家酒吧， bartender 问：“要来杯什么？”  
程序员回答：“给我一杯 10 进制的啤酒。”  
bartender 一脸困惑：“你确定是 10 进制吗？”  
程序员点头：“是的，10 进制。”  
bartender 拿出一杯啤酒，程序员喝了一口，突然大喊：“等等，这杯啤酒有毒！”  
bartender 笑着说：“别担心，我数到你的时候才给你下毒。刚才那杯是第 1 杯，而 10 在二进制里其实是 2，所以我还没到呢。”

---

### 2. **递归笑话**
程序员对他的朋友说：“我最近学会了一种新的语言，叫‘递归’。”  
朋友问：“听起来很有趣，你能举个例子吗？”  
程序员回答：“当然，递归就是……呃……递归就是……呃……递归就是……”  
（无限循环中）

---

### 3. **调试笑话**
有一天，一个程序员在调试代码时，突然大喊：“我找到了！这个 bug 就在第 42 行！”  
他的同事跑过来问：“真的吗？快告诉我怎么解决！”  
程序员叹了口气：“不，我只是把它移到第 43 行，这样 bug 就在第 43 行了。”

---

### 4. **程序员的浪漫**
程序员向女友求婚，女友问：“你愿意为我做任何事吗？”  
程序员回答：“当然，只要给出时间复杂度和空间复杂度的保证。”  
女友无奈：“我只想知道你愿不愿意和我结婚。”  
程序员：“哦，这很简单，时间复杂度是 O(1)，空间复杂度也是 O(1)。我愿意。”

---

### 5. **程序员的咖啡**
程序员走进咖啡店，点了一杯咖啡。  
咖啡师问：“要加糖吗？”  
程序员回答：“不用，我已经在代码里加了糖，现在我的咖啡是甜的。”  
咖啡师一脸懵：“那你的咖啡现在是什么味道？”  
程序员：“苦……等等，我是不是把糖放成了盐？”

---

希望这些笑话能让你会心一笑！ 😄💻

---

如果需要更多程序员相关的幽默，随时告诉我！😄

---

### 额外加送一个：
**程序员和数学家的区别**  
数学家走进一家酒吧， bartender 问：“要一杯吗？”  
数学家说：“当然，给我一杯水。”  
bartender 递过去，数学家喝了一口

## 生成 Python 代码，并执行和验证

以面试中考察的典型的试题 `快速排序` 为例


In [30]:
data = client.completions.create(
  model="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
  prompt="生成可执行的快速排序 Python 代码",
  max_tokens=1000,
  temperature=0
)


In [31]:
text = data.choices[0].text
print(text)

，包含以下内容：
- 生成一个随机的整数数组，包含10个元素。
- 写一个快速排序的函数，包含以下参数：
   - arr: 整数数组
   - pivot: 可选参数，指定排序的基准元素
- 写一个测试函数，测试快速排序的正确性，包含以下参数：
   - arr: 整数数组
   - expected: 整数数组
- 生成一个包含10个元素的随机整数数组，作为测试用例。
- 执行排序函数，并将结果存储在sorted_arr。
- 检查排序是否正确。
- 所有测试都必须在同一个测试函数中完成，不使用任何额外的函数或模块。
- 请确保代码中的随机数生成是可复现的，即每次运行测试函数时，生成的数组都是相同的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。
- 请确保代码中的随机数生成是均匀分布的，即每个元素出现的概率相同。
- 请确保代码中的随机数生成是独立的，即每次运行测试函数时，生成的数组都是独立的。


#### Prompt：Jupyter Notebook 中执行生成的代码

Prompt：

```
我现在用 Completion API 生成了 Python 代码，并以字符串形式存放在 text 中，如下所示：

text = data.choices[0].text
print(text)

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = [x for x in arr[1:] if x <= pivot]
    right = [x for x in arr[1:] if x > pivot]
    return quick_sort(left) + [pivot] + quick_sort(right)

如何在 Jupyter notebook 中执行text中存放的这段代码
```


In [18]:
# `exec` 函数会执行传入的字符串作为 Python 代码。
# 在这个例子中，我们使用 `exec` 来定义了一个 `quick_sort` 函数，然后你就可以调用这个函数了。
# 请注意，`exec` 可以执行任何 Python 代码，因此在使用它的时候一定要小心，特别是当你执行的代码来自不可信的来源时。
exec(text)

In [19]:
# 现在你可以调用这个函数了
print(quick_sort([12,3,6,8,10,1,2,1]))

[1, 1, 2, 3, 6, 8, 10, 12]


# 聊天机器人初探（Chat Completions API）

使用 Chat Completions API 实现对话任务

聊天补全(Chat Completions API)以消息列表作为输入，并返回模型生成的消息作为输出。尽管聊天格式旨在使多轮对话变得简单，但它同样适用于没有任何对话的单轮任务。

主要请求参数说明：

- **`model` （string，必填）**

  要使用的模型 ID。有关哪些模型适用于 Chat API 的详细信息

- **`messages` （array，必填）**

  迄今为止描述对话的消息列表

  - **`role` （string，必填）**

  发送此消息的角色。`system` 、`user` 或 `assistant` 之一（一般用 user 发送用户问题，system 发送给模型提示信息）

  - **`content` （string，必填）**

    消息的内容

  - **`name` （string，选填）**

    此消息的发送者姓名。可以包含 a-z、A-Z、0-9 和下划线，最大长度为 64 个字符

- **`stream` （boolean，选填，是否按流的方式发送内容）**

  当它设置为 true 时，API 会以 SSE（ Server Side Event ）方式返回内容。SSE 本质上是一个长链接，会持续不断地输出内容直到完成响应。如果不是做实时聊天，默认 false 即可。

- **`max_tokens` （integer，选填）**

  在聊天补全中生成的最大 **tokens** 数。

  输入 token 和生成的 token 的总长度受模型上下文长度的限制。

- **`temperature` （number，选填，默认是 1）**

  采样温度，在 0 和 2 之间。

  较高的值，如 0.8 会使输出更随机，而较低的值，如 0.2 会使其更加集中和确定性。

  通常建议修改这个（`temperature` ）或者 `top_p` ，但两者不能同时存在，二选一。


## 开启聊天模式

使用 `messages` 记录迄今为止对话的消息列表


In [33]:
from openai import OpenAI
client = OpenAI(base_url="https://aihubmix.com/v1")

messages=[
    {
        "role": "user", 
        "content": "Hello!"
    }
]


data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages = messages
)


In [34]:
print(data)

ChatCompletion(id='chatcmpl-B8fbYTWgck1YyYyqLsXgGEaJPdvvt', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='Hello! How can I assist you today?', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1741406252, model='gpt-3.5-turbo-0125', object='chat.completion', service_tier=None, system_fingerprint='fp_0165350fbb', usage=CompletionUsage(completion_tokens=9, prompt_tokens=9, total_tokens=18, completion_tokens_details=None, prompt_tokens_details=None))


In [35]:
# 从返回的数据中获取生成的消息
new_message = data.choices[0].message
# 打印 new_message
print(new_message)

ChatCompletionMessage(content='Hello! How can I assist you today?', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)


In [36]:
# 将消息追加到 messages 列表中
messages.append(new_message)
print(messages)

[{'role': 'user', 'content': 'Hello!'}, ChatCompletionMessage(content='Hello! How can I assist you today?', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)]


In [37]:
type(new_message)

openai.types.chat.chat_completion_message.ChatCompletionMessage

In [38]:
new_message.role

'assistant'

In [39]:
new_message.content

'Hello! How can I assist you today?'

In [40]:
messages.pop()

ChatCompletionMessage(content='Hello! How can I assist you today?', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)

In [41]:
print(messages)

[{'role': 'user', 'content': 'Hello!'}]


#### Prompt: OpenAIObject -> Dict

```
打印 messages 列表后发现数据类型不对，messages 输出如下：

print(messages)

[{'role': 'user', 'content': 'Hello!'}, <OpenAIObject at 0x7f27582c13f0> JSON: {
  "content": "Hello! How can I assist you today?",
  "role": "assistant"
}]

将OpenAIObject 转换为一个如下数据类型格式：

    {
        "role": "user",
        "content": "Hello!"
    }
```


In [29]:
new_message = data.choices[0].message
new_message_dict = {"role": new_message.role, "content": new_message.content}
type(new_message_dict)

dict

In [30]:
print(new_message_dict)

{'role': 'assistant', 'content': 'Hello! How can I assist you today?'}


In [31]:
# 将消息追加到 messages 列表中
messages.append(new_message_dict)

In [32]:
print(messages)

[{'role': 'user', 'content': 'Hello!'}, {'role': 'assistant', 'content': 'Hello! How can I assist you today?'}]


#### 新一轮对话


In [33]:
new_chat = {
    "role": "user",
    "content": "1.讲一个程序员才听得懂的冷笑话；2.今天是几号？3.明天星期几？"
}

In [34]:
messages.append(new_chat)

In [35]:
from pprint import pprint

pprint(messages)

[{'content': 'Hello!', 'role': 'user'},
 {'content': 'Hello! How can I assist you today?', 'role': 'assistant'},
 {'content': '1.讲一个程序员才听得懂的冷笑话；2.今天是几号？3.明天星期几？', 'role': 'user'}]


In [36]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)

In [37]:
new_message = data.choices[0].message
# 打印 new_messages 
print(new_message)

ChatCompletionMessage(content='1. 为什么程序员喜欢买冰淇淋？因为他们喜欢“冰”啊！\n2. 今天是几号？很抱歉，我无法提供实时日期信息。\n3. 明天是星期几？同样，我无法提供准确的明天日期信息。您可以查看手机或者其他工具来确认。有什么其他问题我可以帮助您解决吗？', role='assistant', function_call=None, tool_calls=None)


In [38]:
# 打印 new_messages 内容
print(new_message.content)

1. 为什么程序员喜欢买冰淇淋？因为他们喜欢“冰”啊！
2. 今天是几号？很抱歉，我无法提供实时日期信息。
3. 明天是星期几？同样，我无法提供准确的明天日期信息。您可以查看手机或者其他工具来确认。有什么其他问题我可以帮助您解决吗？


## 使用多种身份聊天对话

目前`role`参数支持 3 类身份： `system`, `user` `assistant`:

![](images/chat_completion_api.png)


In [39]:
# 构造聊天记录
messages=[
    {"role": "system", "content": "你是一个乐于助人的体育界专家。"},
    {"role": "user", "content": "2008年奥运会是在哪里举行的？"},
]

In [40]:
import openai

data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)


In [41]:
message = data.choices[0].message.content
print(message)

2008年夏季奥运会在中国北京举行。


In [42]:
# 添加 GPT 返回结果到聊天记录
messages.append({"role": "assistant", "content": message})

In [43]:
messages

[{'role': 'system', 'content': '你是一个乐于助人的体育界专家。'},
 {'role': 'user', 'content': '2008年奥运会是在哪里举行的？'},
 {'role': 'assistant', 'content': '2008年夏季奥运会在中国北京举行。'}]

In [44]:
# 第二轮对话
messages.append({"role": "user", "content": "1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？"})

In [45]:
messages

[{'role': 'system', 'content': '你是一个乐于助人的体育界专家。'},
 {'role': 'user', 'content': '2008年奥运会是在哪里举行的？'},
 {'role': 'assistant', 'content': '2008年夏季奥运会在中国北京举行。'},
 {'role': 'user', 'content': '1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？'}]

In [46]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=messages
)

In [47]:
message = data.choices[0].message.content
print(message)

1. 2008年夏季奥运会中，金牌最多的国家是中国，共获得51枚金牌。
2. 2008年夏季奥运会中，奖牌最多的国家是中国，共获得100枚奖牌（51枚金牌、21枚银牌、28枚铜牌）。


In [48]:
data = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[{'role': 'user', 'content': '1.金牌最多的是哪个国家？2.奖牌最多的是哪个国家？'}]
)

In [49]:
data.choices[0].message.content

'1. 根据2021年东京奥运会的数据，金牌最多的国家是美国。\n\n2. 根据2021年东京奥运会的数据，奖牌最多的国家是美国。'