# [API](https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2712576)调用 

----

- Temperature：调高 temperature 会增加其他可能的 token 的权重，导致更随机（或者说，可能更有创造性）的结果。  
- Top_p：Top P意味着只有词元集合（tokens）中包含top_p概率质量的才会被考虑用于响应，因此较低的top_p值会选择最有信心的响应（更低的多样性）。

> 一般建议只改变 Temperature 和 Top P 其中之一。

- Max Length：控制生成的 token 数。有助于防止大模型生成冗长或不相关的响应并控制成本。  
- Stop Sequences：指定 stop sequences 是控制大模型响应长度和结构的另一种方法。输出停止由特定字符串的出现触发。

> 避免说太多，利于格式化输出。

- Frequency Penalty：减少响应中单词的重复，惩罚和 token 出现次数成比例。  
- Presence Penalty：该惩罚与token的重复次数无关。施加惩罚会导致更多样（更不专注）的内容。

> 一般建议只改变 frequency penalty 和 presence penalty 其中之一。

----

#### 示例代码1 普通使用

In [None]:
import os
from openai import OpenAI
from dotenv import load_dotenv

# 加载 .env 文件中的环境变量
load_dotenv()

client = OpenAI(
    # 若没有配置环境变量，请用百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    # 模型列表：https://help.aliyun.com/zh/model-studio/getting-started/models
    model="qwen-plus",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "你是谁？"},
    ],
    # Qwen3模型通过enable_thinking参数控制思考过程（开源版默认True，商业版默认False）
    # 使用Qwen3开源版模型时，若未启用流式输出，请将下行取消注释，否则会报错
    # extra_body={"enable_thinking": False},
)
print(completion.model_dump_json())

print(completion.choices[0].message.content)

{"id":"chatcmpl-3e6de4b9-962c-4f9d-a1ac-247c3a8a571a","choices":[{"finish_reason":"stop","index":0,"logprobs":null,"message":{"content":"我是通义千问，阿里巴巴集团旗下的超大规模语言模型。我能够回答问题、创作文字，比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等，还能表达观点，玩游戏等。如果你有任何问题或需要帮助，欢迎随时告诉我！","refusal":null,"role":"assistant","annotations":null,"audio":null,"function_call":null,"tool_calls":null}}],"created":1758378348,"model":"qwen-plus","object":"chat.completion","service_tier":null,"system_fingerprint":null,"usage":{"completion_tokens":60,"prompt_tokens":22,"total_tokens":82,"completion_tokens_details":null,"prompt_tokens_details":{"audio_tokens":null,"cached_tokens":0}}}
我是通义千问，阿里巴巴集团旗下的超大规模语言模型。我能够回答问题、创作文字，比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等，还能表达观点，玩游戏等。如果你有任何问题或需要帮助，欢迎随时告诉我！


In [None]:
{
"id":"chatcmpl-3e6de4b9-962c-4f9d-a1ac-247c3a8a571a",
"choices":[
    {
    "finish_reason":"stop", # 生成结束原因（遇到了结束标记，正常结束，未达最大长度或被过滤）
    "index":0,              # 当前回复在 choices 列表中的序号（默认生成一个回复）
    "logprobs":null,        # 生成时每个token的对数概率（如未开启概率输出则为null）
    "message":{
        "content":"我是通义千问，阿里巴巴集团旗下的超大规模语言模型。我能够回答问题、创作文字，比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等，还能表达观点，玩游戏等。如果你有任何问题或需要帮助，欢迎随时告诉我！",
        "refusal":null,     # 如果模型拒答，这里会有拒答原因
        "role":"assistant",
        "annotations":null, # 回复的附加注释
        "audio":null,
        "function_call":null,
        "tool_calls":null}
    }
          ],

"created":1758378348,       # 回复生成的时间戳（秒级，通常为UNIX时间）
                            # 自1970年1月1日0时0分0秒（UTC）到生成回复时所经过的秒数。
"model":"qwen-plus",
"object":"chat.completion", # 返回对象类型（如 chat.completion 表示对话生成结果）
                            # "chat.completion"、"text.completion"、"image.generation"、"function.call"
"service_tier":null,        # 服务等级
"system_fingerprint":null,  # 系统指纹
"usage":{
    "completion_tokens":60, # 本次回复生成的 token 数量
    "prompt_tokens":22,     # 输入提示词的 token 数量
    "total_tokens":82,      # 总共消耗的 token 数量（输入+输出）
    "completion_tokens_details":null,   # 生成token的详细信息
    "prompt_tokens_details":{  # 输入token的详细信息
        "audio_tokens":null,   # 没有音频相关的 token
        "cached_tokens":0}     # 没有使用缓存的 token
    }
}

#### 示例代码2 异步调用

In [1]:
import os
import asyncio
from openai import AsyncOpenAI  # 异步版
import platform

client = AsyncOpenAI(
    # 若没有配置环境变量，请用百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

async def main():
    response = await client.chat.completions.create(
        messages=[{"role": "user", "content": "你是谁"}],
        model="qwen-plus",  # 此处以qwen-plus为例，可按需更换模型名称。模型列表：https://help.aliyun.com/zh/model-studio/getting-started/models
    )
    return response.model_dump_json()

# asyncio.run(main())
result = await main()
print(result)

{"id":"chatcmpl-9c789008-9e51-4f22-b075-7e32ddc3be9c","choices":[{"finish_reason":"stop","index":0,"logprobs":null,"message":{"content":"我是通义千问，阿里巴巴集团旗下的超大规模语言模型。我能够回答问题、创作文字，如写故事、公文、邮件、剧本等，还能进行逻辑推理、编程，表达观点，玩游戏等。我支持多种语言，包括但不限于中文、英文、德语、法语、西班牙语等。如果你有任何问题或需要帮助，欢迎随时告诉我！","refusal":null,"role":"assistant","annotations":null,"audio":null,"function_call":null,"tool_calls":null}}],"created":1758937054,"model":"qwen-plus","object":"chat.completion","service_tier":null,"system_fingerprint":null,"usage":{"completion_tokens":79,"prompt_tokens":10,"total_tokens":89,"completion_tokens_details":null,"prompt_tokens_details":{"audio_tokens":null,"cached_tokens":0}}}


#### 示例代码3、4 联网与流式输出

In [None]:
import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量，请用百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
    model="qwen-plus",  # 此处以qwen-plus为例，可按需更换模型名称。模型列表：https://help.aliyun.com/zh/model-studio/getting-started/models
    messages=[
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': '中国队在巴黎奥运会获得了多少枚金牌'}],
    extra_body={
        "enable_search": True
    },                  # 联网搜索

    stream=True,        # 启用流式输出，边生成边返回内容
    stream_options={"include_usage": True}  # 在流式输出时也返回用量统计信息
    )

print(type(completion))

#for chunk in completion:
#    print(chunk.model_dump_json())

for chunk in completion:
    if hasattr(chunk, "choices") and chunk.choices and hasattr(chunk.choices[0], "delta"):
        # 安全地从 delta 中获取 content 属性，没有则返回None，不会因属性不存在而报错
        content = getattr(chunk.choices[0].delta, "content", None)
        if content:
            print(content, end="", flush=True)  # 强制刷新缓冲区

<class 'openai.Stream'>
根据2024年巴黎奥运会的最终成绩，中国体育代表团共获得了**40枚金牌**。

此外，中国队还获得了27枚银牌和24枚铜牌，总计91枚奖牌。这一成绩创造了中国境外参加奥运会的最佳战绩，并且在金牌榜上与美国并列第一。