# Client

在 AutoGen 中，我们需要将使用的 LLM 配置到 Client 中，然后才能调用 LLM 构建智能体，所以如何编写和使用 Client 是我们的第一步。

本节主要介绍如何通过编写及使用 `Client`。




## 如何保存你的 API key

在调用模型 API 时最重要的是安全的保存我们的 API key，所以首先介绍两种常用的存储 API key 的方法。

法一：在代码中直接设置（建议测试用）

In [None]:
import os
os.environ["OPENAI_API_KEY"] = "skxxxxxxxxxxxx" # 你的 api key

法二：写入 `.env` 文件（推荐）

该方法将 API key 存储到运行程序外，较为安全，适合我们进行测试开发，**后面的演示我们将都使用该方法**。

当有有多个 key 时，取不同的名字做区分即可。

In [None]:
import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv("OPENAI_API_KEY") # 读取你的 OPENAI API key

print("读取到的 API Key 是：", api_key)

> 当然以上两种都是方便我们测试使用的方法，在实际的生产环境中，更多的是将 API key 存储到环境变量中，这里不做赘述。
> 想继续了解的可以参考这篇文章进行学习：https://zhuanlan.zhihu.com/p/627665725

## 如何编写 Client

`ChatCompletionClient` 是 Autogen 框架中用于封装与大模型交互的客户端类，专门用于 Chat Completion API 的请求，支持 OpenAI API 兼容的模型服务（如 OpenAI、Azure OpenAI、Anthropic、Gemini、硅基流动等）。

`autogen_core.models.ChatCompletionClient` 是**抽象基类，不能直接实例化**。所以我们必须选择其子类进行实例化，这里我们选择使用 `OpenAIChatCompletionClient` 这一最常用的子类。

> *亲测，`autogen=0.9.0` 是不能调用 `autogen.ChatCompletionClient` 的可以不必尝试了。*


### OpenAIChatCompletionClient

`OpenAIChatCompletionClient` 是基于 `ChatCompletionClient` 编写的专门对接 OpenAI 这类 API 的子类实现。在接入第三方平台的 API 时，除了更换对应的 url 外还需要添加使用的模型的 `modelinfo`。

`modelinfo` 的作用是说明你调用的模型的基本属性，需要时去对应平台的官方文档或 API文档查看模型名称列表，照着填就可以。

In [2]:
# 直接调用 OPENAI 的 API 
import os
from dotenv import load_dotenv
from autogen_ext.models.openai import OpenAIChatCompletionClient

load_dotenv()
openai_api_key = os.getenv("openai_API_KEY") # 读取你的 API key

openai_client = OpenAIChatCompletionClient(
    model="gpt-4o",                          # 模型名称
    base_url="https://api.openai.com/v1",    # API 基础地址
    api_key="你的API密钥"                     # API 密钥
)

在调用非 OpenAI 的 API 时需要补充模型对应的 `modelinfo`，表格中的属性是必填项。

| 字段名                   | 类型   |含义                                                      | 示例或推荐值            |
|--------------------------|--------|---------------------------------------------------------|------------------------|
| `family`                 | `str`  |  模型族，方便内部归类                                      | `"qwen"` 或 `"openai"` |
| `context_length`         | `int`  |  上下文最大 token 长度                                     | `8192`（看模型规格）   |
| `max_output_tokens`      | `int`  |  单次生成最大 tokens 数                                    | `2048`                 |
| `tool_choice_supported`  | `bool` |  是否支持 OpenAI 的 `tool_choice` 功能（函数调用选择）       | `False`                |
| `tool_choice_required`   | `bool` |  是否强制要求 `tool_choice`                                 | `False`                |
| `structured_output`      | `bool` |  是否支持结构化输出（如 JSON 输出能力）                    | `False`                |
| `vision`                 | `bool` |  是否支持图片输入/多模态能力                                | `False`                |
| `function_calling`       | `bool` |  是否支持 `function_call`（函数调用能力）                   | `False`                |
| `json_output`            | `bool` |  是否原生支持 JSON 格式输出                                 | `False`                |


In [3]:
# 调用非 OPENAI 的 API 
import os
from dotenv import load_dotenv
from autogen_ext.models.openai import OpenAIChatCompletionClient

load_dotenv()
other_api_key = os.getenv("OTHER_API_KEY") # 读取你的 API key

other_client = OpenAIChatCompletionClient(
    model="",                           # 模型名称
    base_url="",                        # API 基础地址
    api_key="你的API密钥",               # API 密钥
    model_info={
        "family": "qwen",              
        "context_length": 8192,        
        "max_output_tokens": 2048,     
        "tool_choice_supported": False, 
        "tool_choice_required": False,  
        "structured_output": False,     
        "vision": False,                
        "function_calling": False,      
        "json_output": True           
    }
)

### 硅基流动

下面演示如何使用 `OpenAIChatCompletionClient` 调用硅基流动的 API。

硅基流动平台的 API 获取可参考该链接：https://zhuanlan.zhihu.com/p/21156769766

In [1]:
import os
from dotenv import load_dotenv
from autogen_ext.models.openai import OpenAIChatCompletionClient

load_dotenv()
siliconflow_api_key = os.getenv("SILICONFLOW_API_KEY") # 读取你的 OPENAI API key

# 初始化 OpenAIChatCompletionClient 客户端，连接到硅基流动平台的 Qwen3-8B 模型
siliconflow_client = OpenAIChatCompletionClient(
    model="Qwen/Qwen3-8B",                # 指定要调用的模型名称，硅基流动平台上 Qwen 3-8B 模型
    base_url="https://api.siliconflow.cn/v1",  # 硅基流动平台的 API 访问地址
    api_key=siliconflow_api_key,  # 你的 API 密钥
    model_info={                        
        "family": "qwen",              
        "context_length": 8192,        
        "max_output_tokens": 2048,     
        "tool_choice_supported": True, 
        "tool_choice_required": False,  
        "structured_output": True,     
        "vision": False,                
        "function_calling": False,      
        "json_output": True           
    }
)

### Openrouter

下面演示如何简单使用`OpenAIChatCompletionClient`调用OpenRouter的API。

OpenRouter平台的API获取可参考链接：https://zhuanlan.zhihu.com/p/28203837581


In [2]:
import os
from dotenv import load_dotenv
from autogen_ext.models.openai import OpenAIChatCompletionClient

load_dotenv()
siliconflow_api_key = os.getenv("OPENROUTER_API_KEY") # 读取你的 OPENAI API key

# 初始化 OpenAIChatCompletionClient 客户端，连接到硅基流动平台的 Qwen3-8B 模型
siliconflow_client = OpenAIChatCompletionClient(
    model="qwen/qwen3-14b:free",               
    base_url="https://openrouter.ai/api/v1",       # OpenRouter的 API 访问地址
    api_key=siliconflow_api_key,  # 你的 API 密钥
    model_info={                        
        "family": "qwen",              
        "context_length": 8192,        
        "max_output_tokens": 2048,     
        "tool_choice_supported": True, 
        "tool_choice_required": False,  
        "structured_output": True,     
        "vision": False,                
        "function_calling": False,      
        "json_output": True           
    }
)

## 如何使用 Client

在使用 `OpenAIChatCompletionClient` 创建 Client 后，下面将讲解其配套的方法。

| 方法                | 功能说明                                                                                           |
| ------------------- | -------------------------------------------------------------------------------------------------- |
| `create()`          | 向模型发送一组消息，获取一次性完整回复。参数通常为消息对象列表（如 UserMessage），返回模型生成的结果。适用于标准问答、对话等场景。<br>**示例：**<br>`result = await client.create([UserMessage(content="你好", source="user")])` |
| `create_stream()`   | 向模型发送消息，获取流式（分段）回复。适合长文本或需要实时展示生成内容的场景。通常以异步生成器方式返回内容片段。<br>**示例：**<br>`async for chunk in client.create_stream([...]): print(chunk)` |
| `count_tokens()`    | 统计一段文本或一组消息的 token 数量。用于控制输入长度、避免超出模型最大上下文限制。<br>**示例：**<br>`num = client.count_tokens("你好，世界")` 或 `num = client.count_tokens([UserMessage(...)])` |
| `close()`           | 关闭客户端，释放网络连接等资源。建议在所有请求结束后调用，避免资源泄漏。<br>**示例：**<br>`await client.close()` |
| `model_info`        | 属性，返回当前模型的配置信息（如模型名称、上下文长度、支持的功能等），通常为字典格式。<br>**示例：**<br>`print(client.model_info)` |
| `capabilities`      | 属性，返回模型的能力描述（如是否支持函数调用、流式输出、图片输入等），用于判断模型支持的高级特性。<br>**示例：**<br>`print(client.capabilities)` |

---

**说明：**  
- `create()` 和 `create_stream()` 是最常用的生成方法，分别对应一次性输出和流式输出。
- `count_tokens()` 有助于输入长度管理。
- `model_info` 和 `capabilities` 便于了解和判断模型的详细能力。
- `close()` 用于资源管理，尤其在异步环境下非常重要。

### create()

`OpenAIChatCompletionClient.create()` 用于发起一次完整的对话请求，异步获取生成的完整响应。

> 使用场景：普通对话、文本生成、总结、问答

- 用途：向大模型发起一次完整的对话请求，获取模型的最终生成结果。

- 异步：该方法是一个异步协程，需要在异步函数中使用 await。

- 兼容：与 OpenAI 原生 chat/completions API 保持一致，但加入了 autogen 层的统一参数管理。

| 参数名             | 类型         | 说明                                                         |
|--------------------|--------------|--------------------------------------------------------------|
| messages           | 列表         | 对话消息对象列表（必须为 `SystemMessage`、`UserMessage`、`AssistantMessage` 或 `FunctionExecutionResultMessage`）         |
| tools              | 列表，可选   | 可用工具或工具描述，支持函数调用等高级功能                   |
| json_output        | bool/类型，可选 | 是否要求模型输出 JSON，或指定输出的 Pydantic 模型类型        |
| extra_create_args  | 字典，可选   | 额外参数（如 temperature、max_tokens 等）                    |
| cancellation_token | 对象，可选   | 用于取消请求的令牌     |



**返回值**：返回一个 `CreateResult` 对象，包含模型生成的回复内容及相关信息。


参考：https://microsoft.github.io/autogen/dev/reference/python/autogen_core.models.html#



In [2]:
from autogen_core.models import UserMessage

result = await siliconflow_client.create([
    UserMessage(content="请介绍一下AutoGen框架。", source="user")
])
print(result)
await siliconflow_client.close()

finish_reason='stop' content='AutoGen框架是由微软开发的一种**多智能体协作的AI框架**，旨在通过模拟多个AI智能体之间的协作实现更复杂、更高效的任务处理和决策过程。它的核心理念是让AI角色（如助手、角色扮演者、用户代理等）在对话中根据任务需求动态分配角色和职责，从而完成人机协同工作的目标。\n\n---\n\n### **1. 架构特点**\nAutoGen的架构基于**多智能体系统（Multi-Agent Systems）**，允许不同AI智能体（Agent）之间通过对话进行交互。主要特点包括：\n- **角色多样性**：每个智能体可以被赋予特定角色（如研究者、表演者、口语者、检验者等），并根据角色设定不同的行为模式和能力。\n- **分布式协作**：智能体可以并行运行，通过消息传递机制进行任务分工和结果汇总。\n- **动态任务分配**：根据任务需求，框架能自动决定哪些角色参与、如何角色切换。\n- **支持多种模型**：兼容大语言模型（LLMs）如GPT、LLaMA、Baichuan等，并可以结合现有工具（如API、数据库）使用。\n\n---\n\n### **2. 核心组件**\n#### **(1) 智能体（Agent）**\n- **用户代理（UserProxyAgent）**：用于引导或干预智能体之间的对话。\n- **助手代理（AssistantAgent）**：执行任务的核心代理，基于LLM生成响应。\n- **角色代理（ConversableAgent）**：可自定义角色的代理，实现多角色交互（如研究员、审稿人等）。\n- **群组代理（GroupChat）**：管理多个智能体之间的协作流程，实现**多智能体会话**（Group Chat）。\n\n#### **(2) 工作流程**\n- **初始化**：定义智能体及其角色、职责和目标。\n- **任务分派**：用户代理或群组代理分配任务。\n- **智能体协作**：各代理根据角色生成回复，可能进行多轮对话或分工。\n- **结果输出**：最终结果由用户代理或指定代理汇总并返回。\n\n---\n\n### **3. 主要功能**\n1. **会话管理（Conversation Management）**  \n   支持复杂对话流程，如多跳对话（mul

### count_tokens（）

`count_tokens()` 方法用于统计一段文本或一组消息在当前模型下会被分成多少个 token（分词单元）。  
这对于控制输入长度、避免超过模型最大上下文限制非常重要。

**常见应用场景：**

- 输入长度控制：确保输入不会超过模型的最大 token 限制（如 8192）。
- 动态截断：根据 token 数量自动截断过长的输入。
- 计费估算：部分模型按 token 数量计费，可用此方法预估消耗。

**注意事项：**

- 不同模型的分词方式不同，同样的文本在不同模型下 token 数量可能不同。
- 该方法通常为同步方法（即不用 await），但具体实现请参考实际 Client 文档。


In [15]:
from autogen_core.models import UserMessage

# 用 UserMessage 包装你的文本，放到列表里
num = siliconflow_client.count_tokens([UserMessage(content="你好，AutoGen！", source="user")])
print(num)  # 输出 token 数量

Model qwen/qwen3-14b:free not found. Using cl100k_base encoding.


27


In [9]:
# 统计多条消息的 token 数量
from autogen_core.models import UserMessage

messages = [
    UserMessage(content="你好", source="user"),
    UserMessage(content="请介绍一下AutoGen。", source="user")
]

num = siliconflow_client.count_tokens(messages)
print(num)

Model qwen/qwen3-14b:free not found. Using cl100k_base encoding.


38


### create_stream()

`create_stream()` 是 LLM Client 的流式生成方法，用于将消息发送给大语言模型，并**实时分段返回**生成内容。  
适合长文本生成、实时展示、边生成边处理等场景。

**应用场景：**

- **长文本生成**：如代码生成、文档写作、小说创作等。
- **实时对话**：聊天机器人、智能客服等需要即时响应的场景。
- **前端流式展示**：网页、终端等界面实时显示生成内容。


**主要特点**

- **流式输出**：模型生成内容时，客户端可以一边接收一边处理，无需等待全部生成完毕。
- **异步生成器**：通常以 `async for` 的方式遍历每个内容片段。
- **节省等待时间**：用户体验更好，适合对响应速度要求高的应用。

**注意事项**

- 需要在支持异步的环境下使用（如 Jupyter Notebook、异步脚本等）。
- 消息参数格式与 `create()` 方法一致，需传入消息对象列表。
- 不同模型和 Client 对流式支持程度不同，具体请查阅对应文档。

In [3]:
from autogen_core.models import UserMessage

messages = [UserMessage(content="请详细介绍AutoGen框架。", source="user")]

# 流式获取模型输出
async for chunk in siliconflow_client.create_stream(messages):
    print(chunk, end="")  # 每次输出一段内容

AutoGen 是由微软亚洲研究院（MSRA）开源的一套 **多智能体协作框架**，旨在通过自动化以及智能体之间的协作来简化大规模 AI 应用开发，同时提升 AI 剧本编写和执行的效率。其核心目标是让用户能够更专注于业务逻辑，而无需手动编码处理复杂的 AI 协作流程。

---

## 一、核心理念

 **AI 剧本**（AI Playbooks）概念，即通过预定义角色、行为规则、任务目标和协作流程，使 **多个 AI 智能体（Agent）** 能够自动化地完成复杂的任务。它强调以下几点：

1. **模块化和可扩展性**  
   每个智能体（Agent）可以独立开发、测试和部署，同时通过框架提供接口进行协作。

2. **角色驱动的行为设计**  
，通过角色间的交互实现动态流程控制。

自动化任务执行**  
   智能体自动完成任务，例如数据收集、问题解答、代码生成等。

4. **基于 LLM 的动态决策**  
智能体的行为可以通过大语言模型（LLM）的输出动态调整，从而实现灵活的协作。

---

## 二、主要组件

 框架由以下核心组件构成：

### 1. **Role（角色）**
每个智能体都有一个角色，角色包含以下属性：
：表示该智能体在协作中要完成的任务。
外部环境或其它角色互动。n）**：角色如何与
生成行为决策。制（Reasoning）**：角色如何利用 LLM 

#### 常见角色类型：
：负责与用户交互，收集需求，并在无需 AI 参与时完成操作（如发送完成信号）。
文本、执行推理等。tantAgent（助理代理）**：负责处理一般任务，如回答问题、生成
话的启动点，负责初始化角色并控制流程的开始。gent（会话起点代理）**：作为协作会
）**：用于管理多个代理人之间的动态对话，支持多角色协作。
）。**LLM（大语言模型）**：用户自定义使用的语言模型（如 GPT、Qwen、RAG 等

---

### 2. **Flow Management（流程管理）**
Termination Condition）** 和 **行为规划（Action Planning）** 的流程控制机制，用于协调多个 AI 智能体的协作顺序和终止条件。

#### 关键概念：
动态调整智能体之间的对话流程，例如强制指定某些智能体执行某些子任务。
角

## Reference

1. https://microsoft.github.io/autogen/stable/reference/python/autogen_core.models.html#autogen_core.models.ChatCompletionClient
2. https://microsoft.github.io/autogen/dev/user-guide/agentchat-user-guide/tutorial/models.html
3. https://microsoft.github.io/autogen/dev/reference/python/autogen_ext.models.openai.html#autogen_ext.models.openai.OpenAIChatCompletionClient
4. https://docs.siliconflow.cn/cn/api-reference/chat-completions/chat-completions