# 4.2 Smolagents 基本使用

### SmolAgents 框架解析

**核心定位**：Hugging Face 推出的轻量级开源 Agent 框架，以**极简代码驱动复杂任务执行**为核心设计理念，支持快速构建高效、安全的智能体系统。其代码精简（核心逻辑约千行），强调“代码即行为”的代理模式，适用于动态任务规划与多工具协同场景。

---

#### **特点**
1. **代码代理优先**  
   • 直接通过 Python 代码定义 Agent 行为，取代传统 JSON/文本指令，减少 30% 的冗余步骤。例如，调用 `CodeAgent` 生成并执行代码片段完成数学计算或搜索任务。  
   • 支持本地与远程（E2B 沙箱）代码执行，确保安全性。

2. **多模态工具生态**  
   • 集成 50+ 预置工具（如 DuckDuckGo 搜索、Google 地图 API），支持自定义工具开发并通过 `@tool` 装饰器快速注册。  
   • 无缝对接 Hugging Face Hub，可共享和复用工具模型，例如调用社区上传的医疗诊断工具。

3. **灵活模型兼容性**  
   • 支持本地 Transformers 模型、Ollama 本地部署及 OpenAI、Anthropic 等商业 API，通过 LiteLLM 实现统一接口调用。  
   • 示例：可快速切换 `HfApiModel`（云端）与 `TransformersModel`（本地）驱动 Agent。

4. **动态规划与安全执行**  
   • 基于 ReAct 框架实现多步推理循环，支持最大步数限制（默认 6 步）和规划间隔调节，动态优化任务路径。  
   • 沙箱环境隔离敏感操作，避免代码注入风险，适用于企业级部署。

---

#### **适用场景**
1. **自动化办公与数据分析**  
   • 快速构建搜索引擎 Agent（如新闻摘要、股票查询），通过代码代理直接调用 API 并生成结构化报告。  
   • 支持 SQL 生成、PDF 解析等工具链，适用于金融数据分析。

2. **教育辅助与代码生成**  
   • 解答数学问题（如生成斐波那契数列）、代码调试，通过 `CodeAgent` 直接执行 Python 代码验证结果。

3. **工业流程优化**  
   • 动态调整生产线排程，例如质检 Agent 与物流 Agent 协同，通过多工具调用实现实时决策。

---

#### **优势**
1. **开发效率高**  
   • 仅需 3 行代码即可构建基础 Agent（如搜索工具集成），显著降低开发门槛。  
   • 模块化设计支持快速原型开发，例如通过 `step_callbacks` 监控执行过程。

2. **学习曲线平缓**  
   • 提供完整文档与示例代码（如新闻搜索、旅行规划案例），新手可快速上手。

3. **安全与轻量化**  
   • 核心依赖仅需 `pip install smolagents`，无冗余组件，支持本地与云端灵活部署。  
   • 通过 `additional_authorized_imports` 控制代码执行权限，满足企业安全需求。

---

### 总结
SmolAgents 凭借其极简代码架构和强大的工具生态，正成为轻量化 Agent 开发的首选框架。与 Phidata 的全栈特性相比，SmolAgents 更擅长**动态任务分解与代码驱动执行**，适合需要快速响应和灵活工具集成的场景。开发者可通过其 [GitHub 仓库](https://github.com/huggingface/smolagents) 获取最新动态与案例代码。

In [1]:
!pip install smolagents

Collecting smolagents
  Downloading smolagents-1.12.0-py3-none-any.whl.metadata (14 kB)
Collecting requests>=2.32.3 (from smolagents)
  Using cached requests-2.32.3-py3-none-any.whl.metadata (4.6 kB)
Collecting pillow>=11.0.0 (from smolagents)
  Using cached pillow-11.1.0-cp310-cp310-win_amd64.whl.metadata (9.3 kB)
Collecting markdownify>=0.14.1 (from smolagents)
  Downloading markdownify-1.1.0-py3-none-any.whl.metadata (9.1 kB)
Collecting duckduckgo-search>=6.3.7 (from smolagents)
  Downloading duckduckgo_search-7.5.2-py3-none-any.whl.metadata (17 kB)
Collecting python-dotenv (from smolagents)
  Downloading python_dotenv-1.0.1-py3-none-any.whl.metadata (23 kB)
Collecting primp>=0.14.0 (from duckduckgo-search>=6.3.7->smolagents)
  Downloading primp-0.14.0-cp38-abi3-win_amd64.whl.metadata (13 kB)
Collecting lxml>=5.3.0 (from duckduckgo-search>=6.3.7->smolagents)
  Downloading lxml-5.3.1-cp310-cp310-win_amd64.whl.metadata (3.8 kB)
Downloading smolagents-1.12.0-py3-none-any.whl (105 kB)
D

  You can safely remove it manually.
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
dds-cloudapi-sdk 0.2.1 requires pillow==10.2.0, but you have pillow 11.1.0 which is incompatible.
dds-cloudapi-sdk 0.2.1 requires requests==2.31.0, but you have requests 2.32.3 which is incompatible.
gradio 4.22.0 requires pillow<11.0,>=8.0, but you have pillow 11.1.0 which is incompatible.


## 代码智能体

代码智能体（Code agents）是 smolagents 中的默认智能体类型。它们生成 Python 工具调用来执行操作，实现高效、表达力强且准确的操作表示。

它们的简化方法减少了所需操作的数量，简化了复杂操作，并实现了对现有代码函数的重用。smolagents 提供了一个轻量级框架，用约 1,000 行代码实现构建代码智能体（code agents）

<img src="img/code_vs_json_actions.png" width='720px' />

典型的如无人机使用多步骤智能体过程中，大语言模型（LLM）编写并执行操作，通常涉及外部工具调用。传统方法使用 JSON 格式来指定工具名称和参数作为字符串，系统必须解析这些内容以确定要执行哪个工具。

然而，研究表明，工具调用型大语言模型直接使用代码工作更有效。这是 smolagents 的核心原则，

用代码而非 JSON 编写操作提供了几个关键优势：

- 可组合性（Composability）：轻松组合和重用操作
- 对象管理（Object Management）：直接处理复杂结构，如图像，这一点在无人机Agent中特别特别重要
- 通用性（Generality）：表达任何计算上可能的任务
- 适合大语言模型：高质量代码已存在于大语言模型的训练数据中


### huggingface smolagents教程

Agent教程：https://huggingface.co/learn/agents-course/zh-CN/unit2/smolagents/introduction

smolagents教程：https://huggingface.co/docs/smolagents/v1.11.0/index