# <center>基于DeepResearch Agent构建企业级自动化调研系统</center>

# 1. 基础概念讲解  

## 什么是deepresearch ？

### 1. 这到底是什么？

**Deep Research（深度研究）**是给 AI 加上“认真做功课”的能力：
它不是随口回答的一句话搜索结果，而是**花一段时间在全网找资料、对照多个来源、再写出带脚注的结论**。可以把它理解成“会自己找资料的研究助理”。

### 2. 为什么会出现这个概念？

* **原来的 AI 更像“快问快答”**：适合查事实，不擅长**跨很多网页/文档**、要**相互印证**、还得**留出证据**的任务。
* **真实工作里需要“研究级”产出**：投研尽调、政策扫描、竞品情报、选型评审，都强调**多源信息+可核验**。
* **大厂同步产品化**：Google 在 2024 年底把 Deep Research 放进 Gemini；OpenAI 在 2025 年把“Deep Research”做成 ChatGPT 的一个能力；Perplexity 在 2025 年也上线同名功能。**多家同时推进，说明它不是一家公司自造的噱头，而是行业共识。**


### 3. 它“解决的痛点”到底是什么？

**把“需要认真查证的复杂问题”，从“快答”升级为“有根据的研究结论”。**
具体体感是三点：

1. **把分散的信息找全**：自动做多次搜索、读很多来源（新闻、报告、PDF 等），不是只看一两篇。
2. **把彼此矛盾的说法理清**：会对比、会指出争议点与不确定处。
3. **把证据带回来**：输出**可核验的引用/脚注**，方便复查与给老板/法务看。

### 4. 它“怎么做”的

把 Deep Research 想成一个**耐心的“长流程”**：

1. **先把题目拆清楚**（要回答哪些小问题？）
2. **去找足够多的资料**（一次不够就多次搜索/多站点浏览）
3. **做对照与筛选**（哪些更权威？哪些互相矛盾？）
4. **写出可复查的结论**（分点表达+脚注/来源列表）
5. **说明边界**（哪里还不确定、还需要人来判断）
   — 这也是 OpenAI、Google、Perplexity 官方对“Deep Research”的共同描述：**多步检索→综合→带引用**。

### 5. 它和“普通联网回答/搜索”有何本质差异？

* **目标不同**：普通联网回答追求“**快**”；Deep Research 追求“**可信且完整**”。
* **过程不同**：普通回答像“一次抓取”；Deep Research 是“**反复查证**”。
* **结果不同**：普通回答常只有结论；Deep Research 会有**结构化报告+脚注**。


### 6. 适配哪些场景？

* **投研/尽调/咨询**：行业扫描、竞品与监管比对、风险清单。
* **市场与传播**：议题研究、辟谣与溯源、媒体背景包。
* **科研/政策**：综述、争议点收敛、法规时间线与条款对照。
* **技术/采购选型**：参数、口碑、TCO、SLA、社区活跃度对照表。
  这些都需要**多来源+可核验**，Deep Research 正对口。Google 与 OpenAI 的官方介绍也把它定位为**处理“复杂研究任务”的助手**。

### 7. 它“不是可有可无的小功能”

* **多家落地→行业共识**：Google（Gemini）、OpenAI（ChatGPT）、Perplexity 同期推出“Deep Research”，共同强调“**花时间**在检索和综合上，交付**带引用**的综合报告”。这说明它是 AI 从“聊天”走向“**能完成真正研究工作**”的一步。
* **媒体评价点**：例如《卫报》报道提到 OpenAI 的 Deep Research 目标是达到研究分析师级别的报告，强调**时间节省与质量**，同时提醒**输出仍需人类核验**——这是“专业工具”的定位而非玩具。
* **产品延展**：Google 甚至把 Deep Research 的报告做成**音频播客**（Audio Overviews）等衍生形态，进一步说明它承载“**系统性内容**”。

### 8. 能力边界与使用提醒

* **不是所有题都要用 Deep Research**：简单事实题用普通回答更高效；Deep Research 适合“**需要证据链**”的问题。
* **不是“绝对正确”**：它仍可能误判来源或忽略少数重要证据，**要看脚注、要抽查**。官方与媒体都建议保留**人类复核**环节。
* **时间换质量**：Deep Research 通常比普通回答**更慢**，因为确实在“做功课”。


### 9. 总结

**Deep Research = AI 从“会回答”升级为“会查证后再回答”。**

# 2. 为什么要使用Deep Research + Agent

> “Deep Research 本身是不是已经是一种『大模型 + 搜索』的形态？那如果是这样，为什么还要再和 Agent 结合？两者不就重复了吗？”


## 区别


### Deep Research 的“底层定义”

**Deep Research 不是一种独立模型，而是一种大模型的使用模式或系统形态**。
换句话说，它是“大模型 + 搜索 + 推理策略 + 溯源机制”的组合。

具体包含：

1. **底座：LLM（大语言模型）**

   * 负责理解问题、规划检索策略、整合结果、撰写总结。
2. **外部感知：搜索/浏览/文件读取等工具**

   * 让模型能实时访问信息，而不局限于训练语料。
3. **推理逻辑：多步思考（ReAct、ToT 等）**

   * 让模型不只“一次问一次答”，而是持续查证、迭代推理。
4. **结果约束：溯源、脚注、引用**

   * 确保输出内容可验证、可追溯。

所以可以理解成：

> **Deep Research = LLM × 搜索/工具 × 多步推理 × 溯源机制**

它解决的是**“内容正确性与可信度”**的问题，
也就是让“模型回答”变成“有证据支撑的研究结论”。



### 那既然这样，它已经是“大模型 + 搜索”了，为何还要 Agent？

关键点在于：**Deep Research 解决“查得准”，但不解决“做得完”。**

想象一下：

> 让 Deep Research 去研究 “欧洲 AI 合规政策”。
> 它能查一堆网页、整合出一份带脚注的分析报告。

但研究完之后呢？

* 它不会把结论更新到企业知识库；
* 不会生成合规清单；
* 不会通知法务团队；
* 更不会每周自动复查。

这些**“研究之后要落地执行的动作”**，正是 Agent 擅长的。

 所以：

> Deep Research = 帮 AI “想清楚”；
> Agent = 帮 AI “做下去”。



### 从技术边界看两者不重叠

| 能力维度 | Deep Research  | Agent                 |
| ---- | -------------- | --------------------- |
| 信息获取 | ✅ 主动搜索、阅读、比对   | 🔸 可调用外部工具但重点不在查      |
| 推理方式 | ✅ 多步思考、溯源验证    | ✅ 任务规划、动态决策           |
| 行动执行 | ❌ 研究后停在输出报告    | ✅ 自动执行任务（发邮件、建表、调用接口） |
| 状态记忆 | 🟡 局部上下文       | ✅ 可长期状态管理             |
| 目标导向 | ❌ 偏被动（回答或研究）   | ✅ 主动（围绕目标完成任务）        |
| 监督合规 | ✅ 信息层合规（引用、来源） | ⚠️ 需要额外治理（行为边界）       |

> 从合规意义上讲，“Agent + Deep Research” 并不是为了“让 Deep Research 更合规”，
> 而是为了“**让研究结果能够自动进入业务闭环**”。

换句话说，结合不是出于安全/合规动机，而是出于**功能完整性**：
Deep Research 让 AI 知道“什么是对的”，
Agent 让 AI 把“对的事”真正做完。


## 结合


### 为什么行业要结合

1. **业务层面需要结果，而不是报告**
   企业真正想要的不是“研究报告”，而是“研究结论 + 对应动作”：

   * 投研 → 自动更新数据库
   * 法务 → 生成合规检查单
   * 市场 → 自动生成竞品对照表并推送 Slack

2. **AI 的学习闭环需要“行动反馈”**
   只研究不行动，模型拿不到结果反馈；
   有了行动，它能在下一次研究中调整策略。

3. **工程角度：Agent 是“调度系统”，DR 是“子能力”**
   Agent 负责 orchestrate（编排）；
   Deep Research 是其中一个 Tool / Sub-Agent。
   这是一种**系统工程的层次结构**，而非功能重复。



### 结合是让 AI 完成“从认知到行动”的闭环

这部分是核心。
AI 的演化可以用一句话概括：

> **从会说话 → 会思考 → 会查证 → 会做事。**

拆开看：

| 阶段            | 技术代表                                     | 能力上限        | 核心问题        |
| ------------- | ---------------------------------------- | ----------- | ----------- |
| 早期 LLM        | ChatGPT、Gemini 基础模型                      | 会聊天，会写，但容易编 | “说得好听但不一定对” |
| Deep Research | ChatGPT Deep Research 模式、Gemini Research | 查得准、讲得对、有引用 | “知道真相但不会行动” |
| Agent         | AutoGPT、LangGraph、OpenAI Agent           | 会执行、能自动化    | “行动快但可能方向错” |

👉 Deep Research 解决了“**认知准确性**”的问题，
👉 Agent 解决了“**行动执行力**”的问题。

但单独存在，都停在“半条命”状态：

* **只有 Deep Research** → 会查不会干；
* **只有 Agent** → 会干但容易干错。

> 结合之后，AI 第一次能像一个人那样：
> “先查清楚，再自己去做。”

这就是人工智能**跨越“智能 → 智慧”**的一步。



### 结合是“智能体时代”的必然结果

现在所有公司都在做一件事：
让 AI 能够 **“独立完成真实世界的任务”**。
任务有三个核心阶段：

1. **理解世界（理解目标）**
2. **获取知识（检索与验证）**
3. **采取行动（执行与反馈）**

对应过去的三种技术形态：

| 环节   | 技术代表          | 角色    |
| ---- | ------------- | ----- |
| 理解   | LLM           | 大脑    |
| 获取知识 | Deep Research | 眼睛和记忆 |
| 行动   | Agent         | 手和脚   |

这三者必须串起来，AI 才能“真正工作”。

如果只有大脑（LLM），没有眼睛（Research）和手（Agent），它永远只是个“会说话的机器”。
而一旦 Deep Research + Agent 结合，得到的是一个：

> 能自己看世界 → 思考 → 查证 → 行动 → 反思的系统。

这就是“智能体（Agentic System）”的核心定义。
因此，**结合不是巧合，而是智能体演化的必经阶段**。





### 结合后的价值跃迁

| 维度   | Deep Research 单独做 | Deep Research + Agent 结合后 |
| ---- | ----------------- | ------------------------- |
| 信息质量 | 内容更可靠、有溯源         | 同样可靠，但能自动流入后续流程（决策/执行）    |
| 效率   | 产出报告快，但还要人工处理结果   | 自动完成研究→汇报→落地的一体化流程        |
| 成本   | 省一半人力但仍需中层人工      | 直接变成“AI 团队成员”，成本再降        |
| 可复用性 | 研究报告静态存在          | Agent 能动态更新、周期复查、持续优化     |

一个最典型的企业应用例子：

> **在投研/咨询/市场分析中**：
> Deep Research 负责查清楚竞品和政策；
> Agent 负责根据报告内容生成汇报邮件、填 CRM、发 Slack 通知、创建任务。
> 整个过程从“半天”缩短到“十几分钟”，且全程留痕、可追溯。



### 结合的必要原因

1. **需求驱动的必然性**

   * 企业不需要“能聊天的 AI”，而是“能交付结果的 AI”。
   * 只有 Deep Research + Agent，才能提供“有根据的成果”。

2. **技术演进的必然性**

   * LLM 的上下文理解力增强（o1/o3 系列）→ 足以支撑长流程计划。
   * 工具调用、内存、RAG、检索等基础组件成熟 → 可以安全组合。
   * 所以两者结合，是整个技术栈水到渠成的结果。

3. **生态竞争的必然性**

   * OpenAI、Google、Anthropic、Perplexity 都在同时推出类似路线：

     > Deep Research → Agent → Agentic Workspace
   * 说明整个行业都意识到：

     > “让 AI 真正能工作”才是下一阶段的门槛。


> **Deep Research 让 AI 知道该怎么做；Agent 让 AI 真正去做。**
> 两者结合，让 AI 从“聪明的回答者”变成“可信的行动者”，
> 这不是一条可选路线，而是智能体时代的必然方向。

## 技术上应该怎么选

* 一种是 👉 **LLM + Deep Research**：
  “手动控制步骤，让模型带着检索能力帮查、帮写。”

* 另一种是 👉 **Agent + Deep Research**：
  “模型自己规划、自己查、自己决定下一步，还能自动执行。”

### 结构本质的区别：

| 对比项    | **LLM + Deep Research** | **Agent + Deep Research** |
| :----- | :---------------------- | :------------------------ |
| 核心定位   | “人工驱动的研究助手”             | “自主执行的研究型智能体”             |
| 控制逻辑   | 人或工作流控制每一步              | 模型自己规划、决策与反思              |
| 工具使用方式 | 被动调用：按指令触发搜索            | 主动调用：按目标自发检索/试探           |
| 执行范围   | 通常停留在研究层面               | 可继续执行研究后的任务（分析→汇报→行动）     |
| 状态管理   | 一次性任务                   | 长生命周期，可记忆与更新状态            |

一句话区分：

> **LLM + DR = “被动查证”； Agent + DR = “主动研究+执行”。**



### 能力差异

| 能力维度  | LLM + DR                   | Agent + DR           |
| :---- | :------------------------- | :------------------- |
| 信息正确性 | ✅ 一样依赖 Deep Research 的查证机制 | ✅ 同样正确，但可多轮验证冲突信息    |
| 自主性   | ❌ 无（完全靠人控制）                | ✅ 有（可自规划、调整策略）      |
| 任务类型  | 单次问答/固定流程                  | 多轮推理/复杂项目            |
| 工具编排  | 固定顺序（如搜索→整合→输出）            | 动态组合（按情境多次搜索、调用不同工具） |
| 行为透明  | ✅ 高：人看得见每一步                | ⚠️ 低：需要日志与约束治理       |
| 出错风险  | 低（人把关）                     | 高（需防止跑偏），但可自修正      |
| 上手门槛  | 低（Prompt 即可）               | 高（需设计 Agent 逻辑或框架）   |

 核心思想：

* **LLM + DR** 更像“人指挥 AI”；
* **Agent + DR** 更像“AI 自己想明白再去干活”。



### 使用体验上的区别

| 体验点  | LLM + DR        | Agent + DR               |
| :--- | :-------------- | :----------------------- |
| 操作方式 | 问 → 它查 → 它答    | 定目标 → 它计划 → 它多轮执行 → 它汇报 |
| 人机关系 | 是“研究主管”，AI 是助理 | 是“业务负责人”，AI 是执行团队       |
| 输出形式 | 报告/摘要/引用        | 报告 + 行动（如自动更新表格/发邮件）     |
| 控制感  | 高（每步确认）         | 较低（更自动）                  |
| 适合谁用 | 研究员、分析师、合规岗     | 自动化工程、策略岗、运营或数据团队        |

用一句比喻：

> **LLM+DR 是“开车”**，AI 给导航、报路；
> **Agent+DR 是“上车”，AI 自动驾驶并自己查路况。**


### 场景匹配度对比

| 场景类型         | 更适合 LLM + DR | 更适合 Agent + DR     |
| :----------- | :----------- | :----------------- |
| 📘 一次性研究报告   | ✅（用户控制节奏）    | ❌（用不到自主规划）         |
| ⚖️ 合规/政策汇编   | ✅（标准化强、易审计）  | ❌（自动化价值不高）         |
| 📊 技术选型/竞品研究 | ⚖️ 都可用       | ✅ 若要自动生成对照表与后续测试计划 |
| 🕵️‍♀️ 投研尽调  | ⚖️ 都可用       | ✅ 自动生成备忘录/任务/通知    |
| 🔄 周期性信息追踪   | ❌（手动重复）      | ✅ 可自动监测并推送报告       |
| ⚙️ 运营/数据自动化  | ❌（输出静态）      | ✅ 可调用系统、执行动作       |

 **总结判断逻辑：**

* **任务标准化、高合规、结果需人工签发 → LLM + DR。**
* **任务复杂、动态变化、后续要执行落地 → Agent + DR。**





### 企业价值层面的区别

| 维度     | LLM + DR      | Agent + DR          |
| :----- | :------------ | :------------------ |
| 价值定位   | 提升“研究效率与准确度”  | 提升“决策到执行的整体效率”      |
| ROI 周期 | 快速见效，短期 ROI 高 | 成长期投入大，长期 ROI 更高    |
| 对人角色影响 | 辅助型：让分析师更快    | 替代型：让系统自动跑任务        |
| 治理与风险  | 容易管控、低风险      | 需治理（行为边界、审计日志）      |
| 战略意义   | 局部提效          | 架构性变革：从信息工具 → 智能执行体 |

重点差异：

> LLM+DR 解决“知道得更准”，
> Agent+DR 解决“知道后能自动去做”。


### 选型建议

| 决策问题      | 优先选谁       |
| :-------- | :--------- |
| 任务清晰、可标准化 | LLM + DR   |
| 任务模糊、需探索  | Agent + DR |
| 合规要求高     | LLM + DR   |
| 自动化收益大    | Agent + DR |
| 团队以分析师为主  | LLM + DR   |
| 团队有工程能力   | Agent + DR |
| 目标：信息更可靠  | LLM + DR   |
| 目标：流程更智能  | Agent + DR |

**最优实践**：
多数成熟企业最终会采用“**混合策略**”：

* 顶层用 **LLM + DR 工作流** 做**标准化研究与审批**；
* 局部高价值节点用 **Agent + DR** 做**智能探索与执行闭环**。


> **LLM + Deep Research** = 让 AI 成为“可信的信息助手”；
> **Agent + Deep Research** = 让 AI 成为“能独立完成研究与行动的员工”。

前者稳、可控，适合“研究驱动的决策”；
后者灵、闭环，适合“行动驱动的智能化”。



# 3. DeepResearch Agent 核心原理与系统架构概览

## DeepResearch Agent 的核心原理

DeepResearch Agent = **Agent（会行动） + DeepResearch（会查证）**
它是一个“自动研究员”系统，能根据目标去规划、执行、查证、整合并得出可信结论。


### Agent 的三层结构

| 层级                      | 功能      | 说明                                                       |
| ----------------------- | ------- | -------------------------------------------------------- |
| **指令层（Decision Layer）** | 决策与规划   | 负责理解任务目标、拆分子任务、生成查询问题，并判断何时继续或停止。相当于“大脑”，决定研究方向与节奏。      |
| **工具层（Action Layer）**   | 行动执行    | 调用各类工具实现目标，如搜索引擎、网页阅读、PDF 解析、知识库检索、数据总结等。相当于“手脚”，完成实际动作。 |
| **记忆层（Memory Layer）**   | 信息整合与反思 | 保存历史搜索结果、证据链、上下文与结论，让系统能从历史中学习和避免重复。相当于“记忆与经验”。          |

**工作方式**

> 任务输入 → 指令层拆解问题 → 工具层执行查找 → 记忆层保存并总结 → 指令层反思与决策下一步。



## DeepResearch 的执行链路

DeepResearch 本身是一条 **“可信研究链路”**，用来确保每个结论都有证据、有溯源、有可复查性。
可以把它理解为 Agent 的“大脑研究思路”。



### DeepResearch 执行链路（共 6 步）

| 阶段                                   | 技术逻辑                             | 作用说明                         |
| ------------------------------------ | -------------------------------- | ---------------------------- |
| **1. 任务理解（Task Understanding）**      | 分析用户问题 → 拆分研究维度（政策、市场、技术、竞争、风险等） | 让系统清楚“要查什么”，确定研究边界。          |
| **2. 查询规划（Query Planning）**          | 生成多维查询（关键词扩展、时间窗、语言、站点过滤）        | 确保搜索覆盖全面，不遗漏重要来源。            |
| **3. 信息获取（Information Retrieval）**   | 调用搜索/浏览工具 → 打开网页/PDF → 读取正文      | 把原始数据抓取回来，为后续阅读和分析准备。        |
| **4. 内容抽取与理解（Extraction & Reading）** | 对文本结构化解析 → 提取关键事实、表格、时间、数据点      | 从杂乱内容中抽出“可比对的信息单元”。          |
| **5. 证据验证与整合（Evidence Validation）**  | 多来源比对 → 检测冲突 → 添加脚注与时间线          | 确保结论有出处、可溯源、可审计。             |
| **6. 结论生成（Synthesis & Reporting）**   | 生成结构化研究报告（含脚注、快照、分歧点、局限）         | 产出最终“可信结论”，可直接用于企业决策或触发后续动作。 |



#### 链路逻辑图

```
任务目标
   ↓
任务理解 → 查询规划
   ↓
信息获取（搜索/抓取）
   ↓
内容抽取（阅读/整理）
   ↓
证据验证（多源对比 + 溯源）
   ↓
结论生成（带脚注的报告）
```



## 两者结合的工作机制

| 模块        | DeepResearch 负责 | Agent 负责          | 结合后结果           |
| --------- | --------------- | ----------------- | --------------- |
| **目标理解**  | 拆研究维度           | 制定任务计划与执行顺序       | 自动形成研究路线图       |
| **搜索与阅读** | 确保来源可信、信息完整     | 调用工具完成执行          | 自动化调研执行         |
| **验证与总结** | 生成脚注、快照、冲突报告    | 判断是否继续或终止         | 保证可信度与效率        |
| **结果输出**  | 结构化报告           | 可触发下游任务（发报告/写数据库） | 实现从“查到”到“用上”的闭环 |


# 4. Tavily 实时搜索引擎详解

## Tavily 是什么？

Tavily 是一个 **专门为大模型（LLM）和 AI Agent 设计的实时搜索引擎**。
可以把它理解成：

> 🔍 「让 AI 真正能上网、查得到、读得懂、引用得出的搜索系统」。

### 普通搜索引擎 vs Tavily 的区别

| 项目       | 普通搜索（Google/Bing） | Tavily             |
| -------- | ----------------- | ------------------ |
| 面向人类     | 展示网页、靠人点击阅读       | ✅ 面向 AI，直接返回干净内容   |
| 返回内容     | 只给标题+链接           | ✅ 给摘要、正文、时间、脚注     |
| 是否理解问题   | ❌ 不理解问题背景         | ✅ 理解自然语言查询         |
| 是否能多轮交互  | ❌ 不行              | ✅ 可被 Agent 调用，多轮查证 |
| 是否支持网页提取 | ❌ 需要自己爬取          | ✅ 内置内容提取与清洗        |
| 是否可控     | ❌ 结果随机            | ✅ 可设白名单、时间范围、域名限制  |

总结：

> Tavily 是“AI 搜索 + 网页阅读 + 内容提炼 + 引用脚注”的一体化服务。
> 它让大模型不再“瞎编”，能“查清楚、讲明白”。



## 为什么会出现 Tavily？

### 1️背景问题：大模型“不知道现在的世界”

* ChatGPT、Claude、Qwen 等模型，**知识止步于训练时间**。
  → 例如：问“2025 年中国新能源政策”，它可能回答 2023 年的旧内容。
* 模型没法实时上网查新数据，只能“预测文本”——这就是“幻觉”。

### 企业痛点

在实际应用里：

* 投研要最新新闻；
* 咨询要最新政策；
* 品牌要监测舆情；
* 产品团队要分析竞品文档。
  但普通大模型的“知识库”老旧、内容不可信，**无法满足“实时 + 可验证”**的需求。

### 于是 Tavily 出现了：

> 它让 AI 拥有“眼睛”和“手”：
>
> * 能实时上网看到最新的网页；
> * 能自己去读、去提取、去判断真假；
> * 能把证据、脚注和摘要整理好交给模型。

这就是 Tavily 诞生的意义。
它解决了 **AI 知识老化** 和 **幻觉不可验证** 的根本问题。



## 三、Tavily 能做什么？

### Tavily 的四大能力

| 能力模块           | 说明                                | 举例                          |
| -------------- | --------------------------------- | --------------------------- |
| 🧭 **实时搜索**    | 输入自然语言问题，Tavily 自动上网搜索、筛选、整合最新内容。 | “2025 年 10 月特斯拉新电池技术有哪些进展？” |
| 🧩 **网页内容提取**  | 给出网页链接，提取干净正文（去广告、保留表格、留脚注）。      | “提取《AI 安全标准白皮书》正文内容”        |
| 🕸️ **站点爬取**   | 批量抓取整个网站内容（带层级限制、正则过滤）。           | “抓取并分析中国证监会公告网站最近政策”        |
| 🗺️ **站点结构探索** | 帮快速获取网站地图和目录层次。                  | “这个文档网站有哪些分类、多少页？”          |


### 四种典型应用场景

**企业研究部门（投研/咨询/战略）**

> 用 Tavily 实时收集行业政策、公司动态、新闻舆情，自动生成带脚注的调研报告。

**AI 助手 / Agent 应用**

> 让的 AI 可以“实时查资料”，不是只靠旧知识回答。
> 例如一个“新闻分析 Agent”，每天调用 Tavily 自动抓新闻并分析趋势。

**知识库构建 / RAG 更新**

> 把 Tavily 提取到的网页正文，直接导入到企业内部的向量数据库（如 Qdrant、Pinecone），让知识库保持新鲜。

**监控与自动化分析系统**

> 定期触发 Tavily 搜索，监测品牌、产品、法律变更或技术论文更新。




## Tavily 怎么用？

https://www.tavily.com/ 


### 第一步：注册账号，获取 API Key

* 官网 tavily.com 注册；
* 免费账户有一定额度（约 1000 次/月）；
* 拿到的 **API Key**。

### 第二步：选择调用方式

Tavily 支持：

* **直接调用网页界面（适合非程序员）**；
* **通过 API / Python SDK（适合开发者）**；
* **在各类框架中一键集成**：

  * LangChain（工具模块已内置）；
  * Dify（官方插件）；
  * n8n （可用现成节点）。

### 第三步：调用逻辑（非代码版思路）

> 举例：想知道「2025 年 Qwen 开源模型的最新版本」。

Step 1：AI（或）调用 Tavily 搜索接口

* 关键词：“Qwen3 模型 最新 发布 2025”
* 过滤条件：时间=近一个月、语言=中文。

Step 2：Tavily 自动抓取前几条网页，提取正文。

* 去掉广告、模板、重复内容。

Step 3：返回结果（AI 可直接使用）

* 文章摘要、引用来源、URL、发布时间。
* 有些结果附带“模型生成的综合答案”。

最终模型看到的就是一份「干净、可引用」的材料包。
→ 可以让它用来生成报告、总结趋势、甚至自动发日报。



<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024114052226.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024114445583.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024115739929.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024115815379.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024115842013.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024115906838.png" width=100%></div>


<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024115955872.png" width=100%></div>


## Tavily 的优势总结

| 优势    | 意义                              |
| ----- | ------------------------------- |
| ✅ 实时性 | 拿到最新网页内容，避免模型“知识过期”             |
| ✅ 可信度 | 自动生成脚注与来源，结果可验证                 |
| ✅ 一体化 | 搜索 + 提取 + 清洗 一步到位               |
| ✅ 易集成 | 直接支持 LangChain、Dify、n8n、Flowise |
| ✅ 成本低 | 访问量计费，免费额度友好                    |
| ✅ 可控性 | 可设置白名单、过滤低质量站点                  |


# 5. Agent 智能流程编排


## 先理解 Dify 是怎么“思考”的

Dify 的工作流其实是一种 **「事件驱动的可视化函数编排」**。
要想把 DeepResearch + Agent 落地，它的工作逻辑是：

> **触发（Trigger） → 控制（Logic） → 执行（Action） → 记忆（Storage） → 反馈（Loop）**

也就是说，Dify 不是单纯的问答工具，而是一个**具备执行力的 Agent Flow Engine（智能体流引擎）**。
所以要想让它像 DeepResearch Agent 一样运行，需要学会：

* 哪些节点负责“想”；
* 哪些节点负责“查”；
* 哪些节点负责“做”；
* 哪些节点负责“记”和“反馈”。




## 核心节点体系

| 节点类型           | Dify 节点名称                                     | 技术作用         | 在 DeepResearch + Agent 中的意义            |
| -------------- | --------------------------------------------- | ------------ | -------------------------------------- |
| 🟢 **触发节点**    | **Trigger / Workflow Trigger**                | 启动整个工作流      | 比如：用户输入一个问题“分析2025新能源政策”               |
| 🔵 **模型节点**    | **LLM Node / Text Generation Node**           | 调用大模型生成文本    | 用于“问题理解”、“任务拆解”、“生成查询关键词”              |
| 🟣 **工具节点**    | **Web Search / Tavily Search / HTTP Request** | 访问外部世界       | DeepResearch 的灵魂：上网搜索、抓取网页、提取正文        |
| 🟤 **条件判断节点**  | **If / Switch / Branch**                      | 控制逻辑分支       | 比如：如果搜索不到结果 → 再次扩展关键词；若找到多个结果 → 进入比对流程 |
| 🟡 **循环节点**    | **Loop / For Each**                           | 遍历数据集或任务     | 比如：对多个网页逐一提取摘要、对比差异                    |
| 🧩 **记忆与存储节点** | **Variable / Data Storage / Knowledge Base**  | 保存中间结果或历史上下文 | 保存搜索结果、脚注、提取内容、最终结论                    |
| 🟠 **输出节点**    | **Response / Text Output**                    | 返回最终输出结果     | 输出带引用的报告、总结或表格                         |





## DeepResearch + Agent 的逻辑核心：流程控制思想

让 Dify 真正像“研究员”一样工作，需要掌握 3 套核心逻辑机制👇


## ① **问题拆解逻辑（Decomposition）**

> 把复杂的研究问题拆成子问题。

实现方法：

* 用 **LLM 节点** 生成子问题列表（比如政策 / 市场 / 技术 / 风险）。
* 用 **Loop 节点** 遍历这些子问题。
* 每轮子问题进入 Tavily 搜索并收集结果。

举例：

```text
主问题: 评估2025中国新能源政策影响
↓
子问题: 
1. 政策主要方向
2. 财税支持条款
3. 产业链影响
4. 外资企业受限政策
```


## ② **查证逻辑（Verification）**

> 对不同来源内容进行比对、提取和可信判断。

实现方法：

* Tavily 节点搜索多源；
* LLM 节点整合结果；
* If 节点判断“是否冲突”；
* 若冲突 → Loop 回到再检索；
* 否则 → 存入可信来源。

举例：

> 若两篇报道的数据不一致，LLM 节点调用提示词：「比较来源差异，解释可能原因并标注可信度」。


## ③ **溯源逻辑（Citation）**

> 每个结论必须能回溯到原始网页、来源或快照。

实现方法：

* Tavily 返回 JSON 中自带 URL；
* 用 Variable 节点保存所有 URL；
* LLM 节点在生成报告时调用这些变量；
* 自动生成「脚注区」。

举例：

> “根据工信部政策公告（来源：tavily_url_1），2025年补贴将调整为按碳排系数计算。”



## 要理解的 Dify 技术机制

| 技术能力                   | 说明                                       | 对 DeepResearch + Agent 的意义 |
| ---------------------- | ---------------------------------------- | -------------------------- |
| 🧠 **上下文变量传递机制**       | 节点之间的数据通过 `$json.xxx` 或 `$memory.xxx` 传递 | 控制搜索结果、脚注、标题动态传入模型         |
| 🔄 **Prompt 模板化**      | 支持用模板语句动态生成提示词                           | 可在不同环节使用不同提示语风格（拆解、总结、比对）  |
| 💾 **Memory / 知识记忆模块** | 在多轮工作流中保持上下文                             | 支持多步查证、反思、再查的逻辑            |
| ⚖️ **Flow 控制与条件分支**    | 用 If + Loop 控制复杂路径                       | 避免死循环或重复搜索                 |
| 🔌 **工具集成（Tools Hub）** | Tavily、Serper、Arxiv、WebPilot、Scraper 等   | 增强 DeepResearch 的“外部感知能力”  |
| 📊 **数据类型系统**          | 支持文本、数组、JSON、数字等                         | 便于结构化存储搜索结果                |



## 知识铺垫建议

1️⃣ **掌握 Prompt 思维**

> 会写“系统提示 + 任务指令 + 输出格式”，尤其是分阶段指令。
> （比如“只输出子任务列表”，“只输出表格对照格式”。）

2️⃣ **理解数据流**

> Dify 的每一个节点都像“一个函数”，输入是什么、输出是什么，一定要清楚。

3️⃣ **熟悉条件控制**

> DeepResearch 往往需要“查不到 → 再查”，要能设计 if / loop 流程，不死循环。

4️⃣ **会用 Variable / Memory**

> 保存中间信息，如 Tavily 的 URL、脚注数组、已总结内容。

5️⃣ **熟悉工具调用逻辑**

> Tavily 用于实时搜索；
> HTTP Request / Scraper 用于内容抓取；
> Knowledge 用于存结果；
> LLM 节点用于“分析与综合”。


## 其他实现框架

### 先对齐概念

“Agent + DeepResearch” 本质上包含两层能力：

| 能力层                      | 定义                    | 关键作用        |
| ------------------------ | --------------------- | ----------- |
| **Agent 层（行动智能）**        | 会拆任务、调用工具、执行循环、判断是否继续 | 决策 + 流程调度   |
| **DeepResearch 层（查证智能）** | 会实时搜索、提取、比对、整合、有脚注    | 查找 + 可信结果输出 |

所以要落地一个完整系统，无论用什么框架，都得具备这两层：
“Agent 框架” + “具备搜索与查证插件（如 Tavily、Serper、WebPilot）”。



### 当前能实现 Agent + DeepResearch 的主流框架

| 框架名称                      | 核心定位                    | 技术成熟度 | 是否可可视化    | 适合对象           |
| ------------------------- | ----------------------- | ----- | --------- | -------------- |
| **Dify**                  | 可视化智能体编排平台              | ⭐⭐⭐⭐  | ✅ 全图形化    | 非程序员 / 快速原型    |
| **LangChain + LangGraph** | Python Agent 框架（标准逻辑管线） | ⭐⭐⭐⭐⭐ | ❌ 代码驱动    | 技术开发者          |
| **AgentScope（通义）**        | 企业级多智能体框架               | ⭐⭐⭐⭐  | 半可视化（DSL） | 想构建复杂Agent协同系统 |
| **CrewAI**                | 多Agent协作框架（基于角色+任务）     | ⭐⭐⭐⭐  | ❌ 纯代码     | 团队型Agent场景     |
| **Flowise**               | 类 Dify 的开源可视化编排器        | ⭐⭐⭐   | ✅ 可视化     | 技术中级用户         |
| **AutoGen (微软)**          | 多Agent对话式协作             | ⭐⭐⭐   | ❌         | 对话型研究项目        |
| **LlamaIndex**            | 信息抽取 / 索引导向的Agent执行     | ⭐⭐⭐⭐  | ❌         | RAG + 调研任务型项目  |



### 他们在 DeepResearch 模式中的分工对比

| 框架                        | “Agent” 角色                              | “DeepResearch” 实现方式                   | 可扩展性                 | 典型使用场景                       |
| ------------------------- | --------------------------------------- | ------------------------------------- | -------------------- | ---------------------------- |
| **Dify**                  | 可视化节点逻辑，内置 LLM Agent                    | Tavily / WebPilot 节点调用，自动整合内容         | 中等（通过 HTTP / API 扩展） | 快速构建企业调研工作流                  |
| **LangChain + LangGraph** | Chain + Tool + Memory 模型                | Tavily / Serper / Firecrawl 等自定义 Tool | 极强（自定义 Class）        | 构建底层“DeepResearch Agent SDK” |
| **AgentScope**            | LLM + 多Agent协作编排                        | 插入搜索、数据库Agent子模块                      | 强                    | 多部门协作型AI系统                   |
| **CrewAI**                | 多角色 Agent（Leader + Researcher + Writer） | 调用外部检索插件，角色间分工查证                      | 强                    | 像真实团队一样分角色研究                 |
| **Flowise**               | 可视化节点流                                  | LangChain Node + Tavily Tool          | 中                    | 想用可视化但比 Dify 灵活的用户           |
| **AutoGen**               | 多Agent对话反思机制                            | 通过 ToolAgent 调 Tavily 或浏览器            | 一般                   | 学术研究、实验验证                    |
| **LlamaIndex**            | QueryEngine / Retriever                 | 通过 Tavily + 文档索引结合                    | 强                    | 构建长期可复查的研究数据库                |


### Dify 与其他框架的“深度对比表”

| 对比维度       | **Dify**                          | **LangChain / LangGraph** | **AgentScope** | **CrewAI** | **Flowise**    |
| ---------- | --------------------------------- | ------------------------- | -------------- | ---------- | -------------- |
| **上手门槛**   | ⭐⭐（低）                             | ⭐⭐⭐⭐（需要编程）                | ⭐⭐⭐⭐           | ⭐⭐⭐        | ⭐⭐             |
| **可视化操作**  | ✅ 完整可视化                           | ❌（纯代码）                    | ⚙️ 半可视化 DSL    | ❌          | ✅              |
| **逻辑编排能力** | 强（节点+变量+循环）                       | 极强（完全自定义）                 | 强（多Agent协作）    | 中          | 强              |
| **插件生态**   | Tavily、Serper、Arxiv、HTTP、WebPilot | 🔥 超丰富（几乎所有开源API都能接）      | 以通义为主          | 社区扩展       | 与 LangChain 共享 |
| **典型优势**   | 无需写代码即可做复杂流程；可快速部署                | 自由度最高、代码可控                | 企业级协作多Agent系统  | 角色扮演型研究流   | 开源低门槛          |
| **适合人群**   | 教育、企业落地、低代码开发                     | 技术开发者、研究型团队               | 企业AI部门         | 内容生成团队     | 半开发者           |
| **缺点**     | 自定义逻辑深度有限                         | 需要代码实现，复杂度高               | 依赖多Agent框架生态   | 无图形化可视     | 可视化但生态小        |
| **理想使用场景** | 搭建企业调研系统 / 教学演示 / 原型开发            | 自研 AI Agent 平台 / 深度研究     | 多部门自动化协作       | 写作 / 团队调研  | 教学与实验室研究       |



# 6. 全链路实战操作以及常见问题

<div align=center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/muyan/image-20251024142502065.png" width=100%></div>
