You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
AI Agent for Data:从幻觉到精准
目标受众: CXO、VP、GM、技术负责人
场景: 企业正在部署 AI Agent 来访问关键业务数据(收入、Pipeline、预测、客户洞察),需要在准确性、安全性和规模化之间找到平衡。
愿景
每个企业都想要同一件事:AI 用数据回答业务问题 — 即时、准确、安全。
技术条件已经成熟。大语言模型能理解自然语言。SQL 引擎能在秒级返回结果。云数据平台能扩展到 PB 级。
那为什么 AI Agent 总是给出错误的数字?
现实:5 个结构性缺陷
这不是 AI 模型的问题,而是 知识管理的问题 — 只不过被包装成了 AI 问题。
根因
架构:四层分离
解法不是更好的 NL2SQL 引擎,而是关注点的 结构性分离:
架构图文字说明(点击展开)
第四层:消费层(AI Agent + Skills)
第三层:语义契约层(The Missing Middle)+ 🔄 进化循环
第二层:执行层(Data MCP — 无状态, 策略强制执行)
第一层:数据基础设施(现有的, 无需改动)
核心概念:Agent、Skill、MCP 三者的关系
理解这三者如何协作,是理解整个架构的关键:
用一个具体例子串起来:
为什么要分三层而不是让 Agent 直接调数据?
为什么第三层是关键
大多数组织在让 AI Agent 连接数据时,跳过了第三层。直接从 Agent(第四层)连到 SQL 执行(第二层)。后果是:
准确性模型:三个层次
不是所有数据问题都该用同一种方式回答:
核心洞察: 大多数 AI 数据产品只做第三层(无约束 NL2SQL)。这个架构让第一层成为默认、第二层成为补充、第三层在生产中禁用。
结果: 报表永远准确。临时提问几乎总是准确。没人需要手动校验数字。
NL2SQL 的位置:不是敌人,是受控的工具
回答:我们不反对 NL2SQL,我们反对的是把 NL2SQL 当唯一路径。
NL2SQL 的核心问题不是"不能用",而是用错了场景:
正确的 mental model:
对现有产品的定位:
一句话:NL2SQL 是好的锤子。Semantic Catalog 告诉它只能敲哪些钉子。
Skill 之外的灵活性:Agent 如何处理"没见过的问题"
回答:Skill 是快速通道,不是围墙。Catalog 保证了即使没有 Skill,Agent 也能安全地自由查询。
决策流程(Agent 视角):
三层 fallback 机制:
关键设计:
进化循环:第三层是活的,越用越强
Semantic Contract 不是写完就放那里的静态文档。它有一个内在的自我进化循环 — 使用本身驱动目录的丰富和精确度的提升。
进化循环的四个阶段
阶段 1:观测(自动)
每次 Agent 走第二层(NL2SQL + Catalog)执行一个查询,系统自动记录:
阶段 2:模式识别(半自动)
当同一类 SQL pattern 被多次生成(不同用户、不同时间、相似意图):
阶段 3:沉淀(人工审核 + 一键发布)
领域专家审核候选模式:
阶段 4:加速(自动)
下次相同意图的问题 → Agent 直接匹配到认证模式 → 走第一层 → 更快、更准。
这跟静态语义层的本质区别
衡量进化健康度的指标
对客户的意义
一句话:语义目录不是你维护的文档,是你培养的系统。用得越多,它就越聪明。
安全模型:同一个问题,不同的答案
同一个 Agent。同一个查询模式。同一条代码路径。 区别完全在安全层:
Agent 永远不决定谁能看什么。 平台决定 — 通过执行层(第二层)强制执行的行级安全(RLS),由语义契约层(第三层)声明的策略驱动。
身份模型
用户故事:数据在决策发生的地方找到你
故事 1:VP — "智能找人,不是人找智能"
区域销售 VP 周一早上打开手机,8:00 Slack 上已经有一条消息等着:
不用登录。不用打开仪表盘。不用搜索。数据找到了领导,不是领导去找数据。
如果他回复 "下周预期怎样?" → Agent 调用预测认证模式 → 1 分钟内在同一个 Slack thread 里回答。
价值: 零摩擦、决策级别的智能,送到领导已经在用的地方 — Email 或 Slack。
故事 2:GM — "洞察 → 行动 → 分配,一个动作完成"
GM 准备周三下午的 Pipeline Review。在 Agent Portal 输入:
Agent 返回:
GM 说:"帮我给这些 owner 发 action items"
Agent 自动生成并发送:
价值: 从"发现问题"到"有人在解决" — 几分钟。不需要开会。不需要手动追踪。
故事 3:BD Manager — "客户楼下,10 分钟准备完毕"
BD Manager 提前 15 分钟到了客户 [客户_F] 的办公楼下。
掏出手机,Slack 输入:
约 1 分钟后收到:
BD 点 "保存为拜访记录" → 自动写入 CRM(拜访记录 + Call Plan 内容)。
价值: 以前需要 15-30 分钟翻仪表盘 + 整理笔记的准备工作 → 手机上 10 分钟搞定,包括阅读和思考。一线团队留在一线。
故事 4:BD IC — "对话式 CRM,告别填表"
BD IC 刚结束客户会议,走出会议室,在 Slack 输入:
Agent 返回:
以前: 回到办公室 → 登录 CRM → 找到商机 → 填 8 个字段 → 保存 → 写活动记录 → 设 next step = 10-15 分钟行政工作。
现在: 走路时一条 Slack 消息,不到 1 分钟完成更新。
价值: CRM 使用率从 40% 提升到 95% — 因为更新比不更新更容易。数据质量也提高了,因为在"现场"就记录,不是回去凭记忆填。
端到端流程:从提问到可信答案
一个完整示例,展示每一层如何参与:
LLM 做什么 vs 平台做什么
核心洞察: LLM 处理"软"的部分(理解意图、呈现结果)。平台处理"硬"的部分(正确 SQL、安全、准确性)。这就是为什么准确性不依赖于用哪个模型。
层间交互:同步机制
第四层 ↔ 第三层:发现 + 消费
第三层 ↔ 第二层:契约执行
供应链心智模型
为什么用 Git Repo 管理语义契约层
回答:因为语义目录本质上是 "关于数据的代码" — 它需要代码级的治理能力。
git loggit revertgit clone实际的 repo 结构:
各层怎么 Access 这个 Repo
Git Repo = Source of Truth:
mainbranch = 生产版本featurebranch = 变更中(PR 审核)tag v2.4.0= 已发布版本第四层(Agent / Skill)怎么拿到
GET /catalog/v2.4.0/manifest.json或git clone --depth 1→ 本地缓存 TTL 1h第二层(MCP 服务)怎么拿到
方式:部署 pipeline 自动同步
policies.yaml(RLS)+table_overrides.yaml+validation_rules.json版本不一致时的行为(fail-closed)
为什么不用数据库或 API 服务?
不是不能用 — 是 Git 在这个场景下综合成本最低:
适用场景:
一句话:Git 是最便宜的、最成熟的、最被信任的 "configuration as code" 基础设施。语义目录本质上就是 configuration — 用 Git 管理它就像用 Git 管理 Terraform 一样自然。
第三层管理:谁来维护目录?
三个角色
status_flag='final'是必填 filter。"weekly_forecast_gap— 参数:scope, period, segment"自动化 vs 人工
80% 的目录内容可以从现有系统自动派生。 领域专家只需要添加机器无法推断的 20% — 主要是业务含义和特定领域规则。
这是不是一个新的全职岗位?
不是。 目录只是把已有的知识正式化 — 这些知识现在散落在 wiki、Slack 消息、代码注释、和老员工的脑子里。用结构化格式写下来是增量工作:
竞品差异化
一句话差异化: 唯一同时解决准确性(认证模式)、安全性(执行层 RLS)和规模化(版本化契约支持多 Agent)的架构。
合规与数据跨境(CBDT)
为什么这个架构天然适配合规要求
四层分离的架构本身就是合规友好的 — 因为关注点分离意味着数据不需要离开它该待的地方:
CBDT 场景分析
架构内置的合规控制点
回答客户常见合规问题
一句话给 CXO
CXO 一页纸
实战案例:XX Agent for XX Sales Intelligence(2 个月生产运行)
背景: 某大型企业区域销售组织,100+ 销售团队成员,13 个事业部(BU),通过内部 AI Agent 平台提供数据智能服务。
做了什么:
关键成果(2 个月):
仍在解决的问题(诚实说):
核心指标:
核心转变
已知限制与开放问题
status='completed'实际应为status='final')enums.yaml定义每列的合法值。validate_sql()对 WHERE 条件做枚举校验。但不能 100% 杜绝 — 这就是为什么 Level 1 是默认路径patterns/{bu}/子目录,中央 team 做 CODEOWNERS + merge conflict resolve最小可行部署(MVP)
30 天 MVP — 验证核心假设:
MVP 的关键度量(4 周后回答):
如果 MVP 成功 → 扩展路径:
行动号召
架构经过 2 个月生产验证,覆盖 14 张数据表、13 个事业部、100+ 用户,领导层周报零数据准确性事故。
Beta Was this translation helpful? Give feedback.
All reactions