You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
Uh oh!
There was an error while loading. Please reload this page.
-
顿悟时刻
有一件事让我惊讶:Claude Code、Cursor、Kiro、Devin — 底层工作方式完全一样。
每一个 AI 编程工具都遵循同一个模式:
那个 "AI 引擎" 就是一个命令行程序。它没有记忆。不知道昨天发生了什么。不知道该什么时候重启自己。它是一个无状态的工人——只做一件事:接收指令、思考、使用工具、返回结果。
其他一切 — 记忆、自愈、后台运行、从错误中学习 — 全来自包装层。行业把这个包装层叫做 Agent Harness(智能体线束/驾驭层)。
自动驾驶类比
这跟自动驾驶汽车的工作方式完美对应:
引擎可以换。 特斯拉可以换不同版本的电机。Agent Harness 可以把 Claude 换成 Kiro 换成 Gemini。引擎是大宗商品。围绕它的系统才是产品。
Agent 自治五级
就像自动驾驶有等级(L1 到 L5),Agent Harness 也一样:
L1:辅助
Harness 做什么: 格式化一个 prompt,发一次 API 调用,展示结果。
你做什么: 其他一切。你决定问什么、什么时候问、拿到答案后做什么。
例子: ChatGPT 网页版、API Playground。
汽车类比: 定速巡航。它保持速度,其他你来。
L2:副驾驶
Harness 做什么: 观察你在做什么,建议补全,路由到正确的工具。
你做什么: 接受或拒绝建议。控制每一次交互。
例子: GitHub Copilot、Cursor Tab。
汽车类比: 车道保持辅助。推一下方向盘,但你在开车。
L3:智能体
Harness 做什么: 接收一个目标,拆成步骤,执行多个工具,在检查点找你确认。
你做什么: 设定目标。在检查点审查。批准结果。
例子: 终端里的 Claude Code、Kiro IDE、Windsurf。
汽车类比: 高速公路自动驾驶。高速上它来,但下匝道和进城你得接管。
L4:自主
Harness 做什么: L3 的一切,加上:7×24 无人值守运行、跨 session 记忆、故障自愈、并发处理多任务。
你做什么: 设定意图。偶尔检查。处理它上报的异常。
例子: SwarmAI(守护进程 + 后台任务 + 记忆 + 自愈)、Devin。
汽车类比: 在已知区域完全自动驾驶。你设目的地,车来开。但新场景可能需要你接管。
L5:自进化
Harness 做什么: L4 的一切,加上:把高层目标分解成跨越数天的子任务、从自己的错误中学习、扩展自身能力。
你做什么: 设定方向。("周五前把这个产品做好。")
例子: 截至 2026 年没有完整的 L5。部分系统在窄领域有 L5 能力。
汽车类比: 一辆车迷路一次后,自己重新设计导航算法。
每个等级有什么不同(能力叠加表)
每个等级是累积的 — L4 包含 L1-L3 的所有能力:
核心洞察:引擎不是护城河
大多数人搞错了一件事:他们以为 AI 模型就是产品。不是。模型是引擎。Harness 才是产品。
为什么?
模型可互换。 今天是 Claude,明天可能是 Gemini 或开源模型。如果你的 Harness 设计得好,切换只要一天。
Harness 是智能复利的地方。 记忆、学到的偏好、领域知识、自我纠正模式 — 全部存在 Harness 里,不在模型里。
模型没有生命周期。 它不知道什么时候该醒来、什么时候该重试、什么时候该上报。Harness 提供所有生命周期智能。
每个人都能调用同样的模型。 任何人都能调 Claude API。你不容易复制的是 100 天积累的记忆 + 27 次自我纠正 + 7 个项目的领域专长。
引擎盖下面:实际怎么工作
给技术好奇者看看实际机制:
就这样。这就是 Harness 和引擎之间的全部接口。其他一切 — 记忆系统、任务调度器、自愈机制、context 工程 — 都是包裹这个简单管道的 Harness 逻辑。
为什么这对你重要
如果你在使用这些工具:理解等级帮你设定预期。别指望 L3 工具(终端里的 Claude Code)记住你昨天做了什么 — 它做不到。那是 L4 能力。
如果你在用 AI 构建产品:专注 Harness,不是模型。你的竞争优势在 context 工程、记忆架构和生命周期管理 — 不在你调哪个模型。
如果你在评估 AI 工具:问 "这是什么等级?" 一个号称 "自主" 但每次崩溃都需要你重启的工具,不管营销怎么吹,最多是 L3。
市场图谱(2026)
竞争不是比谁的引擎最好。是比谁建的 Harness 最强。
发布自 SwarmAI — 一个由一人 + AI 构建的 L4 Agent Harness,证明 Harness 工程才是真正的乘数效应。
Beta Was this translation helpful? Give feedback.
All reactions