Replies: 1 comment
-
|
这不是提示词问题,是"执行层(enforcement layer)"问题——你对提示词不靠谱的判断是对的。 根因在于:per-agent 的 skill 白名单(AgentConfig.skills)只在两个软层生效,而 skill 文件本身对沙箱是全量挂载、可读的,模型完全可以绕过白名单直接读文件。 为什么会绕过(代码事实)
处理办法(从强到弱) ① 文件系统级隔离(最可靠,推荐为主)
② 工具级 ACL(中等强度) ③ GuardrailProvider(官方扩展点,适合做纵深防御) ④ 提示词硬化(最弱) 建议 以 ①(挂载隔离)为主控制,它是唯一对强模型也成立的硬约束;如果运维上做 per-agent 挂载较重,用 ② 或 ③ 做兜底(其中 ③ 更"正统",走 Guardrail 扩展点)。不要指望单独靠 ④。落地最小改动点:local_sandbox_provider.py 的 skills PathMapping 改为按 available_skills 过滤,AIO provider 对应只挂允许的 skill 子目录。 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
agent 中配置了 A、B skill,skills 目录里有A、B、C、D、E skill ,运行时,agent通过ls 识别到了C skill,用C skill执行了,这有办法处理吗,用提示词不一定靠谱
Beta Was this translation helpful? Give feedback.
All reactions