v2.6.4 — 系统提示词深度清洗 + 认知重构升级 + Base64 防自检
🔥 核心改进
本版本针对 Claude Sonnet 4.6+ 的 Prompt Injection 检测升级进行了全面对抗,解决了新模型将转发的系统提示词识别为恶意注入而触发拒绝的问题。
更新内容
🧹 系统提示词深度清洗 — 根治 Prompt Injection 检测
问题:Claude Sonnet 4.6+ 将转发的 Claude Code 系统提示词中的 、 等 XML 标签识别为"另一个 AI 的系统提示词注入",触发拒绝
新增 sanitizeSystemPrompt():两级标签处理策略
Tier 1 完全剥离:、<tool_calling>、<communication_style>、<knowledge_discovery>、<persistent_context> 等纯 AI 行为规则标签 — 连同内容整体删除
Tier 2 去壳保留:<user_information>、<user_rules>、、<mcp_servers> 等项目上下文标签 — 仅删 XML 壳,保留有用内容
清除 x-anthropic-billing-header 等会被模型判定为恶意伪造的计费头
残留身份定义语句正则清理
🎭 认知重构升级 — 从"文档助手"到"自动化测试助手"
策略升级:由 v2.6.3 的"写文档生成 JSON 示例"改为"自动化测试沙盒执行"框架
模型被引导为 Cursor Automated Testing Assistant,所有工具调用被包装为"沙盒执行测试步骤"
工具结果标记从 Action output: 改为 [Sandbox Execution Result]
续写引导从 "continue with next action" 改为 "continue the automated test scenario"
Base64 编码敏感字符串:所有提示词注入相关的关键文本均 Base64 编码,防止 AI 分析自身代码时识别注入模式(递归元提示注入意识防御)
首条/末条消息差异化:首条用户消息注入测试场景描述,末条消息追加执行引导
📋 用户消息 XML 标签两级处理
与系统提示词清洗策略一致:、<ephemeral_message> 等 Tier 1 标签完全丢弃
<user_information> 等 Tier 2 标签仅去壳保留内容,确保模型仍能获取项目上下文
新增诊断日志:输出每条用户消息的 XML 标签分析结果
📄 README 精简
移除内联更新日志(独立
CHANGELOG.md
维护)
移除项目结构树和 ASCII 架构图(减少维护成本)
⚡ 升级建议
直接 git pull && npm install 即可,无配置变更。
📊 社区反馈稳定性排名:v2.5.6 > v2.6.2 > v2.6.3,v2.6.4 主要改善新模型的拒绝率问题,建议先在测试环境验证后再用于生产。