Releases
v1.2.3
Compare
Sorry, something went wrong.
No results found
更新日志
新增
新增 Codex / OpenAI Responses API 兼容入口,支持 /v1/responses 请求并可转换到 OpenAI Chat Completions 或原生 Anthropic Messages 上游。
新增 OpenAI 兼容直连能力,Cherry Studio、Codex 等 OpenAI SDK 客户端可直接请求 /v1/chat/completions。
新增智能原生 Anthropic 上游模式:目标模型为 claude-* / qwen* 时直连 /v1/messages,其它模型继续走转换模式。
新增 Prompt Cache 优化:自动生成 prompt_cache_key、稳定工具和 system/developer 前缀顺序、为原生 Anthropic 请求自动添加 cache_control。
新增缓存统计:记录 cached input tokens / cache creation tokens,并在 Dashboard 与请求日志中展示缓存命中率。
改进
工具定义、工具调用参数和 JSON schema 做稳定化处理,提高上游 prompt cache 命中率。
Responses / Anthropic / OpenAI 三条路径统一记录用量、停止原因和缓存 token。
控制面板 Settings 新增 Prompt Cache 配置项,可开关缓存优化、设置 cache key 前缀和 Anthropic cache_control。
README 与英文 README 更新,补充 OpenAI / Codex / 原生 Anthropic / 缓存相关说明。
项目版本更新到 1.2.3。
修复
修复部分 OpenAI 兼容客户端收到 Anthropic SSE 结构导致解析失败的问题。
修复 Codex 请求原生 Anthropic 上游时的 Responses 转换与流式事件转换问题。
修复上游流式响应缺少 [DONE] 或工具调用片段时的兼容性问题。
修复请求日志无法展示缓存 token 的问题。
测试与构建
已通过 go test ./...。
已通过 npm run build。
GitHub Actions 已自动构建并上传 Linux / Windows / macOS 的 amd64 与 arm64 包,以及 checksums.txt。
You can’t perform that action at this time.