v1.2.3

github-actions released this 17 Jun 04:24

· 1 commit to main since this release

97472d3

更新日志

新增

新增 Codex / OpenAI Responses API 兼容入口，支持 /v1/responses 请求并可转换到 OpenAI Chat Completions 或原生 Anthropic Messages 上游。
新增 OpenAI 兼容直连能力，Cherry Studio、Codex 等 OpenAI SDK 客户端可直接请求 /v1/chat/completions。
新增智能原生 Anthropic 上游模式：目标模型为 claude-* / qwen* 时直连 /v1/messages，其它模型继续走转换模式。
新增 Prompt Cache 优化：自动生成 prompt_cache_key、稳定工具和 system/developer 前缀顺序、为原生 Anthropic 请求自动添加 cache_control。
新增缓存统计：记录 cached input tokens / cache creation tokens，并在 Dashboard 与请求日志中展示缓存命中率。

改进

工具定义、工具调用参数和 JSON schema 做稳定化处理，提高上游 prompt cache 命中率。
Responses / Anthropic / OpenAI 三条路径统一记录用量、停止原因和缓存 token。
控制面板 Settings 新增 Prompt Cache 配置项，可开关缓存优化、设置 cache key 前缀和 Anthropic cache_control。
README 与英文 README 更新，补充 OpenAI / Codex / 原生 Anthropic / 缓存相关说明。
项目版本更新到 1.2.3。

修复

修复部分 OpenAI 兼容客户端收到 Anthropic SSE 结构导致解析失败的问题。
修复 Codex 请求原生 Anthropic 上游时的 Responses 转换与流式事件转换问题。
修复上游流式响应缺少 [DONE] 或工具调用片段时的兼容性问题。
修复请求日志无法展示缓存 token 的问题。

测试与构建

已通过 go test ./...。
已通过 npm run build。
GitHub Actions 已自动构建并上传 Linux / Windows / macOS 的 amd64 与 arm64 包，以及 checksums.txt。

Assets 9