Skip to content

v1.2.3

Choose a tag to compare

@github-actions github-actions released this 17 Jun 04:24
· 1 commit to main since this release

更新日志

新增

  • 新增 Codex / OpenAI Responses API 兼容入口,支持 /v1/responses 请求并可转换到 OpenAI Chat Completions 或原生 Anthropic Messages 上游。
  • 新增 OpenAI 兼容直连能力,Cherry Studio、Codex 等 OpenAI SDK 客户端可直接请求 /v1/chat/completions
  • 新增智能原生 Anthropic 上游模式:目标模型为 claude-* / qwen* 时直连 /v1/messages,其它模型继续走转换模式。
  • 新增 Prompt Cache 优化:自动生成 prompt_cache_key、稳定工具和 system/developer 前缀顺序、为原生 Anthropic 请求自动添加 cache_control
  • 新增缓存统计:记录 cached input tokens / cache creation tokens,并在 Dashboard 与请求日志中展示缓存命中率。

改进

  • 工具定义、工具调用参数和 JSON schema 做稳定化处理,提高上游 prompt cache 命中率。
  • Responses / Anthropic / OpenAI 三条路径统一记录用量、停止原因和缓存 token。
  • 控制面板 Settings 新增 Prompt Cache 配置项,可开关缓存优化、设置 cache key 前缀和 Anthropic cache_control。
  • README 与英文 README 更新,补充 OpenAI / Codex / 原生 Anthropic / 缓存相关说明。
  • 项目版本更新到 1.2.3

修复

  • 修复部分 OpenAI 兼容客户端收到 Anthropic SSE 结构导致解析失败的问题。
  • 修复 Codex 请求原生 Anthropic 上游时的 Responses 转换与流式事件转换问题。
  • 修复上游流式响应缺少 [DONE] 或工具调用片段时的兼容性问题。
  • 修复请求日志无法展示缓存 token 的问题。

测试与构建

  • 已通过 go test ./...
  • 已通过 npm run build
  • GitHub Actions 已自动构建并上传 Linux / Windows / macOS 的 amd64 与 arm64 包,以及 checksums.txt