Releases: MoyuFamily/ai-relay
Releases · MoyuFamily/ai-relay
v2.13.0: Anthropic Messages API 直连
✨ 新功能
- Anthropic Messages API 支持:新增
/v1/messages端点,Claude CLI / Claude Desktop App 可直接对接 Relay,无需转换协议,支持流式和非流式响应。
🐛 问题修复
- 上游 /v1 路径规范化:修复 bare-origin Claude Provider(无
/v1后缀)请求路径拼接错误的问题。 - Claude Desktop 导出修复:修复 Admin 后台 Claude App 配置导出使用无效深度链接的问题,改为复制原始配置。
⚡ 优化改进
- Cloudflare Free 性能优化:精简每次请求的 CPU 开销,确保在 Cloudflare Free 免费 CPU 限制内稳定运行。
v2.12.0: CcSwitch 导出与超时配置
✨ 新功能
- CcSwitch 深度链接导出:支持将 Provider 配置导出为 CcSwitch 兼容的深度链接格式,方便在 Cherry Studio 等客户端中一键导入。
- NewAPI 频道连接 JSON 导入:支持导入 NewAPI 的频道连接 JSON 格式,拓宽数据源兼容性。
- 上游请求超时配置:新增
RELAY_UPSTREAM_TIMEOUT_MS环境变量,支持自定义上游 Provider 请求超时时间,避免长时间挂起。
⚡ 优化改进
- 发版流程规范化:新增 pre-release CI 工作流与发版流程文档(
docs/RELEASE-FLOW.md)。
v2.11.1: FAQ 文档与部署优化
✨ 新功能
- FAQ 文档:新增常见问题文档
docs/FAQ.md,并在 README 中添加链接,方便用户自助排查问题。
🐛 问题修复
- Cloudflare 部署锚点导航:修复 Cloudflare 部署详情
<details>标签缺少 id 属性导致锚点链接无法跳转的问题。
⚡ 优化改进
- CI 手动触发部署:启用 Cloudflare Pages 工作流的手动触发功能(
workflow_dispatch)。
v2.11.0: Cherry Studio 导入与 Provider UA 定制
✨ 新功能
- Cherry Studio 链接导入 Provider:支持通过 Cherry Studio 链接一键导入 Provider 配置,简化多 Provider 管理流程。
- 已有 Key 选择支持:自定义 Provider 编辑弹窗中支持选择已有 API Key,无需重复输入。
- Key 数量指示器:Provider 编辑 UX 优化,展示当前 Key 数量便于管理。
- Provider 自定义 User-Agent:支持为每个 Provider 单独配置 User-Agent,避免上游服务商因默认 SDK 标识而封禁请求。
- Provider 默认模型测试:API Key 测试时自动使用 Provider 特定的默认模型。
- 精确模型优先级路由:支持精确匹配模型名称的优先级路由,以及 Hash Key 解析。
- Provider 导入暂存草稿:导入 Provider 配置时先暂存为草稿,确认后再保存。
- 模型批量删除:支持批量移除模型列表,提升管理效率。
- User-Agent 透传与清理:将客户端 User-Agent 透传至上游 Provider,清理 fallback 引用中的冗余字段。
🐛 问题修复
- 上游请求重试与 User-Agent 兼容:上游请求失败时使用浏览器兼容的 User-Agent 重试。
- Provider Key 测试重试与错误处理:改进 Key 测试的重试逻辑和错误消息展示。
- NewAPI 导入 Base URL 与模型发现回退:修复 NewAPI 导入时的 Base URL 拼接和模型发现 fallback 逻辑。
- UI 错误消息展示:改进上游返回 HTML 响应时的错误消息展示与摘要处理。
v2.10.0: User-Agent 透传与流式性能优化
✨ 新功能
- API Key 最小长度可配置:新增
RELAY_API_KEY_MIN_LENGTH环境变量,允许自定义 API Key 最小长度要求,提升安全性 - 客户端 User-Agent 转发:将客户端的 User-Agent 透传给上游 Provider,提升请求的真实性和兼容性
⚡ 优化改进
- 流式用量跟踪性能优化:跳过逐 chunk 的 JSON.parse,仅在包含
_tokens字段时解析,大幅降低大模型生成场景下的 CPU 开销,避免 Cloudflare Workers 超时
🐛 问题修复
- User-Agent 安全处理:使用中性 SDK User-Agent(如
OpenAI/Python、Anthropic/Python)替代ai-relay/<version>,不再暴露中继身份;自动清理被上游封禁的脚本 UA - CF 部署资源恢复:重新部署时自动恢复已存在的 D1 数据库 UUID 和 KV Namespace ID,避免部署失败
- 上游错误解析:Provider Key 测试接口支持非 JSON 响应体,错误信息展示更准确
- Cron Deploy URL:改为可选配置,未设置时跳过校验而非报错
v2.9.1: Cron 认证回退与部署验证
🐛 问题修复
- Cron 认证回退:支持
CRON_SECRET→RELAY_ADMIN_KEY→RELAY_API_KEY多级回退,解决单一 secret 未配置时 cron 任务失败的问题 - 部署 URL 验证:新增
DEPLOY_URL格式校验(必须包含http://或https://),提前暴露配置错误 - 脚本健壮性:Cron 工作流添加
set -euo pipefail,配置缺失时快速失败并给出清晰提示
v2.9.0: D1 per-key 错误统计
✨ 新功能
- D1 per-key 错误统计:新增每个 API Key 的错误统计功能,通过 D1 数据库记录各 Key 的错误详情,便于快速定位问题 Key。
🐛 问题修复
- Cloudflare 异步 fallback 兼容:修复 Admin 配置和报表存储模块的 CF 环境解析,支持异步 fallback 机制。
⚡ 优化改进
- Vercel 部署跳过 Cloudflare 上下文:Vercel 环境不再加载 CF 上下文,减少不必要的环境检测开销。
- 同步化 Cloudflare 环境访问:重构 CF 环境检测逻辑为同步模式,优化静态路由预渲染,提升 Cloudflare Pages 部署性能。
- 重构部署脚本:优化 GitHub Actions 部署工作流的 node 脚本部分。
v2.8.1: Cloudflare 部署稳定性修复
🐛 问题修复
- Cloudflare 1102 错误修复:修复 CF Pages 部署后管理员页面和首页路由异常(CPU 超时)。
- Cloudflare 部署流水线修复:修复 GitHub Actions deploy-cf.yml 中 wrangler 环境变量传递问题。
- Cloudflare 用量记录性能优化:减少 D1 写入频率,降低 Worker CPU 开销,避免 1102 超时。
📚 文档更新
- 双平台文案全面升级:README、官网首页、SEO meta 全部更新为 Vercel + Cloudflare 双平台叙事,准确区分两种部署方式(Vercel 一键部署 / Cloudflare GitHub Actions 推送即部署)。
v2.8.0: CloudFlare Pages 一键部署
✨ 新功能
- Cloudflare Pages 全自动部署:支持通过 GitHub Actions 一键部署到 Cloudflare Pages,自动完成 D1 数据库创建、KV namespace 创建、D1 migrations 执行、环境变量配置和资源绑定。
- Cloudflare D1 + KV 存储:CF 部署使用 D1(用量统计)+ KV(配置数据),自动检测 CF 环境并切换存储后端。
- Cloudflare Cron 定时任务:通过 CF Pages Cron Triggers 执行健康探测和用量聚合。
_routes.jsonCDN 静态资源路由:静态资源直接从 CDN 边缘节点分发,减少 Worker 调用。- Scheduled GitHub Actions Workflow:新增定时工作流,定期执行 Provider 健康探测和用量聚合。
- CF 环境感知 Setup UI:Admin 后台自动检测 Cloudflare 环境,展示平台专属配置界面。
🐛 问题修复
- 无限 Keys 拉取 Bug:修复 Key 池获取时可能出现的无限循环问题。
- CF 环境日报为空:修复 Cloudflare 部署环境下每日用量报告数据为空的问题。
- KV 服务不可用韧性:改善 KV 服务不可用时的容错能力。
- Key Recorder 失败问题:修复 Key 记录器在特定场景下的失败问题。
- CF 部署工作流稳定性:修复 wrangler KV namespace 查找、D1/KV 资源配置等多个 CI 工作流问题。
⚡ 优化改进
- 升级至 Next.js 15 + React 19:使用 @opennextjs/cloudflare 替代已废弃的 @cloudflare/next-on-pages 构建方案。
- CF Secret 部署重构:Cloudflare Pages secret 部署改为动态同步模式。
- KV 操作并行化:Admin 配置中 Key 和 Fallback 恢复的 KV 操作改为并行执行。
- 用量存储初始化异步化:适配可靠异步上下文。
🚀 现在 AI Relay 同时支持 Vercel 和 Cloudflare Pages 两个平台部署,一键搞定!
v2.7.0: 概率性用量采样,大幅降低 KV 写入频率
✨ 新功能
- 概率性用量采样:实现
RELAY_KV_USAGE_SAMPLE_RATE采样机制,支持按概率写入用量统计,大幅降低 KV 写入频率(采样率 0.1 时约 10% 写入),配合批量写入可将请求与 KV 读写比降至 ~1:1。 - 选择性禁用全局计数器:支持通过配置禁用全局计数器更新,进一步减少 KV 写入。
⚡ 优化改进
- Provider 添加 UX 优化:改进 Admin 后台 Provider 添加流程的用户交互体验。
📚 文档更新
- README 描述优化:补充 KV 读写比例说明和 Upstash 免费层信息(每月 50 万次 KV 操作)。
Upstash 免费层每月 50 万次 KV 操作,开启采样 + 批量写入后基本够用!