Skip to content

Releases: kldhsh123/Afterglow

v0.2.4

31 May 08:42
5497177

Choose a tag to compare

新增

ChatAPI 顶层新增 schedule_tasks 字段(#9
配置引导:允许跳过可用性校验

修复

  • (#10) 配置引导网络错误原因为空
  • 流式过滤器跨 chunk 时会泄漏内部协议标签
  • 流式守卫大小写敏感

改进

  • 配置引导网络错误渲染层加空值兜底文案(防止后端给空串时前端继续空白)

What's Changed

Full Changelog: v0.2.3...v0.2.4

v0.2.3

28 May 12:45
43f3b4f

Choose a tag to compare

添加

  • 新增检索增强链路:支持 Query Rewrite、Cross-encoder Reranker、LLM Semantic Reranker,可在 RRF 召回后继续做相关性粗排与语义精排。
  • 新增 Cross-encoder Reranker 客户端,支持 Jina/Cohere/SiliconFlow/bge-reranker 风格协议,以及 DashScope text-rerank 原生协议。
  • 新增自适应聊天记录切分:支持固定窗口、启发式 adaptive、模型 adaptive 三种导入切分策略。
  • 新增 LanceDB 向量索引管理能力:导入后可自动建索引,并新增 cli indexcli optimize 命令用于手动建索引和合并优化表。
  • 配置向导从 7 步扩展为 8 步,新增“检索增强”和“切分策略”配置页。
  • 前端聊天展示支持将 AI 回复中的双换行拆成多条独立气泡,并按 2-5 秒错峰显示。
  • README 新增使用前警示、伦理/法律边界、能力边界、API 隐私提醒和 AI_GENERATED_LONG_TERM_ENABLED 风险说明。
  • 新增首次安装向导
  • 新增docker部署镜像

修改

  • Chat Completions 与 Responses 主链路改为并发执行检索、关系记忆、联网搜索、URL 解析和 life 决策,降低首包前等待。
  • URL 抓取改为后台任务提前启动,在 life/refine 阶段并行执行,减少网页读取带来的阻塞。
  • Life Marker 应用改为异步 fire-and-forget,并使用强引用任务集合与 shutdown 等待,避免任务丢失或阻塞主回复。
  • LLM 客户端新增 max_retries 控制;life、互动决策、query rewrite、rerank 等 fail-open 路径默认单次失败即降级。
  • 检索层改为多 query variant 并发召回,并按 best_rank + distance 合并去重,避免改写 query 的命中被截断。
  • LanceDB 查询性能优化:缓存 table handle、避免回拉 vector 列、启用 prefilter、按索引规模设置 nprobes。
  • Persona prompt 模板调整结构,将历史风格示例移动到 system 末尾并强化“不可复读/不可当作当前事实”的约束。
  • Life 模型默认 LIFE_MAX_TOKENS 从 320 提高到 1500,降低 reasoning 模型 JSON 被截断导致状态无法写入的概率。

修复

  • 修复前端清空或切换会话后,延迟显示的拆分气泡可能写入新会话的问题。
  • 修复 Query Rewrite 开启后,多路召回合并顺序导致 variant-only 命中容易被 top_k 截断的问题。
  • 修复 shutdown 等待后台任务时的 TimeoutError lint 问题。
  • 修复用户要求沉默时仍可能触发 Web Search / URL Fetch 的隐私与费用问题。
  • 修复 life_state.json 在后台 marker 写入和 life 决策写入之间的竞态。
  • 清理部分未使用 import,并补齐相关 fail-open 与任务清理逻辑。

文档 & 配置

  • .env.example 新增检索改写、LLM rerank、Cross Rerank、自适应切分、LanceDB 索引等配置项。
  • Web UI 新增 reranker/cross-reranker 预设,包含 DashScope、SiliconFlow、Jina、Cohere 和自定义服务。
  • README 更新安装向导步骤、能力说明、推荐模型和 Cross-encoder Reranker 说明。

What's Changed

Full Changelog: v0.2.2...v0.2.3

v0.2.3001

25 May 00:29

Choose a tag to compare

v0.2.3001 Pre-release
Pre-release

添加安装向导


这是一个Pre更新,并不是0.2.3最终版本,请不要将此版本作为 latest 版本使用

Full Changelog: v0.2.0...v0.2.3001

v0.2.2

23 May 19:14
e57466b

Choose a tag to compare

新增

允许配置EMBEDDING最大并发和速率限制
在导入聊天记录至向量库中断时保留已存储的记录

优化

将AI的延迟返回从线程堵塞改成API返回字段,详细见API文档(这是一个很蠢的问题)
时间线系统的回复延迟现在更加真实,暂时新增被叫醒的情况
优化前端返回底部按钮,新增延迟返回调试
美化MD文档

bug修复

修复请求EMBEDDING模型时没有正确携带dimensions字段

What's Changed

Full Changelog: v0.2.1...v0.2.2

v0.2.1

23 May 13:26
5ccb32e

Choose a tag to compare

v0.2.0

22 May 23:31
3a7e1f0

Choose a tag to compare

优化

AI产生的聊天记录不会再被存到主向量库中
优化时间线系统,现在会根据聊天记录生成时间线画像,允许主模型主动发起时间线更新

功能添加

添加允许AI决定不回复消息
添加 v1/responses 接口支持
添加 聊天别名支持
检查更新模块

BUG修复

修复 model 被允许指定后端模型
修复 AI可能发送不存在的表情包
修复QQ聊天记录导出emoji清洗问题

What's Changed

New Contributors

Full Changelog: V0.1.0...v0.2.0

V0.1.0

22 May 21:30

Choose a tag to compare

版本发布