Releases: kldhsh123/Afterglow
Releases · kldhsh123/Afterglow
v0.2.4
v0.2.3
添加
- 新增检索增强链路:支持 Query Rewrite、Cross-encoder Reranker、LLM Semantic Reranker,可在 RRF 召回后继续做相关性粗排与语义精排。
- 新增 Cross-encoder Reranker 客户端,支持 Jina/Cohere/SiliconFlow/bge-reranker 风格协议,以及 DashScope
text-rerank原生协议。 - 新增自适应聊天记录切分:支持固定窗口、启发式 adaptive、模型 adaptive 三种导入切分策略。
- 新增 LanceDB 向量索引管理能力:导入后可自动建索引,并新增
cli index、cli optimize命令用于手动建索引和合并优化表。 - 配置向导从 7 步扩展为 8 步,新增“检索增强”和“切分策略”配置页。
- 前端聊天展示支持将 AI 回复中的双换行拆成多条独立气泡,并按 2-5 秒错峰显示。
- README 新增使用前警示、伦理/法律边界、能力边界、API 隐私提醒和
AI_GENERATED_LONG_TERM_ENABLED风险说明。 - 新增首次安装向导
- 新增docker部署镜像
修改
- Chat Completions 与 Responses 主链路改为并发执行检索、关系记忆、联网搜索、URL 解析和 life 决策,降低首包前等待。
- URL 抓取改为后台任务提前启动,在 life/refine 阶段并行执行,减少网页读取带来的阻塞。
- Life Marker 应用改为异步 fire-and-forget,并使用强引用任务集合与 shutdown 等待,避免任务丢失或阻塞主回复。
- LLM 客户端新增
max_retries控制;life、互动决策、query rewrite、rerank 等 fail-open 路径默认单次失败即降级。 - 检索层改为多 query variant 并发召回,并按
best_rank + distance合并去重,避免改写 query 的命中被截断。 - LanceDB 查询性能优化:缓存 table handle、避免回拉 vector 列、启用 prefilter、按索引规模设置 nprobes。
- Persona prompt 模板调整结构,将历史风格示例移动到 system 末尾并强化“不可复读/不可当作当前事实”的约束。
- Life 模型默认
LIFE_MAX_TOKENS从 320 提高到 1500,降低 reasoning 模型 JSON 被截断导致状态无法写入的概率。
修复
- 修复前端清空或切换会话后,延迟显示的拆分气泡可能写入新会话的问题。
- 修复 Query Rewrite 开启后,多路召回合并顺序导致 variant-only 命中容易被 top_k 截断的问题。
- 修复 shutdown 等待后台任务时的
TimeoutErrorlint 问题。 - 修复用户要求沉默时仍可能触发 Web Search / URL Fetch 的隐私与费用问题。
- 修复 life_state.json 在后台 marker 写入和 life 决策写入之间的竞态。
- 清理部分未使用 import,并补齐相关 fail-open 与任务清理逻辑。
文档 & 配置
.env.example新增检索改写、LLM rerank、Cross Rerank、自适应切分、LanceDB 索引等配置项。- Web UI 新增 reranker/cross-reranker 预设,包含 DashScope、SiliconFlow、Jina、Cohere 和自定义服务。
- README 更新安装向导步骤、能力说明、推荐模型和 Cross-encoder Reranker 说明。
What's Changed
- 0.2.3 docker-dev by @kldhsh123 in #7
- v0.2.3 by @kldhsh123 in #8
Full Changelog: v0.2.2...v0.2.3
v0.2.3001
v0.2.2
新增
允许配置EMBEDDING最大并发和速率限制
在导入聊天记录至向量库中断时保留已存储的记录
优化
将AI的延迟返回从线程堵塞改成API返回字段,详细见API文档(这是一个很蠢的问题)
时间线系统的回复延迟现在更加真实,暂时新增被叫醒的情况
优化前端返回底部按钮,新增延迟返回调试
美化MD文档
bug修复
修复请求EMBEDDING模型时没有正确携带dimensions字段
What's Changed
- v0.2.2 by @kldhsh123 in #4
- 在导入聊天记录至向量库中断时保留已存储的记录 by @kldhsh123 in #5
Full Changelog: v0.2.1...v0.2.2
v0.2.1
v0.2.0
优化
AI产生的聊天记录不会再被存到主向量库中
优化时间线系统,现在会根据聊天记录生成时间线画像,允许主模型主动发起时间线更新
功能添加
添加允许AI决定不回复消息
添加 v1/responses 接口支持
添加 聊天别名支持
检查更新模块
BUG修复
修复 model 被允许指定后端模型
修复 AI可能发送不存在的表情包
修复QQ聊天记录导出emoji清洗问题
What's Changed
- v0.2.0 by @kldhsh123 in #1
New Contributors
- @kldhsh123 made their first contribution in #1
Full Changelog: V0.1.0...v0.2.0