Release v0.2.3 · kldhsh123/Afterglow

新增检索增强链路：支持 Query Rewrite、Cross-encoder Reranker、LLM Semantic Reranker，可在 RRF 召回后继续做相关性粗排与语义精排。
新增 Cross-encoder Reranker 客户端，支持 Jina/Cohere/SiliconFlow/bge-reranker 风格协议，以及 DashScope text-rerank 原生协议。
新增自适应聊天记录切分：支持固定窗口、启发式 adaptive、模型 adaptive 三种导入切分策略。
新增 LanceDB 向量索引管理能力：导入后可自动建索引，并新增 cli index、cli optimize 命令用于手动建索引和合并优化表。
配置向导从 7 步扩展为 8 步，新增“检索增强”和“切分策略”配置页。
前端聊天展示支持将 AI 回复中的双换行拆成多条独立气泡，并按 2-5 秒错峰显示。
README 新增使用前警示、伦理/法律边界、能力边界、API 隐私提醒和 AI_GENERATED_LONG_TERM_ENABLED 风险说明。
新增首次安装向导
新增docker部署镜像

Chat Completions 与 Responses 主链路改为并发执行检索、关系记忆、联网搜索、URL 解析和 life 决策，降低首包前等待。
URL 抓取改为后台任务提前启动，在 life/refine 阶段并行执行，减少网页读取带来的阻塞。
Life Marker 应用改为异步 fire-and-forget，并使用强引用任务集合与 shutdown 等待，避免任务丢失或阻塞主回复。
LLM 客户端新增 max_retries 控制；life、互动决策、query rewrite、rerank 等 fail-open 路径默认单次失败即降级。
检索层改为多 query variant 并发召回，并按 best_rank + distance 合并去重，避免改写 query 的命中被截断。
LanceDB 查询性能优化：缓存 table handle、避免回拉 vector 列、启用 prefilter、按索引规模设置 nprobes。
Persona prompt 模板调整结构，将历史风格示例移动到 system 末尾并强化“不可复读/不可当作当前事实”的约束。
Life 模型默认 LIFE_MAX_TOKENS 从 320 提高到 1500，降低 reasoning 模型 JSON 被截断导致状态无法写入的概率。

.env.example 新增检索改写、LLM rerank、Cross Rerank、自适应切分、LanceDB 索引等配置项。
Web UI 新增 reranker/cross-reranker 预设，包含 DashScope、SiliconFlow、Jina、Cohere 和自定义服务。
README 更新安装向导步骤、能力说明、推荐模型和 Cross-encoder Reranker 说明。

What's Changed

Full Changelog: v0.2.2...v0.2.3