Skip to content

lha 1.0.5

Choose a tag to compare

@xuziqiang98 xuziqiang98 released this 15 Jun 10:41
· 15 commits to main since this release

Highlights

  • 新增实验性 input_slimming,默认关闭,可通过 [features] input_slimming = true 启用。
  • 只压缩当前 request 中安全的 tool result,不改写用户输入、assistant 消息或 reasoning。
  • 为 JSON、日志、搜索结果、diff、纯文本等内容加入了按类型处理的压缩策略。
  • 压缩后的原文和元数据会随会话恢复,支持 resume-safe retrieval。
  • TUI 的实验功能菜单、侧边栏和消息流新增了相关入口与状态展示。
  • 协议层补充了 input-slimming 事件与 token 统计,便于客户端和调试使用。

Why It Matters

  • 大体积工具输出不再直接挤占上下文窗口,模型请求更轻。
  • 这是请求级优化,不会改变持久历史,失败时也会回退到原始请求。
  • 恢复会话后还能继续取回原文,避免前后行为不一致。
  • 端到端可观测后,后续调优 token 节省和压缩质量会更稳。