lha 1.0.5

xuziqiang98 released this 15 Jun 10:41

· 15 commits to main since this release

b879b7f

Highlights

新增实验性 input_slimming，默认关闭，可通过 [features] input_slimming = true 启用。
只压缩当前 request 中安全的 tool result，不改写用户输入、assistant 消息或 reasoning。
为 JSON、日志、搜索结果、diff、纯文本等内容加入了按类型处理的压缩策略。
压缩后的原文和元数据会随会话恢复，支持 resume-safe retrieval。
TUI 的实验功能菜单、侧边栏和消息流新增了相关入口与状态展示。
协议层补充了 input-slimming 事件与 token 统计，便于客户端和调试使用。

Why It Matters

大体积工具输出不再直接挤占上下文窗口，模型请求更轻。
这是请求级优化，不会改变持久历史，失败时也会回退到原始请求。
恢复会话后还能继续取回原文，避免前后行为不一致。
端到端可观测后，后续调优 token 节省和压缩质量会更稳。

Assets 2