欢迎使用 v1.0.0。本版本在界面体验与模型运行效率上做了较大提升,更方便在代码编辑器里使用本地大模型。
温馨提示:请搭配较新版本的模型运行程序使用。若尚未安装或需要更新,可在软件顶栏点击链接,前往官方下载页面获取与您电脑匹配的版本。
一、界面更好用了
整体布局
- 采用深色主题,长时间使用更舒适。
- 左右分区:左边放路径、网络、模型列表和运行日志;右边放加速选项和对话模板,找功能更顺手。
- 常用设置分成「网络」「推理」「加速与特性」「缓存与对话提速」等区块,不再挤在一屏里。
- 开关类选项改为拨动开关,一眼能看出开还是关。
路径管理
- 模型目录、运行程序路径、多模态投影文件,每一行都可以单独清空。
- 仍保留清空全部路径,需要重置时一次搞定。
内置帮助
- 右侧新增功能说明(默认收起),用通俗话解释每个开关是干什么的。
- 顶栏 ? 按钮里有场景速查,不知道开什么时可以对照查看。
- 顶栏可快速打开模型运行程序的官方下载页。
二、新增与增强的能力
以下功能均在界面右侧「加速与缓存」区域操作,勾选后启动模型时自动生效,无需手动敲命令。
加速与特性
| 功能 | 能帮您做什么 | 建议 |
|---|---|---|
| Jinja 模板 | 让程序自动识别模型的对话格式,工具调用等功能更稳定 | 一般保持开启 |
| 自动适配显存 | 根据显卡显存自动调整部分设置,省得自己猜 | 一般保持开启 |
| KV 缓存压缩 | 长对话时节省显存,大约能省一半左右 | 显存紧张时再开 |
| 思考模式 | 适合带「先想再答」能力的模型 | 普通模型可关 |
| MTP 多令牌预测 | 加快生成速度,适合支持该能力的专用模型 | 默认关闭,有对应模型再开 |
| N-gram 推测 | 轻量加速,不占额外显存,可与 MTP 一起用 | 按需尝试 |
| Flash Attention | 进一步加速注意力计算 | 按显卡与模型情况尝试 |
缓存与对话提速
| 功能 | 能帮您做什么 | 建议 |
|---|---|---|
| Prompt 缓存 | 多轮对话时,相同开头的内容不用重复算,回复更快 | 写代码、固定系统提示时很有用 |
| 上下文检查点 | 超长对话更流畅,减少卡顿 | 对话很长时再开 |
| 思考预算 | 限制模型「想」多久,避免一直思考不出答案 | 思考模型可选填数字 |
其它
- 额外参数栏仍留给高级用户填写特殊需求;日常用右侧开关即可。
- 所有设置会自动保存,下次打开软件还在。
三、对话模板
- 模板市场新增通用对话模板,适合多数常见模型格式。
- 可从模板市场一键选用,也可自己添加、搜索和管理模板。
四、不知道怎么选?看这里
| 您的场景 | 可以这样开 |
|---|---|
| 日常聊天、显存够用 | 保持默认即可 |
| 对话很长、显存不够 | 打开 KV 缓存压缩 |
| 在代码编辑器里反复对话 | 打开 Prompt 缓存 |
| 用的是支持加速的专用模型 | 可尝试 MTP,草稿数建议 2 |
| 模型想太久才回答 | 打开思考模式,并设一个思考预算 |
| 超长对话有点卡 | 试试上下文检查点 + KV 缓存压缩 |
更细的说明请点界面右侧功能说明,或顶栏 ? 帮助。
五、升级后请注意
- 运行程序版本:部分新功能需要较新的模型运行程序,太旧的版本可能不支持;请从官方下载页更新。
- 专用加速功能:如 MTP 等,只对特定模型有效,普通模型请勿强行开启。
- 原有设置:升级后,您之前保存的路径、端口、模型目录等仍会保留;新增开关使用默认状态。
小紫 AI 代码编辑器 · 模型引擎底座 v1.0.0