Skip to content

小紫 AI 代码编辑器 · 模型引擎底座 v1.0.0

Latest

Choose a tag to compare

@17741421897 17741421897 released this 15 Jun 02:09
10b79bf

欢迎使用 v1.0.0。本版本在界面体验与模型运行效率上做了较大提升,更方便在代码编辑器里使用本地大模型。

温馨提示:请搭配较新版本的模型运行程序使用。若尚未安装或需要更新,可在软件顶栏点击链接,前往官方下载页面获取与您电脑匹配的版本。


一、界面更好用了

整体布局

  • 采用深色主题,长时间使用更舒适。
  • 左右分区:左边放路径、网络、模型列表和运行日志;右边放加速选项和对话模板,找功能更顺手。
  • 常用设置分成「网络」「推理」「加速与特性」「缓存与对话提速」等区块,不再挤在一屏里。
  • 开关类选项改为拨动开关,一眼能看出开还是关。

路径管理

  • 模型目录、运行程序路径、多模态投影文件,每一行都可以单独清空
  • 仍保留清空全部路径,需要重置时一次搞定。

内置帮助

  • 右侧新增功能说明(默认收起),用通俗话解释每个开关是干什么的。
  • 顶栏 ? 按钮里有场景速查,不知道开什么时可以对照查看。
  • 顶栏可快速打开模型运行程序的官方下载页

二、新增与增强的能力

以下功能均在界面右侧「加速与缓存」区域操作,勾选后启动模型时自动生效,无需手动敲命令。

加速与特性

功能 能帮您做什么 建议
Jinja 模板 让程序自动识别模型的对话格式,工具调用等功能更稳定 一般保持开启
自动适配显存 根据显卡显存自动调整部分设置,省得自己猜 一般保持开启
KV 缓存压缩 长对话时节省显存,大约能省一半左右 显存紧张时再开
思考模式 适合带「先想再答」能力的模型 普通模型可关
MTP 多令牌预测 加快生成速度,适合支持该能力的专用模型 默认关闭,有对应模型再开
N-gram 推测 轻量加速,不占额外显存,可与 MTP 一起用 按需尝试
Flash Attention 进一步加速注意力计算 按显卡与模型情况尝试

缓存与对话提速

功能 能帮您做什么 建议
Prompt 缓存 多轮对话时,相同开头的内容不用重复算,回复更快 写代码、固定系统提示时很有用
上下文检查点 超长对话更流畅,减少卡顿 对话很长时再开
思考预算 限制模型「想」多久,避免一直思考不出答案 思考模型可选填数字

其它

  • 额外参数栏仍留给高级用户填写特殊需求;日常用右侧开关即可。
  • 所有设置会自动保存,下次打开软件还在。

三、对话模板

  • 模板市场新增通用对话模板,适合多数常见模型格式。
  • 可从模板市场一键选用,也可自己添加、搜索和管理模板。

四、不知道怎么选?看这里

您的场景 可以这样开
日常聊天、显存够用 保持默认即可
对话很长、显存不够 打开 KV 缓存压缩
在代码编辑器里反复对话 打开 Prompt 缓存
用的是支持加速的专用模型 可尝试 MTP,草稿数建议 2
模型想太久才回答 打开思考模式,并设一个思考预算
超长对话有点卡 试试上下文检查点 + KV 缓存压缩

更细的说明请点界面右侧功能说明,或顶栏 ? 帮助。


五、升级后请注意

  1. 运行程序版本:部分新功能需要较新的模型运行程序,太旧的版本可能不支持;请从官方下载页更新。
  2. 专用加速功能:如 MTP 等,只对特定模型有效,普通模型请勿强行开启。
  3. 原有设置:升级后,您之前保存的路径、端口、模型目录等仍会保留;新增开关使用默认状态。

小紫 AI 代码编辑器 · 模型引擎底座 v1.0.0