小紫 AI 代码编辑器 · 模型引擎底座 v1.0.0

Latest

Latest

17741421897 released this 15 Jun 02:09

10b79bf

欢迎使用 v1.0.0。本版本在界面体验与模型运行效率上做了较大提升，更方便在代码编辑器里使用本地大模型。

温馨提示：请搭配较新版本的模型运行程序使用。若尚未安装或需要更新，可在软件顶栏点击链接，前往官方下载页面获取与您电脑匹配的版本。

一、界面更好用了

整体布局

采用深色主题，长时间使用更舒适。
左右分区：左边放路径、网络、模型列表和运行日志；右边放加速选项和对话模板，找功能更顺手。
常用设置分成「网络」「推理」「加速与特性」「缓存与对话提速」等区块，不再挤在一屏里。
开关类选项改为拨动开关，一眼能看出开还是关。

路径管理

模型目录、运行程序路径、多模态投影文件，每一行都可以单独清空。
仍保留清空全部路径，需要重置时一次搞定。

内置帮助

右侧新增功能说明（默认收起），用通俗话解释每个开关是干什么的。
顶栏 ? 按钮里有场景速查，不知道开什么时可以对照查看。
顶栏可快速打开模型运行程序的官方下载页。

二、新增与增强的能力

以下功能均在界面右侧「加速与缓存」区域操作，勾选后启动模型时自动生效，无需手动敲命令。

加速与特性

功能	能帮您做什么	建议
Jinja 模板	让程序自动识别模型的对话格式，工具调用等功能更稳定	一般保持开启
自动适配显存	根据显卡显存自动调整部分设置，省得自己猜	一般保持开启
KV 缓存压缩	长对话时节省显存，大约能省一半左右	显存紧张时再开
思考模式	适合带「先想再答」能力的模型	普通模型可关
MTP 多令牌预测	加快生成速度，适合支持该能力的专用模型	默认关闭，有对应模型再开
N-gram 推测	轻量加速，不占额外显存，可与 MTP 一起用	按需尝试
Flash Attention	进一步加速注意力计算	按显卡与模型情况尝试

缓存与对话提速

功能	能帮您做什么	建议
Prompt 缓存	多轮对话时，相同开头的内容不用重复算，回复更快	写代码、固定系统提示时很有用
上下文检查点	超长对话更流畅，减少卡顿	对话很长时再开
思考预算	限制模型「想」多久，避免一直思考不出答案	思考模型可选填数字

其它

额外参数栏仍留给高级用户填写特殊需求；日常用右侧开关即可。
所有设置会自动保存，下次打开软件还在。

三、对话模板

模板市场新增通用对话模板，适合多数常见模型格式。
可从模板市场一键选用，也可自己添加、搜索和管理模板。

四、不知道怎么选？看这里

您的场景	可以这样开
日常聊天、显存够用	保持默认即可
对话很长、显存不够	打开 KV 缓存压缩
在代码编辑器里反复对话	打开 Prompt 缓存
用的是支持加速的专用模型	可尝试 MTP，草稿数建议 2
模型想太久才回答	打开思考模式，并设一个思考预算
超长对话有点卡	试试上下文检查点 + KV 缓存压缩

更细的说明请点界面右侧功能说明，或顶栏 ? 帮助。

五、升级后请注意

运行程序版本：部分新功能需要较新的模型运行程序，太旧的版本可能不支持；请从官方下载页更新。
专用加速功能：如 MTP 等，只对特定模型有效，普通模型请勿强行开启。
原有设置：升级后，您之前保存的路径、端口、模型目录等仍会保留；新增开关使用默认状态。

小紫 AI 代码编辑器 · 模型引擎底座 v1.0.0

Assets 5