新增 Fun-ASR-Nano 实时转写引擎
MeetMemo 0.6
这次更新重点改进了本地语音识别与系统级语音输入体验,新增 Fun-ASR-Nano 实时转写引擎,并对 SenseVoice、系统音频录制、快捷键听写和权限处理做了大量稳定性优化。
新增
- 新增 Fun-ASR-Nano 实时 STT 引擎,提供新的本地转写选择。
- 新增系统级语音输入能力,可通过快捷键录音并将识别结果插入当前输入位置。
- 新增语音输入设置、悬浮状态窗口、文本规范化与组合逻辑。
- 新增更多模型变体配置,方便在不同转写质量和性能需求之间切换。
改进
- 精简 SenseVoice 与语音输入相关流程,降低重复转写和状态混乱的概率。
- 改进语音输入热键时序、文本处理和录音保护逻辑。
- 系统音频捕获失败时会自动降级为仅麦克风录制,避免整场录音中断。
- 优化 SenseVoice 对轻声、句首吞字等场景的处理,并加入更多诊断信息。
- 改进模型下载、校验和可用性判断流程。
- 为 SpeechAnalyzer 测试补充 macOS 26 可用性保护。
修复
- 修复 SenseVoice 语音输入可能出现重复转写的问题。
- 修复语音输入权限处理中的异常状态。
- 修复部分音频源切换和录制状态同步问题。
- 修复短文本、热键快速触发等场景下的文本插入稳定性问题。
Notes
本版本继续保持本地优先的转写架构:会议录音、实时转写和语音输入都可以通过本地 STT 引擎完成。LLM 仍按用户配置的服务生成会议纪要。