Skip to content

新增 Fun-ASR-Nano 实时转写引擎

Choose a tag to compare

@abcwyc abcwyc released this 07 Jun 02:27
· 3 commits to main since this release

MeetMemo 0.6

这次更新重点改进了本地语音识别与系统级语音输入体验,新增 Fun-ASR-Nano 实时转写引擎,并对 SenseVoice、系统音频录制、快捷键听写和权限处理做了大量稳定性优化。

新增

  • 新增 Fun-ASR-Nano 实时 STT 引擎,提供新的本地转写选择。
  • 新增系统级语音输入能力,可通过快捷键录音并将识别结果插入当前输入位置。
  • 新增语音输入设置、悬浮状态窗口、文本规范化与组合逻辑。
  • 新增更多模型变体配置,方便在不同转写质量和性能需求之间切换。

改进

  • 精简 SenseVoice 与语音输入相关流程,降低重复转写和状态混乱的概率。
  • 改进语音输入热键时序、文本处理和录音保护逻辑。
  • 系统音频捕获失败时会自动降级为仅麦克风录制,避免整场录音中断。
  • 优化 SenseVoice 对轻声、句首吞字等场景的处理,并加入更多诊断信息。
  • 改进模型下载、校验和可用性判断流程。
  • 为 SpeechAnalyzer 测试补充 macOS 26 可用性保护。

修复

  • 修复 SenseVoice 语音输入可能出现重复转写的问题。
  • 修复语音输入权限处理中的异常状态。
  • 修复部分音频源切换和录制状态同步问题。
  • 修复短文本、热键快速触发等场景下的文本插入稳定性问题。

Notes

本版本继续保持本地优先的转写架构:会议录音、实时转写和语音输入都可以通过本地 STT 引擎完成。LLM 仍按用户配置的服务生成会议纪要。