Skip to content

VoiceInput 1.0.1

Choose a tag to compare

@github-actions github-actions released this 08 Jun 17:19
· 3 commits to main since this release

VoiceInput 1.0.1

Bug 修复

  • 修复 Qwen3-ASR 模型无法识别语音AudioPreprocessor.resampleTo16kHzAVAudioConverter 的 input block 重复返回同一 buffer,导致音频数据被复制多次产生混乱音频。引入单次提供机制修复。
  • 修复设置窗口关闭后快捷键不生效ShortcutEventRouting.shouldPassThrough 原仅检查 NSApp.isActive,打开设置关闭后 app 仍处于 active 导致快捷键穿透。改为 NSApp?.keyWindow != nil 精确判断。
  • 修复 Qwen3-ASR 松键后 overlay 显示"正在聆听..."无反馈:增加"正在识别..."加工状态提示 + spinner,同时修复 isRefining=true 时忽略 text 参数的 bug。

新功能

  • 短按切换录制:短按右 Command(< 0.5s)切换录制状态——空闲时开始,录制中结束。长按保持不变。
  • ESC 取消录制:录制中按 ESC 取消当前录制,不注入文本。
  • AudioPreprocessor 音频预处理模块:支持 16kHz 重采样 + Mel filterbank (fbank) 特征提取。
  • Qwen3-ASR 引擎集成:通过 FluidAudio SDK 支持本地 CoreML 推理,支持 0.6B / 1.7B 模型下载。
  • ASR 引擎选择菜单:状态栏菜单中切换 Apple Speech / Qwen3-ASR。
  • 录制权限策略模块:Qwen3-ASR 仅需麦克风权限,无需 Apple 语音识别权限。
  • 快捷键管理器 + 设置 UI:可视化录制快捷键、长按阈值、短按行为设置。
  • 完整单元测试覆盖:15 个新建测试文件,76 个测试全部通过。