VoiceInput 1.0.1

github-actions released this 08 Jun 17:19

· 3 commits to main since this release

86efa8c

VoiceInput 1.0.1

Bug 修复

修复 Qwen3-ASR 模型无法识别语音：AudioPreprocessor.resampleTo16kHz 中 AVAudioConverter 的 input block 重复返回同一 buffer，导致音频数据被复制多次产生混乱音频。引入单次提供机制修复。
修复设置窗口关闭后快捷键不生效：ShortcutEventRouting.shouldPassThrough 原仅检查 NSApp.isActive，打开设置关闭后 app 仍处于 active 导致快捷键穿透。改为 NSApp?.keyWindow != nil 精确判断。
修复 Qwen3-ASR 松键后 overlay 显示"正在聆听..."无反馈：增加"正在识别..."加工状态提示 + spinner，同时修复 isRefining=true 时忽略 text 参数的 bug。

新功能

短按切换录制：短按右 Command（< 0.5s）切换录制状态——空闲时开始，录制中结束。长按保持不变。
ESC 取消录制：录制中按 ESC 取消当前录制，不注入文本。
AudioPreprocessor 音频预处理模块：支持 16kHz 重采样 + Mel filterbank (fbank) 特征提取。
Qwen3-ASR 引擎集成：通过 FluidAudio SDK 支持本地 CoreML 推理，支持 0.6B / 1.7B 模型下载。
ASR 引擎选择菜单：状态栏菜单中切换 Apple Speech / Qwen3-ASR。
录制权限策略模块：Qwen3-ASR 仅需麦克风权限，无需 Apple 语音识别权限。
快捷键管理器 + 设置 UI：可视化录制快捷键、长按阈值、短按行为设置。
完整单元测试覆盖：15 个新建测试文件，76 个测试全部通过。

Assets 4