项目介绍
FunASR(16K+ Stars)是阿里通义实验室开源的工业级语音识别工具包。最近推出了桌面语音输入法工具:
按快捷键 → 说话 → 自动识别 → 粘贴到光标位置
支持中英日韩粤 5 种语言,GPU 170 倍实时 / CPU 17 倍实时,完全本地运行。
使用方式
pip install funasr sounddevice numpy pyperclip openai pynput
# 启动语音服务
funasr-server --device cuda # 或 cpu
# 启动语音输入法
python examples/voice_input/funasr_input.py
然后在任何应用中按 Ctrl+Shift+Space 开始录音。
其他亮点
- OpenAI 兼容 API:一行命令部署语音识别服务,任何 Agent 框架直接接入
- 字幕生成:音视频一键生成 SRT/VTT 字幕
- MCP 服务:Claude/Cursor 等 AI 工具可直接转写音频
- 50+ 语言,说话人分离,情感检测
链接
项目介绍
FunASR(16K+ Stars)是阿里通义实验室开源的工业级语音识别工具包。最近推出了桌面语音输入法工具:
按快捷键 → 说话 → 自动识别 → 粘贴到光标位置
支持中英日韩粤 5 种语言,GPU 170 倍实时 / CPU 17 倍实时,完全本地运行。
使用方式
然后在任何应用中按 Ctrl+Shift+Space 开始录音。
其他亮点
链接