Skip to content

【开源推荐】FunASR 语音输入法 — 按快捷键说话,自动转文字粘贴到光标位置 #10056

@LauraGPT

Description

@LauraGPT

项目介绍

FunASR(16K+ Stars)是阿里通义实验室开源的工业级语音识别工具包。最近推出了桌面语音输入法工具:

按快捷键 → 说话 → 自动识别 → 粘贴到光标位置

支持中英日韩粤 5 种语言,GPU 170 倍实时 / CPU 17 倍实时,完全本地运行。

使用方式

pip install funasr sounddevice numpy pyperclip openai pynput

# 启动语音服务
funasr-server --device cuda  # 或 cpu

# 启动语音输入法
python examples/voice_input/funasr_input.py

然后在任何应用中按 Ctrl+Shift+Space 开始录音。

其他亮点

  • OpenAI 兼容 API:一行命令部署语音识别服务,任何 Agent 框架直接接入
  • 字幕生成:音视频一键生成 SRT/VTT 字幕
  • MCP 服务:Claude/Cursor 等 AI 工具可直接转写音频
  • 50+ 语言,说话人分离,情感检测

链接

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions