项目介绍
SenseVoice(8.2K Stars)是阿里通义实验室的多任务语音理解模型。
一个 234MB 模型同时完成:
- 语音识别(ASR)
- 语种检测(中/英/日/韩/粤)
- 情感识别(开心/悲伤/愤怒/中性)
- 声音事件检测(笑声/掌声/音乐/哭泣)
速度
- GPU: 170 倍实时(10 秒音频只需 70ms)
- CPU: 17 倍实时(无需 GPU 也能用)
使用
pip install funasr
from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall", vad_model="fsmn-vad", device="cuda")
result = model.generate(input="audio.wav")
# 输出带情感标签: <|HAPPY|>今天天气真好<|NEUTRAL|>我们出去走走吧
应用场景
- 客服质检(自动检测客户情绪)
- 会议分析(识别氛围变化)
- 内容审核(检测异常声音事件)
- 语音助手(根据情绪调整回复)
链接
项目介绍
SenseVoice(8.2K Stars)是阿里通义实验室的多任务语音理解模型。
一个 234MB 模型同时完成:
速度
使用
应用场景
链接