通过3个开源模型 + pyaduio模块实现语音实时交互“类豆包”功能。3个模型为:
- Faster Whisper语音转文字模型。https://github.com/SYSTRAN/faster-whisper
- Qween3:14B通义千问大模型。
- ChatTTS文字转语音模型。https://github.com/2noise/ChatTTS
链接:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main
安装到当前项目目录即可
链接:https://huggingface.co/2Noise/ChatTTS/tree/main
curl -fsSL https://ollama.com/install.sh | sh
ollama -v
# 拉取代码
ollama pull qwen2.5:14b
# 本地运行测试
ollama run qwen2.5:14bgit clone https://github.com/Novbo/realtime_dialog.git
cd realtime_dialog安装python
conda create -n realtime_dialog python=3.11
conda activate realtime_dialog
pip install -r requirements.txt注意:运行之前请先修改配置文件信息config.py
python main.pymanager/config.py