Skip to content

Novbo/realtime_dialog

Repository files navigation

语音实时交互

1. 介绍

通过3个开源模型 + pyaduio模块实现语音实时交互“类豆包”功能。3个模型为:

2.环境配置

1. 安装Faster Whisper模型所需要的权重文件

链接:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main

2. 安装ChatTTS模型所需的权重文件

安装到当前项目目录即可

链接:https://huggingface.co/2Noise/ChatTTS/tree/main

3. 通过ollama本地部署Qween大模型

curl -fsSL https://ollama.com/install.sh | sh
ollama -v

# 拉取代码
ollama pull qwen2.5:14b

# 本地运行测试
ollama run qwen2.5:14b

3.安装配置环境

git clone https://github.com/Novbo/realtime_dialog.git
cd realtime_dialog

安装python

conda create -n realtime_dialog python=3.11
conda activate realtime_dialog
pip install -r requirements.txt

3. 运行

注意:运行之前请先修改配置文件信息config.py

python main.py

4. 代码配置文件

manager/config.py

About

语音实时交互

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages