GM_talker

GM_talker 项目介绍

GM_talker 是融合 GPT_SoVITS 及 Musetalker 的语音数字人综合项目项目，并加入了 deepseek 聊天机器人。本项目是方便大家快速完成自己的定制化数字人。

环境配置

本次介绍主要讲解在 autodl 的使用。不需要你有服务器也能快速实现自己的数字人，快来试试吧！

首先请登录 autodlhttps://www.autodl.com/market/list

2.1 设备选择

这里推荐北京 B 区的 4090 或者重庆 A 区的 4090D 单卡，可以满足语音和数字人任务设备需要。

2.2 镜像选择

点击社区镜像，选择 GM_talker 即可，因为还没上传完成暂时没有~

2.3 运行设备

配置好后再控制台点开机，再点击 jupyterlab 即可进入 terminal 页面。

2.4 启动项目

找到：

/root/gm_talker/GPT_SoVITS/inference_webui.py文件后

在 888 行添加自己的 deepseek key

然后在 terminal 输入：

mv ~/GPT-SoVITS/  ~/autodl-tmp
cd /root/autodl-tmp/GPT-SoVITS/
python "/root/autodl-tmp/GPT-SoVITS/GPT_SoVITS/inference_webui.py"

接着到控制台页面，点击自定义服务，映射端口（推荐在 vscode terminal 或者使用 autodl 工具启动命令）。

配置无误后可以通过 127.0.0.1:6006 进入项目。

系统操作

3.1 界面介绍

chat 模块

主要负责支持你需要的视频脚本编写，可以和 deepseek 智能体聊天生成你想要的文案。

语音生成模块

主要负责支持将语音转为个性化的文本，可以放入音频做参考微调。

数字人生成模块及修复模块

主要负责数字人的生成，以及生成后将画质修复。

3.2 操作

3.2.1 chat 模块

chat 这里可以进行对话，输入即可得到需要的回答。你可以编写 prompt，和 deepseek 对话生成你的脚本。点击 clear 清除内容。

3.2.2 个性化语音生成模块

你需要准备一段音频作为参考声音，微调模型。或者使用我提供的模型做参考（御姐微调版本），输入你想生成的内容可以跑出你想要的结果。

数据通过网盘获取，模型文件我也放在这里了，需要自取。

链接：https://pan.quark.cn/s/216b643735ea

这里的参考御姐及参考御姐 1 是指参考视频，放在下图圈出的位置。记得点击右侧的无文本模式，否则音频效果会不好。

接下来说说推理。

首先请将 chat 得到的内容放进去，就是你要生成音频的文本。
然后请选择与文本匹配的语言规则。
接着是切分规则，一般选择以中文句号分割。
GPT parameters 可以保持默认，然后点推理即可。
然后请大家讲推理好的音频试听一下，没问题就请下载。

注意：下面批量生成可以忽略~

3.2.3 视频生成

首先你需要准备一个参考视频，我在刚才的网盘里提供了一份视频，大家也可以自己上传。

这个视频不要动作幅度过大，尽量保持闭口，背景不要过于复杂。

然后记得把你生成的音频也送进去。

点一下生成即可~（算法暂未调整速度较慢。）结果会在右侧标出的位置显示，安静等待即可。

如果有面部修复需求点击下面的修复，很慢！

3.3 效果展示

4.引用

https://github.com/RVC-Boss/GPT-SoVITS https://github.com/deepseek-ai/DeepSeek-LLM https://github.com/TMElyralab/MuseTalk

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Docker		Docker
GPT_SoVITS		GPT_SoVITS
__pycache__		__pycache__
assets		assets
configs/inference		configs/inference
data		data
docs		docs
ffmpeg-6.1-amd64-static		ffmpeg-6.1-amd64-static
i18n/locale		i18n/locale
models		models
musetalk		musetalk
scripts		scripts
static		static
tools		tools
voice		voice
Dockerfile		Dockerfile
GPT_SoVITS_Inference.ipynb		GPT_SoVITS_Inference.ipynb
LICENSE		LICENSE
README.md		README.md
api.py		api.py
app.py		app.py
colab_webui.ipynb		colab_webui.ipynb
config.py		config.py
docker-compose.yaml		docker-compose.yaml
dockerbuild.sh		dockerbuild.sh
entrypoint.sh		entrypoint.sh
go-webui.bat		go-webui.bat
go-webui.ps1		go-webui.ps1
gpt-sovits_kaggle.ipynb		gpt-sovits_kaggle.ipynb
gweight.txt		gweight.txt
inference_webui.py		inference_webui.py
install.sh		install.sh
requirements.txt		requirements.txt
sweight.txt		sweight.txt
webui.py		webui.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GM_talker

GM_talker 项目介绍

环境配置

2.1 设备选择

2.2 镜像选择

2.3 运行设备

2.4 启动项目

系统操作

3.1 界面介绍

3.2 操作

3.2.1 chat 模块

3.2.2 个性化语音生成模块

3.2.3 视频生成

3.3 效果展示

4.引用

About

Releases

Packages

Languages

License

Bald0Wang/GM_talker

Folders and files

Latest commit

History

Repository files navigation

GM_talker

GM_talker 项目介绍

环境配置

2.1 设备选择

2.2 镜像选择

2.3 运行设备

2.4 启动项目

系统操作

3.1 界面介绍

3.2 操作

3.2.1 chat 模块

3.2.2 个性化语音生成模块

3.2.3 视频生成

3.3 效果展示

4.引用

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages