Windows不用搭建环境只要英伟达显卡就行,解压即用!
https://github.com/FunAudioLLM/CosyVoice
链接:https://pan.quark.cn/s/702934278433
提取码:EdGb
https://www.bilibili.com/video/BV1ax4y1x7SG
1、优化框架和模型冗余,现在完整包从9.4GB下降到7.5GB大小;
2、支持多种显存切割模式,长文本从22GB显存占用降低到4GB显存占用;
3、支持生成音频的同时,生成和音频名字一样的srt字幕文件;
4、支持txt导入,将txt里的内容转换成音频;
5、支持srt导入,将字幕里的文字转换成音频,保持时间轴一样;
6、支持删除音色功能。
1、3s极速克隆的同时支持自动将克隆的音色模型保存下来,重启软件,预训练音色模式下,选择音色就多了一个音色,就是你的参考音频名字命名的音色;
2、优化长文本显存占用;
3、修复末尾必须标点符号的bug。
1、基于CosyVoice项目,原汁原味,支持tts、3s音频克隆、跨语种克隆、自然语言控制。