Diffsinger OpenUTAU服务器使用教程

Jump to bottom

oxygen-dioxide edited this page Nov 20, 2022 · 4 revisions

目前Diffsinger OpenUTAU服务器还处于早期开发阶段，本页面内容随时可能更新，请不要对外宣传。

使用方法

配置

用git下载xunmengshe/DiffSinger仓库，切换至server-refactor分支
配置Diffsinger环境之后，在该环境下安装服务器所需要的依赖库：pip install -r requirements_server.txt
下载0814_opencpop_500k（修复无参音素）、0102_xiaoma_pe、0109_hifigan_bigpopcs_hop128三个压缩包，解压到源代码仓库目录下的checkpoints文件夹

前往OpenUTAU官方网站下载最新版OpenUTAU
下载OpenUTAU歌手，将压缩包拖入OpenUTAU界面
- 目前的OpenUTAU歌手仅仅是一个占位符，并不包含模型数据。目前的Diffsinger从源代码目录下加载模型数据。歌手的打包格式将在以后确定。

合成

在源代码目录下启动server.py，直到看到Started diffsinger server
打开OpenUTAU，歌手选择Opencpop，音素器和渲染器均选择ENUNU
输入音符和歌词。支持汉字和拼音输入。连音符为减号-

目前限制

服务器基于ENUNU接口，因此暂无法与ENUNU同时在OpenUTAU中使用。
不支持多歌手
不支持修改音素、音高等参数
不支持变速曲
由于ENUNU接口不支持OpenUTAU原生的加号+连音符，因此需要使用减号-作为连音符

Clone this wiki locally