Skip to content

Diffsinger OpenUTAU服务器使用教程

oxygen-dioxide edited this page Nov 20, 2022 · 4 revisions

目前Diffsinger OpenUTAU服务器还处于早期开发阶段,本页面内容随时可能更新,请不要对外宣传。

使用方法

配置

  • 用git下载xunmengshe/DiffSinger仓库,切换至server-refactor分支
  • 配置Diffsinger环境之后,在该环境下安装服务器所需要的依赖库:pip install -r requirements_server.txt
  • 下载0814_opencpop_500k(修复无参音素)0102_xiaoma_pe0109_hifigan_bigpopcs_hop128三个压缩包,解压到源代码仓库目录下的checkpoints文件夹
image
  • 前往OpenUTAU官方网站下载最新版OpenUTAU
  • 下载OpenUTAU歌手,将压缩包拖入OpenUTAU界面
    • 目前的OpenUTAU歌手仅仅是一个占位符,并不包含模型数据。目前的Diffsinger从源代码目录下加载模型数据。歌手的打包格式将在以后确定。

合成

  • 在源代码目录下启动server.py,直到看到Started diffsinger server
  • 打开OpenUTAU,歌手选择Opencpop,音素器和渲染器均选择ENUNU
  • 输入音符和歌词。支持汉字和拼音输入。连音符为减号-

目前限制

  • 服务器基于ENUNU接口,因此暂无法与ENUNU同时在OpenUTAU中使用。
  • 不支持多歌手
  • 不支持修改音素、音高等参数
  • 不支持变速曲
  • 由于ENUNU接口不支持OpenUTAU原生的加号+连音符,因此需要使用减号-作为连音符
Clone this wiki locally