Skip to content

Releases: RibosomeK/RiaDiffSinger

Ria-DiffSinger-v0.4-TPSE

18 Jan 12:41

Choose a tag to compare

Pre-release

声库说明

基于 TPSE 分支进行训练,包括 acoustic, duration, pitch, variance 四个模块,其中 pitch 可供其他分支的声库使用(除 multi-dict 以外),因此并未将该模块包含进声库中,而是单独提供。

对比

在初步使用后,该分支训练出的模型对比本声库 lynxnet 分支可能会有以下区别:

Acoustic

  • 整体响度变大,约 2db
  • 高频变亮
  • 句尾渲染结果更干净
  • 极个别情况下出现发音变形,如 う -> お
  • 极个别情况下出现频谱混叠(可能由 OpenUtau 导致)

Duration

  • 无明显变化

Pitch

  • 表现力更好,具体表现为转音数量增加,有极个别转尾音情况的出现

Variance

  • 无明显变化

另注

  • 对比的 lynxnet 分支为内测时版本,而 TPSE 分支的 lynxnet 则有少许变动
  • 训练 pitch 模型时显存要求有明显增加
  • acoustic 模型大小有明显增长(约增加 50 MB)
  • pitch 模型大小可能有小幅增长(约增长 5 MB)

自动音高及微调声码器

14 Jan 05:38
0e7b29a

Choose a tag to compare

Pre-release

说明

增加自动音高(dspitch.zip)和微调声码器(dsvocoder.zip)两个扩展包,适用于 Ria-DiffSinger-v0.4 以及 Ria-DiffSinger-v0.4-lynxnet

ps: 自动音高蛮烂的,还有微调的声码器我听不出区别,按你胃

使用方式

将需要的模块(*.zip)下载后解压到对应声库的文件夹中,该文件夹内应该同时包含名为 dsdurdsvariance 的文件夹。

以为 Ria-v.4-lynxnet 同时安装两个模块为例,安装好后的文件目录应该如下:

Ria-v0.4-lynxnet/
├── dsdur/
├── dsvariance/
├── dspitch/      自动音高的文件夹,应当包含以下文件
│   ├── dsconfig.yaml
│   ├── dsdict.yaml
│   ├── pitch.linguistic.onnx
│   ├── pitch.onnx
│   └── pitch.phonemes.txt
├── dsvocoder/    微调声码器的文件夹,应当包含以下文件
│   ├── NOTICE.txt
│   ├── NOTICE.zh-CN.txt
│   ├── vocoder.onnx
│   └── vocoder.yaml
└── 其他文件...

Ria-DiffSinger-v0.4-multi-dict

15 Sep 06:49

Choose a tag to compare

Pre-release

多语言分支版本,采样和标记无改变。

multi-dict version, samples and labels are not changed.

Ria-DiffSinger-v0.4-lynxnet

14 Sep 03:17

Choose a tag to compare

Pre-release

lynxnet 版本,采样和标记无变化。

Change backbone to lynxnet. Samples and lablels are not changed.

Ria-DiffSinger-v0.4

31 Jul 17:28
ebce6f1

Choose a tag to compare

Ria-DiffSinger-v0.4 Pre-release
Pre-release

2024.08.06 更新了字典

请看 README