Ria-DiffSinger-v0.4-TPSE
Pre-release
Pre-release
声库说明
基于 TPSE 分支进行训练,包括 acoustic, duration, pitch, variance 四个模块,其中 pitch 可供其他分支的声库使用(除 multi-dict 以外),因此并未将该模块包含进声库中,而是单独提供。
对比
在初步使用后,该分支训练出的模型对比本声库 lynxnet 分支可能会有以下区别:
Acoustic
- 整体响度变大,约 2db
- 高频变亮
- 句尾渲染结果更干净
- 极个别情况下出现发音变形,如 う -> お
- 极个别情况下出现频谱混叠(可能由 OpenUtau 导致)
Duration
- 无明显变化
Pitch
- 表现力更好,具体表现为转音数量增加,有极个别转尾音情况的出现
Variance
- 无明显变化
另注
- 对比的 lynxnet 分支为内测时版本,而 TPSE 分支的 lynxnet 则有少许变动
- 训练 pitch 模型时显存要求有明显增加
- acoustic 模型大小有明显增长(约增加 50 MB)
- pitch 模型大小可能有小幅增长(约增长 5 MB)