Ria-DiffSinger-v0.4-TPSE

Pre-release

Pre-release

RibosomeK released this 18 Jan 12:41

· 2 commits to master since this release

32eb2f4

声库说明

基于 TPSE 分支进行训练，包括 acoustic, duration, pitch, variance 四个模块，其中 pitch 可供其他分支的声库使用（除 multi-dict 以外），因此并未将该模块包含进声库中，而是单独提供。

对比

在初步使用后，该分支训练出的模型对比本声库 lynxnet 分支可能会有以下区别：

Acoustic

整体响度变大，约 2db
高频变亮
句尾渲染结果更干净
极个别情况下出现发音变形，如う -> お
极个别情况下出现频谱混叠（可能由 OpenUtau 导致）

Duration

无明显变化

Pitch

表现力更好，具体表现为转音数量增加，有极个别转尾音情况的出现

Variance

无明显变化

另注

对比的 lynxnet 分支为内测时版本，而 TPSE 分支的 lynxnet 则有少许变动
训练 pitch 模型时显存要求有明显增加
acoustic 模型大小有明显增长（约增加 50 MB）
pitch 模型大小可能有小幅增长（约增长 5 MB）

Assets 4