Skip to content

Ria-DiffSinger-v0.4-TPSE

Pre-release
Pre-release

Choose a tag to compare

@RibosomeK RibosomeK released this 18 Jan 12:41
· 2 commits to master since this release

声库说明

基于 TPSE 分支进行训练,包括 acoustic, duration, pitch, variance 四个模块,其中 pitch 可供其他分支的声库使用(除 multi-dict 以外),因此并未将该模块包含进声库中,而是单独提供。

对比

在初步使用后,该分支训练出的模型对比本声库 lynxnet 分支可能会有以下区别:

Acoustic

  • 整体响度变大,约 2db
  • 高频变亮
  • 句尾渲染结果更干净
  • 极个别情况下出现发音变形,如 う -> お
  • 极个别情况下出现频谱混叠(可能由 OpenUtau 导致)

Duration

  • 无明显变化

Pitch

  • 表现力更好,具体表现为转音数量增加,有极个别转尾音情况的出现

Variance

  • 无明显变化

另注

  • 对比的 lynxnet 分支为内测时版本,而 TPSE 分支的 lynxnet 则有少许变动
  • 训练 pitch 模型时显存要求有明显增加
  • acoustic 模型大小有明显增长(约增加 50 MB)
  • pitch 模型大小可能有小幅增长(约增长 5 MB)