[TTS]Voc流式推理拼接时出现了高频噪音 #2413

SoloPro-Git · 2022-09-20T01:33:39Z

更新结论:
voc流式合成中,对每一个sub_wav进行change_speed()可能存在问题.
当速度 <1的时候,最终concat出来的声音会有噪音断层,解决方案是把所有生成的新sub_wav最后出席的所有0值删除.
当速度 >1的时候,最终concat出来的声音会有噪音包络,尚未解决

更新1:
audio_process.py文件
change_speed() 这个函数转换了pcm就会有噪音

我们在做流式推理的时候, 在voc流式合成 block1 block2后 .
对b1 b2进行连接之后播放出来的声音会有一点高频的噪音.
我们觉得是 b1 b2 的交接点不一致造成的 .
观察了下pad和depad的代码好像也没找到问题.
但是通过频谱图的观察有两个观点:
1、频谱图有的拼接处有明显的一条竖线
2、竖线所在频谱图对应的时域图表现为振幅为0
麻烦看看呢~

用的fastspeech2和hifigan
block size是36, padsize是20

yt605155624 · 2022-09-20T02:08:45Z

可按照 https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/streaming_tts_server README 提高 pad size 到与非流式数值上一致，pad 值计算可参考 https://aistudio.baidu.com/aistudio/projectdetail/4151335 目前的配置是效果和速度上的权衡，不是数学上最佳的配置

liwei0826 · 2023-06-06T09:44:17Z

确实有问题，不知如何解决

SoloPro-Git added Bug T2S labels Sep 20, 2022

SoloPro-Git assigned yt605155624 Sep 20, 2022

yt605155624 assigned lym0302 Sep 20, 2022

SoloPro-Git closed this as completed Sep 21, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[TTS]Voc流式推理拼接时出现了高频噪音 #2413

[TTS]Voc流式推理拼接时出现了高频噪音 #2413

SoloPro-Git commented Sep 20, 2022 •

edited

Loading

yt605155624 commented Sep 20, 2022 •

edited

Loading

liwei0826 commented Jun 6, 2023

[TTS]Voc流式推理拼接时出现了高频噪音 #2413

[TTS]Voc流式推理拼接时出现了高频噪音 #2413

Comments

SoloPro-Git commented Sep 20, 2022 • edited Loading

更新1: audio_process.py文件 change_speed() 这个函数 转换了pcm就会有噪音

yt605155624 commented Sep 20, 2022 • edited Loading

liwei0826 commented Jun 6, 2023

SoloPro-Git commented Sep 20, 2022 •

edited

Loading

更新1:
audio_process.py文件
change_speed() 这个函数转换了pcm就会有噪音

yt605155624 commented Sep 20, 2022 •

edited

Loading