Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

连续的标点符号时很容易发生参考音频泄露 #1061

Open
zdoek001 opened this issue May 7, 2024 · 4 comments
Open

连续的标点符号时很容易发生参考音频泄露 #1061

zdoek001 opened this issue May 7, 2024 · 4 comments

Comments

@zdoek001
Copy link

zdoek001 commented May 7, 2024

使用分支的apiv2,开启分割5,当片段中存在一串连序的标点符号 比如一连串,,,,,,,,逗号时,这段时间就会疯狂泄露。。试了main中 的webui推理出来的音频没这个问题。

@jmaple12
Copy link

jmaple12 commented May 8, 2024

使用分支的apiv2,开启分割5,当片段中存在一串连序的标点符号 比如一连串,,,,,,,,逗号时,这段时间就会疯狂泄露。。试了main中 的webui推理出来的音频没这个问题。

能放一下后台cmd的记录吗

@jmaple12
Copy link

jmaple12 commented May 8, 2024

使用分支的apiv2,开启分割5,当片段中存在一串连序的标点符号 比如一连串,,,,,,,,逗号时,这段时间就会疯狂泄露。。试了main中 的webui推理出来的音频没这个问题。

你用Pull request中的#962中的文件替换 GPT_SoVITS/TTS_infer_pack/TextPreprocessor.py,会有改善

@zdoek001
Copy link
Author

zdoek001 commented May 8, 2024

使用分支的apiv2,开启分割5,当片段中存在一串连序的标点符号 比如一连串,,,,,,,,逗号时,这段时间就会疯狂泄露。。试了main中 的webui推理出来的音频没这个问题。

能放一下后台cmd的记录吗

image

@zdoek001
Copy link
Author

zdoek001 commented May 8, 2024

#962

替换了,依旧存在,好像是,,,,,,时没有停顿,反而一直在发声.我本意是希望通过逗号 句号 来区分停顿时间...

@zdoek001 zdoek001 changed the title 很容易发生参考音频泄露 连续的标点符号时很容易发生参考音频泄露 May 8, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants