Skip to content

素材中含有单个重复多次的单词是好事吗 #2381

@hzc12321

Description

@hzc12321

我有一份素材,是基于一篇文章念出来的音频。文章主题围绕AI,因此三两句就念一次AI。后面基于这个素材微调出来,发现他抽风的时候就会在生成音频里面奇奇怪怪的地方突然念“AI”一词(推理文本里面没有这个词)。

请问是不是确实有这方面的影响,也就是素材的音频内容不能在某个单词上有过高出现频率吗?还是这纯粹只是个巧合?又要如何避免他自己胡乱给自己加戏?毕竟人类语言的语法原本就符合某种分布,像“的”“地”这类单词原本就会频繁出现,却不见得会造成负面效果。

已参考https://github.com/RVC-Boss/GPT-SoVITS/issues/865,但我推理当下用的参考音频里面完全没有提到AI,所以我的情况是输出的语音中出现训练素材的内容。求大佬提供见解。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions