Got poor quality for japanese data. #230

yw0nam · 2024-05-20T01:18:40Z

Hi, Thank you for great work.

But i got poor quality for synthesize japanese data.
My data that has about 12hrs audios and 16 speakers was extracted from 3 visual novels Riddle Joker, CafeStella, and SenrenBanka.

But, when i finetune text2sementic and vits_decoder, the models are not converged at all.

Is 12 hours of data not enough to fine-tune?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Got poor quality for japanese data. #230

Got poor quality for japanese data. #230

yw0nam commented May 20, 2024

Got poor quality for japanese data. #230

Got poor quality for japanese data. #230

Comments

yw0nam commented May 20, 2024