-
Notifications
You must be signed in to change notification settings - Fork 15
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Làm sao để train vậy bạn? #2
Comments
Để hôm nào mình rảnh mình tổng hợp lại nha, do giờ mình đã chuyển sang research Voice Cloning bằng model khác rồi, không có dùng cái này nữa |
Bạn đang dùng model nào vậy? Cho mình tham khảo với! |
Cho mình tham khảo với! |
Bạn thử cái này xem, mình mới cập nhật á, test VIVOS trước xong extend ra dataset của bạn nè I have updated the pipeline for training: https://github.com/v-nhandt21/ViSV2TTS/blob/master/README.md Try to test the pipeline first with VIVOS then config it to run with your data |
Cho mình hỏi là phần tiền xử lý sử dụng vi2IPA_split có thể áp dụng cho thuật toán TTS: VITS, VITS2 được không bạn nhỉ ? |
Được hết á bạn, vi2IPA thì nó convert raw text thành grapheme dạng IPA, ngoài ra bạn cũng có thể thử dạng ARPAbet https://github.com/v-nhandt21/ViMFA/blob/main/phoneme_dict/viARPAbet.txt |
cảm ơn bạn. For Train Model - where is the train_ms.py file? |
this is a mistake here cat vivos/test/prompts.txt > DATA/val.txt it should be text to val and train to train? Why are we putting the test into the training? cat vivos/test/prompts.txt > DATA/val.txt |
No, I did it intentionally, I try to merge it:
So that makes to train more data because the test in speech synthesis is not too important P/S: the vivos is for checking source code only, we really need more data for this stuff |
thanks a lot. I am fighting with this thing all the way i.e. running on windows 10 instead of linux (viclone) C:\Users\aiwinsor\Documents\dev\ViSV2TTS>python app.py (viclone) C:\Users\aiwinsor\Documents\dev\ViSV2TTS> |
File "app.py", line 84, in You can try to use the absolute path like "C:\Users\aiwinsor\Documents\dev\ViSV2TTS\vits\logs\vivos\G_7700000.pth" |
I gave up on running the code in Windows 10 and am running on Ubuntu using working with VIVOS I was able to run all the install environment without any issues python Step1_data_processing.py. OK But I am getting the error here. python train_ms.py -c configs/vivos.json -m vivos Below is my errors _complex parameter be given for real inputs, and will further require that return_complex=True in a future PyTorch release. (Triggered internally at ../aten/src/ATen/native/SpectralOps.cpp:800.) -- Process 0 terminated with the following error: |
I think this error may be caused by library version: https://librosa.org/doc/main/generated/librosa.filters.mel.html My librosa version is librosa=0.8.0, could you try:
or
|
Cảm ơn bạn nhiều. Mình bây giờ mới bắt đầu training. Xin hỏi bạn có xem qua https://github.com/Plachtaa/VITS-fast-fine-tuning |
Trong folder vits không thấy có folder logs nào vậy bạn? |
It is a big file; hence, it may be the reason why he did not upload it. |
Can you share us?
…On Wed, 8 Nov 2023 at 01:03 UncleBob2 ***@***.***> wrote:
File "app.py", line 84, in object =
VoiceClone("vits/logs/vivos/G_7700000.pth")
You can try to use the absolute path like
"C:\Users\aiwinsor\Documents\dev\ViSV2TTS\vits\logs\vivos\G_7700000.pth"
Trong folder vits không thấy có folder logs nào vậy bạn?
It is a big file; hence, it may be the reason why he did not upload it.
—
Reply to this email directly, view it on GitHub
<#2 (comment)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/ABBJ7DR7YTV3GRQFIQGEFH3YDJZWXAVCNFSM56WKBLV2U5DIOJSWCZC7NNSXTN2JONZXKZKDN5WW2ZLOOQ5TCNZZHEZTMMBTGA3A>
.
You are receiving this because you commented.Message ID:
***@***.***>
|
Mọi người có thể dùng model ở đây vivos_ViSV2TTS, mình train tới 150k step thấy nghe cũng ổn. |
@kingkong135 hình như source code này không còn work nữa, bạn có thể cho mình xin cái working source của bạn được ko? Cám ơn bạn! |
Mình vẫn chạy bình thường mà, có chăng là sửa trong cái file mel_preocessing.py 2 câu lệnh sau là do phiên bản python mình dùng.
|
Cảm ơn Bạn, it is working for me in ubuntu. |
follow the instructions here: python -m pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0 --extra-index-url https://download.pytorch.org/whl/cu116 make sure that you downgrade librosa==0.8.0 You will need to downgrade gradio and httpx |
Xin hỏi các bạn có dùng qua website này https://ttsmaker.com/. Nó có thể thay đổi - Voice Speed, Pitch Adjustment và v.v. Mình đang muốn làm cách software như vậy. |
Have you tried to train on larger data :)) The data from VIVOS is for source code and env validation only, I think it would not be enough for the model to perform cloning. The data I used has size from 200-1000 hours of audio |
I think that the data size of 200-1000 hours of audio is too much. In the past, I was able to clone a voice using 1 hour or less of the voice. BTW, I am currently testing this model and it is working quite well. |
Mình chưa, một phần do tài nguyên không phép, thường mình test với bộ dữ liệu dưới 25h. VỚi voice clone, mình nghĩ sử dụng càng ít dữ liệu nhưng độ chính xác vẫn cao thì tốt, 1 số model chỉ cần thời gian dưới 10 phút như RVC hoặc so-vits-svc (dĩ nhiên đầu vào là audio =)) |
Uhm, so-vits thì nó là voice conversion rồi á, là speech2speech :)) |
Hello bro, How many training step for the convergence of your dataset to reach the quantity as in your demo file (vits/audio/sontung_clone2.wav)? |
I get this audio at 1M iters: https://github.com/v-nhandt21/ViSV2TTS/blob/master/vits/audio/sontung_clone.wav |
Bạn có thể hướng đẫn mình cách train chi tiết được không ạ?
Nếu được thì bạn cho mình xin thử pretrained model với!
The text was updated successfully, but these errors were encountered: