Неофициальная реализация клонирования голоса AGAIN-VC(код), вокодера MelGAN и мой вокодер WavGAN
Предобученные веса многоголосой моделей
Отредактируйте hparams.py
Поместите аудиофайлы для тренировки в data_dir
Запустите python again.py -r p
Запустите python again.py -r t
Запустите python again.py -r g -s path_source_file -t path_target_file
Отредактируйте hparams.py
Поместите аудиофайлы для тренировки в data_dir
Поместите аудиофайлы для использования в generate_dir
Запустите python melgan.py -r p -f mel
Запустите python melgan.py -r t -f mel
Запустите python melgan.py -r g -f wav
для файлов в wav из которого будет считаться мелспектр
Или запустите python melgan.py -r g -f mel
для файлов в mel, в нужном формате
Моя сеть. На вход принимает сгенерированный Гриффин лим звук и пытается его подправить. Архитектура генератора похожа на U-net, а дискриминатор взят из MelGAN
Отредактируйте hparams.py
Поместите аудиофайлы для тренировки в data_dir
Поместите аудиофайлы для использования в generate_dir
запустите python wavgan.py -r p -f mel
, или используйте мелспектрограммы из melgan.
Или запустите python wavgan.py -r p -f wav
, если хотите сразу сгенерировать сигнал Гриффин Лима для ускорения обучения
Запустите python wavgan.py -r t -f mel
для обучения на mel. Звук будет долго синтезироваться Гриффин Лимом на лету
Или запустите python wavgan.py -r t -f wav
для обучения на заранее сгенерированных wav.
Запустите python wavgan.py -r g -f wav
для файлов в wav
Или запустите python melgan.py -r g -f mel
для файлов в mel, в нужном формате. Звук будет сначала синтезироваться Гриффин Лимом