Many-to-Many Voice Conversion based on Variational Autoencoder

Code repository for paper link

Manh Luong, Viet Anh Tran under review in INTERSPEECH 2021

Dataset:

We use VCTK-Corpus to train and estimate our proposed model, VCTK dataset can be found in this link

Pretrained model:

pretrained model can be downloaded in this link Wavenet Vocoder: link

Requirements:

Python 3.6 or newer.
Pytorch 1.4 or newer.
librosa.
tensorboardX.
wavenet_vocoder pip install wavenet_vocoder

Prepare data for training

Download and uncompress VCTK dataset.
Move extracted dataset in [home directory].
run command: export HOME=[home directory]
run command: bash preprocessing.sh.

Usage

To train the model run the following command: bash training.sh

To convert voice from source to target using pretrained model. Run the follwoing commands:

cd [Disentangled-VAE directory]
mkdir ./results/checkpoints
cp [your downloaded checkpoint] ./results/checkpoints/
Download pretrained model of Wavenet_vocoder
cp [downloaded Wavenet_Vocoder]/checkpoint_step001000000_ema.pth [Disentangled-VAE directory]
edit two variables: src_spk and trg_spk in file conversion.sh to your source and target speaker, respectively.
run command: bash conversion.sh

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
autovc_replicate		autovc_replicate
model		model
preprocessing		preprocessing
README.md		README.md
conversion.sh		conversion.sh
preprocessing.sh		preprocessing.sh
train.py		train.py
training.sh		training.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

autovc_replicate

autovc_replicate

model

model

preprocessing

preprocessing

README.md

README.md

conversion.sh

conversion.sh

preprocessing.sh

preprocessing.sh

train.py

train.py

training.sh

training.sh

Repository files navigation

Many-to-Many Voice Conversion based on Variational Autoencoder

Dataset:

Pretrained model:

Requirements:

Prepare data for training

Usage

About

Releases

Packages

Languages

v-manhlt3/Disentangle-VAE-for-VC

Folders and files

Latest commit

History

Repository files navigation

Many-to-Many Voice Conversion based on Variational Autoencoder

Dataset:

Pretrained model:

Requirements:

Prepare data for training

Usage

About

Resources

Stars

Watchers

Forks

Languages