GitHub

This code repository is related to the publication "A comparative study of estimating articulatory movements from phoneme sequences and acoustic features", ICASSP 2020

LINK: https://ieeexplore.ieee.org/document/9053852

Packages Requirement:

Torch
matplotlib==2.1.0
tensorflow
numpy==1.13.3
inflect==0.2.5
librosa==0.6.0
scipy==1.0.0
tensorboardX==1.1
Unidecode==1.0.22
pillow

Training

python train.py --output_directory=outdir --log_directory=logdir

Training using a pre-trained model

Training using a pre-trained model can lead to faster convergence and we have used this technique to fine-tune the base model.

python train.py --output_directory=outdir --log_directory=logdir -c model.pt --warm_start

Acknowledgements

This implementation uses code from the following repo: NVIDIA-tacotron2

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
audio_processing.py		audio_processing.py
data_utils.py		data_utils.py
distributed.py		distributed.py
hparams.py		hparams.py
inference.ipynb		inference.ipynb
layers.py		layers.py
logger.py		logger.py
loss_function.py		loss_function.py
loss_scaler.py		loss_scaler.py
model.py		model.py
multiproc.py		multiproc.py
phoneme_to_seq.py		phoneme_to_seq.py
plotting_utils.py		plotting_utils.py
requirements.txt		requirements.txt
stft.py		stft.py
train.py		train.py
utils.py		utils.py

Abhay242/PhonemeToArticulation

Folders and files

Latest commit

History

Repository files navigation

Packages Requirement:

Training

Training using a pre-trained model

Acknowledgements

About

Resources

Stars

Watchers

Forks

Languages