Speech_Inversion_TCN

This repository holds the baseline models used in the "THE SECRET SOURCE : INCORPORATING SOURCE FEATURES TO IMPROVE ACOUSTIC-TO-ARTICULATORY SPEECH INVERSION" paper. Current baseline models are from the ones trained on the XRMB articulatory dataset. The same model archtectures were used with the HPRC dataset for the experiments in the paper.

This repository is still under construction !!

Baseline models

BiGRNN-MFCC : Model trained with MFCCs as inputs and 6 TVs as target outputs

BiGRNN-SF-MFCC : Model trained with MFCCs as inputs and 6 TVs + source features as target outputs

CNN-BiGRNN-Mspec : Model trained with melspectrograms as inputs and 6 TVs as target outputs

CNN-BiGRNN-SF-Mspec : Model trained with melspectrograms as inputs and 6 TVs + source features as target outputs

CNN-BLSTM-Mspec : Model trained with melspectrograms as inputs and 6 TVs as target outputs

CNN-BLSTM-SF-Mspec : Model trained with melspectrograms as inputs and 6 TVs + source features as target outputs

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
model_BGRU.py		model_BGRU.py
model_BGRU_ext.py		model_BGRU_ext.py
model_CNN-BLSTM.py		model_CNN-BLSTM.py
model_CNN-BLSTM_ext.py		model_CNN-BLSTM_ext.py
model_CNN-BiGRNN.py		model_CNN-BiGRNN.py
model_CNN-BiGRNN_ext.py		model_CNN-BiGRNN_ext.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

model_BGRU.py

model_BGRU.py

model_BGRU_ext.py

model_BGRU_ext.py

model_CNN-BLSTM.py

model_CNN-BLSTM.py

model_CNN-BLSTM_ext.py

model_CNN-BLSTM_ext.py

model_CNN-BiGRNN.py

model_CNN-BiGRNN.py

model_CNN-BiGRNN_ext.py

model_CNN-BiGRNN_ext.py

Repository files navigation

Speech_Inversion_TCN

Baseline models

About

Releases

Packages

Contributors 2

Languages

Yashish92/Speech-Inversion-TCN

Folders and files

Latest commit

History

Repository files navigation

Speech_Inversion_TCN

Baseline models

About

Resources

Stars

Watchers

Forks

Languages