My Paper

Jamming Prediction for Radar Signals Using Machine Learning Methods https://www.hindawi.com/journals/scn/2020/2151570/

PaperList

TTS

Date	Link	Name
2020.01.11	Arxiv	FastPitch: Parallel Text-to-speech with Pitch Prediction
2020.01.08	Arxiv	FastSpeech 2: Fast and High-Quality End-to-End Text to Speech
2019.05.22	Arxiv	FastSpeech: Fast, Robust and Controllable Text to Speech
2020.03.05	Arxiv	AlignTTS: Efficient Feed-Forward Text-to-Speech System without Explicit Alignment

Vocoder

Date	Link	Name
2019.12.05	Arxiv	Towards Robust Neural Vocoding for Speech Generation: A Survey
2019.12.03	Arxiv	WaveFlow: A Compact Flow-based Model for Raw Audio
2019.10.31	Arxiv	WaveGlow: A Flow-based Generative Network for Speech Synthesis
2019.10.25	Arxiv	Parallel WaveGAN: A fast waveform generation model based on generative adversarial networks with multi-resolution spectrogram
2019.10.08	Arxiv	MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis
2019.04.09	Arxiv	Probability density distillation with generative adversarial networks for high-quality parallel waveform generation
2018.11.09	Arxiv	ExcitNet vocoder: A neural excitation model for parametric speech synthesis systems

GAN

Date	Link	Name
2019.12.03	Arxiv	Analyzing and Improving the Image Quality of StyleGAN
2019.08.06	Arxiv	Adversarially Trained End-to-end Korean Singing Voice Synthesis System
2019.04.09	Arxiv	A New GAN-based End-to-End TTS Training Algorithm

Bi-Lingual, Multi-Lingual, Cross-Lingual

Date	Link	Name	Blog
2020.06.26	Arxiv	Multilingual Jointly Trained Acoustic and Written Word Embeddings
2020.06.26	Arxiv	Unsupervised Cross-lingual Representation Learning for Speech Recognition
2020.01.29	Arxiv	Learning Robust and Multilingual Speech Representations
2019.11.26	Arxiv	Cross-lingual Multi-speaker Text-to-speech Synthesis for Voice Cloning without Using Parallel Corpus for Unseen Speakers	Link
2019.07.09	Arxiv	Learning to Speak Fluently in a Foreign Language: Multilingual Speech Synthesis and Cross-Language Voice Cloning
2018.12.04	Arxiv	Domain Attentive Fusion for End-to-end Dialect Identification with Unknown Target Domain

Reepresentations

Date	Link	Name
2020.06.25	Arxiv	wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations
2019.12.03	Arxiv	Singing Voice Conversion with Disentangled Representations of Singer and Vocal Technique Using Variational Autoencoders
2019.11.28	Arxiv	Using VAEs and Normalizing Flows for One-shot Text-To-Speech Synthesis of Expressive Speech
2019.11.27	Arxiv	Powerful Speaker Embedding Training Framework by Adversarially Disentangled Identity Representation
2019.04.04	Arxiv	Multi-reference Tacotron by Intercross Training for Style Disentangling,Transfer and Control in Speech Synthesis

Enhancement (+ Super Resolution)

Date	Link	Name	Blog
2020.06.25	Arxiv	Real Time Speech Enhancement in the Waveform Domain
2019.12.03	Arxiv	High-quality Speech Synthesis Using Super-resolution Mel-Spectrogram

Normalizing Flow

Date	Link	Name	Blog
2019.01.30	Arxiv	Emerging Convolutions for Generative Normalizing Flows

Optimization

Date	Link	Name	Blog
2019.11.01	Arxiv	Does Adam optimizer keep close to the optimal point?

Name		Name	Last commit message	Last commit date
Latest commit History 87 Commits
ApplyingtheInformationBottleneckPrincipletoProsodicRepresentation.PNG		ApplyingtheInformationBottleneckPrincipletoProsodicRepresentation.PNG
ApplyingtheInformationBottleneckPrincipletoProsodicRepresentation2.PNG		ApplyingtheInformationBottleneckPrincipletoProsodicRepresentation2.PNG
Audio-to-Score Alignment Using.PNG		Audio-to-Score Alignment Using.PNG
Cross-speaker Style Transfer with Prosody Bottleneck data.PNG		Cross-speaker Style Transfer with Prosody Bottleneck data.PNG
Cross-speaker Style Transfer with Prosody Bottleneck.PNG		Cross-speaker Style Transfer with Prosody Bottleneck.PNG
DSRLMIM1.PNG		DSRLMIM1.PNG
MSS.PNG		MSS.PNG
Musical Speech.PNG		Musical Speech.PNG
Musical Speech2.PNG		Musical Speech2.PNG
NEURAL REMIXER1.PNG		NEURAL REMIXER1.PNG
NEURAL REMIXER2.PNG		NEURAL REMIXER2.PNG
NEURAL REMIXER3.PNG		NEURAL REMIXER3.PNG
README.md		README.md
Sinsy.PNG		Sinsy.PNG
Sinsy2.PNG		Sinsy2.PNG
Turn Taking Prediction for Natural Conversational Speech1.PNG		Turn Taking Prediction for Natural Conversational Speech1.PNG
adaspeech3.PNG		adaspeech3.PNG
adaspeech32.PNG		adaspeech32.PNG
adaspeech_table1,2.PNG		adaspeech_table1,2.PNG
dance2music.png		dance2music.png
dance2music_offline.png		dance2music_offline.png
deeprapper.PNG		deeprapper.PNG
dprnn.png		dprnn.png
draft-expert.PNG		draft-expert.PNG
draft-expert2.PNG		draft-expert2.PNG
einstein.PNG		einstein.PNG
fitchformant.PNG		fitchformant.PNG
gantts.PNG		gantts.PNG
hierarchical.PNG		hierarchical.PNG
melspectrograminversion1.PNG		melspectrograminversion1.PNG
melspectrograminversion2.PNG		melspectrograminversion2.PNG
melspectrograminversion3.PNG		melspectrograminversion3.PNG
melspectrograminversion4.PNG		melspectrograminversion4.PNG
neural_mix_pro.PNG		neural_mix_pro.PNG
nsinger.PNG		nsinger.PNG
ondeviceneuralspeechsynthesis_1.PNG		ondeviceneuralspeechsynthesis_1.PNG
piano_transcription.PNG		piano_transcription.PNG
servey2.png		servey2.png
stargenv2_vc.PNG		stargenv2_vc.PNG
survey1.PNG		survey1.PNG
telemelody.PNG		telemelody.PNG
trainingttssystemfromsyntheticdata1.PNG		trainingttssystemfromsyntheticdata1.PNG
trainingttssystemfromsyntheticdata2.PNG		trainingttssystemfromsyntheticdata2.PNG
trainingttssystemfromsyntheticdata3.PNG		trainingttssystemfromsyntheticdata3.PNG
uconv_conformer1.PNG		uconv_conformer1.PNG
unet_tts3.PNG		unet_tts3.PNG

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

My Paper

PaperList

TTS

Vocoder

GAN

Bi-Lingual, Multi-Lingual, Cross-Lingual

Reepresentations

Enhancement (+ Super Resolution)

Normalizing Flow

Optimization

About

Releases

Packages

ghlee3401/PaperList

Folders and files

Latest commit

History

Repository files navigation

My Paper

PaperList

TTS

Vocoder

GAN

Bi-Lingual, Multi-Lingual, Cross-Lingual

Reepresentations

Enhancement (+ Super Resolution)

Normalizing Flow

Optimization

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages