ZeroShot StarGAN-VC

ZeroShot Learning이 가능한 StarGAN-VC 제안

소리의 고유 정보를 손상시킬 수 있는 MCEP 대신 Mel-Spectrogram을 사용하여 소리 정보 손실 최소화
Speaker Encoder를 통해 모든 화자의 고유한 소리의 특징 정보 반영
기존 StarGAN-VC에서 사용한 Attribute vector를 Speaker Encoder를 사용하여 출력된 Embedding Vector로 대체 -> ZeroShot Learning 가능
StarGAN-VC의 Domain Classifier 단에서 (1)에서 생성된 Embedding Vector를 사용하도록 수정

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
FastSpeech2		FastSpeech2
ZtarGAN-VC		ZtarGAN-VC
README.md		README.md
requirements.txt		requirements.txt

Provide feedback