Listen, Disentangle, and Control: Controllable Speech-Driven Talking Head Generation

Changpeng Cai1,2*, Guinan Guo 3*, Jiao Li 1*, Junhao Su 2*, Chenghao He 5, Jing Xiao 1, Yuanxu Chen 1, Lei Dai 1, Feiyu Zhu 4† https://arxiv.org/pdf/2405.07257

MEAD: A Large-scale Audio-visual Dataset for Emotional Talking-face Generation [ECCV2020] https://github.com/uniBruce/Mead

FEED: Facial Extreme Emotions Dataset https://github.com/neeek2303/FEED

Affectnet - use this https://www.kaggle.com/datasets/thienkhonghoc/affectnet

Inter-Reconstructed Feature disentanglement(IRFD)

Name		Name	Last commit message	Last commit date
Latest commit History 104 Commits
__pycache__		__pycache__
reference		reference
speak		speak
speak_stylegan		speak_stylegan
.gitignore		.gitignore
CelebADataset.py		CelebADataset.py
FaceHelper.py		FaceHelper.py
README.md		README.md
S.png		S.png
T.png		T.png
config.yaml		config.yaml
fig2.png		fig2.png
inference.py		inference.py
model.py		model.py
mysixdrepnet.py		mysixdrepnet.py
requirements.txt		requirements.txt
stylegan.py		stylegan.py
styleganv1.py		styleganv1.py
test_irfd.py		test_irfd.py
test_resnet.py		test_resnet.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Listen, Disentangle, and Control: Controllable Speech-Driven Talking Head Generation

About

Releases

Packages

Languages

johndpope/SPEAK-hack

Folders and files

Latest commit

History

Repository files navigation

Listen, Disentangle, and Control: Controllable Speech-Driven Talking Head Generation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages