3D-Aware Visual Question Answering about Parts, Poses and Occlusions (NeurIPS 2023)

Description

This is the implementation of the NeurIPS'23 paper "3D-Aware Visual Question Answering about Parts, Poses and Occlusions". This paper contains two parts:

Super-CLEVR-3D. A compositional reasoning dataset that contains questions about object parts, their 3D poses, and occlusions. $\rightarrow$ ./superclevr-3D-question
PO3D-VQA. A 3D-aware VQA model, combining 3D generative representations of objects for robust visual recognition and probabilistic neural symbolic program execution for reasoning. $\rightarrow$ ./PO3D-VQA

Citation

@article{wang20233d,
  title={3D-Aware Visual Question Answering about Parts, Poses and Occlusions},
  author={Wang, Xingrui and Ma, Wufei and Li, Zhuowan and Kortylewski, Adam and Yuille, Alan},
  journal={arXiv preprint arXiv:2310.17914},
  year={2023}
}

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
PO3D-VQA		PO3D-VQA
imgs		imgs
superclevr-3D-question @ 18cf001		superclevr-3D-question @ 18cf001
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PO3D-VQA

PO3D-VQA

imgs

imgs

superclevr-3D-question @ 18cf001

superclevr-3D-question @ 18cf001

.gitignore

.gitignore

.gitmodules

.gitmodules

README.md

README.md

Repository files navigation

3D-Aware Visual Question Answering about Parts, Poses and Occlusions (NeurIPS 2023)

Xingrui Wang, Wufei Ma, Zhuowan Li, Adam Kortylewski, Alan Yuille

Description

Citation

About

Releases

Packages

Languages

XingruiWang/3D-Aware-VQA

Folders and files

Latest commit

History

Repository files navigation

Xingrui Wang, Wufei Ma, Zhuowan Li, Adam Kortylewski, Alan Yuille

Description

Citation

About

Topics

Resources

Stars

Watchers

Forks

Languages