Visual Question Answering

Visual Question Answering datasets are available in multimodal. Annotations data are automatically downloaded and processed when the class is instanciated. Note that the pre-processing can take several minutes.

.. autoclass:: multimodal.datasets.VQA
    :inherited-members:

.. autoclass:: multimodal.datasets.VQA2
    :inherited-members:

.. autoclass:: multimodal.datasets.VQACP
    :inherited-members:

.. autoclass:: multimodal.datasets.VQACP2
    :inherited-members:

CLEVR

https://cs.stanford.edu/people/jcjohns/clevr/

.. autoclass:: multimodal.datasets.CLEVR
    :inherited-members:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

datasets.rst

datasets.rst

Visual Question Answering

CLEVR

Files

datasets.rst

Latest commit

History

datasets.rst

File metadata and controls

Visual Question Answering

CLEVR