MultiModal Machine Learning

Track the trend of Representation learning of MultiModal Machine Learning(MMML).

1. Paper

2021

[CVPR oral] Seeing Out of tHe bOx: End-to-End Pre-training for Vision-Language Representation Learning paper code
[ICML] ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision paper code

2020

[NeurIPS] Large-Scale Adversarial Training for Vision-and-Language Representation Learning paper code

2019

[NeurIPS] ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks paper code
[EMNLP] LXMERT: Learning Cross-Modality Encoder Representations from Transformers paper code
[arXiv] VisualBERT: A Simple and Performant Baseline for Vision and Language paper code

2018

[TPAMI] Multimodal machine learning: A survey and taxonomy paper

2. Dataset

1.

3. Others

1. awesome-multimodal-ml

website
Reading list for research topics in multimodal machine learning

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Repository files navigation

MultiModal Machine Learning

1. Paper

2021

2020

2019

2018

2. Dataset

1.

3. Others

1. awesome-multimodal-ml

About

Releases

Packages

kealennieh/MultiModal-Machine-Learning

Folders and files

Latest commit

History

README.md

README.md

Repository files navigation

MultiModal Machine Learning

1. Paper

2021

2020

2019

2018

2. Dataset

1.

3. Others

1. awesome-multimodal-ml

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages