Visual Transformer (GitHub)

link to the paper : https://arxiv.org/pdf/2006.03677.pdf

Convolutions treat all image pixels equally regardless of importance; explicitly model all concepts across all images, regardless of content; and struggle to relate spatially-distant concepts. Visual Transformers challenge this paradigm by

representing images as semantic visual tokens and
running transformers to densely model token relationships.

We present an implementation of Visual Transformers in relation to the paper above. It has been deployed on a classification model trained on CIRAF10 dataset.

The table below summarizes the loss and the number of parameters in each layer

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commits
ReadMe.md		ReadMe.md
Visual_transformers.ipynb		Visual_transformers.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ReadMe.md

ReadMe.md

Visual_transformers.ipynb

Visual_transformers.ipynb

Repository files navigation

Visual Transformer (GitHub)

About

Releases

Packages

Languages

Diksha942/Visual-Transformers

Folders and files

Latest commit

History

ReadMe.md

ReadMe.md

Visual_transformers.ipynb

Visual_transformers.ipynb

Repository files navigation

Visual Transformer (GitHub)

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages