Hierarchical Side-Tuning for Vision Transformers

This repo is the official implementation of our paper "Hierarchical Side-Tuning for Vision Transformers" (arXiv).

Weifeng Lin, Ziheng Wu, Wentao Yang, Mingxin Huang, Jun Huang and Lianwen Jin

Usage

Install

Clone this repo:

git clone https://github.com/AFeng-x/HST.git
cd HST

Create a conda virtual environment and activate it:

conda create -n HST python=3.8 -y
conda activate HST

Install PyTorch:

pip3 install torch==1.10.1 torchvision==0.11.2 torchaudio --index-url https://download.pytorch.org/whl/cu113

Install other requirements:

pip install -r requirements.txt

Data preparation

FGVC & vtab-1k

You can follow VPT to download them.

VTAB-1K

Original download link: vtab dataset.

Following SSF to download the extracted vtab-1k dataset for convenience.

The license is in vtab dataset.

CIFAR-100

wget https://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz

Pre-trained model preparation

For pre-trained ViT-B/16 or ViT-L/16 models on ImageNet-21K, the model weights will be automatically downloaded. You can also manually download them from ViT.
For pre-trained ViT-B/16 on MAE, please download from MAE

Fine-tuning a pre-trained model via HST

To fine-tune a pre-trained ViT model via HST, pleasse refer to the scripts. Examples:

bash train_scripts/vit/cifar_100/train_hsn_img21k.sh

For Dense Prediction Tasks

You can directly transfer our model in mmdetection and mmsegmentation.

Citation

If you find this project useful for your research and applications, please kindly cite our paper:

@article{lin2023hierarchical,
  title={Hierarchical side-tuning for vision transformers},
  author={Lin, Weifeng and Wu, Ziheng and Yang, Wentao and Huang, Mingxin and Huang, Jun and Jin, Lianwen},
  journal={arXiv preprint arXiv:2310.05393},
  year={2023}
}

💌 Acknowledgement

timm: the codebase we built upon.
VPT and SSF: the codebase we refer to.
vtab github repo: VTAB-1k

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
assets		assets
data		data
models		models
train_scripts		train_scripts
utils		utils
README.md		README.md
optim_factory.py		optim_factory.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

assets

assets

data

data

models

models

train_scripts

train_scripts

utils

utils

README.md

README.md

optim_factory.py

optim_factory.py

requirements.txt

requirements.txt

train.py

train.py

Repository files navigation

Hierarchical Side-Tuning for Vision Transformers

Usage

Install

Data preparation

Pre-trained model preparation

Fine-tuning a pre-trained model via HST

For Dense Prediction Tasks

Citation

💌 Acknowledgement

About

Releases

Packages

Languages

AFeng-x/HST

Folders and files

Latest commit

History

Repository files navigation

Hierarchical Side-Tuning for Vision Transformers

Usage

Install

Data preparation

Pre-trained model preparation

Fine-tuning a pre-trained model via HST

For Dense Prediction Tasks

Citation

💌 Acknowledgement

About

Resources

Stars

Watchers

Forks

Languages