Domain-Aware Fine-Tuning: Enhancing Neural Network Adaptability, AAAI 2024

This repository contains the code for our paper Domain-Aware Fine-Tuning: Enhancing Neural Network Adaptability (AAAI 2024). It is built upon the LP-FT.

Batch Normalization Conversion

Our main technique, batch normalization conversion, is easy to implement. You can use the following code to convert batch normalization layers in your model before fine-tuning. You can also find the code in utils/transfer.py file. Statistics class is used to store mean and variance of batch samples. You can find Statistics class in utils/metric.py file.

import torch
import torch.nn.functional as F
import copy
from torch.nn.modules.batchnorm import _BatchNorm
from utils.metric import Statistics

def convert_bn_params(model, data_loader):
    bn_stats = {}    
    tmp_model = copy.deepcopy(model)
    tmp_model.eval()
    for name, m in tmp_model.named_modules():
        if isinstance(m, _BatchNorm):
            bn_stats[name] = Statistics()            

            def new_forward(bn, stats_est):
                def lambda_forward(x):
                    x = x.contiguous()                         
                    batch_mean = torch.mean(x, dim=[0, 2, 3])
                    batch_var = torch.var(x, dim=[0, 2, 3])  
                    stats_est.update(batch_mean.data, batch_var.data)                    
                    # bn forward using calculated mean & var                    
                    return F.batch_norm(
                        x,
                        bn.running_mean,
                        bn.running_var,
                        bn.weight,
                        bn.bias,
                        False,
                        0.0,
                        bn.eps,
                    )
                return lambda_forward
            m.forward = new_forward(m, bn_stats[name])    
    
    print('Computing new mean & var of batchnorm')
    print('Length of Dataloader : ',len(data_loader))
    
    with torch.no_grad():
        for images, _ in data_loader:            
            if torch.cuda.is_available():
                images = images.cuda()                        
            tmp_model(images)                   

    print('Converting batchnorm')
    for name, m in model.named_modules():
        if isinstance(m, _BatchNorm):
            # convert weight & bias according to new mean and var without changing result            
            m.bias.data += (bn_stats[name].mean - m.running_mean.data) * m.weight.data / torch.sqrt(m.running_var + m.eps)
            m.weight.data *= torch.sqrt(bn_stats[name].var + m.eps) / torch.sqrt(m.running_var + m.eps)            
            # convert running mean & var
            m.running_mean.data.copy_(bn_stats[name].mean)
            m.running_var.data.copy_(bn_stats[name].var)

Prerequisites

We use link file disk to download pretrained models and datasets, because they are too large to download on home directory. disk contains data, pretrained_checkpoints, and results folder as follows:

disk
├── data                        # Directory to save datasets
├── pretrained_checkpoints      # Directory to save pretrained models
└── results                     # Directory to save results of experiments

Pretrained models

Download pretrained models and put them in disk/pretrained_checkpoints folder.

Datasets

Download datasets and put them in disk/data folder.

DomainNet
Living-17 and Entity : use BREEDS
FMoW : use WILD
CIFAR-10, CIFAR-10.1, - CIFAR-10-C, and STL-10

How to Run

You should change learning rate in yaml file according to dataset and pretrained model. We also provide bash scripts to run our experiments in bash files: run-moco.sh, run-clip.sh, run-swav.sh, and run-ablation.sh.

Linear Probing

Following LP-FT, Logistic Regression Classifier is used for head layer. Logistic Regression use features extracted from pretrained model.

(1) Extract features from pretrained model:

$ python extract_features.py --config configs/cifar-lp.yaml --run_num 1

(2) Train a linear classifier with Logistic Regression:

$ python lp_log_reg.py --config configs/cifar-lp.yaml --run_num 1

Fine-tuning

For fine-tuning, we use sgd optimization.

FT (Fine-Tuning)

python ft_sgd.py --config configs/cifar-ft.yaml --run_num 1

LP-FT (Linear Probe, then Fine-Tuning)

python ft_sgd.py --config configs/cifar-lp_ft.yaml--run_num 1

Domain-Aware Fine-Tuning (DAFT)

python ft_sgd.py --config configs/cifar-daft.yaml --run_num 1

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
CLIP		CLIP
configs_clip		configs_clip
configs_moco		configs_moco
configs_swav		configs_swav
datasets		datasets
models		models
utils		utils
.envrc		.envrc
LICENSE		LICENSE
README.md		README.md
extract_features.py		extract_features.py
ft_sgd.py		ft_sgd.py
lp_log_reg.py		lp_log_reg.py
lp_sgd.py		lp_sgd.py
run-ablation.sh		run-ablation.sh
run-clip.sh		run-clip.sh
run-moco.sh		run-moco.sh
run-swav.sh		run-swav.sh

License

skhnha/DAFT

Folders and files

Latest commit

History

Repository files navigation

Domain-Aware Fine-Tuning: Enhancing Neural Network Adaptability, AAAI 2024

Batch Normalization Conversion

Prerequisites

Pretrained models

Datasets

How to Run

Linear Probing

Fine-tuning

Domain-Aware Fine-Tuning (DAFT)

About

Resources

License

Stars

Watchers

Forks

Languages