GitHub

Code for Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training

Training for CIFAR10/100

fp model

At first, train a fp model. For example, train a fp model for CIFAR100, please use:

python main_fixed.py --data pathToCifar --visible_gpus '0' --multiprocessing_distributed False --dist_url 'tcp://127.0.0.1:23117' --workers 4 --arch 'resnet20_quant' --batch_size 128 --epochs 400 --lr_m 0.1 --lr_q 0.0001 --log_dir "./results/" --gpu 0 --datasetsname 'cifar100/10' --lr_scheduler step --decay_schedule 100-200-300

baseline quantized model

For example, if you want to train a 2-bit r20, use:

python main.py --data pathToCifar --visible_gpus '0' --multiprocessing_distributed False --dist_url 'tcp://127.0.0.1:23117' --workers 4 --arch 'resnet20_quant' --batch_size 128 --epochs 400 --lr_m 0.1 --lr_q 0.0001 --log_dir "./results/" --gpu 0 --datasetsname'cifar100' --lr_scheduler step --decay_schedule 100-200-300 --fp_path pathTofpModel --bit 2

LTS quantized model

For example, if you want to train a 2-bit r20, use:

python main_fixed.py --data pathToCifar --visible_gpus '0' --multiprocessing_distributed False --dist_url 'tcp://127.0.0.1:23117' --workers 4 --arch 'resnet20_quant' --batch_size 128 --epochs 400 --lr_m 0.1 --lr_q 0.0001 --log_dir "./results/" --gpu 0 --datasetsname'cifar100' --lr_scheduler step --decay_schedule 100-200-300 --fp_path pathTofpModel --warmup_epoch 80 --fixed_mode linear-growth --distance_ema 0.99 --bit 2

Training for ImageNet

baseline quantized model

For example, if you want to train a 2-bit r18, use:

python main.py --data pathToImagenet --visible_gpus '0,1,2,3' --multiprocessing_distributed True --dist_url 'tcp://127.0.0.1:23117' --workers 16 --arch 'resnet18_quant' --batch_size 256 --epochs 100 --lr_m 0.1 --lr_q 0.0001 --log_dir "./results/" --datasetsname'ImageNet' --lr_scheduler step --decay_schedule 30-60-90 --bit 2

LTS quantized model

For example, if you want to train a 2-bit r18, use:

python main.py --data pathToImagenet --visible_gpus '0,1,2,3' --multiprocessing_distributed True --dist_url 'tcp://127.0.0.1:23117' --workers 16 --arch 'resnet18_quant' --batch_size 256 --epochs 100 --lr_m 0.1 --lr_q 0.0001 --log_dir "./results/" --datasetsname'ImageNet' --lr_scheduler step --decay_schedule 30-60-90 --warmup_epoch 80 --fixed_mode linear-growth --distance_ema 0.99 --bit 2

Trained model

Here

Acknowledgments

Code is implemented based on PalQuant. We are very grateful for their excellent work.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
model_fixed_network		model_fixed_network
model_single_network		model_single_network
run		run
utils		utils
cifar100_em.sh		cifar100_em.sh
cifar100_linear_em.sh		cifar100_linear_em.sh
cifar100_sin_em.sh		cifar100_sin_em.sh
main.py		main.py
main_cifar_fp.py		main_cifar_fp.py
main_fixed.py		main_fixed.py
option.py		option.py
readme.md		readme.md

zysxmu/LTS

Folders and files

Latest commit

History

Repository files navigation

Code for Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training

Training for CIFAR10/100

fp model

baseline quantized model

LTS quantized model

Training for ImageNet

baseline quantized model

LTS quantized model

Trained model

Acknowledgments

About

Resources

Stars

Watchers

Forks

Languages