Model Compression Course

Assignments for the Model Compression Course (ITMO University, AI Talent Hub)

Text classification on mteb/tweet_sentiment_extraction dataset (30K samples).
Model: bert-base-cased

Experiment	Num params	Model size (MB)	Inference time (s)	Macro F1
exp_original_model	1.083e+08	413.188	66.957	0.784
exp_dynamic_quantization	2.270e+07	86.609	48.532	0.779
exp_unstructured_pruning_random	1.083e+08	413.188	64.068	0.429
exp_unstructured_pruning_l1	1.083e+08	413.188	65.058	0.665
exp_sparse_training	1.083e+08	413.188	64.586	0.714
exp_openvino	1.083e+08	206.598	32.635	0.775
exp_onnx	1.083e+08	413.188	57.743	0.770
exp_optimum	1.083e+08	413.188	50.000	0.775

Weight clustering

Text classification on imdb_reviews dataset from tensorflow-datasets.
Model arhitecture:
Embedding -> Dropout -> GlobalAveragePooling1D -> Dropout -> Dense

Model	Num params	Model size (MB)	Accuracy
baseline	160033	0.625	0.904
baseline_clustered	320097	1.83	0.834
baseline_clustered_finetuned	320097	1.83	0.902

Knowledge distillation

Model (teacher): bert-base-uncased
Model (student 1): bert-tiny Model (student 2): distilbert-base-uncased Dataset: mteb/tweet_sentiment_extraction (30K samples)

Model	Num params	Model size (MB)	Time for 100 samples (s)	Accuracy	Raw aсcuracy
bert-base-uncased (1 exp)	109484547	439	10.37	0.831	-
bert-tiny	4386307	19	1.01	0.521	0.282
bert-base-uncased (2 exp)	109484547	439	11.87	0.831	-
distilbert-base-uncased	66955779	269	5.34	0.789	0.282

Name		Name	Last commit message	Last commit date
Latest commit History 76 Commits
experiments		experiments
.gitignore		.gitignore
Knowledge_Distillation_bert_to_tiny_bert_and_distilbert.ipynb		Knowledge_Distillation_bert_to_tiny_bert_and_distilbert.ipynb
README.md		README.md
compare_all_experiments.sh		compare_all_experiments.sh
example.ipynb		example.ipynb
inference.py		inference.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

experiments

experiments

.gitignore

.gitignore

Knowledge_Distillation_bert_to_tiny_bert_and_distilbert.ipynb

Knowledge_Distillation_bert_to_tiny_bert_and_distilbert.ipynb

README.md

README.md

compare_all_experiments.sh

compare_all_experiments.sh

example.ipynb

example.ipynb

inference.py

inference.py

requirements.txt

requirements.txt

train.py

train.py

Repository files navigation

Model Compression Course

Weight clustering

Knowledge distillation

About

Releases

Packages

Contributors 4

Languages

NeuroCrushers/model-compression-course

Folders and files

Latest commit

History

Repository files navigation

Model Compression Course

Weight clustering

Knowledge distillation

About

Resources

Stars

Watchers

Forks

Languages