YOLOv3-complete-pruning

本项目以ultralytics/yolov3为YOLOv3的Pytorch实现，并在YOLOv3-model-pruning剪枝的基础上，推出了4个YOLO-v3剪枝版本。(在此致谢两位)

剪枝方式	优点	缺点
正常剪枝	不对shortcut剪枝，拥有可观且稳定的压缩率，无需微调。	压缩率达不到极致。
极限剪枝	极高的压缩率。	需要微调。
规整剪枝	专为硬件部署设计，剪枝后filter个数均为8的倍数，无需微调。	为规整牺牲了部分压缩率。
Tiny剪枝	稳定的压缩率。	由于Tiny本来已很小，压缩率中规中矩。

项目特点

1.采用的YOLO-v3实现较为准确，mAP相对较高。

模型	320	416	608
`YOLOv3`	51.8 (51.5)	55.4 (55.3)	58.2 (57.9)
`YOLOv3-tiny`	29.0	32.9 (33.1)	35.5

2.提供对YOLOv3及Tiny的多种剪枝版本，以适应不同的需求。

3.剪枝后保存为.weights格式，可在任何框架下继续训练、推理，或以图像视频展示。

4.目前支持情况

功能	单卡	多卡
正常训练	√	√
稀疏化	√	√
正常剪枝	√	√
规整剪枝	√	√
极限剪枝(shortcut)	√	√
Tiny剪枝	√	√

5.最新进展

2019年11月6日：极限剪枝已支持无需微调。
非常感谢github大佬tanluren，对该项目指出的众多问题和支持，实在太强了^_^。

环境搭建

1.由于采用ultralytics/yolov3的YOLO实现，环境搭建见ultralytics/yolov3。这里重复介绍一下：

numpy
torch >= 1.1.0
opencv-python
tqdm

可直接pip3 install -U -r requirements.txt搭建环境，或根据该.txt文件使用conda搭建。

数据获取

依然采用oxford hand数据集

1.下载数据集，并解压至/data目录下，得到hand_dataset文件夹。

2.执行python converter.py ，生成 images、labels 文件夹和 train.txt、valid.txt 文件。

3.获取YOLO预训练权重，/weights文件夹下执行bash download_yolov3_weights.sh，或自行下载。

4.至此，数据部分完成。

模型训练

1.正常训练

python3 train.py --data data/oxfordhand.data --batch-size 32 --accumulate 1 --weights weights/yolov3.weights --cfg cfg/yolov3-hand.cfg

2.稀疏化训练

-sr开启稀疏化，--s指定稀疏因子大小，--prune指定稀疏类型。

其中：

--prune 0为正常剪枝和规整剪枝的稀疏化

--prune 1为极限剪枝的稀疏化

--prune 2为Tiny剪枝的稀疏化

python3 train.py --data data/oxfordhand.data --batch-size 32 --accumulate 1 --weights weights/yolov3.weights --cfg cfg/yolov3-hand.cfg -sr --s 0.001 --prune 0

3.模型剪枝

正常剪枝

python3 normal_prune.py

规整剪枝

python3 regular_prune.py

极限剪枝

python3 shortcut_prune.py

Tiny剪枝

python3 prune_tiny_yolo.py

需要注意的是，这里需要在.py文件内，将opt内的cfg和weights变量指向第2步稀疏化后生成的cfg文件和weights文件。此外，可通过增大代码中percent的值来获得更大的压缩率。（若稀疏化不到位，且percent值过大，程序会报错。）

推理展示

这里，我们不仅可以使用原始的YOLOV3用来推理展示，还可使用我们剪枝后的模型来推理展示。（修改cfg，weights的指向即可）

python3 detect.py --source ...

Image: --source file.jpg
Video: --source file.mp4
Directory: --source dir/
Webcam: --source 0
RTSP stream: --source rtsp://170.93.143.139/rtplive/470011e600ef003a004ee33696235daa
HTTP stream: --source http://wmccpinetop.axiscam.net/mjpg/video.mjpg

例如：

python3 detect.py --cfg cfg/prune_0.8_yolov3-hand.cfg --weights weights/yolov3_hand_pruning_percent0.8.weights --data data/oxfordhand.data --source test.jpg

剪枝效果

以下数据除极限剪枝外，均未微调。

YOLO-v3剪枝

模型	参数量	模型体积	压缩率	耗时	mAP
Baseline(416)	61.5M	246.4MB	0%	11.7ms	0.7924
正常剪枝	10.9M	43.9MB	82.2%	5.92ms	0.7712
规整剪枝	15.31M	61.4MB	75.1%	6.01ms	0.7832
极限剪枝	7.13M	28.6MB	88.4%	5.90ms	0.7382

YOLO-v3-Tiny剪枝

模型	参数量	模型体积	压缩率	耗时	mAP
Baseline(416)	8.7M	33.1MB	0%	2.2ms	0.6378
Tiny剪枝	4.4M	16.8MB	40.1%	2.0ms	0.6132

核心思想

本代码中剪枝方法来源于论文Learning Efficient Convolutional Networks through Network Slimming，剪枝无需微调方法来源于Rethinking the Smaller-Norm-Less-Informative Assumption in Channel Pruning of Convolution Layers。

此外，实现四种剪枝方法时，在作者的基础上做了改进，具体原理与细节会在后续放出。

互动

1.如何获得较高的压缩率？

提高压缩率的关键在于稀疏化训练，可以加大--s的值并迭代训练多次等手段。

2.我的压缩率比表格中更高！

以上数据仅仅是测试了不到20次的结果，如果有同学的压缩率更高，欢迎在评论区分享！

3.程序报错怎么办？

YOLOv3报错

由于采用了ultralytics/yolov3为YOLOv3的Pytorch实现，因此这类错误可跳转至此链接询问。

剪枝错误

一定要在本评论区留言，我会尽快修正！

4.后续更新

shortcut剪枝优化

后续会对shortcut剪枝再升级，加大压缩率并保持高mAP。

YOLO-v3量化

对剪枝后的YOLO-v3/Tiny模型量化。

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
cfg		cfg
data		data
github_files		github_files
utils		utils
weights		weights
Dockerfile		Dockerfile
README.md		README.md
detect.py		detect.py
examples.ipynb		examples.ipynb
models.py		models.py
normal_prune.py		normal_prune.py
prune_tiny_yolo.py		prune_tiny_yolo.py
regular_prune.py		regular_prune.py
requirements.txt		requirements.txt
shortcut_prune.py		shortcut_prune.py
test.py		test.py
train.py		train.py

Sulince/YOLOv3-complete-pruning

Folders and files

Latest commit

History

Repository files navigation