Nanodet (Quant and Deploy based on Openvino)

官方代码仓库：

https://github.com/RangiLyu/nanodet

介绍

本仓库在 OpenVINO 推理框架下部署 Nanodet 检测算法，并重写预处理和后处理部分，具有超高性能！！！

让你在 Intel CPU 平台上的检测速度起飞！！！

并基于 NNCF 和 PPQ 工具将模型量化 (PTQ) 至 int8 精度，推理速度更快！！！

优势：方便部署，高性能。

推理速度

测试平台：i7-12700K

测试代码如下：

void NanoDet::benchmark(int loop_num) {
    int warm_up = 50;
    input_image_ = cv::Mat(input_height_, input_width_, CV_8UC3, cv::Scalar(1, 1, 1));
    // warmup
    for (int i = 0; i < warm_up; i++)
    {
        infer();
    }
    auto start = std::chrono::steady_clock::now();
    for (int i = 0; i < loop_num; i++)
    {
        infer();
    }
    auto end = std::chrono::steady_clock::now();
    std::chrono::duration<double> elapsed = end - start;
    double time = 1000 * elapsed.count();
    printf("Average infer time = %.2f ms\n", time / loop_num);
}

Model	(fp32) infer latency	(nncf_int8) infer latency	(ppq_int8) infer latency
nanodet-plus-320	3.12 ms	2.41 ms	-
nanodet-plus-416	4.80 ms	3.58 ms	-
nanodet-plus-1.5x-320	4.70 ms	3.41 ms	3.66ms
nanodet-plus-1.5x-416	7.59 ms	5.18 ms	5.53ms

注：1. 实际程序运行速度与图像中目标数量有关，目标越多，后处理解码和NMS耗时则越多。

2. ppq量化的推理速度比nncf的慢，在于两者生成的量化节点不同。

一、安装 OpenVINO Toolkit

参考官网安装教程 Get Started Guides

wget https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB
sudo apt-key add GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB
echo "deb https://apt.repos.intel.com/openvino/2022 focal main" | sudo tee /etc/apt/sources.list.d/intel-openvino-2022.list
sudo apt update
apt-cache search openvino
sudo apt install openvino
apt list --installed | grep openvino

python 安装

pip install openvino

二、模型导出与修改

Export ONNX model

cd nanodet
python tools/export_onnx.py --cfg_path config/nanodet-plus-m_320.yml --model_path weights/nanodet-plus-m_320.pth

Convert to OpenVINO

mo --framework onnx --input_model nanodet.onnx

Add PrePostProcess

python add_pre_post.py
# 注意修改其中的模型路径

三、C++ demo Build and Run

1 build

cd /your_path/Nanodet_openvino_quant_deploy
mkdir build && cd build
cmake .. && make -j

2 run

cd workspace

图片输入：

./pro 0 "imgs/car.jpg"

摄像头输入：

./pro 1 0

视频文件输入：

./pro 2 "videos/palace.mp4"

benchmark：

./pro 3 0

(Optional) 模型量化

1 使用OpenVino量化工具NNCF（推荐）

参考官网量化教程 Post-training Quantization with NNCF

准备至少300张图片作为标定数据集，放入 quant/imgs 路径下，图片数量对应修改 nncf_ptq.py 文件中的 SUBSET_SIZE 变量值
安装NNCF
```
pip install nncf
```

执行量化

cd quant
python nncf_ptq.py
# 注意修改其中的模型路径

Add PrePostProcess

python add_pre_post.py
# 注意修改其中的模型路径

注：量化的只是原模型，量化之后仍然要手动添加PrePostProcess。

2 使用PPQ量化工具（不太推荐）

参考PPQ官方量化教程 PPQ

准备至少256张图片作为标定数据集，放入 quant/imgs 路径下，图片数量对应修改 ppq_ptq.py 文件中的 STEPS 变量值

安装PPQ

Install CUDA Toolkit from nvidia.com
Install Complier
```
apt-get install ninja-build 
```

Install PPQ

git clone https://github.com/openppl-public/ppq.git
cd ppq
pip install -r requirements.txt
python setup.py install

执行量化

cd quant
python ppq_ptq.py
# 注意修改其中的模型路径

Add PrePostProcess

python add_pre_post.py
# 注意修改其中的模型路径

误差分析

1.5x-320模型：
- 默认量化效果不算太好，整图累计量化误差和逐层量化误差分别如下图：
- 使用Finetune之后，整图累计量化误差和逐层量化误差分别如下图：
1.5x-416模型：

Finetune之后，整图累计量化误差和逐层量化误差分别如下图：
注：PPQ中，尝试过将最敏感的层不量化，依然保持FP32精度，但是效果并没有太好，所以并没有采用。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.assets		README.assets
quant		quant
workspace		workspace
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
Nanodet.cpp		Nanodet.cpp
Nanodet.h		Nanodet.h
README.md		README.md
add_pre_post.py		add_pre_post.py
main.cpp		main.cpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.assets

README.assets

quant

quant

workspace

workspace

.gitignore

.gitignore

CMakeLists.txt

CMakeLists.txt

Nanodet.cpp

Nanodet.cpp

Nanodet.h

Nanodet.h

README.md

README.md

add_pre_post.py

add_pre_post.py

main.cpp

main.cpp

Repository files navigation

Nanodet (Quant and Deploy based on Openvino)

介绍

推理速度

一、安装 OpenVINO Toolkit

二、模型导出与修改

三、C++ demo Build and Run

1 build

2 run

(Optional) 模型量化

1 使用OpenVino量化工具NNCF（推荐）

2 使用PPQ量化工具（不太推荐）

About

Releases

Packages

Languages

l-sf/Nanodet_openvino_quant_deploy

Folders and files

Latest commit

History

Repository files navigation

Nanodet (Quant and Deploy based on Openvino)

介绍

推理速度

一、安装 OpenVINO Toolkit

二、模型导出与修改

三、C++ demo Build and Run

1 build

2 run

(Optional) 模型量化

1 使用OpenVino量化工具NNCF（推荐）

2 使用PPQ量化工具（不太推荐）

About

Topics

Resources

Stars

Watchers

Forks

Languages