My Detection

本工程使用SSD实现了一个物体检测器，基本上具备了从数据采集、数据预处理、模型定义与训练、模型预测等一系列物体检测的功能，可以轻松应用到其他物体分类问题。

本工程使用Python3.6+mxnet gluon (1.2.0)。

组织结构

1. 图像标注

使用了图像标注软件LabelImg进行标注。标注后会为每张图片生成[filename].xml文件，将所有图片文件放到data/img下，将所有 xml文件放入data/label下。

2. im2rec

将图片转成rec文件格式。参考工程im2rec tutorial 需要注意：mxnet从rec中读取的图片格式是RGB，而OpenCV读取的是BGR。转换方法如下：

img = cv2.imread(imgpath)
b, g, r = cv2.split(img)
img = cv2.merge([r, g, b])

3. 载入数据

读取rec文件的代码位于[data_loader.py]。读取时使用了数据增强的方法，这样每次读取batch时会对图片随机加入一些扰动，增加模型的泛化能力。

4. 模型定义

模型定义于文件[model.py]。可通过修改该程序的66行将SSD的bodynet更改为其他模型。默认使用的是mobilenet1_0（预训练文件18M大小）。 tip:使用预训练网络的参数时pertrained=true，默认为false指只使用网络，参数需要initialize。需要注意将模型前缀定义一致: prefix="name_" 获取参数方法：

#使用net.collect_param().keys()查看参数名（不需要name_scope前缀）

param = net.collect_param().get('conv0_weight').data()

5. 模型训练

训练文件见 train.py 另外，在[data_analysis.ipynb]中统计了数据集size的分布。

6. 模型预测

预测部分位于[predict.py]中。修改其中的图片路径与模型路径，直接执行即可。基于resnet18_v1训练模型(链接: https://pan.baidu.com/s/1cvVe8Mj4HU-MKG7q7qagGQ 密码: kub9)

7. 检测结果

采用resnet18训练的结果，GPU限制效果一般。batch太小，过拟合比较严重。后期在服务器上尝试炼丹

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
dataset/data/rec		dataset/data/rec
ReadMe.MD		ReadMe.MD
data_analysis.ipynb		data_analysis.ipynb
data_loader.py		data_loader.py
generate_rec.py		generate_rec.py
model.py		model.py
myDect_config.py		myDect_config.py
predict.py		predict.py
results_0.png		results_0.png
test_code.ipynb		test_code.ipynb
train.py		train.py
utils.py		utils.py

wk738126046/SSD_Demo

Folders and files

Latest commit

History

Repository files navigation

My Detection

组织结构

1. 图像标注

2. im2rec

3. 载入数据

4. 模型定义

5. 模型训练

6. 模型预测

7. 检测结果

About

Topics

Resources

Stars

Watchers

Forks

Languages