## 使用PaddleDetection实现目标检测(考虑到下载时间，在这里我们使用一个i)
PaddleDetection飞桨目标检测开发套件，旨在帮助开发者更快更好地完成检测模型的组建、训练、优化及部署等全开发流程。

PaddleDetection模块化地实现了多种主流目标检测算法，提供了丰富的数据增强策略、网络模块组件（如骨干网络）、损失函数等，并集成了模型压缩和跨平台高性能部署能力。

经过长时间产业实践打磨，PaddleDetection已拥有顺畅、卓越的使用体验，被工业质检、遥感图像检测、无人巡检、新零售、互联网、科研等十多个行业的开发者广泛应用。
****   
 

### 特性

- **模型丰富**: 包含**目标检测**、**实例分割**、**人脸检测**等**100+个预训练模型**，涵盖多种**全球竞赛冠军**方案
- **使用简洁**：模块化设计，解耦各个网络组件，开发者轻松搭建、试用各种检测模型及优化策略，快速得到高性能、定制化的算法。
- **端到端打通**: 从数据增强、组网、训练、压缩、部署端到端打通，并完备支持**云端**/**边缘端**多架构、多设备部署。
- **高性能**: 基于飞桨的高性能内核，模型训练速度及显存占用优势明显。支持FP16训练, 支持多机训练。

### 准备环境

In [None]:
#PaddleDetection的代码库下载，同时支持github源和gitee源，为了在国内网络环境更快下载，此处使用gitee源。  
#! git clone https://github.com/PaddlePaddle/PaddleDetection.git
! git clone https://gitee.com/paddlepaddle/PaddleDetection.git
%cd PaddleDetection
# 安装其他依赖
! pip install paddledet==2.0.1 -i https://mirror.baidu.com/pypi/simple

### 确认环境安装是否正常
如果出现，则表示安装成功
```
.....
----------------------------------------------------------------------
Ran 5 tests in x.xxxs

OK
```

In [3]:
# ! set PYTHONPATH='pwd':$PYTHONPATH  // 先执行这句指令

活动代码页: 936


In [3]:
! python ppdet/modeling/tests/test_architectures.py

活动代码页: 936


W1101 20:12:44.243363 35364 gpu_resources.cc:119] Please NOTE: device: 0, GPU Compute Capability: 8.6, Driver API Version: 12.2, Runtime API Version: 11.6
W1101 20:12:44.247364 35364 gpu_resources.cc:149] device: 0, cuDNN Version: 8.9.
.......
----------------------------------------------------------------------
Ran 7 tests in 2.535s

OK


### 数据准备
我们使用路标识别数据集进行实验 运行下载准备好的数据集  

也可以进行挂载，请参考[如何准备数据集](https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.0/docs/tutorials/PrepareDataSet.md)

In [4]:
! python dataset/roadsign_voc/download_roadsign_voc.py

活动代码页: 936
[11/01 20:13:04] ppdet.utils.download INFO: Downloading roadsign_voc.tar from https://paddlemodels.bj.bcebos.com/object_detection/roadsign_voc.tar
[11/01 20:15:44] ppdet.utils.download INFO: Decompressing D:\学习资料\TyporaProject\机器学习\计算机视觉\5两阶段目标检测（Faster RCNN）\PaddleDetection\dataset\roadsign_voc\roadsign_voc.tar...



  0%|          | 0/224880 [00:00<?, ?KB/s]
  0%|          | 3/224880 [00:00<2:05:48, 29.79KB/s]
  0%|          | 35/224880 [00:00<30:39, 122.23KB/s]
  0%|          | 83/224880 [00:00<24:45, 151.33KB/s]
  0%|          | 115/224880 [00:00<20:31, 182.46KB/s]
  0%|          | 163/224880 [00:00<15:53, 235.74KB/s]
  0%|          | 211/224880 [00:00<13:49, 270.79KB/s]
  0%|          | 275/224880 [00:01<11:32, 324.22KB/s]
  0%|          | 339/224880 [00:01<10:56, 341.83KB/s]
  0%|          | 403/224880 [00:01<09:19, 401.26KB/s]
  0%|          | 451/224880 [00:01<08:54, 420.05KB/s]
  0%|          | 515/224880 [00:01<07:56, 470.46KB/s]
  0%|          | 579/224880 [00:01<07:47, 479.71KB/s]
  0%|          | 643/224880 [00:01<07:13, 517.38KB/s]
  0%|          | 723/224880 [00:01<06:37, 563.32KB/s]
  0%|          | 803/224880 [00:02<05:58, 624.49KB/s]
  0%|          | 899/224880 [00:02<05:43, 652.40KB/s]
  0%|          | 1027/224880 [00:02<04:55, 758.27KB/s]
  1%|          | 1155/224880 [00:02<04:2

## 训练数据

这里使用的是`faster_rcnn_r50_1x_coco.yml`需要对文件进行修改，打开文件把`/datasets/roadsign_voc.yml`替换原先的训练集！  
然后进行训练即可（可以修改参数进行调节）  
除此之外需要修改`PaddleDetection/configs/faster_rcnn/_base_/faster_fpn_reader.yml`文件的`worker_num`参数修改成0或1.  

* 训练评估参数说明
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210513114440448.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NTYyMzA5Mw==,size_16,color_FFFFFF,t_70)

### 配置文件说明
```
roadsign_voc.yml：训练数据文件。  
runtime.yml：主要说明了公共的运行状态，比如说是否使用GPU、迭代轮数等等。  
optimizer_1x.yml：主要说明模型、和主干网络的情况说明。  
faster_rcnn_r50.yml：主要说明了学习率和优化器的配置。在其他的训练的配置中，学习率和优化器是放在了一个新的配置文件中。  
faster_reader.yml：主要说明了读取后的预处理操作，比如resize、数据增强等等。  
```

### 执行训练

In [5]:
! python tools/train.py -c \
./configs/faster_rcnn/faster_rcnn_r50_1x_coco.yml \
--eval --use_vdl=True --vdl_log_dir="./output" g

活动代码页: 936
[11/01 20:23:42] ppdet.utils.download INFO: Downloading train2017.zip from http://images.cocodataset.org/zips/train2017.zip



  0%|          | 0/18883655 [00:00<?, ?KB/s]
  0%|          | 2/18883655 [00:00<800:42:44,  6.55KB/s]
  0%|          | 10/18883655 [00:00<296:55:33, 17.67KB/s]
  0%|          | 24/18883655 [00:00<176:24:21, 29.74KB/s]
  0%|          | 34/18883655 [00:01<211:51:19, 24.76KB/s]
  0%|          | 47/18883655 [00:01<208:24:22, 25.17KB/s]
  0%|          | 50/18883655 [00:02<346:11:22, 15.15KB/s]
  0%|          | 56/18883655 [00:03<372:49:51, 14.07KB/s]
  0%|          | 58/18883655 [00:04<676:32:48,  7.75KB/s]
  0%|          | 66/18883655 [00:04<544:36:43,  9.63KB/s]
  0%|          | 72/18883655 [00:05<497:00:58, 10.55KB/s]
  0%|          | 75/18883655 [00:05<495:11:05, 10.59KB/s]
  0%|          | 79/18883655 [00:05<459:50:53, 11.41KB/s]
  0%|          | 82/18883655 [00:06<440:58:59, 11.89KB/s]
  0%|          | 85/18883655 [00:06<442:55:56, 11.84KB/s]
  0%|          | 94/18883655 [00:07<419:46:19, 12.50KB/s]
  0%|          | 104/18883655 [00:07<443:53:38, 11.82KB/s]
  0%|          | 112/18883

## 模型评估与预测

### 模型评估

In [None]:
! python -u tools/eval.py \
-c ./configs/faster_rcnn/faster_rcnn_r50_1x_coco.yml  \
-o weights=output/faster_rcnn_r50_1x_coco/model_final.pdparams

  0%|                                | 516/18883655 [00:19<222:17:32, 23.60KB/s]

### 模型预测

In [None]:
!python tools/infer.py -c ./configs/faster_rcnn/faster_rcnn_r50_1x_coco.yml -o\
 weights=output/faster_rcnn_r50_1x_coco/model_final.pdparams \
 --infer_img=dataset/roadsign_voc/images/road114.png

### 结果展示

In [None]:
import matplotlib.pyplot as plt

# 定义显示函数
def display(img_dir):
    plt.figure(figsize=(15, 15))

    title = ['Input Image', 'Predicted Image']
    
    for i in range(len(title)):
        plt.subplot(1, len(img_dir), i+1)
        plt.title(title[i])
        img = plt.imread(img_dir[i])
        plt.imshow(img)
        plt.axis('off')
    plt.show()

# 显示检测图片效果
# 注：仅显示其中一张图片的效果。    
image_dir = "dataset/roadsign_voc/images/road114.png"
mask_dir = "./output/road114.png"
imgs = [image_dir, mask_dir]
display(imgs)