# 目标检测
- 目标检测是一件比较实际的且具有挑战性的计算机视觉任务，其可以看成图像分类与定位的结合。
- 给定一张图片，目标检测系统要能够识别出图片的目标并给出其位置，由于图片中目标数是不定的，且要给出目标的精确位置，目标检测相比分类任务更复杂。目标检测的一个实际应用场景就是无人驾驶，如果能够在无人车上装载一个有效的目标检测系统，那么无人车将和人一样有了眼睛，可以快速地检测出前面的行人与车辆，从而作出实时决策
- 目标检测算法思路非常简单，它将检测问题转化为了图像分类问题。其基本原理就是采用不同大小和比例（宽高比）的窗口在整张图片上以一定的步长进行滑动，然后对这些窗口对应的区域做图像分类，这样就可以实现对整张图片的检测

# YOLO(实时对象检测)
- 您只看一次（YOLO）是最新的实时物体检测系统。它能以30 FPS的速度处理图像，并且在COCO测试开发中的mAP为57.9％。
- Yolo的CNN网络将输入的图片分割成 S*S网格，然后每个单元格负责去检测那些中心点落在该格子内的目标
### yolo的核心思想就是利用整张图作为网络的输入，直接在输出层回归bounding box的位置和bounding box所属的类别。

# YOLOV4训练、测试与识别

# 一、YOLOV4训练

* YOLO网络出来后，有很多实现，其中PyTorch的实现的经典是：
 - https://github.com/ultralytics
 - 实现了YOLOv3(使用文本配置)与YOLOv5（使用Yaml配置）
 - 其中YOLOv4版本很多都根据ultralytics的YOLOv3版本修改而来，比如：
   - https://github.com/DataXujing/Pytorch_YOLO-v4

* 后续教程使用YOLOV4代码重现训练



## 1、准备工作
### 1.1 数据集准备
#### 1、下载数据集
- 这里我们使用的数据集，是coco数据集中随机的128张图像，下载地址:
  - https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip
- 解压数据
```
coco128>tree
卷 Data 的文件夹 PATH 列表
卷序列号为 ACB0-0FB7
D:.
├─images
│  └─train2017
└─labels
      └─train2017
```

- images目录：存放图像文件
- labels目录：存放标签文件，标签文件一行存放一个标注的目标，每个目标的数据是五个数据(45 0.479492 0.688771 0.955609 0.5955)
    - 五个数据分别表示：class x_center y_center width height
    - class是从0开始，对coco数据集一共是80个类别，从0到79。
    - 标注文件例子
    ![image.png](attachment:image.png)
    - 每个labels文件是.txt文件，并与图像文件名对应。
    - 标注文件的目标中心坐标与目标高宽是原图像按照1标准化后的结果，在处理的时候需要注意。

#### 2.配置数据集
- 图像数据配置文件清单:
    > 配置文件清单文件与数据集目录一起，可以使用相对路径描述数据集图像文件
![image.png](attachment:image.png)
- coco.names文件
> 类别名文件，其中类别名按照类别id作为下标索引对应。
![image-3.png](attachment:image-3.png)
- train.txt
> 训练使用的图像数据集文件
- coco128.data
 - 组织训练与测试的数据集工程文件，4行内容：
>  ![image-2.png](attachment:image-2.png)
 - classes指定类别数
 - train指定训练数据集
 - vlaid指定验证测试数据集
 - names指定类别名（训练与识别中使用的是类别id，就是类别名的位置下标）

#### 3.图像数据清单的生成
- 遍历图像目录，保存为文本文件即可。我们这里训练集与测试集都是使用同一个数据集。
- 下面是我们产生train.txt文件的代码。
 ```python
       import os
       import numpy as np
       
       def create_image_list(src_path, dst_path, filename):
           """
               函数功能主要把一个目录下的图像文件名归档为一个文本文件。
               src_path：需要归档的图像所在目录
               dst_path：产生的归档文本文件的目录
               filename：产生的归档文件名
           """
           # 返回文件列表
           files = os.listdir(src_path)
           # 遍历处理文件名，产生清单
           with open(os.path.join(dst_path, filename),"w") as fd:
               for file in files:
                   fd.write(os.path.join(src_path, file))
                   fd.write("\n")
       
       if __name__ == "__main__":
           # 图像所在目录：datasets/coco128/images/train2017
           # 归档文本文件存放目录：datasets
           # 归档文件名：train.txt
           create_image_list("datasets/coco128/images/train2017", "datasets", "train.txt")
```

#### 4.产生测试集清单文件valid.txt
- 我们偷懒使用训练数据集作为测试集，所以直接拷贝train.txt作为vallid.txt
- 或者在coco128.data中valid直接使用train.txt也是一样。

### 1.2模型文件准备
* yolov4的模型文件在github的目录中有。可以直接使用
![image.png](attachment:image.png)

### 1.3权重文件准备 
- 本来第一次训练是不需要权重文件的，但是github的例子中假设是累加训练，没有考虑第一次权重文件不存在的情况，因为代码逻辑中，权重文件不存在，就会尝试从线上下载。

- 为了避免从线上下载找不到，我们提前下载或者准备权重文件，权重文件分两类：

    - PyTorch格式（可以使用字典存放很对其他信息，比如上次训练的轮数，优化器，学习率等）, 我们下载的就是PyToorch的格式。

    - Darknet的格式

- 权重文件的下载在github上已经提供：

    - baidu链接：https://pan.baidu.com/s/1nyQlH-GHrmddCEkuv-VmAg 提取码：78bg

    - 再次提供github的地址：https://github.com/DataXujing/Pytorch_YOLO-v4

- 下载好的权重文件统一放在weights目录下备用，我只下载了yolov4-tiny.pt

- 注意： - last.pt与best.pt是训练中保存的最后权重与结果最好的权重。 - best_yolov4-tiny-1.pt是全部训练完以后最好的权重，-1是我个人训练完成后为了避免下次训练呗覆盖而添加的后缀。

## 2、代码结构与脚本

### 2.1. 训练相关的文件

1. 主要相关的代码文件：
    - `utils`下的所有`.py`文件   
    - `moddels.py`文件
    - `train.py`文件
    - `test.py`文件：因为训练过程也会验证
2. cfg目录
    - 至少一个cfg模型文件
3. weights
    - 与cfg中模型文件对应的权重文件（一定要对应）

### 2.2. 代码文件需要注释的几个地方

> 因为这些代码都是请求线上资源实现权重下载或者状态检测，如果失败会导致程序退出，而且这些代码不是必须的训练代码，所以我们可以注释保证代码能正常执行。

1. 注释下载权重相关的代码
![image.png](attachment:image.png)

2. 检测git状态的代码
![image.png](attachment:image.png)

3.修改循环的参数
- 其中循环参数的设置修改为符合常规思维，原来的代码逻辑的epochs是累加值，而不是当前需要训练的次数，我们做如下修改
    - 修改前：for epoch in range(start_epoch, epochs)
    - 修改后：for epoch in range(start_epoch, start_epoch + epochs)
![image.png](attachment:image.png)

## 3、训练

### 3.1. 训练调用脚本

1. 脚本文件名与内容：`run_train.bat`
>```bash
>    python train.py ^
>    --epochs 30  ^
>    --batch-size 3 ^
>    --data datasets/coco.data ^
>    --cfg cfg/yolov4-tiny.cfg ^
>    --weights weights/yolov4-tiny.pt ^
>    --name yolov4-tiny ^
>    --img 640 640 640
>```

2. 参数解释：

    >- epoches 30   : 训练轮数
    >- batch-size 3 : 数据集批次大小
    >- data datasets/coco.data : 数据集工程组织文件
    >- cfg cfg/yolov4-tiny.cfg ： 模型文件
    >- weights weights/yolov4-tiny.pt ：预训练的权重文件
    >- name yolov4-tiny：保存训练过程产生的数据的文件名，会添加一个result前缀。

### 3.2. 执行训练

1. 执行
    
    >- `run_train.bat`
2. 执行结果
    >- 终端输出
    >结果截图
    >- 训练过程与评估文件
    >结果截图
    >- 训练好的权重文件
    >结果截图

### 3.3. 训练过程中的可视化

>- 训练过程中，会产生视化数据，可视化数据存放在runs目录下，这里的可视化技术使用的是tensorboard。


1. 启动训练可视化服务（需要安装对应的模块）
    > - `tensorboard --logdir=runs`
    > ![image.png](attachment:image.png)
2. 访问可视化服务
    > - 打开浏览器，输入地址：`http://localhost:6006/`
    > ![image-2.png](attachment:image-2.png)

3. 名词解释：
    > - P：准确率。预测为正的样本中有多少是真正的正样本
    > - R：召回率。样本中的正例有多少被预测正确
    > - F1：F1参数。加权调和平均 2pr/p+r
    > - mAP：mean Average Precision平均准确率。

## 4. 附录

- 为了删除训练过程中产生的文件，我们写了一个bat脚本:`tools.bat`。

```bash
    @del results.txt  2>/Nul
    @del results_yolov4-tiny.txt weights\\last_yolov4-tiny.pt 2>/Nul
    @del weights\\last_yolov4-tiny.pt 2>/Nul
    @del weights\\best_yolov4-tiny.pt 2>/Nul
    @del weights\\last.pt 2>/Nul
    @del weights\\best.pt 2>/Nul
    @del results.png 2>/Nul

```

# 二. YOLOv4测试
------
> - 测试的任务就是使用一组图像集来获取相关类别的分类评估信息。这个测试与训练中测试的差别就是对每个类别都有统计信息，是完整的测试报告（通过混淆矩阵得到）
> - 训练的数据集使用费的是Mosaic推理，在测试的时候，当`batch-size=1`使用的是rectangle推理。所以可以关注下`batch-size`值得设置。
------

## 1. 相关代码与文件

1. 依赖的代码包含：
    >    - `utils`下的所有`.py`文件
    >    - `test.py`文件
2. 数据集
    
    >- 与训练的一样。因为其中包含了测试集, 就是`datasets`目录下的`coco128.data`
3. 模型文件
    
    >- 使用训练时候使用的模型文件：cfg目录下的cfg文件
4. 权重文件
    
    >- 使用训练产生的最新权重文件，在weights目录下，应该是`best_yolov4-tiny.pt`


## 2. 测试脚本

1. 编写的测试脚本如下：

```bash
    python test.py  ^
    --data datasets/coco128.data ^
    --cfg cfg/yolov4-tiny.cfg ^
    --weights weights/best_yolov4-tiny.pt ^
    --img 640 ^
    --iou-thr 0.6 ^
    --conf-thres 0.5 ^
    --batch-size 1
```

2. 参数解释
    - iou-thr：iou(Intersection over Union:并集上的交集)：目标重叠度阈值。
    - conf-thres：置信度阈值。

## 3. 测试结果

1. 测试的终端输出
```bash
C:\01works\15money\codes\14_训练用户的目标侦测模型>run_test.bat
```

# 三. YOLOv4识别
------

> - YOLOv4识别就是在图像上标注识别结果。这个环节的关键是提供侦测识别的图像，并正确输入。然后观察输出结果。
>    - 输入的图像是存放在imgs目录下即可。
>    - 输出会自动创建一个output目录，并存放标注好的图像到该目录下。

------

## 1. 相关文件

1. 代码文件
    - `detect.py`文件
    - `models.py`文件
    - `utils`目录下所有`.py`文件
2. 其他文件
    - `imgs`目录：并存放几张图像进去，我们存放的是一张图像。

## 2. 执行脚本

1. 脚本代码内容：`run_detect.bat`
```bash
    python detect.py  ^
    --cfg cfg/yolov4-tiny.cfg ^
    --weights weights/best_yolov4-tiny.pt ^
    --names datasets/coco.names ^
    --source imgs/  ^
    --img-size 640 ^
    --iou-thres 0.2 ^
    --conf-thres 0.3 ^
    --device 0
```
2. 参数解释：
    - source imgs/:指定需要识别的图像所在目录。
    - device 0：识别使用GPU的编号（第一个GPU）
    - iou-thr：iou(Intersection over Union:并集上的交集)：目标重叠度阈值。
    - conf-thres：置信度阈值。

## 3. 执行效果

1. 输出的目录文件
    
    > ![image.png](attachment:image.png) 
2. 输出的图像效果
    
    > ![image-2.png](attachment:image-2.png)

------

- 说明：
    - YOLO网络使用PyTorch实现，训练的时候考虑过多的情况，不便于理解。同时没有封装成可以直接调用实现识别的模块。所以后面准备自己实现一个训练模块，并且使用labelimg标注工具标注（该工具的标注结果使用xml格式）。同时封装一个简单以用的侦测模块，实现缓冲图像、图像文件、视频等侦测调用。