# **0 模型构建思路及调优过程**

# **0.1.1 完整算法结构框图**

本项目采用faster rcnn 的swin transformer和r101分别训练，然后将两个模型的结果进行融合

swin transformer结构框图
![](https://ai-studio-static-online.cdn.bcebos.com/26d3a837358347478a3d648fa03869c48b4491cbdc1549e6b6e7aeda28cdefb2)

r101结构框图
![](https://ai-studio-static-online.cdn.bcebos.com/aa90531cfc6f4c788c06493376759769e6759af6dc6a4753ae72c1c70efc0b39)

# **0.1.2 思路步骤详述**

项目首先进行数据预处理，然后分别利用faster rcnn的swin transformer和r101架构进行训练，最后将模型预测结果利用WBF进行融合。
NMS和soft-NMS都排除了一些框，但是WBF利用了所有框的信息。它可以解决某些情况下，模型预测的框不准确。NMS将只能留下一个不准确的框，而WBF将使用来自3个框的信息来修复它，如下图所示，红色的为预测，蓝色的为真值。

![](https://ai-studio-static-online.cdn.bcebos.com/8efbab1a3a4348649baf6c24984d60eff04b2bd73916402db9804e4c79e136ac)

# **0.1.3 代码组织结构介绍**

项目代码目录

0 模型构建思路及调优过程

1 比赛介绍

2 数据介绍

3 环境准备

4 数据准备

5 数据增强

6 训练模型

7 检测结果

8 融合结果

# **0.2 数据增强/清晰策略**

项目尝试进行数据增强，通过实验结果分析，增强效果不明显，故最后没有使用数据增强


# **0.3 调参优化策略**
项目首先将train数据集进行训练集：验证集=9：1进行划分，通过loss以及mAP调整学习率和衰减轮次等参数。
最后调整到结果较好时，保持训练超参数不变，将所有train数据全部用于训练

# **0.4训练脚本/代码**
见6 训练模型，训练日志保存在/home/aistudio/log

# **0.5测试脚本/代码**
见7 检测结果，测试集为比赛测试数据，无标签，测试结果保存在/home/aistudio/Csv

# **1 比赛介绍**
缺陷检测技术广泛应用于工业场景，比如汽车制造中的车身表面缺陷检测，零件外观缺陷检测，工件裂纹检测等。其中，金属表面缺陷识别技术的应用可以在生产及制造阶段的质量控制方面发挥重要作用。

本次比赛为图像目标识别比赛，要求参赛选手基于给定图像建立模型，识别出钢铁表面出现缺陷的位置，并给出锚点框的坐标，同时对不同的缺陷进行分类。通过本次比赛，我们希望看到各种泛化性能更好且更稳定的钢铁表面缺陷识别模型，您的工作也将为传统钢铁产业生产效率的提升做出重要贡献。

# **2 数据介绍**
东北大学宋克臣教授提供的可开放使用的表面缺陷检测数据集

# **3 环境准备**
为实验配置相应的环境

In [None]:
!pip config list
# 安装paddlex 用于拆分数据集
# 升级pip
!pip install --upgrade pip -i https://mirror.baidu.com/pypi/simple
!pip install "paddlex>2.0.0" -i https://mirror.baidu.com/pypi/simple 
# 统计数据
!pip install scikit-image
!pip install lxml
# # 下载PaddleDetection 
%cd /home/aistudio/work
!git clone https://gitee.com/paddlepaddle/PaddleDetection.git -b release/2.3 
# 安装其它依赖
!pip install -r /home/aistudio/work/PaddleDetection/requirements.txt  
# 临时环境安装
!pip install pycocotools -i https://mirror.baidu.com/pypi/simple
!pip install lap -i https://mirror.baidu.com/pypi/simple
!pip install ensemble-boxes   

# **4 数据准备**
分析实验数据
划分训练集测试集

In [None]:
# 解压文件并移除多余的目录
! unzip /home/aistudio/data/data105746/train.zip -d /home/aistudio/data/steel
!rm -r /home/aistudio/data/steel/__MACOSX
! unzip /home/aistudio/data/data105747/test.zip -d /home/aistudio/data/steel
!rm -r /home/aistudio/data/steel/__MACOSX

# 修改文件名字 JPEGImages  Annotations
!mv /home/aistudio/data/steel/train/ANNOTATIONS  /home/aistudio/data/steel/train/Annotations
!mv /home/aistudio/data/steel/train/IMAGES  /home/aistudio/data/steel/train/JPEGImages

In [None]:
# 分析实验数据
!python /home/aistudio/strongData/sample_num.py  

In [None]:
#使用paddleX拆分数据集
!paddlex --split_dataset --format VOC --dataset_dir /home/aistudio/data/steel/train --val_value 0.001 --test_value 0.0
%cd /home/aistudio/work/PaddleDetection/
#转换train
!python tools/x2coco.py \
        --dataset_type voc \
        --voc_anno_dir /home/aistudio/data/steel/train/ \
--voc_anno_list /home/aistudio/data/steel/train/train_list.txt \
--voc_label_list /home/aistudio/data/steel/train/labels.txt \
--voc_out_name /home/aistudio/data/steel/train/voc_train.json

#转换test
!python tools/x2coco.py \
        --dataset_type voc \
        --voc_anno_dir /home/aistudio/data/steel/train/ \
--voc_anno_list /home/aistudio/data/steel/train/val_list.txt \
--voc_label_list /home/aistudio/data/steel/train/labels.txt \
--voc_out_name /home/aistudio/data/steel/train/voc_val.json

!rm -r /home/aistudio/data/steel/train/Annotations/*
!mv /home/aistudio/data/steel/train/*.json /home/aistudio/data/steel/train/Annotations/

# **5 数据增强**
经过实验对比 增强前和增强后好像并没有提高太多的效果 所以这里我最后还是没用
可能是我增强的方式有问题 你们可以试试

In [None]:
# # 数据增强 基准数扩充2倍
# !python /home/aistudio/strongData/strong.py
# # 合并增强数据
# !mv /home/aistudio/data/steel/train/AugAnnotations/* /home/aistudio/data/steel/train/Annotations
# !mv /home/aistudio/data/steel/train/AugJPEGImages/* /home/aistudio/data/steel/train/JPEGImages
# # 清除空目录
# !rm -rf /home/aistudio/data/steel/train/AugAnnotations
# !rm -rf /home/aistudio/data/steel/train/AugJPEGImages

# **6 训练模型**
经过多次实验 观察到faster rcnn的Swin和r101 效果是最好的 训练这两个模型
注意训练前配置好dataset的路径

In [None]:
# 训练
!python tools/train.py -c /home/aistudio/work/PaddleDetection/configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_3x_coco.yml --use_vdl=true --vdl_log_dir=vdl_dir/scalar --eval

In [None]:
# 训练
!python tools/train.py -c /home/aistudio/work/PaddleDetection/configs/faster_rcnn/faster_rcnn_r101_vd_fpn_2x_coco.yml --use_vdl=true --vdl_log_dir=vdl_dir/scalar --eval

# **7 检测结果**

In [None]:
# Swin
%cd /home/aistudio/work/PaddleDetection

!python tools/infer.py -c  configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_3x_coco.yml \
-o weights=/home/aistudio/work/PaddleDetection/output/faster_rcnn_swin_tiny_fpn_3x_coco/model_final \
--infer_dir=/home/aistudio/data/steel/test/IMAGES/ \
--output_dir=/home/aistudio/data/steel/infer_output\
--draw_threshold=0.0000001 --save_txt=True

In [None]:
# 将Swin模型的检测结果保存为csv文件
import csv
import os
headers = ['image_id','bbox','category_id','confidence']
classList = ['crazing','inclusion','pitted_surface','scratches','patches','rolled-in_scale']
rows = []

rootdir = '/home/aistudio/data/steel/infer_output'
lists = os.listdir(rootdir) #列出文件夹下所有的目录与文件
for i in range(0,len(lists)):
       path = os.path.join(rootdir,lists[i])
       if os.path.isfile(path) and path.endswith('txt'):
           txtFile = open(path)
           print(path)
           result = txtFile.readlines()
           for r in result:
               ls = r.split(' ')
               Cls = ls[0]
               sco = float(ls[1])
              #  if sco < 0.0001:
              #    continue;
               xmin = float(ls[2])
               ymin = float(ls[3])
               w = float(ls[4])
               h = float(ls[5])
               xmax = xmin+w
               ymax = ymin+h
               clsID = classList.index(Cls)
               imgID = lists[i][:-4]
               row = [imgID,[xmin,ymin,xmax,ymax],clsID,sco]
               rows.append(row)
with open('/home/aistudio/Csv/比赛提交/Swin/submission.csv','w')as f:
    f_csv = csv.writer(f)
    f_csv.writerow(headers)
    f_csv.writerows(rows)

import pandas as pd
datafile = pd.read_csv('/home/aistudio/Csv/比赛提交/Swin/submission.csv')
# 按照列值排序
data = datafile.sort_values(by="image_id", ascending=True)
data.to_csv('/home/aistudio/Csv/比赛提交/Swin/submission_final.csv', mode='a+', index=False)

In [None]:
# r101
%cd /home/aistudio/work/PaddleDetection

!python tools/infer.py -c  configs/faster_rcnn/faster_rcnn_r101_vd_fpn_2x_coco.yml \
-o weights=/home/aistudio/work/PaddleDetection/output/faster_rcnn_r101_vd_fpn_2x_coco/model_final \
--infer_dir=/home/aistudio/data/steel/test/IMAGES/ \
--output_dir=/home/aistudio/data/steel/infer_output\
--draw_threshold=0.0000001 --save_txt=True

In [None]:
# 将r101模型的检测结果保存为csv文件
import csv
import os
headers = ['image_id','bbox','category_id','confidence']
classList = ['crazing','inclusion','pitted_surface','scratches','patches','rolled-in_scale']
rows = []

rootdir = '/home/aistudio/data/steel/infer_output'
lists = os.listdir(rootdir) #列出文件夹下所有的目录与文件
for i in range(0,len(lists)):
       path = os.path.join(rootdir,lists[i])
       if os.path.isfile(path) and path.endswith('txt'):
           txtFile = open(path)
           print(path)
           result = txtFile.readlines()
           for r in result:
               ls = r.split(' ')
               Cls = ls[0]
               sco = float(ls[1])
              #  if sco < 0.0001:
              #    continue;
               xmin = float(ls[2])
               ymin = float(ls[3])
               w = float(ls[4])
               h = float(ls[5])
               xmax = xmin+w
               ymax = ymin+h
               clsID = classList.index(Cls)
               imgID = lists[i][:-4]
               row = [imgID,[xmin,ymin,xmax,ymax],clsID,sco]
               rows.append(row)
with open('/home/aistudio/Csv/比赛提交/r101/submission.csv','w')as f:
    f_csv = csv.writer(f)
    f_csv.writerow(headers)
    f_csv.writerows(rows)

import pandas as pd
datafile = pd.read_csv('/home/aistudio/Csv/比赛提交/r101/submission.csv')
# 按照列值排序
data = datafile.sort_values(by="image_id", ascending=True)
data.to_csv('/home/aistudio/Csv/比赛提交/r101/submission_final.csv', mode='a+', index=False)

# **8 融合结果**
将两组结果融合

In [None]:
# 融合两个模型
import numpy as np
from ensemble_boxes import *
import pandas as pd
import csv

# 定义融合两个模型结果的函数
def wbf_2models(filename1, filename2, weights, iou_thr):
    df1=pd.read_csv(filename1)
    df2=pd.read_csv(filename2)

    box1=[]
    box2=[]
    label1=[]
    label2=[]
    score1=[]
    score2=[]
    j=0
    k=0
    for i in range(400):
        box1.append([])
        box2.append([])
        label1.append([])
        label2.append([])
        score1.append([])
        score2.append([])

    # 将结果文件中的数据放入列表中，方便处理
    for id1 in range(1400,1800):    
        while j<len(df1) and df1['image_id'][j]==id1:
            box1[id1-1400].append(eval(df1['bbox'][j]))
            label1[id1-1400].append(df1['category_id'][j])
            score1[id1-1400].append(df1['confidence'][j])
            j+=1
        while k<len(df2) and df2['image_id'][k]==id1:
            box2[id1-1400].append(eval(df2['bbox'][k]))
            label2[id1-1400].append(df2['category_id'][k])
            score2[id1-1400].append(df2['confidence'][k])
            k+=1

    for l in range(len(box1)):  
        for i in range(len(box1[l])):
            box1[l][i][0]=box1[l][i][0]/200.0         # 归一化处理
            box1[l][i][1]=box1[l][i][1]/200.0
            box1[l][i][2]=box1[l][i][2]/200.0
            box1[l][i][3]=box1[l][i][3]/200.0
        for i in range(len(box2[l])):
            box2[l][i][0]=box2[l][i][0]/200.0
            box2[l][i][1]=box2[l][i][1]/200.0
            box2[l][i][2]=box2[l][i][2]/200.0
            box2[l][i][3]=box2[l][i][3]/200.0

    boxes=[]
    scores=[]
    labels=[]
     # 进行结果融合
    for i in range(400):
        label_list=[label1[i],label2[i]]
        box_list=[box1[i],box2[i]]

        score_list=[score1[i],score2[i]]
        box, score, label = weighted_boxes_fusion(box_list, score_list, label_list, weights=weights, iou_thr=iou_thr, skip_box_thr=0.0)
    
        boxes.append(list(box))
        scores.append(list(score))
        labels.append(list(label.astype(int)))

    data=[]
    for i in range(400):
        for j in range(len(labels[i])):
            boxes[i][j][0]*=200.0      # 反归一化
            boxes[i][j][1]*=200.0
            boxes[i][j][2]*=200.0
            boxes[i][j][3]*=200.0
            boxes[i][j]=[boxes[i][j][0],boxes[i][j][1],boxes[i][j][2],boxes[i][j][3]]
            data.append([i+1400,boxes[i][j],labels[i][j],scores[i][j]])
    # 将融合后的结果写入新的文件
    with open("/home/aistudio/Csv/比赛提交/Swin+r101/submission.csv",'w',newline='') as f:
        writer=csv.writer(f)
        writer.writerow(['image_id','bbox','category_id','confidence'])
        writer.writerows(data)

In [None]:
submission1 = '/home/aistudio/Csv/比赛提交/Swin/submission_final.csv'    # 文件路径
submission2 = '/home/aistudio/Csv/比赛提交/r101/submission_final.csv'
weights=[3,1]
iou_thr=0.7
wbf_2models(submission1, submission2, weights, iou_thr)

最终融合的结果保存在 /home/aistudio/Csv/比赛提交/Swin+r101