# 样例介绍
* YOLOv5是一种单阶段目标检测算法，在这个样例中，我们选取了YOLOv5s，它是YOLOv5系列中较为轻量的网络，适合在边缘设备部署，进行实时目标检测。

# 前期准备
* 基础镜像的样例目录中已包含转换后的om模型以及测试图片，如果直接运行，可跳过此步骤。如果需要重新转换模型，可以参考下面的步骤。
* 首先我们可以在[这个链接](https://ascend-repo.obs.cn-east-2.myhuaweicloud.com/Atlas%20200I%20DK%20A2/DevKit/downloads/23.0.RC1/Ascend-devkit_23.0.RC1_downloads.xlsx)的表格中找到本样例的依赖文件，下载我们已经准备好了的ONNX模型，ONNX是开源的离线推理模型框架。

* 为了能进一步优化模型推理性能，我们需要将其转换为om模型进行使用，以下为转换指令：  
    ```shell
    atc --model=yolov5s.onnx --framework=5 --output=yolo --input_format=NCHW --input_shape="input_image:1,3,640,640" --log=error --soc_version=Ascend310B1
    ```
    * 其中转换参数的含义为：  
        * --model：输入模型路径
        * --framework：原始网络模型框架类型，5表示ONNX
        * --output：输出模型路径
        * --input_format：输入Tensor的内存排列方式
        * --input_shape：指定模型输入数据的shape
        * --log：日志级别
        * --soc_version：昇腾AI处理器型号
        * --input_fp16_nodes：指定输入数据类型为FP16的输入节点名称
        * --output_type：指定网络输出数据类型或指定某个输出节点的输出类型

# 模型推理实现

In [1]:
# 导入代码依赖
import cv2
import time
import numpy as np
import ipywidgets as widgets
from IPython.display import display
import torch
from sklearn.cluster import KMeans
from skvideo.io import vreader, FFmpegWriter
import IPython.display
from ais_bench.infer.interface import InferSession

from det_utils import letterbox, scale_coords, nms

  warn(f"Failed to load image Python extension: {e}")


In [2]:
def preprocess_image(image, cfg, bgr2rgb=True):
    """图片预处理"""
    img, scale_ratio, pad_size = letterbox(image, new_shape=cfg['input_shape'])
    if bgr2rgb:
        img = img[:, :, ::-1]
    img = img.transpose(2, 0, 1)  # HWC2CHW
    img = np.ascontiguousarray(img, dtype=np.float32)/255
    return img, scale_ratio, pad_size


def draw_bbox(bbox, img0, color, wt, names, num, a, b, c, d):
    """在图片上画预测框"""
    det_result_str = ''
    for idx, class_id in enumerate(bbox[:, 5]):
        if float(bbox[idx][4] < float(0.05)):
            continue
        img0 = cv2.rectangle(img0, (int(bbox[idx][0]), int(bbox[idx][1])), (int(bbox[idx][2]), int(bbox[idx][3])),
                             color, wt)
        img0 = cv2.putText(img0, str(idx) + ' ' + names[int(class_id)], (int(bbox[idx][0]), int(bbox[idx][1] + 16)),
                           cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 1)
        img0 = cv2.putText(img0, '{:.4f}'.format(bbox[idx][4]), (int(bbox[idx][0]), int(bbox[idx][1] + 32)),
                           cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 1)
        det_result_str += '{} {} {} {} {} {}\n'.format(
            names[bbox[idx][5]], str(bbox[idx][4]), bbox[idx][0], bbox[idx][1], bbox[idx][2], bbox[idx][3])
    # 在图像的右下角添加文本
    text = f"total:{num}  8nm:{a}  10nm:{b}  12nm:{c}  14nm:{d}"
    font = cv2.FONT_HERSHEY_SIMPLEX
    font_scale = 0.45
    font_thickness = 1
    font_color = (0, 0, 255)  # 红色
    # 获取文本的大小
    text_size = cv2.getTextSize(text, font, font_scale, font_thickness)[0]
    # 计算文本放置的位置（右下角）
    text_position = (10, img0.shape[0] - 10)
    # 使用cv2.putText在图像上绘制文本
    cv2.putText(img0, text, text_position, font, font_scale, font_color, font_thickness)
    return img0


def get_labels_from_txt(path):
    """从txt文件获取图片标签"""
    labels_dict = dict()
    with open(path) as f:
        for cat_id, label in enumerate(f.readlines()):
            labels_dict[cat_id] = label.strip()
    return labels_dict


def draw_prediction(pred, image, labels, num, a, b, c, d):
    """在图片上画出预测框并进行可视化展示"""
    imgbox = widgets.Image(format='jpg', height=720, width=1280)
    img_dw = draw_bbox(pred, image, (0, 255, 0), 2, labels, num, a, b, c, d)
    imgbox.value = cv2.imencode('.jpg', img_dw)[1].tobytes()
    display(imgbox)
    
def calculate_num_c(pred):
    areas=[]
    rows, columns = pred.shape
    for i in range(rows):
        area=(pred[i,2]-pred[i,0])*(pred[i,3]-pred[i,1])
        areas.append(area)
    if(len(areas)>=4):
        areas_array = np.array(areas).reshape(-1, 1)  # 转换成二维数组，-1表示自动推断行数，1表示1列
        # 使用K均值聚类，假设你希望将面积分成4个类别
        num_clusters = 4
        kmeans = KMeans(n_clusters=num_clusters)
        kmeans.fit(areas_array)
        # 获取聚类结果
        cluster_labels = kmeans.labels_
        centroids = kmeans.cluster_centers_
        dic={0:int(centroids[0]),1:int(centroids[1]),2:int(centroids[2]),3:int(centroids[3])}
        new_sys2 = sorted(dic.items(), key=lambda d: d[1], reverse=False)
        # 打印每个框的面积和所属类别
        cnt=[0,0,0,0]
        for i, area in enumerate(areas):
            if((int)(cluster_labels[i])==0):
                cnt[0]+=1
            elif((int)(cluster_labels[i])==1):
                cnt[1]+=1
            elif((int)(cluster_labels[i])==2):
                cnt[2]+=1
            elif((int)(cluster_labels[i])==3):
                cnt[3]+=1
    else:
        return 0,0,0,0,0
    return len(areas),cnt[new_sys2[0][0]],cnt[new_sys2[1][0]],cnt[new_sys2[2][0]],cnt[new_sys2[3][0]]

def infer_image(img_path, model, class_names, cfg):
    """图片推理"""
    # 图片载入
    image = cv2.imread(img_path)
    # 数据预处理
    img, scale_ratio, pad_size = preprocess_image(image, cfg)
    # 模型推理
    output = model.infer([img])[0]

    output = torch.tensor(output)
    # 非极大值抑制后处理
    boxout = nms(output, conf_thres=cfg["conf_thres"], iou_thres=cfg["iou_thres"])
    pred_all = boxout[0].numpy()
    # 计算小球数量
    num,a,b,c,d=calculate_num_c(pred_all)
    # 预测坐标转换
    scale_coords(cfg['input_shape'], pred_all[:, :4], image.shape, ratio_pad=(scale_ratio, pad_size))
    # 图片预测结果可视化
    draw_prediction(pred_all, image, class_names, num, a, b, c, d)


def infer_frame_with_vis(image, model, labels_dict, cfg, bgr2rgb=True):
    # 数据预处理
    img, scale_ratio, pad_size = preprocess_image(image, cfg, bgr2rgb)
    # 模型推理
    output = model.infer([img])[0]

    output = torch.tensor(output)
    # 非极大值抑制后处理
    boxout = nms(output, conf_thres=cfg["conf_thres"], iou_thres=cfg["iou_thres"])
    pred_all = boxout[0].numpy()
    # 计算小球数量
    num,a,b,c,d=calculate_num_c(pred_all)
    # 预测坐标转换
    scale_coords(cfg['input_shape'], pred_all[:, :4], image.shape, ratio_pad=(scale_ratio, pad_size))
    # 图片预测结果可视化
    img_vis = draw_bbox(pred_all, image, (0, 255, 0), 2, labels_dict, num, a, b, c, d)
    return img_vis


def img2bytes(image):
    """将图片转换为字节码"""
    return bytes(cv2.imencode('.jpg', image)[1])


def infer_video(video_path, model, labels_dict, cfg):
    """视频推理"""
    image_widget = widgets.Image(format='jpeg', width=800, height=600)
    display(image_widget)

    # 读入视频
    cap = cv2.VideoCapture(video_path)
    while True:
        ret, img_frame = cap.read()
        if not ret:
            break
        # 对视频帧进行推理
        image_pred = infer_frame_with_vis(img_frame, model, labels_dict, cfg, bgr2rgb=True)
        image_widget.value = img2bytes(image_pred)


def infer_camera(model, labels_dict, cfg):
    """外设摄像头实时推理"""
    def find_camera_index():
        max_index_to_check = 10  # Maximum index to check for camera

        for index in range(max_index_to_check):
            cap = cv2.VideoCapture(index)
            if cap.read()[0]:
                cap.release()
                return index

        # If no camera is found
        raise ValueError("No camera found.")

    # 获取摄像头
    camera_index = find_camera_index()
    cap = cv2.VideoCapture(camera_index)
    # 初始化可视化对象
    image_widget = widgets.Image(format='jpeg', width=1280, height=720)
    display(image_widget)
    while True:
        start=time.time()
        # 对摄像头每一帧进行推理和可视化
        _, img_frame = cap.read()
        image_pred = infer_frame_with_vis(img_frame, model, labels_dict, cfg)
        image_widget.value = img2bytes(image_pred)
        end=time.time()
        print(end-start)

# 样例运行

* 初始化相关参数

In [3]:
cfg = {
    'conf_thres': 0.2,  # 模型置信度阈值，阈值越低，得到的预测框越多
    'iou_thres': 0.3,  # IOU阈值，高于这个阈值的重叠预测框会被过滤掉
    'input_shape': [640, 640],  # 模型输入尺寸
}

model_path = 'best.om'
label_path = './test.txt'
# 初始化推理模型
model = InferSession(0, model_path)
labels_dict = get_labels_from_txt(label_path)

* 选择推理模式。"infer_mode"有三个取值：image, camera, video，分别对应图片推理、摄像头实时推理和视频推理。默认使用视频推理模式。
* 我们选取的样例是一个赛车视频，执行下面的代码后可以看到模型会对视频的每一帧进行推理，并将预测结果展示在画面上。

In [None]:
infer_mode = 'camera'

if infer_mode == 'image':
    img_path = 'test2.jpg'
    infer_image(img_path, model, labels_dict, cfg)
elif infer_mode == 'camera':
    infer_camera(model, labels_dict, cfg)
elif infer_mode == 'video':
    video_path = 'racing.mp4'
    infer_video(video_path, model, labels_dict, cfg)

[INFO] acl init success
[INFO] open device 0 success
[INFO] load model best.om success
[INFO] create model description success


[ WARN:0@7.963] global cap_v4l.cpp:982 open VIDEOIO(V4L2:/dev/video0): can't open camera by index
[ERROR:0@8.148] global obsensor_uvc_stream_channel.cpp:156 getStreamChannelGroup Camera index out of range


Image(value=b'', format='jpeg', height='720', width='1280')

0.4172341823577881
0.17367172241210938
0.16678285598754883
0.16647863388061523
0.16730809211730957
0.16872429847717285
0.16738128662109375
0.16556906700134277
0.16688871383666992
0.1697676181793213
0.17064666748046875
0.16693496704101562
0.16608762741088867
0.1647963523864746
0.16610026359558105
0.16544342041015625
0.16594171524047852
0.16531729698181152
0.16605186462402344
0.16508841514587402
0.16755914688110352
0.16712069511413574
0.16747832298278809
0.16881489753723145
0.16720056533813477
0.165604829788208
0.1678910255432129
0.16700243949890137
0.1667191982269287
0.16621851921081543
0.16688108444213867
0.16593718528747559
0.16701340675354004
0.16673779487609863
0.16783356666564941
0.16500568389892578
0.16617107391357422
0.16685962677001953
0.16978240013122559
0.16916465759277344
0.167525053024292
0.16599106788635254
0.1679084300994873
0.16935491561889648
0.1694793701171875
0.16570329666137695
0.16900205612182617
0.1656358242034912
0.16661906242370605
0.16706228256225586
0.1680326461



0.3457207679748535
0.17340302467346191
0.17150259017944336
0.16993260383605957




0.21640777587890625
0.16958832740783691
0.16844654083251953
0.16561675071716309
0.16890549659729004
0.1650407314300537
0.16695809364318848
0.16869902610778809
0.16955828666687012
0.16816973686218262
0.17015743255615234
0.16832208633422852
0.1692042350769043
0.17058587074279785
0.16989946365356445
0.16915011405944824
0.16987943649291992
0.16989827156066895
0.16990327835083008
0.1699373722076416
0.17278361320495605
0.17028117179870605
0.1703634262084961
0.168379545211792
0.1697707176208496
0.16778063774108887
0.16870689392089844
0.16805434226989746
0.16921353340148926
0.16961669921875
0.17038416862487793
0.1678619384765625
0.16938138008117676
0.16793441772460938
0.16896390914916992
0.16857194900512695
0.17008566856384277
0.16873478889465332
0.16981720924377441
0.16712331771850586
0.16886186599731445
0.16891884803771973
0.16863489151000977
0.1670396327972412
0.16866278648376465
0.1676805019378662
0.1683053970336914
0.16790556907653809
0.17145586013793945
0.16861510276794434
0.172873973846



0.2164599895477295




0.23205232620239258
0.17073726654052734
0.17079782485961914
0.1659870147705078
0.17014527320861816




0.2146918773651123
0.17018437385559082
0.16883611679077148
0.16779446601867676




0.21558451652526855




0.21909666061401367
0.17093491554260254




0.21514892578125




0.22149229049682617
0.17331361770629883
0.16820955276489258
0.16835618019104004
0.16963601112365723
0.16727018356323242
0.1688988208770752
0.16794824600219727




0.21574711799621582
0.17088079452514648
0.1679694652557373
0.16739964485168457




0.21350383758544922
0.16533684730529785
0.1658625602722168
0.16475820541381836
0.1651749610900879
0.16828393936157227
0.170867919921875
0.16796636581420898
0.1682438850402832
0.16769790649414062
0.16826224327087402
0.16829657554626465
0.16911721229553223
0.17032408714294434
0.16968178749084473
0.1703782081604004
0.16953730583190918
0.16759943962097168
0.16896462440490723
0.16777777671813965
0.16854476928710938
0.1681365966796875
0.16962385177612305
0.16785717010498047
0.16819000244140625
0.1676464080810547
0.16869401931762695
0.16862797737121582
0.1712474822998047
0.17156600952148438




0.21986794471740723
0.1692643165588379
0.17022323608398438
0.16896653175354004
0.1705937385559082
0.1671762466430664
0.16853976249694824
0.16890549659729004
0.16936540603637695




0.2158358097076416




0.22443914413452148
0.16950535774230957




0.21479392051696777




0.21871566772460938
0.16952872276306152
0.17221903800964355
0.1681365966796875
0.16881608963012695
0.16766810417175293
0.16962623596191406
0.1671464443206787
0.16827702522277832
0.16679596900939941
0.16959309577941895
0.16907572746276855
0.16816329956054688
0.168137788772583
0.1684255599975586
0.16852998733520508
0.16866469383239746
0.16780900955200195
0.1685173511505127




0.21961331367492676
0.1715223789215088




0.21479153633117676




0.21439075469970703
0.16926884651184082




0.21802568435668945
0.16867470741271973
0.16857242584228516
0.167863130569458
0.16800570487976074
0.16739225387573242
0.1691734790802002
0.16714787483215332
0.16888165473937988
0.16868305206298828
0.16952800750732422
0.16755366325378418
0.16843605041503906
0.1681070327758789
0.16950678825378418
0.16781067848205566
0.16846585273742676
0.1677875518798828
0.16900324821472168
0.16775727272033691
0.16906428337097168
0.16801905632019043
0.16875624656677246
0.16773200035095215
0.16849851608276367
0.17055392265319824
0.1707146167755127
0.16972756385803223
0.1697220802307129
0.16784882545471191
0.16959619522094727
0.16824913024902344
0.16937899589538574
0.16748666763305664
0.16848254203796387
0.16436338424682617
0.1689300537109375
0.16518092155456543
0.16634750366210938
0.16683101654052734
0.1693274974822998
0.1650547981262207
0.16977334022521973
0.1692490577697754
0.16913461685180664
0.16617441177368164
0.16912603378295898
0.17131304740905762
0.1666429042816162
0.16822552680969238
0.1681382656



0.213942289352417
0.1718752384185791
0.16854333877563477
0.16816425323486328
0.16934776306152344
0.16810369491577148
0.17541050910949707
0.17325496673583984
0.1706852912902832
0.16950011253356934
0.1687462329864502
0.1671450138092041
0.17171573638916016
0.16665053367614746
0.1683790683746338
0.16807198524475098
0.16926288604736328
0.1644608974456787
0.16712713241577148
0.16935515403747559
0.16642165184020996
0.1677541732788086
0.1698765754699707
0.16678762435913086
0.16765213012695312
0.16520977020263672
0.1672382354736328
0.1651623249053955
0.1694478988647461
0.1690051555633545
0.16896367073059082
0.1669328212738037
0.16886234283447266
0.1681966781616211
0.1690971851348877
0.16788434982299805
0.16596603393554688




0.22059988975524902
0.17265748977661133
0.17002129554748535
0.1676652431488037
0.16858625411987305
0.16893219947814941
0.17276740074157715
0.16998505592346191
0.17021632194519043
0.16997766494750977
0.1711573600769043
0.16992783546447754
0.17066645622253418
0.16797661781311035
0.16935133934020996
0.16773653030395508
0.16789913177490234
0.1675572395324707
0.1681513786315918
0.16813230514526367
0.16808390617370605
0.16739749908447266
0.16811323165893555
0.16698455810546875
0.16579937934875488
0.1672515869140625
0.16855335235595703
0.16801857948303223
0.16985654830932617
0.1672227382659912
0.16734600067138672
0.16527700424194336
0.1717216968536377
0.16748261451721191
0.1704573631286621
0.16836810111999512
0.16983509063720703
0.1663801670074463
0.16864848136901855
0.16720223426818848




0.22173595428466797
0.17320990562438965
0.17125582695007324
0.16875576972961426
0.1700880527496338
0.16901540756225586
0.17001581192016602
0.16908550262451172
0.16917061805725098
0.16799402236938477
0.16895556449890137
0.16744089126586914
0.16808819770812988
0.16755199432373047
0.16807293891906738
0.16731595993041992
0.17179274559020996
0.1713879108428955
0.1734144687652588
0.16974210739135742
0.17030811309814453
0.17021465301513672
0.17063212394714355
0.16749811172485352




0.21427059173583984
0.17001080513000488
0.1682279109954834
0.1700115203857422
0.1725482940673828
0.16798830032348633




0.21568799018859863
0.17322516441345215
0.1712052822113037
0.1685037612915039
0.1694197654724121




0.21362948417663574
0.16820931434631348
0.16858887672424316
0.16771507263183594
0.17069554328918457
0.17290425300598145
0.16991758346557617
0.1669447422027588
0.16837644577026367
0.1674039363861084
0.1689906120300293
0.17478585243225098
0.16862845420837402
0.16706156730651855
0.16898036003112793
0.16857433319091797
0.1699385643005371
0.16872096061706543
0.16864323616027832
0.16735053062438965
0.16790103912353516
0.16709232330322266




0.2145075798034668
0.17216014862060547
0.17238593101501465
0.16869807243347168




0.21420717239379883
0.16785001754760742
0.16849350929260254
0.16905641555786133




0.21786856651306152
0.17101168632507324
0.1692061424255371
0.1680440902709961
0.16940689086914062
0.16828131675720215
0.16883254051208496
0.16944646835327148
0.1691899299621582
0.16925334930419922
0.1687788963317871
0.16945719718933105
0.17023086547851562
0.16940975189208984
0.16960573196411133
0.16988563537597656
0.16791868209838867
0.16777515411376953
0.16876983642578125
0.16797232627868652
0.16830897331237793
0.16814041137695312
0.16582083702087402
0.16773080825805664
0.16871190071105957
0.1678144931793213
0.16963648796081543
0.1691277027130127
0.16947102546691895
0.16807317733764648
0.17041873931884766
0.16993093490600586
0.17016172409057617
0.16784429550170898
0.1680145263671875
0.16682195663452148
0.1681656837463379
0.16700029373168945
0.16863036155700684
0.16816496849060059
0.16902565956115723
0.1686389446258545
0.16881823539733887
0.16962313652038574
0.17097997665405273
0.16971540451049805
0.16900873184204102
0.16822314262390137
0.17004728317260742
0.17017102241516113
0.1708540



0.21349430084228516
0.1696155071258545
0.17014145851135254
0.16632676124572754
0.1682877540588379
0.16732454299926758
0.16820073127746582
0.16774892807006836
0.16647601127624512
0.16493868827819824
0.16832423210144043
0.1659252643585205
0.16573166847229004
0.1674792766571045
0.1686701774597168
0.16786766052246094
0.1685013771057129
0.16738677024841309
0.17175984382629395
0.1701645851135254
0.17023134231567383
0.16958999633789062
0.16953396797180176
0.16959214210510254
0.17084693908691406
0.16950106620788574
0.1709883213043213
0.16862034797668457
0.16856002807617188
0.167769193649292
0.16903448104858398
0.1671299934387207
0.17076897621154785
0.16846680641174316
0.16878461837768555
0.16832208633422852
0.16942191123962402
0.1685793399810791
0.16863608360290527
0.1676490306854248
0.16797542572021484
0.1683206558227539
0.16922688484191895
0.16739559173583984
0.16886663436889648
0.16756606101989746
0.1695404052734375
0.16905593872070312
0.16824889183044434
0.1671304702758789
0.16894507408142



0.21265840530395508
0.16753292083740234
0.16949200630187988
0.16951799392700195
0.17203831672668457
0.1689920425415039
0.16925883293151855
0.17209434509277344
0.16991662979125977
0.16847729682922363
0.17157411575317383
0.1690077781677246
0.16992664337158203
0.16912245750427246
0.16923761367797852
0.17008399963378906
0.169325590133667
0.1685783863067627
0.1704273223876953
0.1699674129486084
0.1691732406616211
0.16533803939819336
0.16923928260803223
0.16956353187561035
0.17101144790649414
0.16791009902954102
0.1680009365081787
0.16748571395874023
0.16910672187805176
0.16669178009033203
0.1677844524383545
0.1668682098388672
0.16904330253601074
0.16892457008361816
0.17152976989746094
0.17037749290466309
0.16795682907104492
0.16477084159851074
0.16551780700683594
0.16576743125915527
0.16794466972351074
0.1687934398651123
0.16537976264953613
0.16553688049316406
0.16602849960327148
0.16505646705627441
0.16585755348205566
0.16494989395141602
0.16588258743286133
0.1643972396850586
0.16561007499



0.21658992767333984
0.17189979553222656
0.17006421089172363
0.16718840599060059




0.21321415901184082
0.16914677619934082
0.1681516170501709
0.16881179809570312
0.169111967086792
0.168137788772583
0.16714024543762207
0.16697025299072266
0.16683530807495117
0.16625547409057617
0.16698932647705078
0.166107177734375
0.1698131561279297
0.16925549507141113
0.16626334190368652
0.16425585746765137
0.16898298263549805
0.16777706146240234
0.16567349433898926
0.16781115531921387
0.1679060459136963
0.1642458438873291
0.16603565216064453
0.16728496551513672
0.16884422302246094
0.1679081916809082
0.16777491569519043
0.1667783260345459




0.2132101058959961




0.21924090385437012
0.17189669609069824
0.16991400718688965
0.16774964332580566
0.1694955825805664
0.16864991188049316
0.16974949836730957
0.16921710968017578
0.1694629192352295
0.1673281192779541
0.1715691089630127
0.1682288646697998
0.17011332511901855
0.1681809425354004
0.1701064109802246
0.1688852310180664
0.16853642463684082
0.16922450065612793
0.1708071231842041
0.16805624961853027
0.16881346702575684
0.1694951057434082
0.1703944206237793
0.16986775398254395
0.16882705688476562
0.16663479804992676
0.17052435874938965
0.1672072410583496
0.168212890625
0.16762256622314453
0.1693413257598877
0.16913175582885742
0.16928887367248535
0.16924810409545898
0.16866493225097656
0.16635370254516602
0.16868281364440918
0.16789507865905762
0.16860342025756836
0.16690897941589355
0.16793513298034668
0.1668689250946045
0.16848063468933105
0.16694903373718262
0.16865873336791992
0.16856956481933594
0.1690518856048584
0.166762113571167
0.1693110466003418
0.16637325286865234
0.1690211296081543
0.16



0.2132723331451416
0.16793274879455566
0.16792559623718262
0.16715073585510254
0.16977834701538086
0.16878271102905273
0.17069506645202637
0.16910886764526367
0.16997003555297852
0.16756129264831543
0.1689004898071289
0.16847562789916992
0.16922235488891602




0.2131519317626953




0.21320247650146484
0.1711280345916748
0.16904854774475098
0.16801738739013672
0.16860485076904297
0.16777467727661133
0.16874933242797852
0.1690821647644043
0.1697373390197754
0.17183327674865723




0.21355223655700684
0.17293524742126465
0.16912412643432617
0.16797566413879395
0.17020726203918457
0.16882872581481934
0.16980242729187012
0.16834521293640137
0.1681225299835205
0.1678781509399414
0.17064261436462402
0.1678323745727539
0.1690680980682373
0.16945433616638184
0.1707925796508789
0.17023110389709473
0.17078518867492676
0.1676337718963623
0.16798663139343262
0.1681671142578125
0.17112517356872559
0.1681196689605713
0.16890454292297363
0.16910171508789062
0.16907024383544922
0.16818022727966309
0.16968631744384766
0.16876578330993652
0.17368650436401367
0.16856908798217773
0.16889047622680664
0.16982173919677734
0.16854143142700195
0.16821026802062988
0.16930127143859863
0.16820883750915527
0.16912508010864258
0.1696631908416748
0.16849231719970703
0.16955351829528809
0.1697099208831787
0.1678452491760254
0.16802549362182617
0.16736745834350586
0.16917133331298828
0.16814255714416504
0.17017579078674316




0.21453022956848145




0.22075366973876953
0.17105460166931152
0.16834449768066406
0.16853952407836914
0.17044353485107422
0.1697375774383545
0.16915130615234375




0.2127063274383545
0.17163419723510742
0.17056632041931152
0.168137788772583




0.21401238441467285
0.16958069801330566
0.17006802558898926
0.16901850700378418
0.17077279090881348
0.16916966438293457
0.16971826553344727
0.16814970970153809
0.16874003410339355
0.1656644344329834
0.1695396900177002
0.16543078422546387
0.16626453399658203
0.16513943672180176
0.16763901710510254
0.16655397415161133
0.16589808464050293
0.16454195976257324
0.1658182144165039
0.165024995803833
0.169203519821167
0.1646862030029297
0.17052745819091797
0.16825127601623535
0.1692492961883545
0.17036867141723633
0.17022323608398438
0.1688389778137207
0.16960859298706055
0.16835999488830566
0.1676044464111328
0.16692614555358887
0.16857099533081055
0.16808581352233887
0.1686842441558838
0.1667323112487793
0.17203593254089355
0.16794228553771973
0.16806697845458984
0.1687459945678711
0.1739645004272461
0.17209839820861816
0.17042946815490723
0.16749119758605957
0.16985321044921875
0.16732549667358398
0.17059850692749023
0.16884255409240723
0.16981291770935059
0.16884422302246094
0.1697516441345



0.21405339241027832




0.2175276279449463
0.17103791236877441
0.17275619506835938
0.16931891441345215
0.17385530471801758
0.16836905479431152




0.21839094161987305




0.22125029563903809




0.21855759620666504




0.21649765968322754




0.21783971786499023




0.21485424041748047




0.21369647979736328




0.2228405475616455




0.2181227207183838




0.2201082706451416




0.21581554412841797




0.21572089195251465




0.21561145782470703




0.21722149848937988
0.17006421089172363
0.16845130920410156
0.1659548282623291
0.16820931434631348
0.16528749465942383
0.16528940200805664
0.16568660736083984
0.16795802116394043
0.16619038581848145
0.16733074188232422
0.16947531700134277
0.168318510055542
0.1670844554901123
0.1704576015472412
0.16975045204162598
0.16982650756835938
0.16806983947753906
0.16833853721618652
0.16739821434020996
0.1687147617340088
0.1711280345916748
0.1765298843383789
0.16713643074035645
0.16879963874816895
0.16778349876403809
0.16841959953308105
0.1682734489440918
0.1696922779083252
0.16864490509033203
0.16971302032470703
0.16701579093933105
0.16924405097961426
0.16967535018920898
0.17119407653808594
0.16852092742919922
0.16815805435180664
0.16749048233032227
0.16950607299804688
0.1697862148284912
0.16972780227661133
0.1675856113433838
0.16835594177246094
0.16913080215454102
0.17029857635498047
0.16826868057250977
0.17014741897583008
0.16912555694580078




0.217087984085083
0.17175865173339844
0.16971516609191895
0.16869020462036133
0.168900728225708
0.16779065132141113
0.16725564002990723
0.1684725284576416
0.16956448554992676
0.17007732391357422
0.17009687423706055
0.16977214813232422
0.16987037658691406
0.16869211196899414
0.1699371337890625
0.16697072982788086
0.17089629173278809
0.16979455947875977
0.17122507095336914
0.16967558860778809
0.1693572998046875
0.16733837127685547
0.16881394386291504
0.17157220840454102
0.16707825660705566
0.16820931434631348
0.16830706596374512
0.1678164005279541
0.1713705062866211
0.1671297550201416
0.16901540756225586
0.16833829879760742
0.1692216396331787
0.16797280311584473
0.17081093788146973




0.2198944091796875
0.17052030563354492
0.16943073272705078
0.16712617874145508
0.16794514656066895
0.16811585426330566
0.16901302337646484
0.16797256469726562
0.16940760612487793
0.16802477836608887
0.17076587677001953
0.17068266868591309
0.16858887672424316
0.16778016090393066
0.17035317420959473
0.16941070556640625




0.21637678146362305
0.17023873329162598
0.16883563995361328
0.16801023483276367
0.16977810859680176
0.16904711723327637
0.17101621627807617




0.21852970123291016




0.2221240997314453




0.22299814224243164




0.21515536308288574
0.1753993034362793
0.17010784149169922
0.16842389106750488
0.1681528091430664
0.16905546188354492




0.22110342979431152
0.17129945755004883
0.16658806800842285
0.16789889335632324
0.16984820365905762
0.16666650772094727
0.16849708557128906
0.16548466682434082
0.16485953330993652
0.16448569297790527
0.16903352737426758
0.16459417343139648
0.1654987335205078
0.164473295211792
0.16530346870422363
0.16633009910583496
0.1687164306640625
0.16829681396484375
0.17023491859436035
0.16659760475158691
0.16770052909851074
0.16434383392333984
0.1724076271057129
0.16865134239196777
0.17109322547912598
0.16675806045532227
0.16820430755615234
0.16687965393066406
0.16750717163085938
0.16716623306274414
0.1683042049407959
0.16742229461669922
0.1697831153869629
0.1694803237915039
0.16895723342895508
0.16666364669799805
0.171067476272583
0.1671745777130127
0.16805720329284668
0.16571378707885742
0.17280220985412598
0.16786456108093262
0.16907453536987305
0.16616344451904297
0.16919946670532227
0.1676168441772461
0.16505861282348633
0.16489076614379883
0.16822099685668945
0.1672382354736328
0.16526865959

# 样例总结与扩展
以上就是这个样例的全部内容了，值得关注的是在模型推理后有一步非常重要的后处理，就是非极大值抑制，即NMS，由于模型的原始预测结果会有非常多无效或重叠的预测框，我们需要通过NMS来进行过滤。再者，模型预测框的表示往往是一个标准化的结果，比如0到1之间，我们需要通过坐标转换将结果与原始图片的宽高对应上。