# 简单使用

## 推理

使用 YOLOv5和 [PyTorch Hub](https://github.com/ultralytics/yolov5/issues/36) 的推理。从[最新的 YOLOv5 版本](https://github.com/ultralytics/yolov5/releases)自动下载模型。

这个示例加载一个预训练的 YOLOv5s 模型，并传递一个用于推断的图像。YOLOv5 接受 **URL**, **Filename**, **PIL**, **OpenCV**, **Numpy** 和 **PyTorch** 输入，并返回检测 torch、pandas 和 JSON 输出格式。有关详细信息，请参见 [YOLOv5 PyTorch Hub 教程](https://github.com/ultralytics/yolov5/issues/36)。

In [2]:
import torch

# 载入模型
model = torch.hub.load('ultralytics/yolov5', 'yolov5s')  # or yolov5m, yolov5x, custom

Using cache found in models/ultralytics_yolov5_master
YOLOv5  517e745 torch 1.10.0 CUDA:0 (NVIDIA GeForce GTX 1080 Ti, 11264MiB)



Downloading https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt to yolov5s.pt...


  0%|          | 0.00/14.0M [00:00<?, ?B/s]




Fusing layers... 
Model Summary: 213 layers, 7225885 parameters, 0 gradients
Adding AutoShape... 


In [3]:
# 图片来源 https://ultralytics.com/images/zidane.jpg
img = 'images/zidane.jpg'  # or file, PIL, OpenCV, numpy, multiple

# 推理本地图片
results = model(img)

# 结果
results.print()  # or .show(), .save(), .crop(), .pandas(), etc.

image 1/1: 720x1280 2 persons, 1 tie
Speed: 41.0ms pre-process, 41.5ms inference, 18.0ms NMS per image at shape (1, 3, 384, 640)


In [4]:
results.xyxy[0] # 张量结果

tensor([[7.51908e+02, 4.55721e+01, 1.14855e+03, 7.16218e+02, 8.75046e-01, 0.00000e+00],
        [1.00013e+02, 2.01290e+02, 1.00205e+03, 7.18763e+02, 5.79518e-01, 0.00000e+00],
        [4.38405e+02, 4.21902e+02, 5.09925e+02, 7.20000e+02, 5.22344e-01, 2.70000e+01]], device='cuda:0')

In [5]:
results.pandas().xyxy[0] # pandas 结果

Unnamed: 0,xmin,ymin,xmax,ymax,confidence,class,name
0,751.908325,45.572083,1148.552246,716.218262,0.875046,0,person
1,100.012848,201.289825,1002.052246,718.762817,0.579518,0,person
2,438.40506,421.902466,509.924774,720.0,0.522344,27,tie


### 批量图片

In [11]:
_dir = 'images/'
imgs = [_dir + f for f in ('zidane.jpg', 'bus.jpg')]

# 推理
results = model(imgs)
results.print()  # or .show(), .save()

image 1/2: 720x1280 2 persons, 1 tie
image 2/2: 1080x810 4 persons, 1 bus
Speed: 38.5ms pre-process, 21.0ms inference, 4.0ms NMS per image at shape (2, 3, 640, 640)


### 使用 `detect.py` 推理

`detect.py` 对各种源运行推断，自动从[最新的 YOLOv5 版本](https://github.com/ultralytics/yolov5/releases)下载模型，并将结果保存到 `runs/detect`。

```shell
python detect.py --source 0  # webcam
                            file.jpg  # image 
                            file.mp4  # video
                            path/  # directory
                            path/*.jpg  # glob
                            'https://youtu.be/NUsoVlDFqZg'  # YouTube video
                            'rtsp://example.com/media.mp4'  # RTSP, RTMP, HTTP stream
```

## 训练

运行下面的命令在 COCO 数据集上重现结果（数据集第一次使用时自动下载）。在单个 V100 上，YOLOv5s/m/l/x 的训练时间是2/4/6/8天（多 gpu 更快）。使用 GPU 允许的最大批处理大小（16GB 设备的批处理大小）。

```shell
python train.py --data coco.yaml --cfg yolov5s.yaml --weights '' --batch-size 64
                                         yolov5m                                40
                                         yolov5l                                24
                                         yolov5x                                16
```

![](./images/coco-yolov5.png)