nan in my custom dataset training #239

Mason1992-Git · 2022-03-14T02:30:40Z

训练时全是nan
训练集标签格式

train_batch0

train_batch1

train_batch2

结果文件hyp.yaml
lr0: 0.001
lrf: 0.2
momentum: 0.937
weight_decay: 0.0005
warmup_epochs: 3.0
warmup_momentum: 0.8
warmup_bias_lr: 0.1
box: 0.05
cls: 0.5
cls_pw: 1.0
theta: 0.5
theta_pw: 1.0
obj: 1.0
obj_pw: 1.0
iou_t: 0.2
anchor_t: 4.0
fl_gamma: 0.0
hsv_h: 0.015
hsv_s: 0.7
hsv_v: 0.4
degrees: 180.0
translate: 0.1
scale: 0.5
shear: 0.0
perspective: 0.0
flipud: 0.5
fliplr: 0.5
mosaic: 0.95
mixup: 0.1
copy_paste: 0.0
cls_theta: 180
csl_radius: 2.0
结果文件opt.yaml
weights: weights\yolov5m.pt
cfg: ''
data: data\yolov5obb_demo.yaml
hyp: data\hyps\obb\hyp.finetune_dota.yaml
epochs: 10
batch_size: 1
imgsz: 1024
rect: false
resume: false
nosave: false
noval: false
noautoanchor: false
evolve: null
bucket: ''
cache: null
image_weights: false
device: '0'
multi_scale: false
single_cls: false
adam: false
sync_bn: false
workers: 8
project: runs\train
name: exp
exist_ok: false
quad: false
linear_lr: false
label_smoothing: 0.0
patience: 100
freeze:

0
save_period: -1
local_rank: -1
entity: null
upload_dataset: false
bbox_interval: -1
artifact_alias: latest
save_dir: runs\train\exp

hukaixuan19970627 · 2022-03-15T07:14:40Z

把上述标记的文件整理一下截图发过来，另外再详细介绍一下你使用的数据集

Mason1992-Git · 2022-03-15T07:14:59Z

您好，您的来信已收到，我会尽快阅读并回信。谢谢。袁磊

Mason1992-Git · 2022-03-15T07:47:15Z

把上述标记的文件整理一下截图发过来，另外再详细介绍一下你使用的数据集
hyp.yaml截图

opt.yaml截图

results截图

train_batch0截图

train_batch1截图

train_batch2截图

val_batch0_labels截图

val_batch0_pred截图

没有生成labels.jpg

我的数据集：

images:

txt:

数据集一共50张图片，仅为了测试代码能否在其他场景跑通，所以只选择了50张图片。

hukaixuan19970627 · 2022-03-15T08:33:32Z

度盘提供了DOTAv1.5的训练权重以及所有的训练参数文件，所以除非你知道每个参数的具体意义和影响否则不要自己更改参数
格式文件的类别名是字符串
训练后缺少文件说明训练过程中有问题，检查一下

wjmicheal · 2022-03-24T08:19:29Z

使用了demo中的数据集，P0032，分割也没有问题，但是训练的时候也是一样全是nan，不知道是什么原因，怀疑是不是在编译nms_rotated时出了问题。在编译nms_rotated时，在poly_nms_cuda.cu文件中出现错误提示：identificer 'eps' is undefined in device code，由于变量'eps'定义在文件中定义的是常量，因此将使用eps中的地方直接替换为常量，编译通过。

wjmicheal · 2022-03-24T08:21:52Z

追踪train.py 代码第324行，将pred 打印出来，添加 print(pred)发现 pred全是nan

hukaixuan19970627 · 2022-03-29T08:03:52Z

#224

hukaixuan19970627 · 2022-04-02T12:37:23Z

如果你是windows+CUDA11的话可以参考下这个issue：ultralytics/yolov5#5815

Mason1992-Git · 2022-04-09T01:20:29Z

如果你是windows+CUDA11的话可以参考下这个issue：ultralytics/yolov5#5815

感谢作者！这个问题已解决，是显卡和pytorch版本问题。换到30系列可以训练

LUO77123 · 2022-05-13T07:37:22Z

Mason1992-Git · 2022-05-13T07:37:47Z

您好，您的来信已收到，我会尽快阅读并回信。谢谢。袁磊

LUO77123 · 2022-05-13T07:39:40Z

把上述标记的文件整理一下截图发过来，另外再详细介绍一下你使用的数据集

数据集就是DATA，分割1024*1024，gap=512

Mason1992-Git · 2022-10-11T08:40:04Z

您好，您的来信已收到，我会尽快阅读并回信。谢谢。袁磊

hukaixuan19970627 changed the title ~~训练一直全是nan~~ nan in my custom dataset training Mar 15, 2022

Mason1992-Git closed this as completed Apr 9, 2022

hukaixuan19970627 mentioned this issue May 13, 2022

nan in training #319

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

nan in my custom dataset training #239

nan in my custom dataset training #239

Mason1992-Git commented Mar 14, 2022

hukaixuan19970627 commented Mar 15, 2022

Mason1992-Git commented Mar 15, 2022 via email

Mason1992-Git commented Mar 15, 2022 •

edited

hukaixuan19970627 commented Mar 15, 2022

wjmicheal commented Mar 24, 2022

wjmicheal commented Mar 24, 2022

hukaixuan19970627 commented Mar 29, 2022

hukaixuan19970627 commented Apr 2, 2022

Mason1992-Git commented Apr 9, 2022

LUO77123 commented May 13, 2022

Mason1992-Git commented May 13, 2022 via email

LUO77123 commented May 13, 2022

Mason1992-Git commented Oct 11, 2022 via email

nan in my custom dataset training #239

nan in my custom dataset training #239

Comments

Mason1992-Git commented Mar 14, 2022

hukaixuan19970627 commented Mar 15, 2022

Mason1992-Git commented Mar 15, 2022 via email

Mason1992-Git commented Mar 15, 2022 • edited

hukaixuan19970627 commented Mar 15, 2022

wjmicheal commented Mar 24, 2022

wjmicheal commented Mar 24, 2022

hukaixuan19970627 commented Mar 29, 2022

hukaixuan19970627 commented Apr 2, 2022

Mason1992-Git commented Apr 9, 2022

LUO77123 commented May 13, 2022

Mason1992-Git commented May 13, 2022 via email

LUO77123 commented May 13, 2022

Mason1992-Git commented Oct 11, 2022 via email

Mason1992-Git commented Mar 15, 2022 •

edited