-
Notifications
You must be signed in to change notification settings - Fork 7.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
FasterRCNN 训练错误 #111
Comments
你这是GPU环境没有配置好,应该是cuda的问题 |
我用的是系里服务器,cuda是conda装的匹配pytorch的版本,一般会有什么问题呢? |
GPU,GPU驱动、CUDA以及Pytorch版本都是有对应关系的,你自己可以在Nvidia官网查下,看下你的GPU的驱动是否支持你下载的CUDA版本 |
其他pytorch的实验是ok的,感觉是代码的问题?
… On Dec 26, 2020, at 4:04 PM, WuZhe ***@***.***> wrote:
GPU,GPU驱动、CUDA以及Pytorch版本都是有对应关系的,你自己可以在Nvidia官网查下,看下你的GPU的驱动是否支持你下载的CUDA版本
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub <#111 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AKEFVEPGF47TY55QWHBZ3BTSWWKJRANCNFSM4VI7SRZA>.
|
但我测试是没问题的哦,你用我视频中提供的pascal voc数据集跑过吗? |
您好,我改进了网络结构,但是不能用官方预训练的权重了,我是要自己做一个预权重吗?还是直接不管直接跑数据集呢? |
我用过pascal是没问题的,所以我想强加一下您,这个问题是因为代码里哪一部分导致的,我去改一改。
… On Dec 26, 2020, at 4:15 PM, WuZhe ***@***.***> wrote:
但我测试是没问题的哦,你用我视频中提供的pascal voc数据集跑过吗?
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub <#111 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AKEFVEIMDPXSI2XQ2VHU7SLSWWLQJANCNFSM4VI7SRZA>.
|
请问一下 各位大神,我改进了up主yolov3_spp的网络架构了, 所以不能用原来的预训练权重了, 我只能直接训练, 但是这样训练收敛很慢,且map不高,请问如何做一个自己的预训练权重呢?(网上查的资料是直接去imagenet 自己训练)谢谢大家!
…------------------ 原始邮件 ------------------
发件人: "Zhao Wang"<notifications@github.com>;
发送时间: 2020年12月26日(星期六) 下午3:57
收件人: "WZMIAOMIAO/deep-learning-for-image-processing"<deep-learning-for-image-processing@noreply.github.com>;
抄送: "Subscribed"<subscribed@noreply.github.com>;
主题: Re: [WZMIAOMIAO/deep-learning-for-image-processing] FasterRCNN 训练错误 (#111)
你这是GPU环境没有配置好,应该是cuda的问题
我用的是系里服务器,cuda是conda装的匹配pytorch的版本,一般会有什么问题呢?
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
@jacklee-scau 如果改了网络结构,还要看你改了哪里,如果你改了backbone部分,那一般是要在imagenet上预训练一下,然后最好在coco数据集上进行预训练,最后在自己的数据集上做迁移学习。如果你数据量很大可以尝试直接在自己数据集上训练。但一般而言基于在coco上的预训练权重进行迁移学习效果会更好。 |
@Kyfafyd 那应该是你数据集的问题了,是否有漏标或者空的标注文件。还有标注文件是否符合pascal voc格式。 |
我现在是在up主你的yolov3_spp上增加了两个spp层 (原则上没有改动backbone部分即darknet53)所以我不需要去imagenet上预训练对吗?但是我的数据集很小,我需要基于coco上的预训练对吗?(由于coco数据集太大,我用voc数据集预训练)但是我预训练之后的权重明显不对,一应用在自己的小数据集上就报错,报错为size不一样,或者类别不一样。请问在coco或voc上做预训练的时候还需要官方原来的权重吗(yolov3-spp-ultralytics-512.pt)?刚接触这个,可能表达不好。请见谅! |
1)那你可以只载入darknet53的部分权重,数据集小的话,如果想达到更好的效果,在coco数据集上预训练是很有帮助的。 |
我改了网络(这次仅仅在最后一个预测特征层的前面加了两个卷积层)加载官方模型预训练的时候就报错了,因为模型的网络参数接受到我改动的部分 提示建值不对,不知道该如何修改,报错信息如下:
The above exception was the direct cause of the following exception: Traceback (most recent call last): |
由于这个问题比较涉及细节, up主我可以添加一下您的联系方式吗(931118435@qq.com),把详细的截图发您看一下,谢谢您! |
System information
Describe the current behavior
您好,用faster_rcnn训练自己的数据集,一共六种物体,create model设置的num_classes=7,但是还是出现了这个错误。其他没有改过,求教该怎么解决呀?
Error info / logs
The text was updated successfully, but these errors were encountered: