注意力模块的训练问题 #44

sakurasakura1996 · 2020-10-14T03:25:48Z

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

argusswift · 2020-10-14T06:18:52Z

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数，训练其他参数，然后在finetune整个模型。我不清楚你数据集学习的难度，不过你的想法可以试一下。

joe660 · 2021-01-01T08:08:10Z

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数，训练其他参数，然后在finetune整个模型。我不清楚你数据集学习的难度，不过你的想法可以试一下。

作者您好可以问您个吗？为什么我使用了注意力机制反而比原模型稍微降低了一些，不知道怎么回事。需要注意什么吗？谢谢

jcluo1994 · 2021-04-07T15:03:08Z

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

如果你加入了注意力机制，原预训练权重就不能再用了。

argusswift added the enhancement New feature or request label Nov 2, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

注意力模块的训练问题 #44

注意力模块的训练问题 #44

sakurasakura1996 commented Oct 14, 2020

argusswift commented Oct 14, 2020

joe660 commented Jan 1, 2021

jcluo1994 commented Apr 7, 2021

注意力模块的训练问题 #44

注意力模块的训练问题 #44

Comments

sakurasakura1996 commented Oct 14, 2020

argusswift commented Oct 14, 2020

joe660 commented Jan 1, 2021

jcluo1994 commented Apr 7, 2021