Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

注意力模块的训练问题 #44

Open
sakurasakura1996 opened this issue Oct 14, 2020 · 3 comments
Open

注意力模块的训练问题 #44

sakurasakura1996 opened this issue Oct 14, 2020 · 3 comments
Labels
enhancement New feature or request

Comments

@sakurasakura1996
Copy link

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

@argusswift
Copy link
Owner

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数,训练其他参数,然后在finetune整个模型。我不清楚你数据集学习的难度,不过你的想法可以试一下。

@argusswift argusswift added the enhancement New feature or request label Nov 2, 2020
@joe660
Copy link

joe660 commented Jan 1, 2021

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数,训练其他参数,然后在finetune整个模型。我不清楚你数据集学习的难度,不过你的想法可以试一下。

作者您好 可以问您个吗? 为什么我使用了注意力机制 反而比原模型稍微降低了一些,不知道怎么回事。需要注意什么吗?谢谢

@jcluo1994
Copy link

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

如果你加入了注意力机制,原预训练权重就不能再用了。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

4 participants