Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

推理性能 #43

Open
lvxiaodong6688 opened this issue Apr 17, 2024 · 10 comments
Open

推理性能 #43

lvxiaodong6688 opened this issue Apr 17, 2024 · 10 comments

Comments

@lvxiaodong6688
Copy link

lvxiaodong6688 commented Apr 17, 2024

您好!
我用 Nvidia T4 (性能接近2080Ti) 做了一个推理测试,测试程序是 sample代码app.py, 图片大小2560*1440,scale为2倍模型,处理性能大概是9s多,是不是哪里处理的有问题?或者如何优化?

谢谢!

@sunny2109
Copy link
Owner

您好 app.py这个脚本是面向真实场景下的超分,使用的模型是SAFMN-L。
如果您的使用场景侧重运行速度的话,您可以用我们在NTIRE24 ESR上提出的SAFMN++模型,它的速度相较于之前的版本有显著的提升。

@lvxiaodong6688
Copy link
Author

好的,谢谢您!我测试下看看速度和效果怎么样

@sunny2109
Copy link
Owner

好的,谢谢您!我测试下看看速度和效果怎么样

小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。

@lvxiaodong6688
Copy link
Author

image
您好,运行这个模型的demo程序报错,请问怎么回事,您那边遇到过么?我分别在2080和M40两种卡上测试都报相同的问题
Unsupported operator aten::div encountered 12 time(s)
Unsupported operator aten::adaptive_max_pool2d encountered 6 time(s)
Unsupported operator aten::gelu encountered 18 time(s)
Unsupported operator aten::mul encountered 6 time(s)
Unsupported operator aten::add encountered 7 time(s)

@lvxiaodong6688
Copy link
Author

好的,谢谢您!我测试下看看速度和效果怎么样

小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。

抱歉我很愚钝,没找到训练的参考代码,您方便给个链接么

@sunny2109
Copy link
Owner

image 您好,运行这个模型的demo程序报错,请问怎么回事,您那边遇到过么?我分别在2080和M40两种卡上测试都报相同的问题 Unsupported operator aten::div encountered 12 time(s) Unsupported operator aten::adaptive_max_pool2d encountered 6 time(s) Unsupported operator aten::gelu encountered 18 time(s) Unsupported operator aten::mul encountered 6 time(s) Unsupported operator aten::add encountered 7 time(s)

这不是错误,只是warning。这是因为get_model_activation()这里支持的操作不全,直接用fvcore测试模型的复杂度就行。

@sunny2109
Copy link
Owner

好的,谢谢您!我测试下看看速度和效果怎么样

小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。

抱歉我很愚钝,没找到训练的参考代码,您方便给个链接么

训练脚本请参考主页的Training部分,修改对应的配置文件就行。

@lvxiaodong6688
Copy link
Author

lvxiaodong6688 commented Apr 18, 2024

好的,谢谢您!我测试下看看速度和效果怎么样

小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。

抱歉我很愚钝,没找到训练的参考代码,您方便给个链接么

训练脚本请参考主页的Training部分,修改对应的配置文件就行。

哦哦,看到了,抱歉只翻代码来着,不好意思,多谢啦

@lvxiaodong6688
Copy link
Author

image 您好,运行这个模型的demo程序报错,请问怎么回事,您那边遇到过么?我分别在2080和M40两种卡上测试都报相同的问题 Unsupported operator aten::div encountered 12 time(s) Unsupported operator aten::adaptive_max_pool2d encountered 6 time(s) Unsupported operator aten::gelu encountered 18 time(s) Unsupported operator aten::mul encountered 6 time(s) Unsupported operator aten::add encountered 7 time(s)

这不是错误,只是warning。这是因为get_model_activation()这里支持的操作不全,直接用fvcore测试模型的复杂度就行。

好的好的,谢谢!

@lvxiaodong6688
Copy link
Author

在请教下,23这个小模型,重新训练的话用多少组数据训练比较合适?另外yam文件您方便给一下吗?有些参数不确定改的对不对,谢谢!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants