Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

线上libpaddle_capi_shared.so耗时问题 #4708

Closed
Jarlonyan opened this issue Oct 11, 2017 · 5 comments
Closed

线上libpaddle_capi_shared.so耗时问题 #4708

Jarlonyan opened this issue Oct 11, 2017 · 5 comments
Assignees
Labels
User 用于标记用户问题

Comments

@Jarlonyan
Copy link

Jarlonyan commented Oct 11, 2017

我们用的libpaddle_capi_shared.so有3个版本, [下载链接](https://paddleci.ngrok.io/overview.html)

  1. 版本1,支持avx, libpaddle_capi_shared.so有248M。(8月份,paddle的同学提供的下载链接得到的)
  2. 版本2,支持avx, libpaddle_capi_shared.so只有5.8M, 同时有其他的so库。(9月29日paddle同学编译的)
  3. 版本3,不支持avx, libpaddle_capi_shared.so只有5.8M, 同时有其他的so库。(9月29日paddle同学编译的)

现在的问题是耗时问题,版本1平均耗时120ms左右。 版本2测试的耗时是400多ms。

是不是编译版本2、3的时候没有加一些编译优化?辛苦paddle的同学了。

@Jarlonyan
Copy link
Author

Jarlonyan commented Oct 11, 2017

@gongweibao 同学加上了CMAKE_BUILD_TYPE=Release参数编译,再测试版本2、3的耗时情况是:
版本2平均耗时258ms
版本3平均耗时283ms

@kuke kuke added the User 用于标记用户问题 label Oct 11, 2017
@zds9204
Copy link

zds9204 commented Oct 11, 2017

同遇到这个问题,请教paddle组的同学!我最近在链接 https://paddleci.ngrok.io/overview.html 上下到的libpaddle_capi_shared.so(6M左右,但是还有libmklml_intel.so等其它依赖),与内网上找到的的一份文件(http://icode.baidu.com/repo/baidu%2Fthird-party%2Fpaddle-capi/files/master/tree/ , 136M,只有单独一个文件)相比,模型耗时增加了10倍。

@gongweibao
Copy link
Contributor

gongweibao commented Oct 12, 2017

基本上已经找到问题了,

  • 链接的mkl不能链接开源版本,而要链接公司买的商业版本。

@luotao1
Copy link
Contributor

luotao1 commented Oct 12, 2017

请问为什么不能链接mkl开源版本,公司买的商业版本是哪个版呢?

@gongweibao
Copy link
Contributor

gongweibao commented Oct 15, 2017

mklml sometimes is much slower than mkl.
I create a ISSUE about it #4813.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
User 用于标记用户问题
Projects
None yet
Development

No branches or pull requests

7 participants