[Question] bert直接接bi-lstm+crf之后预测很慢，一条预测要耗时260ms,请问能优化速度吗 #78

wayneowen7 · 2019-04-25T10:10:38Z

titan xp的GPU，应该能排除机器问题，，，想问问有没有解决办法

BrikerMan · 2019-04-25T10:35:25Z

BERT 速度就这么慢，暂时没有办法优化。参考：http://eliyar.biz/nlp_chinese_bert_ner/

wayneowen7 · 2019-04-25T11:37:05Z

谢谢owener,我之前看过这个博客，但是因为我以为这个是CPU跑起来的预测模型，MacBook Pro 13, 2 GHz Intel Core i5, 8G RAM，所以我感觉是不是GPU有提升空间，并且我在别的博客里面看到有10ms的预测速度，但是我个人不是很相信（受限于个人自身知识面），但不知道您有没有了解过这个10ms，参考https://github.com/macanv/BERT-BiLSTM-CRF-NER/issues/40

BrikerMan · 2019-04-25T11:41:24Z

GPU 上可能会比较快，我这两天找时间测试一下。还有我们也在规划从 keras 转到 tf.keras #77 ，到时候保存模型，再用 serving 方式去预测，应该还能有所提升。

wayneowen7 · 2019-04-25T11:52:27Z

太好了，谢谢您的回复:smiley:持续关注

Rainman242 · 2019-05-05T03:56:26Z

我也是predict特别慢啊，更加夸张的是1个sample需要1.3秒。（我的sequence length = 512）
其实我fit一个batch=32也只要4秒左右。
请问作者大大，有没有batch predict之类的方法可以调用？

BrikerMan · 2019-05-05T03:59:00Z

@Rainman242 predit 方法可以传数组，就会 batch predict。慢目前没有很好地解决办法。

alexwwang · 2019-05-05T04:09:05Z

Last week I tested a classifier with Bert as the embedding layer. The prediction time was also very slow. I assumed that was because the calculating work is heavy during the Bert section for CPUs. I will be appreciated if anyone could test relative task with Bert on GPUs and share his/her findings.

…

On Sun, 5 May 2019 at 11:59, Eliyar Eziz ***@***.***> wrote: @Rainman242 <https://github.com/Rainman242> predit 方法可以传数组，就会 batch predict。慢目前没有很好地解决办法。 — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub <#78 (comment)>, or mute the thread <https://github.com/notifications/unsubscribe-auth/AAGRFKUFQ33U6LBEJFBJGPDPTZLQJANCNFSM4HILVHMQ> .

BrikerMan · 2019-06-27T14:32:34Z

可以在 tf.keras 版本尝试看看，但是 crf 本身也会比较慢，如果对性能要求比较高，可以尝试不用 crf 层。

SunYanCN · 2019-06-29T12:19:44Z

@alexwwang , @wayneowen7 , @Rainman242 ,https://github.com/SunYanCN/BERT-chinese-text-classification-and-deployment, This project may be helpful

BrikerMan · 2019-07-12T05:00:19Z

@wayneowen7 @Rainman242 试试 tf.keras 分支的 tf-serving 部署。

BiLSTM_CRF_Model, 100 sequence_length 测试结果如下：

1080Ti-GPU 50ms
CPU 200ms

qiuwei · 2019-12-04T03:15:58Z

谢谢owener,我之前看过这个博客，但是因为我以为这个是CPU跑起来的预测模型，MacBook Pro 13, 2 GHz Intel Core i5, 8G RAM，所以我感觉是不是GPU有提升空间，并且我在别的博客里面看到有10ms的预测速度，但是我个人不是很相信（受限于个人自身知识面），但不知道您有没有了解过这个10ms，参考https://github.com/macanv/BERT-BiLSTM-CRF-NER/issues/40

我们能在cpu上优化到30ms，不过做了大量工作。

BrikerMan · 2019-12-04T04:50:01Z

@qiuwei 可以分享一下优化经验么？

JianWenJun · 2019-12-26T02:43:04Z

@qiuwei 望大佬分享一下经验~

wayneowen7 added the question Further information is requested label Apr 25, 2019

wayneowen7 assigned BrikerMan Apr 25, 2019

BrikerMan closed this as completed Jul 12, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Question] bert直接接bi-lstm+crf之后预测很慢，一条预测要耗时260ms,请问能优化速度吗 #78

[Question] bert直接接bi-lstm+crf之后预测很慢，一条预测要耗时260ms,请问能优化速度吗 #78

wayneowen7 commented Apr 25, 2019

BrikerMan commented Apr 25, 2019

wayneowen7 commented Apr 25, 2019

BrikerMan commented Apr 25, 2019

wayneowen7 commented Apr 25, 2019

Rainman242 commented May 5, 2019

BrikerMan commented May 5, 2019

alexwwang commented May 5, 2019 via email

BrikerMan commented Jun 27, 2019

SunYanCN commented Jun 29, 2019 •

edited

BrikerMan commented Jul 12, 2019

qiuwei commented Dec 4, 2019

BrikerMan commented Dec 4, 2019

JianWenJun commented Dec 26, 2019

[Question] bert直接接bi-lstm+crf之后预测很慢，一条预测要耗时260ms,请问能优化速度吗 #78

[Question] bert直接接bi-lstm+crf之后预测很慢，一条预测要耗时260ms,请问能优化速度吗 #78

Comments

wayneowen7 commented Apr 25, 2019

BrikerMan commented Apr 25, 2019

wayneowen7 commented Apr 25, 2019

BrikerMan commented Apr 25, 2019

wayneowen7 commented Apr 25, 2019

Rainman242 commented May 5, 2019

BrikerMan commented May 5, 2019

alexwwang commented May 5, 2019 via email

BrikerMan commented Jun 27, 2019

SunYanCN commented Jun 29, 2019 • edited

BrikerMan commented Jul 12, 2019

qiuwei commented Dec 4, 2019

BrikerMan commented Dec 4, 2019

JianWenJun commented Dec 26, 2019

SunYanCN commented Jun 29, 2019 •

edited