Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于执行效率 #16

Closed
sinojyj opened this issue Nov 25, 2016 · 8 comments
Closed

关于执行效率 #16

sinojyj opened this issue Nov 25, 2016 · 8 comments

Comments

@sinojyj
Copy link
Contributor

sinojyj commented Nov 25, 2016

我在本地调试的时候,20字的句子切词需要30秒以上,请问会是哪些因素影响速度?

@liupan182
Copy link

是的,这个分词好慢,不知道是不是作者写的有问题

@fukuball
Copy link
Owner

fukuball commented Dec 15, 2016

@sinojyj @liupan182 我沒有遇到這個問題呢,剛剛執行了十個句子,包含“我在本地调试的时候,20字的句子切词需要30秒以上,请问会是哪些因素影响速度?”這個句字,大概 5 秒內完成,不過目前的效能的確不比 python 版本。若有可以改善的地方,也請幫忙改善,開源的目的就是在此~

@liupan182
Copy link

结巴分词挺有名的,感谢作者的付出和努力,但是很多分词程序分词几百字只需要不到一秒,这个程序我第一次使用以及看你们线上的demo,速度有点难以接受,线上的我测试大概七秒,我下载后测试也差不多七八秒,觉得稍微慢了点

@fukuball
Copy link
Owner

@liupan182 也只能持續改進囉~

@sinojyj
Copy link
Contributor Author

sinojyj commented Dec 23, 2016 via email

@fukuball
Copy link
Owner

@sinojyj 緩存是一個方向,我在想可以將建構及詞頻的運算結果都緩存,然後客製詞典另外做運算,讓 jieba init 時先讀取緩存結果,大概會快一些吧~ 有空再來試試。

@sinojyj
Copy link
Contributor Author

sinojyj commented Dec 23, 2016 via email

@fukuball
Copy link
Owner

@sinojyj 感覺你已經下了很多功夫,如果你有什麼成果請發一下 pull request 吧!

@fukuball fukuball closed this as completed May 6, 2017
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants