-
Notifications
You must be signed in to change notification settings - Fork 6.7k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
最新稳定版本测试问题 #36
Comments
@yukaizhao , easy_install被切开了,是因为我没有把 ‘_’ 纳入可参与成词的字符。英文半角的空格的确被yield出来了,过滤一下就好了。“好用的”被切成单字,是因为“好”和“用“的单字概率较大,除非你在自定义词典中调高”好用“的概率。 |
效果: easy_install python |
谢谢回复。 _下划线不应该作为单词分隔的依据希望在新的稳定版本中修复此问题 |
另外半角空格被yield出来其实是完全没有意义的,建议在jieba中处理,而不是让每个使用jieba的用户都去过滤这个空格 |
@yukaizhao , 空格已经在昨天的提交中过滤掉了。 |
@yukaizhao ,这个不是算法的问题,主要是词典中的词频有些并不准确。 |
用户自定义词典中的内容如下:
如下测试代码:
以上代码执行的结果:
分词的结果很不理想, 有如下问题:
我测试用的是最新的稳定版本0.26.1.
感谢作者的开源精神
The text was updated successfully, but these errors were encountered: