We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请确认下列注意事项:
当前最新版本号是: 我使用的版本是:hanlp-1.3.2-portable.jar 、 hanlp-lucene-plugin-1.1.2.jar
一个web容器中有两个webapp,一个是webappA,另一个是solr,solr使用hanlp为中文分词器,并配置了用户词典(即customDictionaryPath属性),webappA有一个在线编辑词典的功能,希望编辑完字典,solr能够看到效果而不需要重启tomcat容器。
在hanlp solr插件中的HanLPTokenizerFactory开启一个守护线程,每隔一段时间去检查字典的校检码,如果发生变化就删掉.bin缓存文件,并重新加载字典。
1、我目前在CustomDictionary添加了如下一个静态方法,但是这样会把所有的自定义词典重新加载一遍,有没有只加载某个文件的方法呢
public static void reloadDic(){ trie = null; dat = new DoubleArrayTrie<CoreDictionary.Attribute>(); loadMainDictionary(path[0]); }
2、执行CustomDictionary.insert()方法后,为什么新词典已经产生效果,但dat.size()没有发生变化
The text was updated successfully, but these errors were encountered:
Sorry, something went wrong.
感谢您对HanLP1.x的支持,我一直为没有时间回复所有issue感到抱歉,希望您提的问题已经解决。或者,您可以从《自然语言处理入门》中找到答案。
时光飞逝,HanLP1.x感谢您的一路相伴。我于东部标准时间2019年12月31日发布了HanLP1.x在上一个十年最后一个版本,代号为最后的武士。此后1.x分支将提供稳定性维护,但不是未来开发的焦点。
值此2020新年之际,我很高兴地宣布,HanLP2.0发布了。HanLP2.0的愿景是下一个十年的前沿NLP技术。为此,HanLP2.0采用TensorFlow2.0实现了最前沿的深度学习模型,通过精心设计的框架支撑下游NLP任务,在海量语料库上取得了最前沿的准确率。作为第一个alpha版本,HanLP 2.0.0a0支持分词、词性标注、命名实体识别、依存句法分析、语义依存分析以及文本分类。而且,这些功能并不仅限中文,而是面向全人类语种设计。HanLP2.0提供许多预训练模型,而终端用户仅需两行代码即可部署,深度学习落地不再困难。更多详情,欢迎观看HanLP2.0的介绍视频,或参与论坛讨论。
展望未来,HanLP2.0将集成1.x时代继承下来的高效率务实风范,同时冲刺前沿研究,做工业界和学术界的两栖战舰,请诸君继续多多指教,谢谢。
No branches or pull requests
注意事项
请确认下列注意事项:
版本号
当前最新版本号是:
我使用的版本是:hanlp-1.3.2-portable.jar 、 hanlp-lucene-plugin-1.1.2.jar
实际场景
一个web容器中有两个webapp,一个是webappA,另一个是solr,solr使用hanlp为中文分词器,并配置了用户词典(即customDictionaryPath属性),webappA有一个在线编辑词典的功能,希望编辑完字典,solr能够看到效果而不需要重启tomcat容器。
解决思路
在hanlp solr插件中的HanLPTokenizerFactory开启一个守护线程,每隔一段时间去检查字典的校检码,如果发生变化就删掉.bin缓存文件,并重新加载字典。
我的问题
1、我目前在CustomDictionary添加了如下一个静态方法,但是这样会把所有的自定义词典重新加载一遍,有没有只加载某个文件的方法呢
2、执行CustomDictionary.insert()方法后,为什么新词典已经产生效果,但dat.size()没有发生变化
The text was updated successfully, but these errors were encountered: