@liu946 liu946 released this Jun 15, 2017 · 46 commits to master since this release

Assets 4

语言技术平台3.4.0版 发布

  • [增加] 新的基于Bi-LSTM的SRL模型
  • [增加] 增加了SRL的多线程命令行程序srl_cmdline
  • [修改] SRL相关的编程接口已经改变,修复了之前内存泄露的相关问题。

@endyul endyul released this Mar 31, 2016 · 120 commits to master since this release

Assets 3

语言技术平台 3.3.1 版 发布

  • [修复] 修复了 3.3.0 版本模型加载的 bug
  • [修复] 修复了 gcc5、mingw、VS2015 下的编译问题
  • [增加] 提供 Windows 下的ltp_testxxx_cmdline二进制下载

@endyul endyul released this Jan 24, 2016 · 133 commits to master since this release

Assets 3

语言技术平台 3.3.1-beta 版 发布

  • [修复] 修复了 3.3.0 版本模型加载的 bug
  • [增加] 提供 Windows 下的ltp_testxxx_cmdline二进制下载,无需再手工编译

MD5 (ltp-win-3.3.1-beta.zip) = da59e5c2981b9380869e5ba626032028

@Oneplus Oneplus released this May 24, 2015 · 187 commits to master since this release

Assets 2
  • [增加] 词性标注模型加入微博数据,使得在开放域上的词性标注性能更好(+3.3 precision)
  • [增加] 依存句法分析模型加入微博数据,使得在开放域上的句法分析性能更好(+3 UAS)
  • [增加] 依存句法分析算法切换到transition-based neural network parser,速度从250 tokens/s提升到8000 tokens/s。同时通过加入聚类特征以及优化训练算法,(在新闻领域)准确率也得到小幅提升(+0.2 UAS)
  • [增加] ltp_test默认支持多线程,线程数可配置。
  • [增加] 新加入子模块命令行程序,cws_cmdlinepos_cmdlinepar_cmdlinener_cmdline,使用户可以很容易替换中间模块,从而实现语言分析的组合。
  • [修改] 优化了训练套件的交互方式
  • [增加] 添加模型验证,单元测试模块。

@Oneplus Oneplus released this Nov 17, 2014 · 246 commits to master since this release

Assets 2
  • [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
  • [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的match_results类存在竞争问题,这一修改修复了multi_cws_cmdline随机出错的问题。
  • [修改] 使自动化测试脚本支持Windows运行以及多线程测试
  • [修改] 将原examples文件夹下的示例文件转移到test文件夹下并纳入语言技术平台的编译链
  • [测试] 新版语言技术平台通过cygwin编译测试
  • [测试] 多线程程序multi_ltp_testmulti_cws_cmdline以及multi_pos_cmdline在Windows通过测试

@Oneplus Oneplus released this Oct 11, 2014 · 314 commits to master since this release

Assets 2
  • [修改] 修改utils/template.hpp的实现,提高40%的速度性能
  • [修改] 修改_WIN32宏在mingw下的歧义,使得LTP在Codeblocks - Mingw Makefile模式下正常编译
  • [修改] 修改非unix系统的编译目标,使得win32与win64都不进行ltp_server以及unittest的编译
  • [增加] 自动化测试脚本

@Oneplus Oneplus released this Jun 18, 2014 · 333 commits to master since this release

Assets 2
  • [创建] 创建Java封装,ltp4j:https://github.com/HIT-SCIR/ltp4j
  • [创建] 创建Python封装,pyltp:https://github.com/HIT-SCIR/pyltp
  • [增加] 词性标注模块添加了词典功能,用户可以为特定词语指定候选词性
  • [增加] 训练数据增加微博数据,提高了互联网语料的处理能力
  • [增加] 增加编程接口中的数据合法性检查
  • [增加] 增加单元测试模块
  • [修改] 修改了预处理规则,使得iphone5s这样的产品名不会被切开
  • [修改] 修改了语义角色标注训练套件的bug

@Oneplus Oneplus released this Jan 20, 2014 · 414 commits to master since this release

Assets 2
  • 在分词、词性标注和依存句法分析模块中加入模型裁剪功能,减少了模型大小。用户可以通过配置文件里的rare-feature-threshold参数配置裁剪力度,如果rare-feature-threshold为0,则只去掉为0的特征;rare-feature-threshold大于0时将一步去掉更新次数低于阈值的特征。这一优化方法主要参考Learning Sparser Perceptron Models
  • 增加了ltp_server在异常输入情况下返回错误代码,如果输入数据编码错误或者输入xml不符合规则,将返回400
  • 修复了词性标注、命名实体识别、依存句法分析训练套件中的内存泄露问题
  • 修复了语义角色标注的内存泄露问题
  • 修复了词性标注、命名实体识别模型文件的错误标示符,这项修改将导致3.1.0以及之后的版本不能与3.0.x的模型兼容,请务必注意
  • 修复了由boost.multi_array.views引起的MSVC下不能以Debug方式编译的问题
  • 修复了由打开文件时字符串为空引起的Windows下不能正常运行的bug

@Oneplus Oneplus released this Sep 29, 2013 · 469 commits to master since this release

Assets 2
  • 解决windows编译问题
  • 实现各模块多线程支持
  • 新增linux下多线程LTP工具包,multi_ltp_test
  • 实现服务器程序ltp_server多线程支持
  • 修复4长度utf-8字符、伪标记导致%的标注结果等bug