@hankcs hankcs released this Jul 12, 2015 · 805 commits to master since this release

Assets 3
  1. 调整用户词典作用为:分词后使用用户词典合并相邻词语
  2. KeywordExtractor排除空格换行等
  3. 优化地名识别模块对短地名的处理
  4. 词典加载期间提供更人性化的报错信息
  5. 默认关闭字符正规化
  6. 求解两个数组中最相近的数更新到一种O(n)时间的算法
  7. 自动校验CoreNatureDictionary.ngram.txt的缓存与CoreNatureDictionary.txt的缓存的一致性
  8. 词典微调,最新数据集:data-for-1.2.4.zip
  9. Portable同步升级到v1.2.4,Maven:
        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.2.4</version>
        </dependency>