这个项目是一个基本包.封装了大多数nlp项目中常用工具
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
src add overwrite Jan 8, 2018
.gitignore refactore test Jul 15, 2015
.travis.yml Update .travis.yml Sep 19, 2018
LICENSE.txt up Aug 8, 2017
NOTICE.txt up Aug 8, 2017
README.md Update README.md Nov 20, 2017
pom.xml up Jan 5, 2018

README.md

nlp-lang

1.X Build Status

文档地址:http://www.nlpcn.org/docs/7 部分演示:http://www.nlpcn.org/demo

##MAVEN

<dependencies>
    <dependency>
        <groupId>org.nlpcn</groupId>
        <artifactId>nlp-lang</artifactId>
        <version>1.7.6</version>
    </dependency>
</dependencies>

这个项目是一个基本包.封装了大多数nlp项目中常用工具

工具

  • √ 词语标准化
  • √ tire树结构
  • √ 双数组tire树
  • √ 文本断句
  • √ html标签清理
  • √ Viterbi算法增加

组件

  • √ 汉字转拼音
  • √ 简繁体转换
  • √ bloomfilter
  • √ 指纹去重
  • √ SimHash文章相似度计算
  • √ 词共现统计
  • √ 基于内存的搜索提示
  • √ WordWeight词频统计,词idf统计,词类别相关度统计