Permalink
Browse files

Update README.md

  • Loading branch information...
yaoguangluo committed Dec 27, 2018
1 parent 740ed1c commit 3b0ed51a6e776a317b63525fd91c6f5eb5640176
Showing with 3 additions and 4 deletions.
  1. +3 −4 README.md
@@ -14,14 +14,13 @@
#### 11 速度:每秒高达1200万中文简体字准确分词。 因为通过国际SONAR最高认证,牺牲了程序执行时间十分之三的速度效率(自行修改去掉sonar认知模式可达1600万字分词每秒,性能比应该是世界第二,世界第一赠给高斯林先生,因为我用的是java,没办法)。
##### 11.1 速度每秒高达900万词语的中文词性索引。(Part Of Speech, POS),
##### 11.2 机制为分词和词性分析可拆分使用。采用一次实例,多并发执行思想。
#### 12 词库:多达12700+的中文语料库精确简体中文词汇,有效的辨别新词。
#### 12 词库:多达23700+的中文语料库精确简体中文词汇,有效的辨别新词。
#### 13 大小:55Kb。
#### 14 多核模式:可以自己写 parallelStream() 函数去实现,jdk8以上已经支持, CogsBinaryForestAnalyzer 支持海量多核多线程并发安全 。
#### 15 安全:VPC架构采用纯虚函数做反向映射跳过IOC,效率增加,线程安全高度严格保障。
#### 16 部分中文短句翻译英语。
#### 17 28000英语词汇词库。
#### 18 中英混合分词。每秒2700万英文常规格式分词。
#### 19 病句中乱码分析。
#### 17 中英混合分词。每秒2700万英文常规格式分词。
#### 18 病句中乱码分析。

## 使用方法:
#### 1 支持 java JDK 8 以上。

0 comments on commit 3b0ed51

Please sign in to comment.