基于Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene.net 的 analyzer以方便在Lucene.Net中使用。本代码来源于*王员外*(http://www.cnblogs.com/land/archive/2011/07/19/mmseg4j.html)基于Java版的翻译,升级到了最新版Lucene.Net (≥ 3.0.3),并包含简单示例和NuGet安装包。
Switch branches/tags
Nothing to show
Clone or download
Latest commit 8095acd May 27, 2013
Permalink
Failed to load latest commit information.
output 解决内存泄露问题 May 27, 2013
src 解决内存泄露问题 May 27, 2013
.gitattributes first checkin May 9, 2013
.gitignore first checkin May 9, 2013
README.md Update README.md May 9, 2013

README.md

Lucene.Net.Analysis.MMSeg

基于Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene.net 的 analyzer以方便在Lucene.Net中使用。本代码来源于王员外(http://www.cnblogs.com/land/archive/2011/07/19/mmseg4j.html )基于Java版的翻译,升级到了最新版Lucene.Net (≥ 3.0.3),并包含简单示例和NuGet安装包。

NuGet地址

https://nuget.org/packages/Lucene.Net.Analysis.MMSeg/

使用

一共三种搜索模式供选择:

SimpleAnalyzer

Analyzer analyzer = new SimpleAnalyzer();

MaxWordAnalyzer

Analyzer analyzer = new MaxWordAnalyzer();

ComplexAnalyzer

Analyzer analyzer = new ComplexAnalyzer();

具体使用方法,请参考代码中的示例和lucene.net的文档