Lucene 2.9 修改了 Tokenizer 类接口，导致 MMSegTokenizer 无法运行 #5

GoogleCodeExporter · 2015-12-25T01:58:39Z

lucene 2.4 中 Tokenizer 类中维护了一个 protected Reader input;
但在 lucene 2.9 中，变成了 protected CharStream input;

导致 MMSegTokenizer  抛异常：
java.lang.NoSuchFieldError: input
    at com.chenlb.mmseg4j.analysis.MMSegTokenizer.init(MMSegTokenizer.java:34)
    at com.chenlb.mmseg4j.analysis.MMSegTokenizer.<init>(MMSegTokenizer.java:30)
    at
com.chenlb.mmseg4j.analysis.MMSegAnalyzer.tokenStream(MMSegAnalyzer.java:63)
    at search.analysis.MyAnalyzer.getMMseg4jTokenStream(MyAnalyzer.java:97)

修改建议：
在 MMSegTokenizer 类中自己维护一个 Reader input 成员吧。

Original issue reported on code.google.com by tangfu...@gmail.com on 6 Aug 2009 at 11:42

The text was updated successfully, but these errors were encountered:

GoogleCodeExporter · 2015-12-25T01:58:39Z

准备修正这个 bug 时，发现 CharStream extends 
Reader。原因是使用了Tokenizer 类的 input
属性，所以会报这个错误。

快捷的方式是下载 mmseg4j 源码，把 lucene 2.4 换为 lucene 2.9 
重新编译就行。

下一版本会修正。

Original comment by chenlb2...@gmail.com on 8 Aug 2009 at 4:23

Attachments:

mmseg4j-5.patch

GoogleCodeExporter · 2015-12-25T01:58:39Z

Original comment by chenlb2...@gmail.com on 21 Oct 2009 at 3:09

Changed state: Fixed

GoogleCodeExporter added Priority-Medium Type-Defect auto-migrated labels Dec 25, 2015

GoogleCodeExporter closed this as completed Dec 25, 2015

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lucene 2.9 修改了 Tokenizer 类接口，导致 MMSegTokenizer 无法运行 #5

Lucene 2.9 修改了 Tokenizer 类接口，导致 MMSegTokenizer 无法运行 #5

GoogleCodeExporter commented Dec 25, 2015

GoogleCodeExporter commented Dec 25, 2015

GoogleCodeExporter commented Dec 25, 2015

Lucene 2.9 修改了 Tokenizer 类接口，导致 MMSegTokenizer 无法运行 #5

Lucene 2.9 修改了 Tokenizer 类接口，导致 MMSegTokenizer 无法运行 #5

Comments

GoogleCodeExporter commented Dec 25, 2015

GoogleCodeExporter commented Dec 25, 2015

GoogleCodeExporter commented Dec 25, 2015