Skip to content
elasticsearchのanalysis plugin 形態素にmecabを使用
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
licenses
src
.gitignore
LICENSE
README.md
build.gradle

README.md

Elasticsearch Analysis Mecab

elasticsearch-analysis-mecab

elasticsearchのanalysis plugin 形態素にmecabを使用

ビルド

gradle assemble

使用方法

Mecabのインストール

mecabをインストールしてください。
辞書はutf-8であれば、unidic、ipadic、juman、ipadic-neologd、unidic_neologd等を使用可能

elasticsearchプラグインのインストール

bin/elasticsearch-plugin install file:///path/to/analysis-mecab.zip

kuromojiとの対比

kuromojiのTokenizer,Filterとの対比は以下。

name kuromoji name type
mecab_iteration_mark kuromoji_iteration_mark charfilter
mecab kuromoji analyzer
mecab_tokenizer kuromoji_tokenizer tokenizer
mecab_baseform kuromoji_baseform tokenfilter
mecab_part_of_speech kuromoji_part_of_speech tokenfilter
mecab_readingform kuromoji_readingform tokenfilter
mecab_stemmer kuromoji_stemmer tokenfilter

kuromojiとmecabのfilterの同時の使用はできません。
(tokenizerをmecab_tokenizerにしてfilterをkuromoji_baseformは不可)

You can’t perform that action at this time.