Skip to content

Latest commit

 

History

History
19 lines (14 loc) · 794 Bytes

10_Standard_analyzer.asciidoc

File metadata and controls

19 lines (14 loc) · 794 Bytes

标准分析器

任何全文检索的字符串域都默认使用 standard 分析器。 如果我们想要一个 自定义 分析器 ,可以按照如下定义方式重新实现 标准 分析器:

{
    "type":      "custom",
    "tokenizer": "standard",
    "filter":  [ "lowercase", "stop" ]
}

[token-normalization] (标准化词汇单元)和 [stopwords] (停用词)中,我们讨论了 lowercase (小写字母)和 stop (停用词) 词汇单元过滤器 ,但是现在,我们专注于 standard tokenizer (标准分词器)。