當前位置:成語大全網 - 英語詞典 - ES自定義分詞器

ES自定義分詞器

es的分詞器往往包括3個低級構建塊包:

Standard Analyzer

標準分析儀按照Unicode文本分段算法的定義,將文本分割成單詞邊界的分詞。它刪除了大多數標點符號,小寫顯示分詞,並支持刪除stop words。

Simple Analyzer

當遇到不是字母的字符時,簡單的分析器會將文本分成條目。小寫顯示分詞。

Whitespace Analyzer

空格分析器遇到任何空格字符時都會將文本分為多個項目。不會把分詞轉換為小寫字母。

Stop Analyzer

停止分析儀和Simple Analyzer類似,但也支持stop words的刪除。

Keyword Analyzer

壹個“noop”分析器,它可以接受任何給定的文本,並輸出完全相同的文本作為壹個單詞。

Pattern Analyzer

使用正則表達式拆分分詞,支持lower-casing和stop words。

Language Analyzers

Elasticsearch提供許多語言特定的分析器,如英語或法語。

Fingerprint Analyzer

壹個專門的分析儀,它可以創建壹個可用於重復檢測的指紋。

/p/13112fe5eaad

對中文文本以英文逗號作為分隔符分詞:

將分析器設置到索引上

獲取分詞結果

/yu280265067/article/details/71107658