在文檔發送並添加到倒排索引之前,Es對主題的操作;
a、字符過濾器:使用字符過濾器對字符進行轉換。
b、斷字:正文分為斷字,正文分為單個或多個斷字。
c、分詞過濾器:用分詞過濾器改造分詞。
d、分詞索引:將分詞存入索引。
e、分析流程圖:
2.定制分析儀
包含零個或多個字符篩選器、1個斷字符以及零個或多個斷字符篩選器。
註意:
3.對文檔使用斷字符
3.1.創建索引時添加斷字符。
3.2.指定地圖中字段的分析器。
3.3.在Elasticsearch的配置文件中設置全局分析器。
4.使用分析API來分析文本
5.使用術語向量來學習索引術語。