當前位置:成語大全網 - 漢語詞典 - [ES]搜索match_phrase和通配符之間的區別。

[ES]搜索match_phrase和通配符之間的區別。

包含hello或world的句子將被搜索出來:

包含hello world的句子將被搜索出來:

也就是說,hello world壹定是相鄰的。

再看另壹個例子:

這個搜索hello es world也會被搜索出來,因為中間區間的字數是1

實施流程:

Match_phrase執行流程:

1.像匹配搜索壹樣劃分單詞,

2.在字段中搜索分段的單詞(多個$ term匹配)。這個步驟返回每個單詞對應的文檔以及這些單詞在對應文檔中的位置。

3.過濾第壹步返回的文檔,找到每個單詞都在同壹個字段的文檔。

4.再次篩選第三步過濾的單據,選擇位置符合要求的單據。例如,對於match_phrase,找到最後壹個單詞的位置比前壹個單詞的位置大1。或者移動的次數

5.近似匹配(使用slot)具有相同的原理,除了第四個位置以不同的方式被篩選。

例如,搜索“hello world”

前綴原則:

有必要遍歷所有的倒排索引並比較每個$ term是否以指定的前綴開始。

舉個例子,

搜索過程:

為了支持前綴匹配,查詢執行以下操作:

如果有很多以w1開頭的$ term,就會出現嚴重的性能問題。但是如果$ term很小,您可以安全地使用它。

這也意味著我們需要註意和前綴查詢壹樣的性能問題,執行這些查詢可能會消耗大量的資源,所以我們需要避免使用左歧義之類的模式匹配(比如foo或者。foo)。

註意:

前綴、通配符和regrep查詢基於術語。如果我們使用它們來查詢壹個分析過的字段,它們將檢查字段中的每個術語,而不是將字段作為壹個整體來對待。

該查詢的行為與match_phrase查詢的行為相同,只是它使用查詢字符串的最後壹個單詞作為前綴。

例如:

像match_phrase壹樣,它也可以接受slop參數,使相對詞序位置不那麽嚴格:

我們可以通過設置max_expansions參數來限制前綴擴展的影響,合理的值可能是50:

參數max_expansions控制可以與前綴匹配的詞的數量。

另壹種實時搜索方法是使用Ngram部分匹配,這樣會增加索引的開銷,但會加快查詢速度。妳可以自己去查。