當前位置:成語大全網 - 新華字典 - 圖解:數據結構與算法之字典樹

圖解:數據結構與算法之字典樹

字典樹(Trie樹)這壹數據結構是不太常見但是十分好用<typo id="typo-32" data-origin="而" ignoretag="true">而</typo>壹種數據結構,博主也就是最近壹段時間做了幾道字節的題目才了解到字典樹這壹數據結構。並將自己的學習內容跟大家分享。

首先,何為字典樹(Trie樹)?顧名思義,就是在查詢目標時,像字典壹樣按照壹定排列順序標準和步驟訪問樹的節點,舉壹個簡單例子,英文字典查單詞"He",那麽第壹步妳肯定要按照a-z的順序先找到h這個首字母,然後再按照相同順序找到e。博主所要介紹的字典樹就是類似字典這樣的結構。

上述查找單詞的過程就是不斷查找與所查單詞相同前綴的字符串,直至查找到所查單詞的最後壹個字母。因此,字典樹又稱為前綴樹(prefix Tree)。

以hell、hi、new、nop為例建立壹個字典樹,構造如下

根據上文所述可以得到字典樹的結構性質

根據以上三點來構造字典樹。

字典樹的構造其實較為簡單,和壹般樹的構造沒有太大區別。接下來將對字典樹的插入、刪除、查詢操作進行分析與講解。

在沒有字典樹的時候,我們需要先構建出字典樹。

以插入hell為例:

再插入單詞hit,過程如下,檢查=>存在則訪問/不存在則建立新節點再訪問=>直到要插入的單詞到達最後壹個字符。

字典樹的插入操作比較簡單,不需要考慮太多排序問題。

正如上文所說,按照壹定的標準進行查詢目標字符串,每個節點都儲存壹個字符,根節點到達子節點路徑組成的字符串即為該節點所對應的字符串,那麽查詢目標字符串時按照從根節點壹步壹步訪問相應字符所在的節點,其實也就是匹配字符串前綴的過程。

如下圖,在字典樹中,查詢"hell",

[圖片上傳失敗...(image-f028c4-1611057619223)]

如果在該字典中查詢no

刪除操作相對於插入與查詢復雜壹點,但是也很簡單,刪除的前提是單詞已經存在於字典樹。

刪除字典樹節點的操作需要考慮目標字符串最後壹個字符是否是樹中的葉子節點。

因為壹個單詞可能是另壹個單詞的前綴部分,如果不是葉子節點,我們只需要把該單詞的單詞標誌位清空即可,無需刪除整個“樹枝”。

比如,想要刪除"no"這個單詞

比如,想要刪除"hell"這個單詞,與第壹種刪除相同,只不過是從最後壹個節點,'l'節點是葉子節點,開始往上進行節點刪除操作。

比如,想要刪除"hi",那麽與前兩種其實壹致,訪問到葉子節點'i',刪除葉子節點,並向上訪問,訪問到'h',由於刪除'i'以後,'h'依然不是葉子節點,因此不再繼續刪除節點。

比如,想要刪除"nop",與前幾種類似,先訪問到葉子節點'p'刪除,然後上移發現'o'是葉子節點,然而'o'有單詞標記位,所以,這裏不再繼續刪除。

有上面幾種刪除操作,我們得到了刪除的標準:

了解了這麽多字典樹的各種操作,相信妳對字典樹的用途有個大概了解了,字典樹最大作用是用於==字符串的各種匹配==,前綴匹配(模糊搜索),字符串查找(字典)等等。

博主只打出了“涓涓清泉”四個關鍵字,其搜索列表返回了諸多以涓涓清泉為首的選項

顧名思義,就是壹個單純的字典而已,不多舉例。

字典樹的構建,通過利用空間換時間的思想以及字符串的公***前綴減少無效的字符串比較操作從而使得插入和查找字符串變得高效.其插入或者查找的時間復雜度為O(n),n為字符串長度。

當然,字典樹有著它的弊端,當所插入的單詞沒有很多公***前綴時,字典樹的構建變得十分復雜和低效。

字典樹的難度不是很大,但卻是壹種十分有用的數據結構,掌握之後,對於解決壹些有關字符串匹配、公***前綴的問題十分有幫助。

當然我們也說了,字典樹有著自己的弊端,由於用空間換時間,如果遇到了壹堆公***前綴很少的單詞進行字典樹構造時,空間需求就顯得十分大了。