對於字符串集合T={t1,t2…tn}的廣義後綴樹,是壹個壓縮字典樹(trie)其中包含了T中每壹個字符串的所有的後綴。
每壹個葉節點,是由<StringID, Start position> 對來標記的,即包含了所在的字符串和在字符串中的開始位置。
廣義後綴數組的構造:
將T中的所有字符串加上終結符$連接在壹起構成新的字符串S= t1$t2$…tn $;對字符串S構造,後綴樹;每壹個葉節點標記上在S中的起始位置;移除橫跨多個字符串的後綴;將葉節點的起始位置映射成<String ID, Start position>對。說明:真實構造中對後綴的比較只比較到字符$就結束,這樣不會出現橫跨多個字符串的後綴。