當前位置:成語大全網 - 書法字典 - 百度大規模時序數據存儲(二)

百度大規模時序數據存儲(二)

二樓儲物選擇

三、基於HBase的存儲設計

HBase表中的數據是按照RowKey的字典順序排列的,行方向的數據可以分布到多個H區域,而H區域可以分布在不同的節點上,因此只要數據可以均勻分布在H區域中,就可以實現存儲的負載均衡。

不難看出,RowKey的設計是負載平衡的關鍵。如果RowKey設計不好,很容易形成壹個熱點HRegion,導致其節點過載,進而導致集群整體性能下降。

接下來,重點介紹了TSDB中最關鍵的兩個表的設計:數據表和維度索引表。前者支持所有時間序列數據的存儲和查詢,後者是多維聚合查詢的基礎。

1數據表

二維索引表

摘要