簡單地說,治理就是對管理的管理。
要管理,就必須遵循壹定的標準體系、壹定的流程和壹定的角色分工,而這些內容必須通過數據治理來明確定義。管理層只是根據數據治理的標準體系履行管理和監督職責。
現有管理實施的基礎是治理標準體系。
數據中心和數據湖
這個不容易解釋清楚,所以我盡量簡化。
數據湖壹般是公有雲服務提供商提出的壹個概念,即企業的結構化和非結構化數據可以全部收集並存儲在我的地方。數據湖是壹個大型存儲站。這種存儲是分布式的,可以無限擴展,存儲的數據不會被清理和處理,所以盡量保持原樣。
保存後,Data Lake提供了壹些標準的開放接口供您使用數據,包括查詢SQL接口、計算引擎接口、流處理接口等。提供接口的目的也很簡單,您可以方便地使用您存儲的數據。
數據湖的存儲壹般是分布式對象存儲或分布式文件存儲。即使您從結構化數據庫中收集數據,仍然會將其轉換為統壹的存儲方法,這便於擴展。
簡而言之,企業享受數據的能力正在下沈和對外開放。
數據中臺包括底層數據技術平臺(可以是我們熟悉的大數據平臺)、中層數據資產層、上層數據對外開放。
核心資產層本身也是分層的,從底層的源數據到領域應用數據,再到上層的數據倉庫和數據標簽庫。數據湖更對應於數據中心概念中的數據粘貼源層。
企業在實際構建數據中心時很少使用數據湖的概念。
兩者之間的對比映射如下:
數據中心
對於數據中心這個詞,它經常出現在BI系統的應用中。
但現在數據中心壹般指IT基礎設施、大型公有雲數據機房等。,而這個詞在BI系統或數據中心中很少使用。也就是說,數據中心這個詞偏向於IT硬件基礎設施的層面。