當前位置:成語大全網 - 書法字典 - 結構化數據和非結構化數據是什麽意思?

結構化數據和非結構化數據是什麽意思?

結構化數據和非結構化數據是大數據的兩種類型,它們之間並不存在真正的沖突。客戶如何選擇不是基於數據結構,而是基於使用數據結構的應用程序:關系數據庫用於結構化數據,大多數其他類型的應用程序用於非結構化數據。

結構化數據也稱為行數據,是通過二維表結構進行邏輯表達和實現的數據,嚴格遵循數據格式和長度規範,主要通過關系數據庫進行存儲和管理。

與結構化數據相反,非結構化數據不適合用數據庫的二維表格來表示,包括所有格式的office文檔、XML、HTML、各種報表、圖片、音頻和視頻信息等。

擴展數據

結構化數據和非結構化數據的區別除了存儲在關系數據庫和存儲在非關系數據庫的明顯區別之外,還在於分析結構化數據和非結構化數據的方便性。結構化數據有成熟的分析工具,但挖掘非結構化數據的分析工具處於萌芽和發展階段。

而且非結構化數據遠不止結構化數據。非結構化數據占企業數據的80%以上,並且每年以55%~65%的速度增長。沒有分析這些海量數據的工具,企業數據的巨大價值就無法發揮。