1.大數據的主要特征是數據量巨大,而且數據量持續快速增長。
2.大數據的異構數據類型、不同數據表示和語義解釋多種多樣。
3.大數據是快速變化的,也稱為實時性。壹方面意味著數據快速到達,另壹方面意味著處理時間短,或者要求響應速度快,即實時響應。
4.大數據的價值是潛在的、巨大的。大數據不僅具有經濟價值和產業價值,還具有科學價值。這是大數據最重要的特征,也是大數據的魅力所在。
大數據(Big data),即巨量數據,是指涉及的數據量巨大到無法在合理的時間內捕獲、管理、處理和安排的信息,以幫助企業做出更積極的業務決策。
在維克多·邁爾-舍恩伯格和肯尼斯·庫克耶撰寫的《大數據時代》中,大數據意味著所有數據都用於分析和處理,而沒有隨機分析(抽樣調查)的捷徑。大數據的5V特征(由IBM提出):體積(海量)、速度(高速)、多樣性(多樣性)、價值(低價值密度)和真實性。
結構
大數據包括結構化、半結構化和非結構化數據,非結構化數據正日益成為數據的主要部分。根據IDC的調查報告,企業中80%的數據是非結構化數據,並且這些數據每年以60%的指數級增長。
大數據只是互聯網發展到現階段的壹種表征或特征。沒有必要將其神話或對其保持敬畏。在以雲計算為代表的技術創新背景下,這些原本看似難以收集和使用的數據開始被輕松使用。通過各行各業的不斷創新,大數據將逐步為人類創造更多價值。