大數據,或稱巨量數據,是指涉及的數據量巨大到主流軟件工具無法在合理的時間內捕捉、管理、處理和排列的信息,以幫助企業做出更積極的商業決策。大數據是美國著名未來學家阿爾文·托夫勒在《從65438年到0980年的第三次浪潮》壹書中提出的。
在維克多·邁耶-勛伯格和肯尼斯·庫克耶合著的《大數據時代》中,大數據是指所有的數據都用於分析和處理,而沒有隨機分析(抽樣調查)的捷徑。大數據的5V特征(IBM提出):體量(海量)、速度(高速)、多樣性(多樣性)、價值(低價值密度)、真實性。
“大數據”壹詞,在商務印書館出版的《中國新詞語詞典(2000-2020)》中,列出了中國近20年來生命力指數最高的十大“時代新詞”。
大數據的結構
第壹個層次是理論,理論是認知的必由之路,是被廣泛認同和傳播的基線。在這裏,我們可以從大數據的特征定義來理解行業對大數據的整體描述和定性;從大數據價值的討論,深入剖析大數據的珍貴;洞察大數據發展趨勢;本文從大數據隱私這壹特殊而重要的視角來審視人與數據的長期博弈。
第二個層面是技術,技術是體現大數據價值的手段,是進步的基石。這裏從雲計算、分布式處理技術、存儲技術、傳感技術的發展,闡述大數據從采集、處理、存儲到形成結果的全過程。
第三個層次是實踐,實踐是大數據的終極價值體現。在這裏,我們從互聯網大數據、政府大數據、企業大數據、個人大數據四個方面來描述大數據已經展現的美好場景和將要實現的藍圖。
以上內容參考百度百科-大數據。