MapReduce是壹種用於大規模並行數據處理的數據模型。無需分布式並行編程,程序員可以方便地在分布式系統上運行自己的程序。
擴展數據
Hadoop是壹個分布式計算平臺,用戶可以輕松構建和使用。用戶可以在Hadoop上輕松開發和運行處理海量數據的應用程序。主要有以下優點:
1,可靠性高。Hadoop壹點壹點存儲和處理數據的能力值得信賴。
2.高可擴展性。Hadoop在可用的計算機集群之間分發數據並完成計算任務,可以輕松擴展到數千個節點?。
3.效率高。Hadoop可以在節點之間動態移動數據,並保證每個節點的動態平衡,所以處理速度很快?。
4.高容錯性。Hadoop可以自動保存數據的多個副本,並自動重新分配失敗的任務。
5.成本低。與QlikView和永宏Z-Suite等壹體機、商業數據倉庫和數據集市相比,hadoop是開源的,因此項目的軟件成本將大大降低。
百度百科-MapReduce
百度百科-Hadoop