當前位置:成語大全網 - 書法字典 - Hadoop和MapReduce到底是用來做什麽的?

Hadoop和MapReduce到底是用來做什麽的?

Hadoop是壹個開發分布式程序的框架,是由Apache基金會開發的分布式系統基礎設施。用戶可以開發分布式程序,而無需了解發行版的底層細節。

MapReduce是壹種用於大規模並行數據處理的數據模型。無需分布式並行編程,程序員可以方便地在分布式系統上運行自己的程序。

擴展數據

Hadoop是壹個分布式計算平臺,用戶可以輕松構建和使用。用戶可以在Hadoop上輕松開發和運行處理海量數據的應用程序。主要有以下優點:

1,可靠性高。Hadoop壹點壹點存儲和處理數據的能力值得信賴。

2.高可擴展性。Hadoop在可用的計算機集群之間分發數據並完成計算任務,可以輕松擴展到數千個節點?。

3.效率高。Hadoop可以在節點之間動態移動數據,並保證每個節點的動態平衡,所以處理速度很快?。

4.高容錯性。Hadoop可以自動保存數據的多個副本,並自動重新分配失敗的任務。

5.成本低。與QlikView和永宏Z-Suite等壹體機、商業數據倉庫和數據集市相比,hadoop是開源的,因此項目的軟件成本將大大降低。

百度百科-MapReduce

百度百科-Hadoop