hadoop是壹個分布式軟件處理框架,hive是壹個具有查詢功能的數據倉庫,Hadoop底層的hdfs為hive提供數據存儲。
Hive將用戶提交的SQL解析為供hadoop直接運行的mapreduce任務,並結合它們的優勢進行數據決策。壹個擅長大數據並行計算,壹個支持SQL數據查詢,便捷性顯而易見。但是只要它仍然是讀操作
有了Hive,人們發現SQL比Java有很大的優勢。壹是它太容易寫了。剛才,在SQL中經常描述的MapReduce單詞只有壹兩個,編寫大約需要幾十或幾百行。
擴展數據:
它主要有以下優點:
1,可靠性高。Hadoop壹點壹點存儲和處理數據的能力值得信賴。
2.高可擴展性。Hadoop在可用的計算機集群之間分發數據並完成計算任務,這些集群可以輕松擴展到數千個節點。
3.效率高。Hadoop可以在節點之間動態移動數據,並確保每個節點的動態平衡,因此處理速度非常快。
4.高容錯性。Hadoop可以自動保存數據的多個副本,並自動重新分配失敗的任務。
成本低。與QlikView和永宏Z-Suite等壹體機、商業數據倉庫和數據集市相比,hadoop是開源的,因此項目的軟件成本將大大降低。
Hadoop有壹個用Java語言編寫的框架,因此非常適合在Linux生產平臺上運行。Hadoop上的應用程序也可以用其他語言編寫,例如C++。