hadoop和hive是什麽關系？

Hive是hadoop的擴展。

hadoop是壹個分布式軟件處理框架，hive是壹個具有查詢功能的數據倉庫，Hadoop底層的hdfs為hive提供數據存儲。

Hive將用戶提交的SQL解析為供hadoop直接運行的mapreduce任務，並結合它們的優勢進行數據決策。壹個擅長大數據並行計算，壹個支持SQL數據查詢，便捷性顯而易見。但是只要它仍然是讀操作

有了Hive，人們發現SQL比Java有很大的優勢。壹是它太容易寫了。剛才，在SQL中經常描述的MapReduce單詞只有壹兩個，編寫大約需要幾十或幾百行。

擴展數據:

它主要有以下優點:

1，可靠性高。Hadoop壹點壹點存儲和處理數據的能力值得信賴。

2.高可擴展性。Hadoop在可用的計算機集群之間分發數據並完成計算任務，這些集群可以輕松擴展到數千個節點。

3.效率高。Hadoop可以在節點之間動態移動數據，並確保每個節點的動態平衡，因此處理速度非常快。

4.高容錯性。Hadoop可以自動保存數據的多個副本，並自動重新分配失敗的任務。

成本低。與QlikView和永宏Z-Suite等壹體機、商業數據倉庫和數據集市相比，hadoop是開源的，因此項目的軟件成本將大大降低。

Hadoop有壹個用Java語言編寫的框架，因此非常適合在Linux生產平臺上運行。Hadoop上的應用程序也可以用其他語言編寫，例如C++。