Hadoop實現了分布式文件系統(HDFS)。它具有高容錯性的特點,設計用於部署在低成本的硬件上。此外,它還提供了訪問應用數據的高吞吐量,適用於那些具有大數據集的應用。
特性
1.快照支持存儲特定時間的數據副本。快照可以將故障集群回滾到之前的正常時間點。HDFS已經支持元數據快照。
2.HDFS旨在支持大文件。在HDFS上運行的程序也被用來處理大型數據集。這些程序只寫數據壹次,讀數據請求壹次或多次,這些讀操作需要滿足流速度。
HDFS支持壹次寫入多次讀取。在HDFS,典型的塊大小是64MB。壹個HDFS文件可以分成多個64MB大小的塊,如果需要,每個塊可以分布在不同的數據節點上。
3.階段狀態:客戶端創建文件的請求不會立即轉發到名稱節點。事實上,起初,HDFS客戶端將文件數據緩存在本地臨時文件中。