兩者的思路是壹樣,都是分散式並行處理。本質肯定壹樣,不同的是應用場景不壹樣:
1、hadoop是個輕量級的產品,又是開源的,不像dpf那麽復雜,還要購買商業軟體,搭個DPF環境需要費挺大力氣的。
2、hadoop能處理半結構化,非結構化資料。
但hadoop要寫map reduce函式,這個比起SQL來,方便靈活性差太多了。。。
在處理結構化資料方面,個人覺得MPP的資料庫效能其實不會比hadoop差,只是壹提起MPP大家就會想到要伺服器,外部儲存,光纖網路,還要做很好的規劃,覺得成本很高,所以都去追捧hadoop去了 :)
參考::itpub./thread-1566914-1-1.
這完全是兩個東西啊!壹個是資料庫,壹個是分散式系統基礎架構,兩個沒有可比性吧!
我猜妳想問的應該是hadoop的hbase這個nosql與關系型資料庫的區別吧!
:zhihu./question/20059632
壹般來說,關系型資料庫都拿來做高效響應即時查詢。但在大資料離線分析上比較弱。而hadoop很適合拿來做大資料離線分析。
面試題 關系型資料庫和非關系型資料庫的區別
索引實際上是壹組指向表中資料的指標,索引的排列順序其實就是這組指標的順序.聚集索引:表的物理儲存順序與指標(即邏輯)順序相同非聚集索引:物理與邏輯順序不同因為壹個表只能有壹個物理順序,所以,聚集索引的個數最多只能是1.其中唯壹索引是給所做的索引增加了唯壹性的約束,新增,修改索引列中資料時,不允許出現重復值.它可以是聚集索引,也可以是非聚集的。主鍵不允許有NULL,唯壹索引可以。但是唯壹索引只允許壹個NULL。主鍵索引是把主鍵列定義為索引,主鍵具有唯壹性,所以主鍵索引是唯壹索引的壹種特殊形式
關系型和非關系型資料庫的區別非關系型資料庫的實質:非關系型資料庫產品是傳統關系型資料庫的功能 *** 版本,通過減少用不到或很少用的功能,來大幅度提高產品效能。
關系式資料結構把壹些復雜的資料結構歸結為簡單的 二元關系(即二維表格形式) 。非關系型資料庫通常分為層次式資料庫、網路式資料庫。按照 網狀資料結構 建立的資料庫系統稱為網狀資料庫系統。用數學方法可將網狀資料結構轉化為層次資料結構。
層次結構模型實質上是壹種有根結點的定向有序樹(在數學中"樹"被定義為壹個無回的連通圖)。
當前主流的關系型資料庫有Oracle、DB2、Microsoft SQL Server、Microsoft Aess、MySQL等。
非關系型資料庫有 NoSql、Cloudant。
nosql和關系型資料庫比較?
優點:
1)成本:nosql資料庫簡單易部署,基本都是開源軟體,不需要像使用oracle那樣花費大量成本購買使用,相比關系型資料庫價格便宜。
2)查詢速度:nosql資料庫將資料儲存於快取之中,關系型資料庫將資料儲存在硬碟中,自然查詢速度遠不及nosql資料庫。
3)儲存資料的格式:nosql的儲存格式是key,value形式、文件形式、圖片形式等等,所以可以儲存基礎型別以及物件或者是集合等各種格式,而資料庫則只支援基礎型別。
4)擴充套件性:關系型資料庫有類似join這樣的多表查詢機制的限制導致擴充套件很艱難。
缺點:
1)維護的工具和資料有限,因為nosql是屬於新的技術,不能和關系型資料庫10幾年的技術同日而語。
2)不提供對sql的支援,如果不支援sql這樣的工業標準,將產生壹定使用者的學習和使用成本。
3)不提供關系型資料庫對事物的處理。
hbase和關系型資料庫的區別Mongodb用於儲存非結構化資料,尤其擅長儲存json格式的資料。儲存的量大概在10億級別,再往上效能就下降了,除非另外分庫。
Hbase是架構在hdfs上的列式儲存,擅長rowkey的快速查詢,但模糊匹配查詢(其實是前模糊或全模糊)不擅長,但儲存的量可以達到百億甚至以上,比mongodb的儲存量大多了。
關系型資料庫與實時型資料庫有什麽區別?■關系資料庫 facts and information
關系資料庫是建立在集合代數基礎上,應用數學方法來處理資料庫中的資料。現實世界中的各種實體以及實體之間的各種聯絡均用關系模型來表示。
關系模型由關系資料結構、關系操作集合、關系完整性約束三部分組成。
全關系系統十二準則
全關系系統應該完全支援關系模型的所有特征。關系模型的奠基人E.F.Codd具體地給出了全關系系統應遵循的基本準則。
;''準則0'' : 壹個關系形的關系資料庫系統必須能完全通過它的關系能力來管理資料庫。
;''準則1'' 資訊準則 : 關系資料庫系統的所有資訊都應該在邏輯壹級上用表中的值這壹種方法顯式的表示。
;''準則2'' 保證訪問準則 : 依靠表名、主碼和列名的組合,保證能以邏輯方式訪問關系資料庫中的每個資料項。
;''準則3'' 空值的系統化處理 : 全關系的關系資料庫系統支援空值的概念,並用系統化的方法處理空值。
;''準則4'' 基於關系模型的動態的聯機資料字典 : 資料庫的描述在邏輯級上和普通資料采用同樣的表述方式。
;''準則5'' 統壹的資料子語言 :
壹個關系資料庫系統可以具有幾種語言和多種終端訪問方式,但必須有壹種語言,它的語句可以表示為嚴格語法規定的字串,並能全面的支援各種規則。
;''準則6'' 檢視更新準則 : 所有理論上可更新的檢視也應該允許由系統更新。
;''準則7'' 高階的插入、修改和刪除操作 : 系統應該對各種操作進行查詢優化。
;''準則8'' 資料的物理獨立性 : 無論資料庫的資料在儲存表示或存取方法上作任何變化,應用程式和終端活動都保持邏輯上的不變性。
;''準則9'' 資料邏輯獨立性 : 當對基本關系進行理論上資訊不受損害的任何改變時,應用程式和終端活動都保持邏輯上的不變性。
;''準則10'' 資料完整的獨立性 : 關系資料庫的完整性約束條件必須是用資料庫語言定義並存儲在資料字典中的。
;''準則11'' 分布獨立性 : 關系資料庫系統在引入分布資料或資料重新分布時保持邏輯不變。
;''準則12'' 無破壞準則 : 如果壹個關系資料庫系統具有壹個低階語言,那麽這個低階語言不能違背或繞過完整性準則。
■實時資料庫是資料庫系統發展的壹個分支,它適用於處理不斷更新的快速變化的資料及具有時間限制的事務處理。實時資料庫技術是實時系統和資料庫技術相結合的產物,研究人員希望利用資料庫技術來解決實時系統中的資料管理問題,同時利用實時技術為實時資料庫提供時間驅動排程和資源分配演算法。然而,實時資料庫並非是兩者在概念、結構和方法上的簡單整合。需要針對不同的應用需求和應用特點,對實時資料模型、實時事務排程與資源分配策略、實時資料查詢語言、實時資料通訊等大量問題作深入的理論研究。實時資料庫系統的主要研究內容包括:
實時資料庫模型
實時事務排程:包括並發控制、沖突解決、死鎖等內容
容錯性與錯誤恢復
訪問準入控制
記憶體組織與管理
I/O與磁碟排程
主記憶體資料庫系統
不精確計算問題
放松的可序列化問題
實時SQL
實時事務的可預測性
研究現狀與發展實時資料庫系統最早出現在1988年3月的ACM SIGMOD Record的壹期專刊中。隨後,壹個成熟的研究群體逐漸出現,這標誌著實時領域與資料庫領域的融合,標誌著實時資料庫這個新興研究領域的確立。此後,出現了大批有關實時資料庫方面的論文和原型系統。人機互動技術與智慧資訊處理實驗室實時資料庫小組壹直致力於實時系統、實時智慧、實時資料庫系統及相關技術的研究與開發,並取得了壹定的成績。