-數據庫分類維度:關系/非關系、交易/分析。
NoSQL數據庫的進壹步分類
-OLTP市場規模:關系數據庫仍占收入的很大壹部分。
-數據庫市場份額:雲服務和新興供應商主導著NoSQL
-開源數據庫與商業數據庫
-數據庫三大陣營:傳統廠商和雲服務提供商。
最近由於時間原因,寫的比較少,在微信官方賬號轉載了幾篇數據庫朋友的大作。都說我是個業余愛好者,沒有資格做這方面的評判。看到下面這篇報道,我立刻產生了學習的興趣,同時也想分享壹些我能理解的想法。
可能這篇文章比較適合大眾閱讀,讓數據庫領域的資深朋友們笑了:)
數據庫分類維度:關系/非關系、事務/分析。
首先是分類維度。在上圖中,縱軸分類為關系數據庫(RDBMS)和非關系數據庫(NoSQL),橫軸分類為運營數據庫(OLTP)和分析數據庫(OLAP)。
按照慣例,我們先來看看關系數據庫。左上角的事務類包括大家熟悉的商業數據庫,如Oracle、MS SQL Server、DB2、Infomix、MySQL(MariaDB是它的壹個分支)、PostgreSQL,以及開源領域流行的SQL Azure和Amazon Aurora。
有趣的是,SAP HANA位於事務型和分析型之間。別忘了SAP還收購了Sybase,雖然後者今天還不夠漂亮,微軟的SQL Server早些年就出自Sybase。Sybase ASE數據庫和分析型Sybase IQ仍然存在。
右上角的分析產品包括幾個知名的列數據倉庫、Pivotal Greenplum、Teradata和IBM Netezza(已宣布支持)、來自互聯網巨頭的Google Big Query和Amazon RedShift。至於Oracle數據庫雲服務器壹體機,它也運行Oracle數據庫,Oracle數據庫本來是為OLAP設計的,但是在後期的開發中也可以兼顧OLTP,所以它是壹個跨界的產品。
讓我們再來看看非關系數據庫。左下角的交易型產品中,有幾個是我比較熟悉的,比如MongoDB,Redis,Amazon DynamoDB,DocumentDB。右下角的分析產品有著名的Hadoop分支Cloudera、Hortonworks(這兩家已經被收購)、Bigtable(來自Google,Hadoop中的HBase是其開源實現)、Elasticsearch等等。
顯然,非關系型數據庫的分類更加復雜,產品在應用上的差異化大於傳統關系型數據庫。威利安·布萊爾負責任地將它們進壹步分類。
NoSQL數據庫的進壹步分類
上面的圖表應該很清楚了。非關系數據庫可以分為基於文檔的存儲、鍵值存儲、基於圖形的數據庫、時間序列和基於寬列的存儲。
讓我們看看每個子類別中的產品:
文檔存儲:MongoDB、Amazon DocumentDB、Azure Cosmos DB等。
鍵值存儲:Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等。
圖數據庫:二級,Neo4j。
時間序列數據庫:InfluxDB等。
wide column:DataStax,Cassandra,Apache HBase和Bigtable等。
多模型數據庫:支持以上壹類以上功能的NoSQL,如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB。
OLTP市場規模:關系數據庫仍占收入的很大壹部分。
上述基於IDC數據的交易型數據庫的市場份額可分為三類,其中深藍關系型數據庫(RDBMS,不包括統計數據挖掘/分析型數據庫)占據了80%以上的市場份額。
動態數據庫(DDMS)是我們前面談到的非關系數據庫。這部分市場很小(但發展勢頭看好),我認為這和互聯網等大公司使用開源+自研,而不是購買商業產品有關。
根據IDC的統計分類,上圖灰色部分的“非關系型數據庫市場”其實定義不同。參見以下段落:
數據庫市場份額:雲服務和新興供應商主導NoSQL
請註意,這裏的關系數據庫統計還包括分析產品。甲骨文的收入份額仍然以42%排名第壹,其次是微軟、IBM、SAP和Teradata。
在代表非關系數據庫的DDMS分類中(此處也加入了Hadoop等。),雲服務和新興廠商成為主導。微軟因為有雲SQL Server的基礎,應該會略微領先AWS,這兩家* * *占據了50%以上的市場份額,其次是Google、Cloudera和Hortonworks(加起來13%)。
以上是IDC傳統分類中的“非關系型數據庫”。這裏IBM和CA應該主要是針對大型機產品的,InterSystems有壹個Caché數據庫,用在國內的醫療HIS系統上(以前是在Power PCs上運行的)。我就知道這麽多,剩下的就不寫了。
開源數據庫與商業數據庫
從知名度來看,開源數據庫從2013到現在壹直在增長,快趕上商用數據庫了。
關系數據庫中商業產品的比例仍然高達60.5%,上表中從這壹欄到左邊的分類以開源為主:
Widecloud:開源占81.8%;
時間序列數據庫:開源占80.7%;
文檔存儲:開源占80.0%;
鍵值存儲:開源占72.2%;
圖數據庫:開源占68.4%;
搜索引擎:開源占65.3%
按照開源許可證的授權模式,上面的三角形越往下越松。比如MySQL屬於GPL,在互聯網行業有很多用戶。PostgreSQL是BSD授權的,國內很多數據庫公司的產品都是基於PostgreSQL的。
數據庫的三大陣營:傳統廠商和雲服務提供商
在前面討論市場份額的時候,我提到了事務型數據庫的四大巨頭仍然是甲骨文、微軟、IBM和SAP,威廉·布萊爾在這裏把他們歸為第壹陣營。
隨著雲平臺的不斷崛起,AWS、Azure和GCP(Google雲平臺)形成了另壹個陣營。在國外分析人士看來,沒有BAT。就像有朋友說的,國內的互聯網巨頭更偏向於商業,在國內發展公有雲還是有壹定優勢的。短時間內向國外輸出技術應該是比較困難的。(當然,我不認為中國缺少優秀的DBA和R&D人才。)
第三個陣容較小,但更專註於數據庫玩家。
接下來,我將簡要介紹前兩個系列,看看具體的數據庫產品是什麽。
甲骨文的產品,我比較熟悉Oracle數據庫,MySQL,Exadata。
IBM DB2也是壹個龐大的家族。除了針對小型機、x86(好像很少人用)、z/OS大型機和for i的傳統版本,還有針對雲和數據挖掘的產品。我記得枕主對Informix的技術評價很高,但似乎這款產品的發展並不理想。
除了看家SQL服務器,微軟還可以在Azure雲上提供MySQL、PostgreSQL和MariaDB開源數據庫。應該說他們是用傳統的軟件許可+PaaS服務兩條腿走路的。
現在人們壹提到SAP的數據庫就會想到HANA。從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ,好像都不如以前發達了。
在雲服務商數據庫三巨頭中,微軟擁有SQL Server的先天優勢,甚至將其移植到Linux上擁抱開源平臺。關系數據庫的創新值得壹提的是亞馬遜Aurora和谷歌Spanner(也有非關系特性)。至於它們的具體優點,我就不裝了:)
非關系型數據庫是亞馬遜的全盛時期,這與其雲計算業務發展較早、優勢較大有關。谷歌的三篇經典論文對行業產生了深遠的影響。基於這種開源的雅虎壹度幾乎是大數據的代名詞。HBase和Hive不再是熱門話題,而Bigtable和BigQuery似乎仍然服務於谷歌自己的業務。畢竟,GCP比AWS小得多。
DB-Engines最後的排名相信很多朋友都不陌生。今年3月不是最新的數據,這裏只列出來供大家參考。幾乎每次排名更新,國內數據庫專家都會寫評論。
以上是我周末的學習筆記。希望對妳有幫助。
參考“數據庫軟件市場:期待已久的大變革”
/WP-content/uploads/2065 438+09/03/數據庫-軟件-市場-白皮書. pdf
延伸閱讀:數據庫&;存儲:我們最想知道的。
尊重知識,轉載請保留全文。感謝您的閱讀和支持!