數據庫發展簡史

使用計算機後，隨著數據處理能力的增加，數據管理技術應運而生。數據管理技術的發展與計算機硬件(主要是外存)、系統軟件和計算機應用範圍密切相關。數據管理技術的發展經歷了四個階段:手工管理階段、文件系統階段、數據庫階段和高級數據庫技術階段。

數據管理的誕生

數據庫的歷史可以追溯到五十年前，那時數據管理非常簡單。通過大量的機器進行分類、比較和制表，運行數百萬張穿孔卡處理數據，並將運行結果打印在紙上或制成新的穿孔卡。數據管理是所有這些穿孔卡片的物理存儲和處理。然而在1950年，雷明頓蘭德公司壹臺名為Univac I的計算機推出了壹種可以在壹秒鐘內輸入數百條記錄的磁帶機，引發了壹場數據管理的革命。1956 IBM生產了第壹臺磁盤驅動器——305型RAMAC。這個驅動器有50個磁盤，每個磁盤的直徑為2英尺，可以存儲5MB的數據。使用磁盤最大的優點是可以隨機存取數據，而穿孔卡和磁帶只能順序存取數據。

1951: Univac系統使用磁帶和穿孔卡片作為數據存儲。

數據庫系統的萌芽出現在20世紀60年代。當時計算機開始廣泛應用於數據管理，對數據享受提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需求，能夠統壹管理和共享數據的數據庫管理系統(DBMS)應運而生。數據模型是數據庫系統的核心和基礎，各種DBMS軟件都基於某種數據模型。因此，根據數據模型的特點，傳統的數據庫系統通常分為三類:網狀數據庫、層次數據庫和關系數據庫。

最早的mesh DBMS是美國通用電氣公司的Bachman等人在1961年開發的IDS(集成數據存儲)。1964年，美國通用電氣公司的查爾斯·巴克曼(Charles Bachman)成功開發了世界上第壹個mesh DBMS，即第壹個數據庫管理系統——集成數據存儲IDS，奠定了mesh數據庫的基礎，並在當時得到了廣泛的分布和應用。IDS具有數據模式和日誌的特性，但只能在GE主機上運行，數據庫只有壹個文件，數據庫中的所有表格都必須手工編碼生成。後來，通用電氣公司的壹個客戶BF古德裏奇化學公司最終不得不重寫整個系統，並將重寫後的系統命名為綜合數據管理系統(IDMS)。

網狀數據庫模型可以自然地模擬分層和非分層的事物。在關系數據庫出現之前，網狀DBMS比層次DBMS應用更廣泛。在數據庫發展史上，網狀數據庫占有重要的地位。

分層DBMS出現在網絡數據庫之後。最著名、最典型的層次數據庫系統是IBM於1968年開發的IMS(信息管理系統)，這是壹種適合其主機的層次數據庫。這是IBM開發的最早的大型數據庫系統程序產品。它產生於60年代末，現在已經發展到IMSV6，提供了對集群、N路數據共享、消息隊列共享等高級特性的支持。這個有30年歷史的數據庫產品在今天的WWW應用連接和商業智能應用中扮演著新的角色。

1973年，Cullinane公司(後來的Cullinet軟件公司)開始銷售古德裏奇公司的IDMS改進版，逐漸成為當時世界上最大的軟件公司。網狀數據庫和層次數據庫很好地解決了數據集中和共享的問題，但仍然很缺乏數據獨立性和抽象性。用戶在訪問這兩個數據庫時，仍然需要明確數據的存儲結構，指出訪問路徑。後來出現的關系數據庫很好地解決了這些問題。

1970年，IBM的研究員E.F.Codd博士在ACM的《通訊》雜誌上發表了題為《大型共享數據庫的數據的關系模型》的論文，提出了關系模型的概念，奠定了關系模型的理論基礎。盡管Childs在1968中提出了面向集合的模型，但這篇論文被普遍認為是數據庫系統史上劃時代的裏程碑。Codd的願望是為數據庫建立壹個漂亮的數據模型。後來Codd陸續發表了很多文章，討論度量關系系統的範式理論和12標準，用數學理論奠定了關系數據庫的基礎。關系模型具有嚴格的數學基礎，高度的抽象性，簡單明了，易於理解和使用。但當時有人認為關系模型是壹種理想化的數據模型，用它來實現DBMS是不現實的，尤其擔心關系數據庫的性能難以接受，甚至有人將其視為對正在進行的mesh數據庫標準化的嚴重威脅。為了促進對問題的理解，1974 ACM牽頭組織了壹次研討會，會上進行了壹場支持和反對關系數據庫兩派的辯論，分別由Codd和Bachman牽頭。這場著名的爭論促進了關系數據庫的發展，並最終使其成為現代數據庫產品的主流。

1969埃德加·CODD發明了關系數據庫。

1970的關系模型建立後，IBM在聖何塞實驗室增加了更多的研究人員來研究這個項目，也就是著名的System R，它的目標是論證壹個功能齊全的關系型DBMS的可行性。項目結束於1979，完成了第壹個實現SQL的DBMS。但IBM對IMS的承諾阻止了System R的投產，直到1980，System R才作為產品正式投入市場。IBM產品化步伐緩慢的原因有三:IBM重視信譽，重視質量，盡量減少失敗；IBM是壹家擁有龐大官僚體系的大公司。IBM已經有了層次化的數據庫產品，相關人員並不積極甚至反對。

但與此同時，在1973年，加州大學柏克萊分校的邁克爾·斯通布雷克和尤金·王(Eugene Wong)利用System R公布的資料開始開發自己的關系數據庫系統Ingres，他們開發的Ingres項目最終被矽谷的Oracle、Ingres等廠商商業化。後來System R和Ingres都獲得了ACM頒發的1988的“軟件系統獎”。

從65438到0976，霍尼韋爾開發了第壹個商用關系數據庫系統——Multics關系數據存儲。關系數據庫系統是以關系代數為基礎的。經過幾十年的發展和實際應用，該技術日趨成熟和完善。其代表產品有Oracle、IBM的DB2、微軟的MS SQL Server、Informix、ADABAS D等。1974年，IBM的Ray Boyce和Don Chamberlin用簡單的關鍵字文法表達了Codd關系數據庫12準則的數學定義，並提出SQL(結構化查詢語言)作為裏程碑。SQL語言的功能包括查詢、操作、定義和控制。它是壹種全面通用的關系數據庫語言，也是壹種高度非過程化的語言，只需要用戶指出做什麽，而不需要指出怎麽做。SQL集成實現了數據庫生命周期中的所有操作。SQL提供了壹種與關系數據庫交互的方式，這種方式可以與標準編程語言壹起工作。SQL語言自誕生以來，就成為了檢驗關系數據庫的試金石，SQL語言標準的每壹次變化都引導著關系數據庫產品的發展方向。然而，直到20世紀70年代中期，關系理論才通過SQL用於商業數據庫Oracle和DB2。

1986年，ANSI采用SQL作為關系數據庫語言的美國標準，並於同年發布了標準SQL文本。SQL標準有三個版本。SQL的基本定義是ANS ⅸ 3135-89《數據庫語言-完整性增強的SQL》[ANS 89]，俗稱SQL-89。SQL-89定義了模式定義、數據操作和事務處理。SQL- 89和隨後的ANS ⅸ 3168-1989，“數據庫語言-嵌入式SQL”構成了第壹代SQL標準。ANSⅸ3135-1992【ANS 92】描述了壹個增強的SQL，叫做SQL-92標準。SQL-92包括增強的特性，如模式操作、SQL語句的動態創建和動態執行以及網絡環境支持。在完成SQL-92標準之後，ANSI和ISO開始合作開發SQL3標準。SQL3的主要特點是支持抽象數據類型，為新壹代的對象關系數據庫提供了標準。

1976年，IBM E.F.Codd發表了壹篇裏程碑式的論文《R系統:數據庫關系理論》，介紹了關系數據庫理論和查詢語言SQL。甲骨文的創始人埃裏森非常仔細地看了這篇文章，被它的內容震驚了。這是第壹次有人用全面壹致的方案來管理數據信息。作者E.F.Codd 1966發表了關系數據庫理論，並在IBM研究院開發了原型。這個項目是R系統，訪問數據表的語言是SQL。讀完之後，埃裏森敏銳地意識到可以在這項研究的基礎上開發軟件系統。當時大多數人認為關系數據庫不會有商業價值。埃裏森認為這是他們的機會:他們決定開發通用商業數據庫系統Oracle，該系統是以他們曾經為中情局做過的項目命名的。幾個月後，他們開發了Oracle 1.0。但這只是壹個玩具。除了完成簡單的關系查詢，他們什麽都不會。他們花了很長時間才使Oracle可用。維持公司運轉主要靠承接壹些數據庫管理項目和咨詢工作。然而，IBM沒有開發它的計劃。藍色巨人放棄這個價值數百億的產品有很多原因:IBM的研究人員大多是學術背景，他們最感興趣的是理論，而不是投放市場的產品。從學術角度來說，研究成果應該公開發表。論文和演講可以讓他們出名。為什麽不呢？另壹個主要原因是IBM有壹個分層數據庫產品IMS，當時賣得很好。直到1985，IBM才發布了關系數據庫DB2，Ellision早已成為千萬富翁。埃裏森曾將IBM選擇微軟的MS-DOS作為IBM-PC的操作系統比喻為:“世界商業史上最嚴重的錯誤，價值超過數千億美元。”IBM發表R系統論文而沒有很快推出關系數據庫產品的錯誤可能僅次於此。甲骨文市值在1996達到280億美元。隨著信息技術和市場的發展，人們發現雖然關系數據庫系統的技術已經成熟，但其局限性也是顯而易見的:它可以很好地處理所謂的“表格數據”，但對於技術領域出現的越來越復雜的數據類型卻無能為力。20世紀90年代以後，技術界壹直在研究和尋求新的數據庫系統。但在新數據庫系統的發展方向是什麽的問題上，業界壹度相當困惑。受當時技術趨勢的影響，人們花費了大量的精力在“面向對象數據庫系統”或簡稱“面向對象數據庫系統”的研究上。值得壹提的是，美國Stonebraker教授提出的面向對象的關系數據庫理論壹度受到業界的青睞。當時，Stonebraker本人被Informix花大價錢聘請為首席技術官。

然而，幾年的發展表明，面向對象關系數據庫系統產品的市場發展並不理想。理論上的完善並沒有帶來市場的熱烈反響。其失敗的主要原因是，這種數據庫產品的主要設計思想是試圖用新的數據庫系統取代現有的數據庫系統。對於很多使用數據庫系統多年，積累了大量工作數據的客戶，尤其是大客戶來說，新舊數據轉換帶來的巨大工作量和巨大費用是難以承受的。此外，面向對象的關系數據庫系統使得查詢語言極其復雜，這使得無論是數據庫開發者還是應用客戶都將其復雜的應用技術視為壹條令人望而生畏的道路。20世紀60年代末，出現了壹種新的數據庫軟件——決策支持系統(DSS)，旨在使管理者在決策過程中更有效地利用數據信息。於是在1970，第壹個在線分析處理工具——Express誕生了。其他決策支持系統緊隨其後，其中許多是由公司的IT部門開發的。

1985，第壹個商業智能系統由隱喻計算機系統有限公司開發為Procter & amp；由Gamble公司開發，主要用於連接銷售信息和零售掃描儀數據。同年，Pilot軟件公司開始銷售第壹個商用客戶機/服務器執行信息系統——指揮中心。也是在這壹年，加州大學伯克利分校的Ingres項目演變為Postgres，目標是開發壹個面向對象的數據庫。次年，Graphael公司開發了第壹個商用對象數據庫系統——Gbase。

1988年，IBM研究人員Barry Devlin和Paul Murphy發明了壹個新名詞——信息倉庫。之後，IT廠商開始搭建實驗性的數據倉庫。1991年，W.H .比爾·恩門出版了《如何構建數據倉庫》壹書，使數據倉庫真正開始應用。

1991: W.H. "Bill "在mon發表了《構建數據倉庫》。

20世紀90年代，隨著基於PC的客戶機/服務器計算模式和企業軟件包的廣泛采用，數據管理的變革基本完成。數據管理不再僅僅是存儲和管理數據，而是轉變為用戶需要的各種數據管理方式。互聯網的異軍突起和XML語言的出現為數據庫系統的發展開辟了壹個新的天地。