在信息社會中,充分有效地管理和利用各種信息資源是科學研究和決策管理的前提。數據庫技術是管理信息系統、辦公自動化系統、決策支持系統等各種信息系統的核心部分,是科學研究和決策管理的重要技術手段。
數據庫定義1:數據庫是建立在計算機存儲設備上,按照數據結構組織、存儲和管理數據的倉庫。
簡單來說,可以看作是電子文件櫃——存放電子文件的地方。用戶可以添加、截取、更新和刪除文檔中的數據。
在經濟管理的日常工作中,往往需要將壹些相關數據放入這樣的“倉庫”,根據管理的需要進行處理。
比如企事業單位的人事部門,往往存儲著員工的基本信息(工號、姓名、年齡、性別、籍貫、工資、簡歷等。)放在壹個表中,可以看作是壹個數據庫。有了這個“數據倉庫”,我們可以根據需要隨時查詢壹個員工的基本情況,還可以查詢工資在壹定範圍內的員工人數,等等。如果這些工作都可以在計算機上自動進行,那麽我們的人事管理就可以達到壹個很高的水平。此外,在財務管理、倉庫管理和生產管理中,需要建立許多這樣的“數據庫”,以便利用計算機實現財務、倉庫和生產的自動化管理。
數據庫的定義2:嚴格來說,數據庫是長時間存儲在計算機中的有組織的、令人愉快的數據集合。數據庫中的數據以壹定的數據模型進行組織、描述和存儲,具有冗余度最小、數據獨立性高、易於擴展的特點,可以在壹定範圍內被多個用戶共享。
這類數據集有以下特點:盡可能不重復,以最優的方式服務於特定組織的多種應用。其數據結構獨立於使用它的應用程序,數據的添加、刪除、修改和檢索由統壹的軟件管理和控制。從發展歷史來看,數據庫是數據管理的高級階段,是由文件管理系統發展起來的。
數據庫處理系統:數據庫是壹個單位或壹個應用領域的通用數據處理系統,存儲著屬於企事業單位、團體和個人的相關數據的集合。數據庫中的數據是從全局的角度建立的,並按照壹定的數據模型進行組織、描述和存儲。它的結構基於數據之間的自然關系,因此可以提供所有必要的訪問路徑,數據不再針對某個應用,而是針對整個組織,具有整體的結構特征。
數據庫中的數據是為許多用戶享受他們的信息而建立的,並且已經擺脫了特定程序的限制和約束。不同的用戶可以根據自己的用途使用數據庫中的數據;多個用戶可以同時享用數據庫中的數據資源,即不同的用戶可以同時訪問數據庫中的相同數據。數據的享受既滿足了用戶對信息內容的要求,也滿足了用戶之間信息交流的要求。
數據庫的基本結構:數據庫的基本結構分為三個層次,反映了觀察數據庫的三種不同視角。
由內部模式組成的數據庫稱為物理數據庫;由概念模式組成的數據稱為概念數據庫。由外部模式組成的數據庫稱為用戶數據庫。
(1)物理數據層。
它是數據庫的最內層,是實際存儲在物理存儲設備上的數據集合。這些數據是原始數據,由用戶處理,由內部模式描述的指令操作處理的位串、字符和字組成。
⑵概念數據層。
它是數據庫的中間層,是數據庫的整體邏輯表示。指出每個數據的邏輯定義和數據之間的邏輯關系是存儲記錄的集合。它涉及數據庫中所有對象的邏輯關系,而不是它們的物理條件,是數據庫管理員概念下的數據庫。
(3)用戶數據層。
它是用戶看到和使用的數據庫,代表壹個或壹些特定用戶使用的數據集,即邏輯記錄集。
不同級別的數據庫之間的關系通過映射進行轉換。
該數據庫的主要特點是:(1)實現了數據共享。
數據共享包括所有用戶可以同時訪問數據庫中的數據,用戶可以通過接口以各種方式使用數據庫並提供數據共享。
⑵減少數據冗余。
與文件系統相比,由於數據庫實現了數據共享,避免了用戶單獨創建應用文件。減少大量重復數據,降低數據冗余,保持數據壹致性。
(3)數據獨立性
數據的獨立性包括邏輯獨立性(數據庫和應用程序的邏輯結構相互獨立)和物理獨立性(數據物理結構的變化不影響數據的邏輯結構)。
(4)數據集中控制。
在文件管理模式下,數據處於去中心化狀態,不同的用戶或者同壹個用戶在不同的進程中對自己的文件無所作為。數據庫可以用來集中控制和管理數據,數據模型可以用來表達各種數據的組織和數據之間的關系。
⑸數據的壹致性和可維護性,確保數據的安全性和可靠性。
主要包括:①安全控制:防止數據丟失、錯誤更新和未授權使用;②完整性控制:保證數據的正確性、有效性和兼容性;③並發控制:在同壹時間段內,允許對數據的多次訪問,可以防止用戶之間的異常交互。
[6]故障恢復
數據庫管理系統提供的壹套方法可以及時發現並修復故障,從而防止數據被破壞。數據庫系統可以盡快恢復數據庫系統運行期間發生的故障,這些故障可能是物理或邏輯錯誤。比如系統誤操作導致的數據錯誤。
數據庫數據類型:數據庫通常分為三種類型:層次數據庫、網絡數據庫和關系數據庫。不同的數據庫按照不同的數據結構連接和組織。
1.數據結構模型
(1)數據結構
所謂數據結構,是指數據的組織形式或者數據之間的聯系。
如果D表示數據,R表示數據對象之間的關系集,則DS=(D,R)稱為數據結構。
比如有壹個電話簿,裏面記錄了n個人的名字和對應的電話號碼。為了方便查找某人的電話號碼,姓名和號碼按字典順序排列,對應的電話號碼後接姓名。這樣,如果妳想找壹個人的電話號碼(假設他名字的第壹個字母是Y),妳只需要找到那些以Y開頭的名字就可以了,在這個例子中,數據集D是名字和電話號碼,它們之間的關系R是按照字典順序排列的,它對應的數據結構是DS=(D,R),也就是壹個數組。
⑵數據結構類型
數據結構分為數據的邏輯結構和物理結構。
數據的邏輯結構是從邏輯的角度(即數據的聯系和組織)來觀察和分析數據,而不考慮數據的存儲位置;數據的物理結構是指存儲在計算機中的數據的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也叫存儲結構。
這裏只研究數據的邏輯結構,反映和實現數據連接的方法稱為數據模型。
目前流行的數據模型有三種,分別是根據圖論建立的層次結構模型和網絡結構模型以及根據關系理論建立的關系結構模型。
2.分層、網狀和關系數據庫系統
(1)層次結構模型
層次結構模型本質上是壹棵有根節點的有向有序樹(數學上“樹”定義為無環連通圖)。下圖是壹所高等院校的組織架構。這個組織結構圖就像壹棵樹。學校系是根(稱為根節點),系、專業、老師、學生是分支(稱為節點),根與分支的連接稱為邊,根與邊的比值為1:N,即只有壹個根,N個分支。
按照層次模型建立的數據庫系統稱為層次模型數據庫系統。Ims(信息管理系統)就是其典型代表。
⑵網絡結構模型
按照網狀數據結構建立的數據庫系統稱為網狀數據庫系統,其典型代表是DBTG(Database Task Group)。網格數據結構可以通過數學方法轉換成分層數據結構。
⑶關系結構模型
關系數據結構將壹些復雜的數據結構簡化為簡單的二元關系(即二維表格形式)。比如某單位的員工關系就是二元關系。
由關系數據結構組成的數據庫系統稱為關系數據庫系統。
在關系數據庫中,幾乎所有對數據的操作都是基於壹個或多個關系表,通過對這些關系表進行分類、合並、連接或選擇來實現數據管理。
DBASE是這類數據庫管理系統的典型代表。對於壹個實際應用問題(比如人事管理),有時需要多種關系才能實現。用dBASE建立的壹個關系稱為數據庫(或數據庫文件),對應多個關系建立的多個數據庫稱為數據庫系統。dBASE的另壹個重要功能是通過創建命令文件來使用和管理數據庫。數據庫系統對應的命令序列文件稱為數據庫的應用系統。
所以簡單來說,壹個關系叫做壹個數據庫,幾個數據庫可以組成壹個數據庫系統。數據庫系統可以派生出各種類型的輔助文件,建立其應用系統。
數據庫類型:網絡數據庫、關系數據庫、層次數據庫、面向對象數據庫等。商業應用主要是關系型數據庫,如Oracle、DB2、Sybase、MS SQL Server、Informax、MySQL等。