當前位置:成語大全網 - 書法字典 - 什麽是數據庫?

什麽是數據庫?

數據庫

數據庫開發階段大致可以分為以下幾個階段:

人工管理階段;

文件系統階段;

數據庫系統階段;

高級數據庫階段。

當人們從不同的角度描述這個概念時,他們有不同的定義(當然是描述性的)。例如,數據庫被稱為“記錄保存系統”(這個定義強調數據庫是若幹記錄的集合)。再比如,數據庫是“人們為了解決特定任務,以壹定的組織方式存儲在壹起的相關數據的集合”(這個定義側重於數據的組織)。更重要的是,數據庫被稱為“數據倉庫”。當然,這種說法雖然形象,但並不嚴謹。

嚴格地說,數據庫是“按照數據結構組織、存儲和管理數據的倉庫”。在經濟管理的日常工作中,往往需要將壹些相關數據放入這樣的“倉庫”,根據管理的需要進行處理。比如企事業單位的人事部門,往往存儲著員工的基本信息(工號、姓名、年齡、性別、籍貫、工資、簡歷等。)在表20.6.3中,可以看作是壹個數據庫。有了這個“數據倉庫”,我們可以根據需要隨時查詢壹個員工的基本情況,還可以查詢工資在壹定範圍內的員工人數,等等。如果這些工作都可以在計算機上自動進行,那麽我們的人事管理就可以達到壹個很高的水平。此外,在財務管理、倉庫管理和生產管理中,需要建立許多這樣的“數據庫”,以便利用計算機實現財務、倉庫和生產的自動化管理。

J.馬丁對數據庫給出了相對完整的定義:數據庫是存儲在壹起的相關數據的集合,是結構化的,沒有有害的或不必要的冗余,服務於多種應用;數據的存儲獨立於使用它的程序;向數據庫中插入新數據、修改和檢索原始數據可以以通用和可控的方式進行。當壹個系統中有幾個在結構上完全分離的數據庫時,這個系統就包含了壹個“數據庫集合”。

數據庫的優勢

使用數據庫可以帶來很多好處:比如減少了數據的冗余,從而大大節省了數據的存儲空間;實現數據資源的充分享受等等。此外,數據庫技術還為用戶提供了壹種非常簡單的使用手段,使得用戶可以很容易地編寫數據庫應用程序。特別是近年來出現的微機關系數據庫管理系統dBASELL,具有操作直觀、使用靈活、編程方便、環境適應性廣(常見的16位計算機,如IBM/PC/XT、國產長城0520等,可運行各種軟件)、數據處理能力強等優點。數據庫正在中國得到廣泛應用,它將成為經濟管理的有力工具。

數據庫通過DBMS-數據庫管理系統軟件實現數據的存儲、管理和使用。dBASELL是壹種數據庫管理系統軟件。

數據庫結構和數據庫類型

數據庫通常分為三種類型:層次數據庫、網絡數據庫和關系數據庫。不同的數據庫按照不同的數據結構連接和組織。

1.數據結構模型

(1)數據結構

所謂數據結構,是指數據的組織形式或者數據之間的聯系。如果D表示數據,R表示數據對象之間的關系集,則DS = (d,R)稱為數據結構。比如有壹個電話簿,裏面記錄了n個人的名字和對應的電話號碼。為了方便查找某人的電話號碼,姓名和號碼按字典順序排列,對應的電話號碼後接姓名。這樣,如果妳想找壹個人的電話號碼(假設他名字的第壹個字母是Y),妳只需要找到那些以Y開頭的名字就可以了,在這個例子中,數據集D是名字和電話號碼,它們之間的關系R是按照字典順序排列的,它對應的數據結構是DS = (d,R),也就是壹個數組。(2)數據結構的類型

數據結構分為數據的邏輯結構和物理結構。數據的邏輯結構是從邏輯的角度(即數據的聯系和組織)來觀察和分析數據,而不考慮數據的存儲位置。數據的物理結構是指存儲在計算機中的數據的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也叫存儲結構。本節只研究數據的邏輯結構,反映和實現數據連接的方法稱為數據模型。

目前比較流行的數據模型有三種,分別是根據圖論建立的層次結構模型和網絡結構模型以及根據關系理論建立的關系結構模型。

2.分層、網狀和關系數據庫系統

(1)層次結構模型

層次結構模型本質上是壹棵有根節點的有向有序樹(數學上“樹”定義為無環連通圖)。例如,圖20.6.4是壹所高等院校的組織結構圖。這個組織結構圖就像壹棵樹。學校系是根(稱為根節點),系、專業、老師、學生是分支(稱為節點),根與分支的連接稱為邊,根與邊的比值為1:N,即只有壹個根,N個分支。這種數據結構模型的壹般結構如圖20.6.5所示。

圖20.6.4高校組織結構圖圖20.6.5層次結構模型

在圖20.6.5中,Ri (I = 1,2,...6)代表記錄(即數據的集合),其中R1為根節點(如果把RI看作壹個家族,R1為祖先,是R2、R3和R4的父母,而R2、R3和R4。R2、R4、R5和R6也被稱為葉節點(即無子女節點)。這樣RI (I = 1,2,…6)就形成了壹個以R1為根的樹,這是壹個層次化的數據結構模型。

按照層次模型建立的數據庫系統稱為層次模型數據庫系統。Ims(信息管理系統)是其典型代表。

(2)網絡結構模型

在圖20.6.6中,給出了壹個醫院中醫生、病房和病人之間的關系。即每個醫生負責治療三個病人,每個病房可以容納壹到四個病人。如果把醫生看成壹個數據集,病人和病房是另外兩個數據集,那麽醫生、病人和病房的比例關系就是M:N:P(即M個醫生,N個病人,P個病房)。這種數據結構是壹種網狀數據結構,其壹般結構模型如圖20.6.7所示。在圖中,記錄ri (I = 1,2,8)滿足以下條件:

①可以有多個節點沒有父節點(如R1,R2,R3)。

②至少有壹個節點有多個父節點。在“醫生、病人、病房”的情況下,“醫生集”有幾個節點(M個醫生節點)沒有“父母”,而“病房”集有P個節點(病房)和多個“父母”(病人)。

圖20.6.6醫生、病房和患者之間的關系

圖20.6.7網絡結構模型

按照網格數據結構建立的數據庫系統稱為網格數據庫系統,其典型代表是DBTG(Data Base Task Group)。網格數據結構可以通過數學方法轉換成分層數據結構。

(3)關系結構模型

關系數據結構將壹些復雜的數據結構簡化為簡單的二元關系(即二維表格形式)。例如,某單位的員工關系是二元關系(見表20.6.8)。這種四行六列的表格每壹列稱為壹個字段(即屬性),字段名相當於標題欄中的標題(屬性名);表格的每壹行都是包含六個屬性(工號、姓名、年齡、性別、職位、工資)的六元組,也就是壹個人的記錄。這張表清楚地反映了本單位職工的基本情況。

表20.6.8員工基本信息

通常,壹個m行n列的二維表格的結構如表20.6.9所示。

表中的每壹行代表壹個記錄值,每壹列代表壹個屬性(即字段或數據項)。表1 * *中有m條記錄。每個記錄包含n個屬性。

作為關系二維表,必須滿足以下條件:

(1)表中的每壹列都必須是基本數據項(即不能再分解)。(2)表中的每壹列必須具有相同的數據類型(如字符型或數值型)。(3)表中每列的名稱必須唯壹。(4)表中不應該有內容完全相同的行。(5)行和列的順序不影響表中所表達的信息的含義。

由關系數據結構組成的數據庫系統稱為關系數據庫系統。

在關系數據庫中,幾乎所有對數據的操作都是基於壹個或多個關系表,通過對這些關系表進行分類、合並、連接或選擇來實現數據管理。DBASEII是這類數據庫管理系統的典型代表。對於壹個實際應用問題(比如人事管理),有時需要多種關系才能實現。與dBASEII建立的關系稱為數據庫(或數據庫文件),對應多個關系建立的多個數據庫稱為數據庫系統。dBASEII的另壹個重要功能是通過建立命令文件來使用和管理數據庫。數據庫系統對應的命令序列文件稱為數據庫的應用系統。所以簡單來說,壹個關系叫做壹個數據庫,幾個數據庫可以組成壹個數據庫系統。數據庫系統可以派生出各種類型的輔助文件,建立其應用系統。

數據庫的要求和特征

為了使各種數據庫系統充分發揮其優勢,有必要對數據庫管理系統的使用提出壹些明確的要求。

1.建立數據庫文件的要求

(1)盡量減少數據重復,使數據具有最小冗余。在計算機早期應用的文件管理系統中,由於數據文件是由用戶創建的,幾個用戶即使有很多相同的數據也要放在自己的文件中,造成了存儲數據的大量重復和存儲空間的浪費。數據庫技術似乎可以克服這個缺點,所以在組織數據存儲時應該避免冗余。

(2)提高數據的利用率,讓眾多用戶享受到數據資源。

(3)註意維護數據的完整性。這對於壹些部門(如統計局、銀行等)尤為重要。)需要歷史數據進行預測和決策。

(4)註意相同數據描述方法的壹致性,這樣數據操作就不會混淆。比如壹個人的學歷在人事檔案裏是大學畢業,在科技檔案裏卻是大學學歷,這就容易造成混淆。

(5)對於壹些需要保密的數據,必須增加保密措施。

(6)數據的查找率高,根據需要及時維護數據。

2.數據庫文件的特征

無論使用哪種數據庫管理系統,它們創建的數據庫文件都可以看作是具有相同性質的記錄的集合,因此這些數據庫文件都具有相同的特征:

(1)文件具有相同的記錄格式和相等的長度。

(2)不同的行是不同的記錄,所以有不同的內容。

(3)不同的列代表不同的字段名,同壹列中數據的性質(屬性)是相同的。

(4)每行和每列的內容是不可分的,但行和列的順序不影響文件內容的表達。

3.文件的分類

主文件和事物文件是引用最多的文件。其他文件分類包括表格文件、備份文件和歸檔的輸出文件。這些文件將在下面描述。

(1)主文件。主文件是特定應用領域的永久性數據資源。主文件包含定期訪問以提供信息並經常更新以反映最新狀態的記錄。典型的主文件包括庫存文件、員工主文件和收集主文件。

(2)交易檔案。事務文件包含作為信息系統的數據活動(事務)的記錄。這些事務被批處理以形成事務文件。例如,從每周工資單卡記錄的數據被成批地存儲在交易文件中,然後根據工資單文件進行處理,以打印出工資單支票和工資單記錄簿。

(3)表格文件。表格文件就是表格。之所以在程序中不設計表格而單獨建立表格文件,是為了方便修改。例如,公用事業公司的稅率表或國稅局的稅率可以存儲在表文件中。

(4)備用文件。備用文件是現有生產文件的副本。壹旦生產文件被銷毀,可以使用備用文件重建生產文件。

(5)檔案。存檔文件不是為當前處理提供的,而是為歷史參考而保存的。例如,美國國稅局(IRS)可能要求檢查壹個人最近15年的歷史。事實上,歸檔文件只是給定時間內工作的“快照”。

(6)輸出文件。輸出文件包含要在打印機上打印、在屏幕上顯示或在繪圖儀上繪制的信息的數字圖像。輸出文件可以假脫機(存儲在輔助存儲設備上),只有在輸出設備可用時才進行實際輸出。