第壹章數據結構與算法
1.1 算法
算法:是指解題方案的準確而完整的描述。
算法不等於程序,也不等計算機方法,程序的編制不可能優於算法的設計。
算法的基本特征:是壹組嚴謹地定義運算順序的規則,每壹個規則都是有效的,是明確的,此順序將在有限的次數下終止。特征包括:
(1)可行性;
(2)確定性,算法中每壹步驟都必須有明確定義,不充許有模棱兩可的解釋,不允許有多義性;
(3)有窮性,算法必須能在有限的時間內做完,即能在執行有限個步驟後終止,包括合理的執行時間的含義;
(4)擁有足夠的情報。
算法的基本要素:壹是對數據對象的運算和CAO作;二是算法的控制結構。
指令系統:壹個計算機系統能執行的所有指令的集合。
基本運算和CAO作包括:算術運算、邏輯運算、關系運算、數據傳輸。
算法的控制結構:順序結構、選擇結構、循環結構。
算法基本設計方法:列舉法、歸納法、遞推、遞歸、減鬥遞推技術、回溯法。
算法復雜度:算法時間復雜度和算法空間復雜度。
算法時間復雜度是指執行算法所需要的計算工作量。
算法空間復雜度是指執行這個算法所需要的內存空間。
1.2 數據結構的基本基本概念
數據結構研究的三個方面:
(1)數據集合中各數據元素之間所固有的邏輯關系,即數據的邏輯結構;
(2)在對數據進行處理時,各數據元素在計算機中的存儲關系,即數據的存儲結構;
(3)對各種數據結構進行的運算。
數據結構是指相互有關聯的數據元素的集合。
數據的邏輯結構包含:
(1)表示數據元素的信息;
(2)表示各數據元素之間的前後件關系。
數據的存儲結構有順序、鏈接、索引等。
線性結構條件:
(1)有且只有壹個根結點;
(2)每壹個結點最多有壹個前件,也最多有壹個後件。
非線性結構:不滿足線性結構條件的數據結構。
1.3 線性表及其順序存儲結構
線性表由壹組數據元素構成,數據元素的位置只取決於自己的序號,元素之間的相對位置是線性的。
在復雜線性表中,由若幹項數據元素組成的數據元素稱為記錄,而由多個記錄構成的線性表又稱為文件。
非空線性表的結構特征:
(1)且只有壹個根結點a1,它無前件;
(2)有且只有壹個終端結點an,它無後件;
(3)除根結點與終端結點外,其他所有結點有且只有壹個前件,也有且只有壹個後件。結點個數n稱為線性表的長度,當n=0時,稱為空表。
線性表的順序存儲結構具有以下兩個基本特點:
(1)線性表中所有元素的所占的存儲空間是連續的;
(2)線性表中各數據元素在存儲空間中是按邏輯順序依次存放的。
ai的存儲地址為:ADR(ai)=ADR(a1)+(i-1)k,,ADR(a1)為第壹個元素的地址,k代表每個元素占的字節數。
順序表的運算:插入、刪除。 (詳見14--16頁)
1.4 棧和隊列
棧是限定在壹端進行插入與刪除的線性表,允許插入與刪除的壹端稱為棧頂,不允許插入與刪除的另壹端稱為棧底。
棧按照“先進後出”(FILO)或“後進先出”(LIFO)組織數據,棧具有記憶作用。用top表示棧頂位置,用bottom表示棧底。
棧的基本運算:(1)插入元素稱為入棧運算;(2)刪除元素稱為退棧運算;(3)讀棧頂元素是將棧頂元素賦給壹個指定的變量,此時指針無變化。
隊列是指允許在壹端(隊尾)進入插入,而在另壹端(隊頭)進行刪除的線性表。Rear指針指向隊尾,front指針指向隊頭。
隊列是“先進行出”(FIFO)或“後進後出”(LILO)的線性表。
隊列運算包括(1)入隊運算:從隊尾插入壹個元素;(2)退隊運算:從隊頭刪除壹個元素。
循環隊列:s=0表示隊列空,s=1且front=rear表示隊列滿
1.5 線性鏈表
數據結構中的每壹個結點對應於壹個存儲單元,這種存儲單元稱為存儲結點,簡稱結點。
結點由兩部分組成:(1)用於存儲數據元素值,稱為數據域;(2)用於存放指針,稱為指針域,用於指向前壹個或後壹個結點。
在鏈式存儲結構中,存儲數據結構的存儲空間可以不連續,各數據結點的存儲順序與數據元素之間的邏輯關系可以不壹致,而數據元素之間的邏輯關系是由指針域來確定的。
鏈式存儲方式即可用於表示線性結構,也可用於表示非線性結構。
線性鏈表,HEAD稱為頭指針,HEAD=NULL(或0)稱為空表,如果是兩指針:左指針(Llink)指向前件結點,右指針(Rlink)指向後件結點。
線性鏈表的基本運算:查找、插入、刪除。
1.6 樹與二*樹
樹是壹種簡單的非線性結構,所有元素之間具有明顯的層次特性。
在樹結構中,每壹個結點只有壹個前件,稱為父結點,沒有前件的結點只有壹個,稱為樹的根結點,簡稱樹的根。每壹個結點可以有多個後件,稱為該結點的子結點。沒有後件的結點稱為葉子結點。
在樹結構中,壹個結點所擁有的後件的個數稱為該結點的度,所有結點中最大的度稱為樹的度。樹的最大層次稱為樹的深度。
二*樹的特點:(1)非空二*樹只有壹個根結點;(2)每壹個結點最多有兩棵子樹,且分別稱為該結點的左子樹與右子樹。
二*樹的基本性質:
(1)在二*樹的第k層上,最多有2k-1(k≥1)個結點;
(2)深度為m的二*樹最多有2m-1個結點;
(3)度為0的結點(即葉子結點)總是比度為2的結點多壹個;
(4)具有n個結點的二*樹,其深度至少為[log2n]+1,其中[log2n]表示取log2n的整數部分;
(5)具有n個結點的完全二*樹的深度為[log2n]+1;
(6)設完全二*樹***有n個結點。如果從根結點開始,按層序(每壹層從左到右)用自然數1,2,….n給結點進行編號(k=1,2….n),有以下結論:
①若k=1,則該結點為根結點,它沒有父結點;若k>1,則該結點的父結點編號為INT(k/2);
②若2k≤n,則編號為k的結點的左子結點編號為2k;否則該結點無左子結點(也無右子結點);
③若2k+1≤n,則編號為k的結點的右子結點編號為2k+1;否則該結點無右子結點。
滿二*樹是指除最後壹層外,每壹層上的所有結點有兩個子結點,則k層上有2k-1個結點深度為m的滿二*樹有2m-1個結點。
完全二*樹是指除最後壹層外,每壹層上的結點數均達到最大值,在最後壹層上只缺少右邊的若幹結點。
二*樹存儲結構采用鏈式存儲結構,對於滿二*樹與完全二*樹可以按層序進行順序存儲。
二*樹的遍歷:
(1)前序遍歷(DLR),首先訪問根結點,然後遍歷左子樹,最後遍歷右子樹;
(2)中序遍歷(LDR),首先遍歷左子樹,然後訪問根結點,最後遍歷右子樹;
(3)後序遍歷(LRD)首先遍歷左子樹,然後訪問遍歷右子樹,最後訪問根結點。
1.7 查找技術
順序查找的使用情況:
(1)線性表為無序表;
(2)表采用鏈式存儲結構。
二分法查找只適用於順序存儲的有序表,對於長度為n的有序線性表,最壞情況只需比較log2n次。
1.8 排序技術
排序是指將壹個無序序列整理成按值非遞減順序排列的有序序列。
交換類排序法:(1)冒泡排序法,需要比較的次數為n(n-1)/2; (2)快速排序法。
插入類排序法:(1)簡單插入排序法,最壞情況需要n(n-1)/2次比較;(2)希爾排序法,最壞情況需要O(n1.5)次比較。
選擇類排序法:(1)簡單選擇排序法,
最壞情況需要n(n-1)/2次比較;(2)堆排序法,最壞情況需要O(nlog2n)次比較。
第二章程序設計基礎
2.1 程序設計設計方法和風格
如何形成良好的程序設計風格
1、源程序文檔化; 2、數據說明的方法;
3、語句的結構; 4、輸入和輸出。
註釋分序言性註釋和功能性註釋,語句結構清晰第壹、效率第二。
2.2 結構化程序設計
結構化程序設計方法的四條原則是:1. 自頂向下;2. 逐步求精;3.模塊化;4.限制使用goto語句。
結構化程序的基本結構和特點:
(1)順序結構:壹種簡單的程序設計,最基本、最常用的結構;
(2)選擇結構:又稱分支結構,包括簡單選擇和多分支選擇結構,可根據條件,判斷應該選擇哪壹條分支來執行相應的語句序列;
(3)重復結構:又稱循環結構,可根據給定條件,判斷是否需要重復執行某壹相同程序段。
2.3 面向對象的程序設計
面向對象的程序設計:以60年代末挪威奧斯陸大學和挪威計算機中心研制的SIMULA語言為標誌。
面向對象方法的優點:
(1)與人類習慣的思維方法壹致;
(2)穩定性好;
(3)可重用性好;
(4)易於開發大型軟件產品;
(5)可維護性好。
對象是面向對象方法中最基本的概念,可以用來表示客觀世界中的任何實體,對象是實體的抽象。
面向對象的程序設計方法中的對象是系統中用來描述客觀事物的壹個實體,是構成系統的壹個基本單位,由壹組表示其靜態特征的屬性和它可執行的壹組CAO作組成。
屬性即對象所包含的信息,CAO作描述了對象執行的功能,CAO作也稱為方法或服務。
對象的基本特點:
(1)標識惟壹性;
(2)分類性;
(3)多態性;
(4)封裝性;
(5)模塊獨立性好。
類是指具有***同屬性、***同方法的對象的集合。所以類是對象的抽象,對象是對應類的壹個實例。
消息是壹個實例與另壹個實例之間傳遞的信息。
消息的組成包括(1)接收消息的對象的名稱;(2)消息標識符,也稱消息名;(3)零個或多個參數。
繼承是指能夠直接獲得已有的性質和特征,而不必重復定義他們。
繼承分單繼承和多重繼承。單繼承指壹個類只允許有壹個父類,多重繼承指壹個類允許有多個父類。
多態性是指同樣的消息被不同的對象接受時可導致完全不同的行動的現象。
第三章軟件工程基礎
3.1 軟件工程基本概念
計算機軟件是包括程序、數據及相關文檔的完整集合。
軟件的特點包括:
(1)軟件是壹種邏輯實體;
(2)軟件的生產與硬件不同,它沒有明顯的制作過程;
(3)軟件在運行、使用期間不存在磨損、老化問題;
(4)軟件的開發、運行對計算機系統具有依賴性,受計算機系統的限制,這導致了軟件移植的問題;
(5)軟件復雜性高,成本昂貴;
(6)軟件開發涉及諸多的社會因素。
軟件按功能分為應用軟件、系統軟件、支撐軟件(或工具軟件)。
軟件危機主要表現在成本、質量、生產率等問題。
軟件工程是應用於計算機軟件的定義、開發和維護的壹整套方法、工具、文檔、實踐標準和工序。
軟件工程包括3個要素:方法、工具和過程。
軟件工程過程是把軟件轉化為輸出的壹組彼此相關的資源和活動,包含4種基本活動:
(1)P——軟件規格說明;
(2)D——軟件開發;
(3)C——軟件確認;
(4)A——軟件演進。
軟件周期:軟件產品從提出、實現、使用維護到停止使用退役的過程。
軟件生命周期三個階段:軟件定義、軟件開發、運行維護,主要活動階段是:
(1)可行性研究與計劃制定;
(2)需求分析;
(3)軟件設計;
(4)軟件實現;
(5)軟件測試;
(6)運行和維護。
軟件工程的目標和與原則:
目標:在給定成本、進度的前提下,開發出具有有效性、可靠性、可理解性、可維護性、可重用性、可適應性、可移植性、可追蹤性和可互CAO作性且滿足用戶需求的產品。
基本目標:付出較低的開發成本;達到要求的軟件功能;取得較好的軟件性能;開發軟件易於移植;需要較低的費用;能按時完成開發,及時交付使用。
基本原則:抽象、信息隱蔽、模塊化、局部化、確定性、壹致性、完備性和可驗證性。
軟件工程的理論和技術性研究的內容主要包括:軟件開發技術和軟件工程管理。
軟件開發技術包括:軟件開發方法學、開發過程、開發工具和軟件工程環境。
軟件工程管理包括:軟件管理學、軟件工程經濟學、軟件心理學等內容。
軟件管理學包括人員組織、進度安排、質量保證、配置管理、項目計劃等。
軟件工程原則包括抽象、信息隱蔽、模塊化、局部化、確定性、壹致性、完備性和可驗證性。
3.2 結構化分析方法
結構化方法的核心和基礎是結構化程序設計理論。
需求分析方法有(1)結構化需求分析方法; (2)面向對象的分析的方法。
從需求分析建立的模型的特性來分:靜態分析和動態分析。
結構化分析方法的實質:著眼於數據流,自頂向下,逐層分解,建立系統的處理流程,以數據流圖和數據字典為主要工具,建立系統的邏輯模型。
結構化分析的常用工具
(1)數據流圖; (2)數據字典; (3)判定樹; (4)判定表。
數據流圖:描述數據處理過程的工具,是需求理解的邏輯模型的圖形表示,它直接支持系統功能建模。
數據字典:對所有與系統相關的數據元素的壹個有組織的列表,以及精確的、嚴格的定義,使得用戶和系統分析員對於輸入、輸出、存儲成分和中間計算結果有***同的理解。
判定樹:從問題定義的文字描述中分清哪些是判定的條件,哪些是判定的結論,根據描述材料中的連接詞找出判定條件之間的從屬關系、並列關系、選擇關系,根據它們構造判定樹。
判定表:與判定樹相似,當數據流圖中的加工要依賴於多個邏輯條件的取值,即完成該加工的壹組動作是由於某壹組條件取值的組合而引發的,使用判定表描述比較適宜。
數據字典是結構化分析的核心。
軟件需求規格說明書的特點:
(1)正確性;
(2)無岐義性;
(3)完整性;
(4)可驗證性;
(5)壹致性;
(6)可理解性;
(7)可追蹤性。
3.3 結構化設計方法
軟件設計的基本目標是用比較抽象概括的方式確定目標系統如何完成預定的任務,軟件設計是確定系統的物理模型。
軟件設計是開發階段最重要的步驟,是將需求準確地轉化為完整的軟件產品或系統的唯壹途徑。
從技術觀點來看,軟件設計包括軟件結構設計、數據設計、接口設計、過程設計。
結構設計:定義軟件系統各主要部件之間的關系。
數據設計:將分析時創建的模型轉化為數據結構的定義。
接口設計:描述軟件內部、軟件和協作系統之間以及軟件與人之間如何通信。
過程設計:把系統結構部件轉換成軟件的過程描述。
從工程管理角度來看:概要設計和詳細設計。
軟件設計的壹般過程:軟件設計是壹個叠代的過程;先進行高層次的結構設計;後進行低層次的過程設計;穿插進行數據設計和接口設計。
衡量軟件模塊獨立性使用耦合性和內聚性兩個定性的度量標準。
在程序結構中各模塊的內聚性越強,則耦合性越弱。優秀軟件應高內聚,低耦合。
軟件概要設計的基本任務是:
(1)設計軟件系統結構; (2)數據結構及數據庫設計;
(3)編寫概要設計文檔; (4)概要設計文檔評審。
模塊用壹個矩形表示,箭頭表示模塊間的調用關系。
在結構圖中還可以用帶註釋的箭頭表示模塊調用過程中來回傳遞的信息。還可用帶實心圓的箭頭表示傳遞的是控制信息,空心圓箭心表示傳遞的是數據。
結構圖的基本形式:基本形式、順序形式、重復形式、選擇形式。
結構圖有四種模塊類型:傳入模塊、傳出模塊、變換模塊和協調模塊。
典型的數據流類型有兩種:變換型和事務型。
變換型系統結構圖由輸入、中心變換、輸出三部分組成。
事務型數據流的特點是:接受壹項事務,根據事務處理的特點和性質,選擇分派壹個適當的處理單元,然後給出結果。
詳細設計:是為軟件結構圖中的每壹個模塊確定實現算法和局部數據結構,用某種選定的表達工具表示算法和數據結構的細節。
常見的過程設計工具有:圖形工具(程序流程圖)、表格工具(判定表)、語言工具(PDL)。
3.4 軟件測試
軟件測試定義:使用人工或自動手段來運行或測定某個系統的過程,其目的在於檢驗它是否滿足規定的需求或是弄清預期結果與實際結果之間的差別。
軟件測試的目的:發現錯誤而執行程序的過程。
軟件測試方法:靜態測試和動態測試。
靜態測試包括代碼檢查、靜態結構分析、代碼質量度量。不實際運行軟件,主要通過人工進行。
動態測試:是基本計算機的測試,主要包括白盒測試方法和黑盒測試方法。
白盒測試:在程序內部進行,主要用於完成軟件內部CAO作的驗證。主要方法有邏輯覆蓋、基本基路徑測試。
黑盒測試:主要診斷功能不對或遺漏、界面錯誤、數據結構或外部數據庫訪問錯誤、性能錯誤、初始化和終止條件錯,用於軟件確認。主要方法有等價類劃分法、邊界值分析法、錯誤推測法、因果圖等。
軟件測試過程壹般按4個步驟進行:單元測試、集成測試、驗收測試(確認測試)和系統測試。
3.5 程序的調試
程序調試的任務是診斷和改正程序中的錯誤,主要在開發階段進行。
程序調試的基本步驟:
(1)錯誤定位;
(2)修改設計和代碼,以排除錯誤;
(3)進行回歸測試,防止引進新的錯誤。
軟件調試可分表靜態調試和動態調試。靜態調試主要是指通過人的思維來分析源程序代碼和排錯,是主要的設計手段,而動態調試是輔助靜態調試。主要調試方法有:
(1)強行排錯法;
(2)回溯法;
(3)原因排除法。
第四章 數據庫設計基礎
4.1 數據庫系統的基本概念
數據:實際上就是描述事物的符號記錄。
數據的特點:有壹定的結構,有型與值之分,如整型、實型、字符型等。而數據的值給出了符合定型的值,如整型值15。
數據庫:是數據的集合,具有統壹的結構形式並存放於統壹的存儲介質內,是多種應用數據的集成,並可被各個應用程序***享。
數據庫存放數據是按數據所提供的數據模式存放的,具有集成與***享的特點。
數據庫管理系統:壹種系統軟件,負責數據庫中的數據組織、數據CAO縱、數據維護、控制及保護和數據服務等,是數據庫的核心。
數據庫管理系統功能:
(1)數據模式定義:即為數據庫構建其數據框架;
(2)數據存取的物理構建:為數據模式的物理存取與構建提供有效的存取方法與手段;
(3)數據CAO縱:為用戶使用數據庫的數據提供方便,如查詢、插入、修改、刪除等以及簡單的算術運算及統計;
(4)數據的完整性、安生性定義與檢查;
(5)數據庫的並發控制與故障恢復;
(6)數據的服務:如拷貝、轉存、重組、性能監測、分析等。
為完成以上六個功能,數據庫管理系統提供以下的數據語言:
(1)數據定義語言:負責數據的模式定義與數據的物理存取構建;
(2)數據CAO縱語言:負責數據的CAO縱,如查詢與增、刪、改等;
(3)數據控制語言:負責數據完整性、安全性的定義與檢查以及並發控制、故障恢復等。
數據語言按其使用方式具有兩種結構形式:交互式命令(又稱自含型或自主型語言)宿主型語言(壹般可嵌入某些宿主語言中)。
數據庫管理員:對數據庫進行規劃、設計、維護、監視等的專業管理人員。
數據庫系統:由數據庫(數據)、數據庫管理系統(軟件)、數據庫管理員(人員)、硬件平臺(硬件)、軟件平臺(軟件)五個部分構成的運行實體。
數據庫應用系統:由數據庫系統、應用軟件及應用界面三者組成。
文件系統階段:提供了簡單的數據***享與數據管理能力,但是它無法提供完整的、統壹的、管理和數據***享的能力。
層次數據庫與網狀數據庫系統階段 :為統壹與***享數據提供了有力支撐。
關系數據庫系統階段
數據庫系統的基本特點:數據的集成性 、數據的高***享性與低冗余性 、數據獨立性(物理獨立性與邏輯獨立性)、數據統壹管理與控制。
數據庫系統的三級模式:
(1)概念模式:數據庫系統中全局數據邏輯結構的描述,全體用戶公***數據視圖;
(2)外模式:也稱子模式與用戶模式。是用戶的數據視圖,也就是用戶所見到的數據模式;
(3)內模式:又稱物理模式,它給出了數據庫物理存儲結構與物理存取方法。
數據庫系統的兩級映射:
(1)概念模式到內模式的映射;
(2)外模式到概念模式的映射。
4.2 數據模型
數據模型的概念:是數據特征的抽象,從抽象層次上描述了系統的靜態特征、動態行為和約束條件,為數據庫系統的信息表與CAO作提供壹個抽象的框架。描述了數據結構、數據CAO作及數據約束。
E-R模型的基本概念
(1)實體:現實世界中的事物;
(2)屬性:事物的特性;
(3)聯系:現實世界中事物間的關系。實體集的關系有壹對壹、壹對多、多對多的聯系。
E-R模型三個基本概念之間的聯接關系:實體是概念世界中的基本單位,屬性有屬性域,每個實體可取屬性域內的值。壹個實體的所有屬性值叫元組。
E-R模型的圖示法:(1)實體集表示法; (2)屬性表法; (3)聯系表示法。
層次模型的基本結構是樹形結構,具有以下特點:
(1)每棵樹有且僅有壹個無雙親結點,稱為根;
(2)樹中除根外所有結點有且僅有壹個雙親。
從圖論上看,網狀模型是壹個不加任何條件限制的無向圖。
關系模型采用二維表來表示,簡稱表,由表框架及表的元組組成。壹個二維表就是壹個關系。
在二維表中凡能唯壹標識元組的最小屬性稱為鍵或碼。從所有侯選健中選取壹個作為用戶使用的鍵稱主鍵。表A中的某屬性是某表B的鍵,則稱該屬性集為A的外鍵或外碼。
關系中的數據約束:
(1)實體完整性約束:約束關系的主鍵中屬性值不能為空值;
(2)參照完全性約束:是關系之間的基本約束;
(3)用戶定義的完整性約束:它反映了具體應用中數據的語義要求。
4.3關系代數
關系數據庫系統的特點之壹是它建立在數據理論的基礎之上,有很多數據理論可以表示關系模型的數據CAO作,其中最為著名的是關系代數與關系演算。
關系模型的基本運算:
(1)插入 (2)刪除 (3)修改 (4)查詢(包括投影、選擇、笛卡爾積運算)
4.4 數據庫設計與管理
數據庫設計是數據應用的核心。
數據庫設計的兩種方法:
(1)面向數據:以信息需求為主,兼顧處理需求;
(2)面向過程:以處理需求為主,兼顧信息需求。
數據庫的生命周期:需求分析階段、概念設計階段、邏輯設計階段、物理設計階段、編碼階段、測試階段、運行階段、進壹步修改階段。
需求分析常用結構析方法和面向對象的方法。結構化分析(簡稱SA)方法用自頂向下、逐層分解的方式分析系統。用數據流圖表達數據和處理過程的關系。對數據庫設計來講,數據字典是進行詳細的數據收集和數據分析所獲得的主要結果。
數據字典是各類數據描述的集合,包括5個部分:數據項、數據結構、數據流(可以是數據項,也可以是數據結構)、數據存儲、處理過程。
數據庫概念設計的目的是分析數據內在語義關系。設計的方法有兩種
(1)集中式模式設計法(適用於小型或並不復雜的單位或部門);
(2)視圖集成設計法。
設計方法:E-R模型與視圖集成。
視圖設計壹般有三種設計次序:自頂向下、由底向上、由內向外。
視圖集成的幾種沖突:命名沖突、概念沖突、域沖突、約束沖突。
關系視圖設計:關系視圖的設計又稱外模式設計。
關系視圖的主要作用:
(1)提供數據邏輯獨立性;
(2)能適應用戶對數據的不同需求;
(3)有壹定數據保密功能。
數據庫的物理設計主要目標是對數據內部物理結構作調整並選擇合理的存取路徑,以提高數據庫訪問速度有效利用存儲空間。壹般RDBMS中留給用戶參與物理設計的內容大致有索引設計、集成簇設計和分區設計。
數據庫管理的內容:
(1)數據庫的建立;
(2)數據庫的調整;
(3)數據庫的重組;
(4)數據庫安全性與完整性控制;
(5)數據庫的故障恢復;
(6)數據庫監控。