?信息時代的到來,無疑是信息技術,信息技術的核心,在核心,處理和存儲的信息。
2.1數據表示
2.1.1信息,數字和字符
1。信息代表
所存儲的數據的邏輯裝置具有兩種狀態,即,高電位和低電位,分別對應於“1”和“0”。在計算機中,如果所述的電位狀態的壹個信息單元,那麽壹個二進制數可以表示兩個信息單元。如果使用壹個2位的二進制數,它可以表示四個信息單元,使用壹個3位二進制數可以表示8個信息單元。之間存在的關系可以表示的二進制數和信息單元的數目的比特的數目的次數的功率。也就是說,當n位的二進制數,不同數目的信息單元可表示為2。
反過來說,如果有18個新聞單位說,妳應該使用多個二進制嗎?如果使用壹個4位二進制數可以表示為壹個5位的二進制數的信息單元16,信息可以表示為32個單位。需要表達的18個信息單元的數據,至少壹個5位的二進制數。
的計算機數據被存儲,作為存儲單元通常是壹個8位的二進制數,或稱為壹個字節。用於計算的存儲容量(1024)稱為1K字節的存儲單元,K(1024 K)存儲單元稱為1M字節,M(1024M)稱為1G字部分的存儲單元。
2。數字表示
二進制格式來存儲數字數據存儲的十進制數。代表數字型數據類型,妳需要解決三個問題。
首先,要確定的數量的長度。的數目的長度是在數學上,壹般是指以十進制表示的數目的位數,例如,258 3位,124 578 6位。在該計算機中的二進制數位的數量的長度。時候,由於計算機的存儲容量的測量單位(以字節為單位),所以,通常是測量的數據長度(以字節為單位)。應該指出的是,不同的數目的長度的數學,多少寫道。計算機,如果數據的長度也隨波濤洶湧的數目,而不管存儲或處理是非常不方便的。因此,在同壹臺計算機上的數據的長度往往是統壹的,用“0”填充不足部分。
其次,正和負的點的數目。計算機,始終使用的最高位的二進制數表示的符號數,和“0”代表陽性公約,“1”代表壹個負數,稱為數量的字符;剩余仍然表示值。通常,放在本機存儲器中的數字符號的數目稱為大量的機器,機器的外部由符號所指的人數作為真值的數目。如果數量為8位,存儲在本機中的真值的數目?(-0101100)B,機器號10101100,見圖2.1.1
圖2.1.1在本機儲存的電話號碼,
甲機的數目表示的範圍是有限的字長度和數據的類型。字長度的數據,以確定該範圍內可表示的機器的數量和類型也預定。例如,如果壹個整數,字長為8位,和壹個最大值01111111,最高位是符號位,因此這個數的最大值是127。如果該值超過127,它是必要的“溢出”。
此外小數點。在計算機的數字數據,總是隱含的小數點的位置,以節省存儲空間。這個隱含的小數點的位置可以是固定的,或可以是可變的。前者被稱為固定點的數目,這是被稱為作為浮點數。
1)定點數字表示法:
固定點整數,小數點位置慣例背後的最低值位用於表示整數。
分為二種符號和無符號整數。在最高位有符號整數,符號位。整數表示的數字是準確的,但數量範圍是有限的。根據存儲的字的長度,它們可以被用來8,16,32位,每壹個表示的數字範圍示於表2.1.1。
表2.1.1範圍的代表性的不同比特數的和幾個
二進制位無符號整數表示的帶符號整數的表示範圍
8
16
32
如果我們展開長度的有符號整數的4個字節的整數表示的範圍可以擴大到±32767±2147483647≈0.21×1010,超過2.1億。然而,每個數字所占用的存儲空間增加了壹倍。
定點小數,小數點位置前的最高位慣例的純小數小於1。
如固定點的數量代表十進制小數-0.6876,相比,-0.101100000000011 ...二進制數字-0.6876無限小數的數目,它是存儲只截取15,16之前省略。
如果使用2個字節來表示壹個定點小數,最低重量的2-15(10-4?10-5),這是在最精確到4至5度(按十進制小數計算)的長度。此範圍和精度,即使在正常的應用程序,它是難以滿足的需求。為了表達在較大或較小數量的浮點表示。
2)浮點表示法:
在科學計算中說,國王或特殊的少數“浮動”或“科學記數法”說實數,“浮”是由兩部分組成,即尾數和指數。例如,尾數為0.23456,5階碼。
浮點表示,小數點的位置是浮動的,為了代碼可取不同的值。為了便於在計算機中的小數點,浮點數的規定的寫入中的歸壹化的形式,即尾數的絕對值大於或等於0.1,小於1的方法,它唯壹定義的位置的小數點。的尾數的長度會影響精度的數目,其符號將確定的碼元數。相當於數學指數的浮點數的指數,它的大小,將確定的所述範圍內的數目。
同樣,任何標準浮點二進制數表示:
說:“是尾數,”“表示的字符數,階碼,為了休息。它是存儲在電腦表格,如圖2.1.2所示。
順序的象征秩序碼數字符尾數
圖2.1.2浮點存儲格式
例如,設定尾數8,順序碼6,然後壹個浮點數的形式存儲在二進制數,如圖2.1.3所示。
圖2.1.3的商店
3)原代碼,倒和補碼表示法
信源編碼
上面介紹的定點和浮點表示,壹些符號的數據,具有下列成員的數量(包括尾數和指數)的絕對值。這種方法很簡單,但運營商不僅能夠使另外,也的減法操作數既有正面的,也有負面的,所以原來的代碼計算往往伴隨著很多判斷。例如,兩個數字相加,如果符號不同,實際上是在做減法;如果該符號是不同的兩個數字相減,做實際加成等。其結果是,算術單元的復雜性的增加,並增加了計算時間。
“補”和“反編碼
壹個負數如何處理?因此,提出了壹種“補體”,“反碼的編碼方法。補算術的主要優點是負的適當的治療,減法轉化此外。無論加法差異,無論操作數為負時,操作員應僅此外,從而大大簡化了加法和減法。補運算通常是通過反碼的計算來實現,因此,不僅應包括壹個完整的討論的算術值也應包括代碼系統(原,反,補碼)。
3。特點:
的字符編碼?表示的壹系列的二進制數的非數值數據(如字符,標點,等)的方法,稱為編碼。說26個英文字母中的字母和5位足以代表26個字符。然而,每壹個字母的字母是區分大小寫的,也有很多的標點符號和其它特殊字符(如$,#,@,&,+等)。所有的符號,壹***有95個不同的字符來表示。最廣?泛使用的三種編碼是ASCII,ANSI的EBCDIC代碼,第四個編碼Unicode代碼的開發。
1)ASCII(美國信息交換標準碼信息的美國標準代碼)是使用最廣泛的。文件中使用的ASCII編碼為ASCII文件。標準的ASCII編碼使用7個二進制數字來表示128個符號,包括英文大寫字母和小寫字母,標點符號,數字和特殊的控制字符。
2)的ANSI(美國國家研究所,美國國家標準學會)使用8位的二進制數來表示每個字符編碼。八個二進制數可以表示256個信息單元,並且因此,可以編碼256個字符,符號等進行編碼。 ANSI 128個字符的ASCII定義的編碼,只需添加壹個0,最高位。例如,在ASCII編碼中,字符“A”表示為1000001,在ANSI編碼,表示的01000001。 128個字符的ASCII編碼,ANSI編碼128個符號來表達,如版權符號,英鎊符號,外語字符。
3)擴充的二進制編碼的十進制交換碼(EBCDIC,延長兩個十進制交換碼)是IBM的8字符編碼,它的大型機開發。值得註意的是,EBCDIC編碼的ASCII或ANSI編碼是不壹樣的在EBCDIC編碼前128個字符,。
在壹般情況下,標準為128數字,字母,標點符號和特殊字符的ASCII字符編碼,說夠了。 ANSI編碼表示所有ASCII編碼128個字符,並同時表示,在歐洲語言的字符。 EBCDIC編碼表示,的性質和控制代碼標準。然而,有壹個編碼方案,支持可選的字符集不支持的非字母語言的組合,如中國,日本等。
4)Unicode編碼是壹組16位編碼,可代表超過65,000個不同的單位。的原則,Unicode可以代表現在正在使用的字符,或不再使用任何語言。此編碼為國際商業和通信是有用的,可能需要被包含在壹個文件在不同的語言嗎?如中文,日語,英語。而且,Unicode編碼的本地化軟件,軟件可以為特定的國家。此外,使用Unicode編碼,軟件開發人員可以屏幕上的提示,菜單和錯誤信息提示,適用於語言?不同的國家。
2.1.2圖像數據和視頻數據表示
兩個非常不同的圖形編碼模式,加入#圖編碼和矢量編碼方法。兩種不同的方式編碼的,影響的程度的難度的圖像質量,圖像的大小的存儲空間,圖像轉印時間和圖像。該視頻是壹個種圖像數據,由數量相關聯的圖像數據,形成由上述連續再現。壹般來說用於在電視信號的視頻信號是模擬信號;計算機的視頻信號是數字信號。
1。位圖圖像:
基於在屏幕上的像素的位置來存儲圖像的位圖圖像。最簡單的位圖圖像是單色圖像。單色圖象是只有黑色和白色兩種顏色,如果對應於某壹像素點單元,0的黑色圖象在計算機中使用的代表;若對應的是白色的,那麽計算機1。
對於單色圖像,它被用來表示全屏圖像的圖像單元的數目正好等於在屏幕的像素的數目。如果水平方向的分辨率為640,480的垂直分辨率,將被乘以的水平分辨率和垂直分辨率的屏幕:640×480 = 307200,在屏幕的像素的數目是307 200的單色圖像,由於使用二進制數來表示的像素,使所述存儲的位圖圖像的數目的字節是壹屏也將能夠計算:307200÷8 = 38400,因此,分辨率為640×480屏面的單色圖像需要38,400字節存儲,存儲空間並不大。但在單色圖像看起來相當真實的,但很少使用。
灰度圖像比黑白圖像看起來更逼真。的灰度圖像的灰度顯示圖像,使用的灰度級的圖像,越看起來更逼真。壹般的計算機的壹個256灰度圖像顯示。在256級灰度的圖像,每個像素可以是白色,黑色或灰色的,即256的任何壹個,每個像素有256種信息指示的可能性。因此,存儲在灰度圖像中,壹個像素的圖像信息的單元256,即壹個字節的存儲空間。因此,分辨率為640×480,屏幕的灰度圖像,需要307,200字節的存儲空間。
計算機可以使用16,256或1670萬色顯示彩色圖像,用戶將得到更逼真的圖像。
16色圖像,每個像素可以有16種顏色。因此,為了表達的16個不同的信息單元,每個像素需要4位來存儲信息。因此,壹個全屏幕的16色位圖圖像的存儲容量是153,600字節。
256色位圖圖像,每個像素可以有256種顏色。為了表示256個不同的信息單元,每個像素需要8位的二進制數來存儲信息,即壹個字節。因此,為壹個全屏幕的256色的307 200個字節的位圖圖像,所需的存儲容量的16種顏色,相同的256級灰度的圖像的兩倍。
1670萬色的位圖圖像被稱為24位圖像或真彩色圖像。每個像素可以具有顏色16700種。要顯示16700000種不同的信息單元,每個像素需要壹個24位的二進制數是3個字節的存儲信息。很明顯,壹個完整的屏幕真彩色圖像需要更多的存儲容量。
包含的圖像文件很大,需要較大的內存容量來存儲,傳輸和下載的時間很長。例如,在互聯網上下載,分辨率為640×480的256色圖像需要至少壹分鐘的時間內,需要壹半的時間在16色圖像,而真正的彩色圖像需要更多的時間。
有兩種技術,可用於以減少的圖像的存儲空間和傳輸時間,數據壓縮技術和圖像抖動技術。然後介紹了數據壓縮技術,圖像抖動技術,以減少圖像的色彩,以減少文件的存儲容量。抖動的技術是,以產生附加的顏色和陰影來實現的,通過由兩種或更多種顏色的圖案,根據人眼的分辨率的顏色和陰影。例如,壹個在琥珀色區域的256色的圖像,通過抖動技術被轉換為16色圖像上的黃色 - 紅色點模式。在互聯網上的網頁,抖動的技術是壹種常用的技術,用於減少的圖像的存儲容量。
使用位圖圖像顯示什麽是真正的圖像,適用於更精確的性能水平和豐富的色彩,包含了大量的圖像的細節。例如,掃描的圖像,所捕獲的圖像的相機,數碼相機,戈幀捕獲裝置獲得的數字化的幀圖象。經常使用位圖圖像文件的擴展名:BMP,PCX,TIF,jpg和。 gif等。
可以的像素矩陣組成的位圖圖像鍺編輯單個像素,可以使用位圖軟件(也被稱為照片編輯軟件,葛繪畫軟件)的位圖文件。可用於軟件,以GE編輯位圖圖像,如:Microsoft畫圖,PC畫筆,Adobe公司的Photoshop,Publisher軟件的Micrografx圖片放大的圖片當地,然後對其進行。
2。插圖
在計算機上,如由壹組存儲的向量,描述點,線,面,如大小,形狀,以及其位置,尺寸指令,而不是真正的圖像。它是通過讀出這些命令,並轉換它的形狀和在屏幕上顯示的顏色,以顯示圖像,矢量圖像看起來真正的位圖圖像。該軟件用於生成矢量圖像通常被稱為繪圖軟件,如常見的:Micrographx設計師和CorelDRAW。
矢量圖像的優點和缺點
優點:
的存儲空間是小於的位圖圖像。矢量圖像的存儲空間是依賴於圖像的復雜性,每條指令需要的存儲空間,所以更多的圖像線條,圖形,填充模式,更大的所需的存儲空間。但在壹般情況下,由於矢量圖像存儲指令,遠小於位圖圖像文件。
的插圖可以控制圖的過程中的各個部分,該部分的圖像作為壹個單壹的對象,獨自壹人被拉伸,狹窄,變形,移動,刪除,和整體形象不被扭曲。不同的對象也可以被疊加在屏幕上,並保持在各自的特性,如果需要,仍是分開的。插圖的線性圖,工程圖紙和藝術字。經常使用的矢量圖像文件的擴展名:WMF,DXF,MGX。 CGM等。
缺點:
來表達復雜的圖形程序員和計算機需要花費大量的時間,耗費時間處理更復雜的,它通常是第壹個創建復雜的圖形,矢量圖形處理,然後將其轉換為位圖圖像矢量格式。
位圖圖像和矢量圖像比較:
顯示位圖圖像比顯示的矢量圖像是速度快,但是,因為它是由位圖圖像所需的存儲空間,以指示在屏幕上的每個像素的信息。總之,矢量圖像的關鍵技術是生產和再生產的圖形,位圖圖像的關鍵技術是圖像掃描,編輯,無損壓縮,快速減壓和色彩的壹致性重現。
3。數字視頻:
視頻信息實際上是由壹個屏幕上的幾件。通過每幀的快速播放電影,電視,再加上人眼的視覺鏈的影響,他們的連續運動產生的影響。數字化的視頻信號是在壹定時間內以壹定的速度的單個幀的視頻信號的捕獲,加工過程中產生的數字信息。
相對於模擬視頻,數字視頻的優點:
1)數字視頻無失真無限的模擬視頻資料每轉錄副本,將時間誤差積累,導致信息失真。
2)數字視頻廣告的編輯,如字幕,電視特技了許多新的方法。
3)使用數字視頻可以花費更少的時間和成本來創建交互式的培訓和教育計劃,可以實現視頻融進的電腦系統,以及可以實現與電腦播放電影節目。
的數字視頻的缺點如下:
的數字視頻是由壹系列的幀,每個幀是靜態圖像,並且圖像被使用的位圖文件的形式中也表示。通常情況下,視頻每秒顯示30個數字視頻需要巨大的存儲容量。
例如:壹個全屏幕,分辨率為640×480 256色圖像需要307200個字節的存儲容量。秒的數字化視頻存儲所需的空間是30乘以這個數,9,216,000字節,約9萬。 66 355 200 000字節,兩個小時的電影需要超過66G字節為單位。這可能僅使用超級計算機來播放。因此,必須使用在數字視頻壓縮編碼的過程中,存儲和傳輸。
2.1.3音頻數據的代表性
計算機可以記錄,存儲和播放聲音。在電腦的聲音轉換成數字音頻文件,MIDI文件。
1。數字音頻
這些連續的模擬由許多具有不同的振幅和頻率的正弦波的復合波,不能直接由計算機進行處理,它必須被數字化,以便為計算機存儲和處理
計算機獲得的聲音信息是聲音信號的數字化過程。在數字化的數字聲音信息文本和圖像信息的存儲和處理計算機。的模擬音頻信號轉換為數字音頻信號的基本過程:
數字錄制聲音,妳首先需要的聲音采樣。聲采樣之前和之後的波形示出在圖2.1.4(其特征在於,所述水平軸表示時間,縱軸表示振幅):
圖2.1.4聲波波形和采樣後
的采樣頻率是指每秒的聲音測量的次數的數目是在這個過程中的采樣聲音。在赫茲的采樣頻率。如果增加的采樣頻率,在單位時間內獲得的振幅值,由多,即,較高的采樣頻率時,更精確的模擬曲線的原始聲。然後把足夠的振幅值的相同的采樣頻率被轉換的電壓值,以驅動揚聲器,可以聽到相同的聲音和原始波形。這種技術被稱為脈沖編碼調制(PCM)技術。
聲音文件
在您的計算機上存儲的聲音文件的擴展名:WAV,。 MOD,au和。揮發性有機化合物。錄制和播放聲音文件,妳需要使用語音軟件,聲音軟件通常使用聲卡。
2。 MIDI文件
樂器數字接口 - MIDI(音樂樂器數字接口),是壹種電子樂器與電腦和信息交換之間的接口連接。 MIDI格式的文件擴展名。中,通常簡稱為MIDI文件格式MIDI文件。
MIDI是壹種國際標準的數字音樂。數字電子樂器,電腦處理音樂的出現創造了極為有利的條件。 MIDI聲音數字化波形的聲音完全不同,它是不上的聲采樣,量化和編碼。它實際上是壹個系列的定時命令,用於記錄電子樂器的鍵盤演奏,包括主要的努力,這些信息的時間和長度被稱為MIDI消息中描述的數字樂譜。當妳要玩,只是讀出相應的MIDI文件MIDI信息,生成所需的樂器聲音波形,由揚聲器輸出放大。
MIDI文件的存儲容量是遠遠小於數字音頻文件。如3分鐘的MIDI音樂只需要10KB的存儲空間,並且在3分鐘的數字音頻信號的音樂的存儲容量要求15MB的。
2.2數據壓縮
重新編碼的數據,以減少所需的存儲空間。數據壓縮必須是可逆的,即,壓縮後的數據必須恢復到現狀的逆過程稱為解壓縮。
數據被壓縮時,該文件的大小變小,並且可以被用於測量的壓縮量,壓縮比。例如,壓縮比為20:1,表明的壓縮文件的大小為1/20的原始文件。無損壓縮編碼方法法(冗余壓縮方法)和有損壓縮方法。後者允許壹定程度的失真,可以用於壓縮的圖像,音頻,數字視頻和其它數據。使用此方法,其中,所述數據被壓縮的數字視頻圖像的壓縮比,可以實現從100:1至200:1。
數據壓縮可以由壹個特殊的計算機硬件或完全由軟件來實現,並且也可以是軟件和硬件的組合來實現。使用壓縮軟件WinZip。
2.2.1文本文件壓縮
自適應替換壓縮技術
掃描整個文本模式,並找到兩個或多個字節。壹旦壹個新的模式,不使用其他文件中的字節,而不是這種模式,在字典中添加壹個條目。例如:有這樣的壹段文字
“西班牙的雨主要停留在平原上,但在緬因州的雨水壹次又壹次落在”
:“”是壹個模型,三次出現在文本中,“取代6個字節可以被壓縮;”泉“出現8次,如果換成帶”@“的,可以被壓縮到16(以字節為單位);”中的“2, “$”來代替,可以被壓縮為兩個字節。中看出,該文件是更長的時間,包含重復的信息,可以是更大的,更大的壓縮比。
掃描整個文件,找到重復的單詞。當的次數的單詞出現壹次以上,那麽這個詞將出現從第二個和隨後的使用壹個數字替換。這個數字被稱為指針的原話。例如:在上面的例子中,文本可以被壓縮為:“主要是在西班牙停留在雨中#1平,但#1#2#3緬因州再次下降和#16”可見,只有6個字節,壓縮,文件的大小較大的字重復的頻率就越高,因此,壓縮的效果也更好。
2.2.2圖像數據壓縮
遊程編碼的圖形文件壓縮技術,它是壹種字節模式,壹個消息可以描述這種模式交替壓縮技術。
例如:假定圖像有壹個白色的面積?191像素,並且每個像素由壹個字節表示。 RLE壓縮後,這兩個字節的字符串,191個字節的數據被壓縮成。
擴展bmp位圖文件不會被壓縮的文件。擴展TIF,PCX,JPG位圖文件是壹個壓縮文件。要使用的文件擴展名的文件。 TIF TIFF(與標誌圖像文件格式)格式。文件使用的文件擴展名。 PCX PCX格式。虧損。 jpg文件擴展名的文件是JPEG(聯合圖像專家組,聯合圖像專家組)格式。人們往往會落實有損圖像壓縮。
2.2.3視頻數據的壓縮
該視頻由壹系列幀,每個幀是位圖圖像,視頻,需要巨大的存儲容量。
通過減少每秒回放幀的數目,從而減少的視頻窗口的大小,或僅在編碼等技術,以減少存儲容量的視頻信號的每個幀之間的變化的內容。
經常使用的數字視頻格式:視頻用於Windows,QuickTime和MPEG格式,文件擴展名:。 AVI,。 MOV,MPG。 MPG是壹種壓縮文件。兩個小時的視頻信息的MPEG格式可以壓縮到幾千兆字節。
也可以使用視頻壓縮的運動補償技術,以減少存儲容量。這種技術僅存儲每個幀之間的數據變化,而不需要在每幀中存儲的所有數據。當變化不大,每幀圖像之間的視頻剪輯,運動補償技術是非常有效的。例如:演講者的頭,嘴和眼睛的變化,而背景壹直相當穩定。計算機簡單地計算出兩者之間的差別,改變的內容只能存儲。根據具體的數據,運動補償的壓縮比可高達200:1。此外,玩家在每秒的幀的數目直接影響播放的視頻的質量。減少圖像的大小也是壹個很好的方式,以減少存儲容量壹般可以集成在幾個壓縮技術降低了視頻文件的存儲容量要達到的目的。
2.2.4音頻數據壓縮
音頻數據是最突出的問題是大量的信息。的音頻信息的文件所需的存儲空間的計算方法如下:
存儲容量(字節)=采樣頻率×采樣精度的通道數/ 8××時間
實施例:雙聲道音樂的持續時間為1分鐘,如果采樣頻率為44.1KHz的,為16位的采樣精度,將數字化的存儲容量需要:44.1×103×16/8×2×60 = 10.584 MB。
的數字音頻編碼必須有壓縮音頻信息的能力,最常用的方法,是壹個自適應脈碼調制方法,即ADPCM壓縮編碼。
ADPCM壓縮編碼方案的高的SNR,而無明顯失真中的2?5倍的數據壓縮率,因此,使用這樣的壓縮技術的數字化的語音信息。
2.3信息處理
通常是指中央處理單元的總和,為完成的基本的信息處理循環部件。中央處理單元的硬件的計算機系統中,它主要包括壹個中央處理器(中央處理單元,CPU),存儲器(Memory)內,系統總線(系統總線),和壹個控制部件的核心是,通過這些組分的協同作用來完成的信息處理。
2.3.1 CPU
CPU的計算機系統的核心部件,它的工作是處理信息,完成計算。許多不同類型的CPU的。微電腦CPU被稱為“微處理器”,采用最先進的技術,生產超大規模集成電路芯片。以百萬計的晶體管通常集成在其中芯片的電子元件,具有壹個非常復雜的功能。比微機的各種電腦功能更強大,例如高性能的網絡服務器,計算機等,它們的CPU通常是由壹組高性能芯片具有更強的計算能力。此外,在所有的現代設備,如各種機械,設備,器具,運輸和其他內部安裝所謂的“嵌入”在CPU芯片,在高端家電幾乎所有的配備,甚至幾片CPU芯片。
2.3.2內部存儲器
存儲器或主存儲器的內部存儲器中,也被稱為主存儲器(主存儲器),簡稱為。使用電腦工作存儲器的信息保存在計算機系統中的主要組成部分,發揮著極其重要的作用,它的運行速度和內存容量,系統的整體性能,系統解決問題的規模和性能的影響是非常大的。對於內部存儲器,除了容量以外,另壹個重要的性能指標是,它是訪問速度。內存訪問速度的讀或寫操作的時間來衡量的。