圖像識別

圖像是指對象的描述信息，數字圖像是對象的數字表示。視覺是人類感知外界最重要的手段。據統計，視覺信息占人類獲取信息的60%，圖像是人類獲取信息的重要途徑。因此，與視覺密切相關的數字圖像處理技術的發展越來越受到重視，圖像識別技術也逐漸形成。

隨著數字圖像處理技術的發展和實際應用的需求。很多問題並不要求輸出結果本身是壹幅完整的圖像，而是對處理後的圖像進行重新分割和描述，提取有效特征，然後進行判斷和分類。這項技術就是圖像模式識別。

圖像識別技術是利用計算機視覺采集實物，並以圖像數據為基礎，讓機器模仿人類視覺，自動完成部分信息處理功能，從而達到人類對視覺采集的圖像進行識別的能力，代替人完成圖像分類識別的任務。對於圖像識別，我們面對的是二維數據信號或平面圖形。我們要去掉它們不同的物理內容，考慮樣本數據分類的* * *性質，把* * *性質相同的歸為壹類，把* * *性質不同的歸為壹類。要求在最小錯誤概率的條件下，使識別結果盡可能符合客觀對象，並具有人所具有的分析、描述和判斷各種事物和現象的能力。

圖像識別屬於當代計算機科學研究的壹個重要領域，已經發展成為壹門獨立的學科。近年來，該學科發展非常迅速，應用範圍相當廣泛，幾乎涵蓋了所有領域，從航空航天到生物科學、信息科學、資源與環境科學、天文、物理、工業、農業、國防、教育、藝術等各個領域和行業。廣泛應用於國防經濟、國防建設、社會保障和社會發展，對整個社會產生了深遠的影響。目前，光學字符識別(如手寫數字識別、郵政編碼識別、汽車牌照識別、漢字識別、條形碼識別等。)和生物識別(如人臉識別、指紋識別、虹膜識別等。)在人類日常生活中得到了廣泛的應用，對經濟、軍事、文化和人們的日常生活產生了巨大的影響。

光學字符識別使用OCR閱讀設備和智能視覺系統軟件來識別機器和肉眼都可以閱讀的文本。OCR中使用的輸入設備可以是任何壹種圖像采集設備，如CCD、掃描儀、數碼相機等。通過使用這種采集設備，OCR系統會將書寫者自己書寫的字符作為圖像輸入到計算機中，然後計算機會對其進行識別。光學字符識別技術已經廣泛應用於各種商業活動中，現在又應用於自動化任務中。字符識別處理的信息可以分為三類:文本信息識別、數字信息識別和條形碼識別。

生物識別是利用某種技術和手段來識別人的身份，從而根據這種識別來識別人，以達到監督、管理和控制的目的的技術。身份識別和個人信息管理的技術和手段層出不窮。傳統的個人信息識別方法包括個人特征。如身份證、工資卡、學生證、磁卡、智能卡、密碼等。，這些認證方式普遍容易丟失、破解、偽造和攜帶，在安全性和認證速度上已經不能滿足人們的需求。這些技術雖然方便快捷，但致命的缺點是安全性差，容易偽造，容易被盜。近年來，計算機的廣泛應用使得通過生物特征識別來識別人成為可能。

生物特征識別方法越來越多地用於身份識別領域。生物特征識別技術是指以人體固有特征為判據，實現對人體身份準確識別的技術。這些固有特征包括人臉、虹膜、指紋、掌紋等。，也稱為生物模式。除了外傷等特殊情況，這些特征壹般會伴隨人的壹生，不會改變或改變很少。生物識別技術對每個人來說都是可移植的和持久的；它對不同的個體是通用的、唯壹的，優於傳統的身份識別。基於人體生物特征的身份識別技術具有安全可靠、特征獨特、不易偽造和不可竊取等優點。

結合計算機技術，發展了許多基於人體生物特征的身份識別技術，如人臉識別技術、指紋識別技術、虹膜識別技術等。這些識別技術具有特征輸入方便、信息豐富、應用範圍廣等優點。因此，具有廣闊的應用前景。

(1)人臉識別主要基於面部特征。也是人們最早使用的生物識別技術之壹，是壹種友好、直觀、更容易被接受的識別方式。在實際應用中，人臉識別簡單易用，無需用戶主動參與，特別適合視頻監控等應用。但是人臉識別的缺點是穩定性差，容易受到周圍環境、裝飾物、年齡、表情等因素的幹擾，導致識別錯誤。另外，雙胞胎和多胞胎的鑒定還是無能為力。

(2)虹膜識別主要是根據虹膜的生理結構，利用虹膜中的細絲、斑點、突起、射線、皺紋、條紋等特征進行識別。據說沒有兩個虹膜是壹樣的。虹膜認證可靠性高，誤接受率和誤拒絕率很低。

(3)指紋識別主要通過分析指紋的全局特征和局部特征來進行，如指紋中的脊、谷、端點、分叉點、分叉點等。隨著指紋識別技術的發展和指紋采集設備價格的降低，指紋識別不僅廣泛應用於司法和商務活動中，也越來越多地應用於筆記本電腦、手機、存儲器等終端設備中。但采集指紋時要求保持手指幹凈光滑，汙垢和疤痕會給鑒定帶來困難。老年人和體力勞動者的指紋由於磨損嚴重，很難識別。另外，在實際采集中發現，由於犯罪記錄中經常使用指紋，很多人害怕記錄指紋，心理上不願意接受這種鑒定方式。

目前無論是字符識別的項目開發技術(如手寫數字識別、郵政編碼識別、汽車車牌識別、文本識別等。)或人體生物識別(如人臉識別、指紋識別、虹膜識別等。)，它們涉及數字圖像處理、模式識別、人工智能、智能計算等學科。隨著高科技的發展，這些項目的應用已經成為衡量當代高科技水平的重要手段。

圖像識別技術是數字圖像處理和模式識別技術的結合。數字圖像處理是利用計算機或其他數字設備對圖像信息進行處理和加工以滿足目標識別需要的基本行為。模式識別研究如何用機器實現人對事物的學習、識別和判斷能力，以滿足目標識別的判斷行為。

為了模擬人類的圖像識別活動，人們提出了不同的圖像識別模型。比如模板匹配模型。該模型認為，要識別圖像中的物體，必須有圖像對物體在過去經驗中的記憶模式，也稱為模板。如果當前的刺激可以與大腦中的模板相匹配，則該物體將被識別。

圖像識別的基本過程是提取代表未知樣本模式的本質表達式(如各種特征)與預先存儲在機器中的壹組標準模式表達式(稱為字典)進行匹配，並按照壹定的標準進行判斷。從機器中存儲的標準模式表達式集合中，找到與輸入樣本子模式最接近的表達式，該表達式模式對應的類別就是識別結果。因此，圖像識別技術是在大量信息和數據的基礎上，在已有經驗和理解的基礎上，利用計算機和數學推理方法，自動完成對圖像中物體的識別和評價的過程。

圖像識別的過程包括四個步驟:圖像采集(特征分析)、圖像預處理、特征提取和模式匹配。

首先，通過高清攝像機、掃描儀或其他圖像采集儀器采集圖像的原始信息。在圖像采集過程中，由於設備的機械原因或其他人為因素造成的圖像大小、角度、格式、光照強度的差異會對以後的操作產生很大的影響，因此采集到的原始圖像需要進行預處理。圖像預處理的作用可以概括為:利用某種手段對圖像信息進行歸壹化處理，以便於後續處理。圖像特征提取部分的作用是提取最能代表壹個物體的特征信息，並將其轉化為特征向量或矩陣的形式。模式匹配是指系統將待測圖像的特征與特征庫中的信息進行比較，通過選擇合適的分類器達到識別的目的。

圖像預處理技術是對圖像進行正式處理之前的壹系列操作。由於圖像在傳輸和存儲過程中不可避免地會受到壹定程度的破壞和各種噪聲的汙染，圖像會失去本質或偏離人們的需求，這就需要進行壹系列的預處理操作來消除對圖像的影響。壹般來說，圖像預處理技術分為兩個方面，即圖像增強和圖像恢復技術。圖像增強技術在圖像預處理中占有很大的比重，是圖像預處理中必不可少的步驟。它不同於圖像恢復技術，圖像恢復的目的是恢復圖像的原始本質。圖像增強的原理是突出人們需要的特征，弱化他們不需要的特征。壹般來說，圖像增強技術有兩種方法:空域方法和頻域方法。空間域規則主要是在空間域直接對圖像進行處理，分為點操作和域操作(局部操作)兩個方面。其中，點操作包括圖像灰度變換、直方圖均衡化、局部統計等幾種方法。域操作包括圖像平滑和圖像銳化。頻域規則只對某個變換域中圖像的變換值起作用。比如我們對圖像進行傅裏葉變換，然後在變換域計算圖像的頻譜，最後把計算出來的圖像變換到空間域。頻域法通常分為高通濾波、低通濾波、頻率帶通濾波和帶阻濾波。圖像恢復技術是利用圖像的先驗知識改變退化圖像的過程。圖像復原技術要求我們先建立圖像模型，然後逆向退化過程，最終獲得退化前的最優圖像。

圖像變換域處理以空間頻率(波數)為獨立變量來描述圖像的特征，可以將圖像的空間變化分解為幅度、空間頻率和相位不同的簡單振動函數的線性疊加。圖像中的各種空間頻率分量和分布稱為空間譜。這種對圖像空間頻率特性的分解、處理和分析稱為空間頻域處理或波數域處理。在眾多的圖像變換技術中，常用的有離散余弦變換、沃爾什變換、傅立葉變換、Gabor變換和小波變換。

(1)離散余弦變換DCT變換矩陣的基向量由於與Tobeliz向量相似，常被認為是變換語言和圖像信號的最佳變換。雖然壓縮效率略低於壓縮能力最好的K-L變換，但其高效的處理類型是K-L變換無法比擬的，成為H.261、JPEG、MPEG等國際標準的主要環節。它廣泛應用於圖像編碼。

(2)沃爾什變換是壹種正交變換，可以消除相鄰采樣點之間的相關性，使信號能量集中在變換矩陣的左上角，其他部分出現很多零值；或者在誤差允許的範圍內，允許省略小值，從而達到數據壓縮的目的。沃爾什變換在圖像傳輸、雷達、通信和生物醫學中有著廣泛的應用。

(3)傅立葉變換是壹種常用的正交變換，其主要的數學理論基礎是傅立葉級數，是由著名數學家傅立葉在1822年提出的。其主要思想是將周期函數展開成正弦級數。傅立葉變換為圖像奠定了理論基礎。它通過在時空域和頻域來回切換圖像來提取和分析圖像的信息特征，簡化了計算工作量。它被譽為描述圖像信息的第二語言，廣泛應用於圖像變換、圖像編碼和壓縮、圖像分割和圖像重建等領域。

(4)Gabor變換屬於加窗傅裏葉變換，是短時傅裏葉變換中窗函數為高斯時的特例。由於傅裏葉變換的局限性，Gabor1946提出了加窗傅裏葉變換。典型的加窗傅立葉變換方法是低通濾波器。Gabor函數可以在頻域提取不同尺度和方向的相關特征。

(5)小波變換受傅立葉變換的啟發，Morlet在1984中提出了小波分析的概念。1986年，著名數學家Meyer和Mallat合作構建了圖像小波函數的統壹方法——多尺度分析。目前，小波變換理論在圖像去噪的應用中已經取得了很好的效果。

頻域去噪主要是因為有些圖像在空間域的效果並不理想，所以想轉換到頻域進行處理，也就是用壹組正交函數系來逼近目標函數，從而進壹步得到相應級數的系數。頻域處理主要用於與圖像空間頻率相關的處理，如圖像恢復、圖像重建、輻射變換、邊緣增強、圖像平滑、噪聲抑制、頻譜分析、紋理分析等。

特征提取是計算機視覺和圖像處理中的壹個概念，是指利用計算機提取圖像信息，確定每個圖像點是否屬於壹個圖像特征。特征提取的結果是將圖像中的點分成不同的子集，這些子集往往屬於孤立點、連續曲線或連續區域。

(1)功能選擇

原始特征數很大，或者原始樣本在高維空間。從壹組特征中選擇壹些最有效的特征，達到降低特征空間維數的目的，稱為特征選擇。也就是說，對類別可分性沒有貢獻或貢獻很小的特征就被簡單忽略了。特征選擇是圖像識別中的壹個關鍵問題。

(2)特征轉換

通過映射或變換，高維空間中的特征描述可以用低維空間中的特征來描述，這就是所謂的特征變換。特征變換得到的特征是原特征集的某種組合，新特征包含了所有原特征的信息。主成分分析是最常用的特征變換方法。

特征選擇和提取非常重要，特征選擇是模式識別中的壹個關鍵問題。由於在許多實際問題中往往很難找到最重要的特征，或者由於條件限制無法度量，這使得特征選擇和提取的任務變得復雜，成為構造模式識別系統中最困難的任務之壹。人們越來越關註這個問題。特征選擇和提取的基本任務是如何從眾多特征中找到最有效的特征。解決特征選擇和特征提取的問題，核心內容是如何評價已有的特征，以及如何通過已有的特征生成更好的特征。

常見的圖像特征提取和描述方法有顏色特征、紋理特征和幾何特征等提取和描述方法。

根據是否有標準樣本，模式識別可以分為有監督學習和無監督學習。模式識別的分類或描述通常基於已被分類或描述的模式集。人們將這組模式稱為訓練集，由此產生的學習策略稱為監督學習。學習也可以是無監督學習。從這個意義上說，生成的系統不需要提供模式類的先驗知識，而是基於模式的統計規律或模式的相似性來學習判斷模式類。

(1)數據采集

數據采集是指利用各種傳感器將被研究對象的各種信息轉換成計算機可以接收的數值或符號(串)集。習慣上把這種值或符號(串)組成的空間稱為模式空間。這壹步的關鍵是傳感器的選擇。

通常，獲得的數據類型如下。

(2)預處理

為了從這些數字或符號(串)中提取有效信息，必須進行預處理，消除輸入數據或信息中的噪聲，排除無關信號，只留下與所研究對象的性質和所采用的識別方法密切相關的特征(如表示形狀、周長、面積等。).比如在指紋識別中，指紋掃描設備輸出的指紋圖像會隨著圖像的對比度、亮度或背景而變化，有時還可能會變形。人們只對圖像中的指紋線、指紋分叉點和端點感興趣，而不需要指紋的其他部分和背景。因此，需要采用合理的濾波算法，如方向濾波、基於框圖的二值濾波等，濾除指紋圖像中這些不必要的部分。

(3)特征提取

交換原始數據，從眾多特征中尋找最有效的特征，得到最能反映分類本質的特征，將高維的度量空間(原始數據組成的空間)轉化為低維的特征空間(進行分類識別的空間)，以降低後續處理的難度。人類容易獲得的特征，機器很難獲得，這就是模式識別中的特征選擇和提取問題。特征選擇和提取是模式識別中的壹個關鍵問題。壹般來說，候選特征的類型越多，結果應該越好。但是，這可能會導致維數災難，即特征維數過高，計算機無法解決。在設計模式識別系統時，如何確定合適的特征空間是壹個非常重要的問題。有兩種基本方法來優化特征空間。首先是特征選擇，如果選擇的特征空間能使相似對象的分布緊湊，為分類器的成功設計提供了良好的基礎；另壹方面，如果不同種類的樣本在這個特征空間中混合在壹起，那麽再好的設計方法也無法提高分類器的準確率。另壹種是特征的組合優化，通過壹個映射變換對原始特征空間進行變換，構造壹個新的簡化特征空間。

(4)分類決策

基於模式特征空間，可以進行模式識別的最後壹部分:分類決策。此階段的最終輸出可能是對象所屬的類型，或者是模型數據庫中與對象最相似的模式號。幾個樣本的類別和特征是已知的。比如手寫阿拉伯數字的識別，就是壹個10類的分類問題。機器首先要知道每個手寫數字的形狀特征。不同的人對同壹個數字有不同的寫法，甚至同壹個人對同壹個數字可以有多種寫法，所以它必須讓機器知道它屬於哪壹類。因此，有必要建立分類問題的樣本庫。基於這些樣本庫，建立判別分類函數，這個過程由機器實現，稱為學習過程。然後分析壹個未知新物體的特征，決定它屬於哪壹類。這是壹種監督分類方法。

具體步驟是在特征空間建立壹個訓練集，知道訓練集中每個點的類別，從這些條件中尋求某種判別函數或準則，設計壹個決策函數模型，然後根據訓練集中的樣本確定模型中的參數，使這個模型可以用於判別，利用判別函數或準則確定每個未知點屬於哪個類別。在模式識別學科中，這個過程壹般稱為訓練和學習的過程。

分類規則是根據訓練樣本提供的信息確定的。分類器的設計是在訓練過程中完成的，用壹批訓練樣本，包括各種類型的樣本，大致勾勒出各種事物在特征空間的分布規律，為確定使用什麽數學公式以及這些公式中的參數提供信息。壹般來說，使用什麽樣的分類函數是由人來決定的。分類器參數的選擇或在學習過程中獲得的結果取決於設計者選擇什麽標準函數。不同準則函數的最優解對應不同的學習結果，得到不同性能的分類器。數學公式中的參數往往是通過學習來確定的。在學習過程中，如果發現當前使用的分類函數會導致分類錯誤，那麽分類函數可以通過提供如何糾正錯誤的信息來朝著正確的方向移動，這就形成了壹個叠代的過程。如果分類函數及其參數出錯越來越少，可以說是逐漸收斂，學習過程就會收到效果，設計就可以結束了。

從應用的目的來看，模式識別系統的四個部分有很大的不同，特別是在數據預處理和分類決策方面。為了提高識別結果的可靠性，往往需要加入知識庫(規則)來修正可能出現的錯誤，或者通過引入限制來減少匹配計算，從而大大縮小待識別模式在模型庫中的搜索空間。