隨著數字圖像處理技術的發展和實際應用的需求。許多問題並不要求輸出結果本身是壹幅完整的圖像,而是對處理後的圖像進行重新分割和描述,提取有效特征,然後進行判斷和分類。這項技術就是圖像模式識別。
圖像識別技術是利用計算機視覺采集實物,並基於圖像數據,讓機器模仿人類視覺並自動完成壹些信息處理功能,從而達到人類識別視覺采集的圖像的能力,代替人完成圖像分類和識別的任務。對於圖像識別,我們面對的是二維數據信號或平面圖形。我們應該擺脫它們不同的物理內容並考慮樣本數據分類的* * *性質,將具有相同* * *性質的數據歸入壹類,將具有另壹* * *性質的數據歸入壹類。在錯誤概率最小的條件下,要求使識別結果盡可能符合客觀對象,並具有分析、描述和判斷人所具有的各種事物和現象的能力。
圖像識別屬於當代計算機科學研究的壹個重要領域,已經發展成為壹門獨立的學科。近年來,該學科發展非常迅速,其應用範圍相當廣泛,幾乎涵蓋了所有領域,從航空航天到生物科學、信息科學、資源與環境科學、天文學、物理學、工業、農業、國防、教育、藝術等領域和行業。在國防經濟、國防建設、社會保障和社會發展中得到了廣泛應用,對全社會產生了深遠影響。目前,光學字符識別(如手寫數字識別、郵政編碼識別、汽車牌照識別、漢字識別、條形碼識別等。)和生物識別(如人臉識別、指紋識別、虹膜識別等。)已廣泛應用於人類日常生活中,對經濟、軍事、文化和人們的日常生活產生了巨大影響。
光學字符識別使用OCR閱讀設備和智能視覺系統軟件來識別機器和肉眼都可以閱讀的文本。OCR中使用的輸入設備可以是任何壹種圖像采集設備,如CCD、掃描儀、數碼相機等。通過使用這種采集設備,OCR系統將把書寫者自己書寫的字符作為圖像輸入計算機,然後計算機將識別它們。光學字符識別技術已經廣泛應用於各種商業活動中,現在它被應用於自動化任務。字符識別處理的信息可分為三類:文本信息識別、數字信息識別和條形碼識別。
生物識別是利用某種技術和手段來識別人的身份,從而根據這種識別來識別人的身份,從而達到監督、管理和控制的目的的技術。身份識別和個人信息管理的技術和手段層出不窮。傳統的個人信息識別方法包括個人特征。如身份證、工作證、學生證、磁卡、智能卡、密碼等。,這些認證方式壹般容易丟失、破解、偽造和攜帶,在安全性和認證速度方面已經不能滿足人們的需求。雖然這些技術方便快捷,但它們的致命缺點是安全性差、易偽造和易被盜。近年來,計算機的廣泛應用使得通過生物特征識別來識別人成為可能。
生物識別方法越來越多地用於身份識別領域。生物識別技術是指以人體固有特征為準繩,實現對人體身份準確識別的技術。這些固有特征包括人臉、虹膜、指紋、掌紋等。,也稱為生物模式。除了外傷等特殊情況外,這些特征壹般會伴隨人的壹生,不會改變或改變很少。生物識別技術對每個人來說都是可移植和持久的;它對不同的個體具有普遍性和唯壹性,優於傳統的身份識別。基於人體生物特征的身份識別技術具有安全可靠、特征獨特、不易偽造和不可竊取等優點。
結合計算機技術,開發了許多基於人體生物特征的身份識別技術,如人臉識別技術、指紋識別技術和虹膜識別技術。這些識別技術具有特征輸入方便、信息豐富、適用範圍廣等優點。因此,它具有廣闊的應用前景。
(1)人臉識別主要基於面部特征。它也是人們最早使用的生物識別技術之壹,是壹種友好、直觀且更容易接受的識別方法。在實際應用中,人臉識別易於使用,無需用戶主動參與,特別適合視頻監控等應用。但人臉識別的缺點是穩定性差,容易受到周圍環境、裝飾品、年齡、表情等幹擾,導致識別錯誤。此外,對雙胞胎和多胞胎的鑒定仍然無能為力。
(2)虹膜識別主要基於虹膜的生理結構,利用虹膜中的細絲、斑點、凸起、射線、皺紋和條紋等特征進行識別。據說沒有兩種鳶尾花是相同的。虹膜認證具有很高的可靠性,其誤接受率和誤拒絕率都很低。
(3)指紋識別主要通過分析指紋的全局特征和局部特征來進行,如指紋中的脊、谷、端點、分叉點和分叉點。隨著指紋識別技術的發展和指紋采集設備價格的降低,指紋識別不僅廣泛應用於司法和商業活動中,而且越來越多地應用於筆記本電腦、手機和存儲器等終端設備中。但采集指紋時要求保持手指清潔光滑,汙垢和疤痕會給鑒定帶來困難。老年人和體力勞動者的指紋因磨損嚴重而難以識別。此外,在實際采集中發現,由於犯罪記錄中經常使用指紋,許多人害怕記錄指紋,心理上不願意接受這種識別方法。
目前,無論是字符識別的項目開發技術(如手寫數字識別、郵政編碼識別、汽車牌照識別、文本識別等。)或人體生物識別(如人臉識別、指紋識別、虹膜識別等。),它們涉及數字圖像處理、模式識別、人工智能、智能計算等學科。隨著高科技的發展,這些項目的應用已成為衡量當代高科技水平的重要手段。
圖像識別技術是數字圖像處理和模式識別技術的結合。數字圖像處理是利用計算機或其他數字設備對圖像信息進行處理和加工以滿足目標識別需要的基本行為。模式識別研究如何用機器實現人對事物的學習、識別和判斷能力,以滿足目標識別的判斷行為。
為了模擬人類的圖像識別活動,人們提出了不同的圖像識別模型。例如,模板匹配模型。該模型認為,要識別圖像中的物體,必須有壹個過去經驗中圖像對物體的記憶模式,也稱為模板。如果當前的刺激可以與大腦中的模板匹配,則該物體將被識別。
圖像識別的基本過程是提取代表未知樣本模式的本質表達式(如各種特征)並將其與預先存儲在機器中的標準模式表達式集(稱為字典)進行匹配,並通過壹定的標準進行判斷。從機器中存儲的標準模式表達式集中,找到與輸入樣本子模式最接近的表達式,該表達式模式對應的類別就是識別結果。因此,圖像識別技術是基於大量的信息和數據,並在現有經驗和理解的基礎上,利用計算機和數學推理方法自動完成對圖像中對象的識別和評估的過程。
圖像識別的過程包括四個步驟:圖像采集(特征分析)、圖像預處理、特征提取和模式匹配。
首先通過高清相機、掃描儀或其他圖像采集儀器采集圖像的原始信息。在圖像采集過程中,由於設備機械原因或其他人為因素造成的圖像大小、角度、格式和光照強度的差異會對以後的操作產生很大影響,因此采集的原始圖像需要進行預處理。圖像預處理的作用可以概括為:利用某種手段對圖像信息進行歸壹化處理,以便進行後續處理。圖像特征提取部分的作用是提取最能代表物體的特征信息,並將其轉換為特征向量或矩陣的形式。模式匹配是指系統將待測圖像的特征與特征庫中的信息進行比較,通過選擇合適的分類器達到識別的目的。
圖像預處理技術是對圖像進行正式處理之前的壹系列操作。由於圖像在傳輸和存儲過程中不可避免地會受到壹定程度的損壞和各種噪聲的汙染,圖像會失去其本質或偏離人們的需求,這就需要進行壹系列預處理操作來消除對圖像的影響。壹般來說,圖像預處理技術分為兩個方面,即圖像增強和圖像恢復技術。圖像增強技術在圖像預處理中占有很大的比重,是圖像預處理的必要步驟。與圖像恢復技術不同的是,圖像恢復旨在恢復圖像的原始本質。圖像增強的原理是突出人們需要的特征,削弱他們不需要的特征。壹般來說,圖像增強技術有兩種方法:空間域方法和頻率域方法。空間域規則主要在空間域直接處理圖像,分為點操作和域操作(局部操作)兩個方面。其中,點操作包括圖像灰度變換、直方圖均衡化和局部統計等幾種方法。域操作包括圖像平滑和圖像銳化。頻域規則僅在特定變換域中對圖像的變換值起作用。例如,我們對圖像進行傅裏葉變換,然後在變換域中計算圖像的頻譜,最後將計算的圖像變換到空間域中。頻域方法通常分為高通濾波、低通濾波、頻率帶通濾波和帶阻濾波。圖像恢復技術是利用圖像的先驗知識改變退化圖像的過程。圖像恢復技術要求我們建立圖像模型,然後逆向退化過程,最終獲得退化前的最優圖像。
圖像變換域處理將空間頻率(波數)作為描述圖像特征的獨立變量,可以將圖像的空間變化分解為不同振幅、空間頻率和相位的簡單振動函數的線性疊加。圖像中的各種空間頻率分量和分布稱為空間譜。這種對圖像空間頻率特性的分解、處理和分析稱為空間頻域處理或波數域處理。在眾多圖像變換技術中,常用的有離散余弦變換、沃爾什變換、傅裏葉變換、Gabor變換和小波變換。
(1)離散余弦變換DCT變換矩陣的基向量通常被認為是變換語言和圖像信號的最佳變換,因為它類似於Tobeliz向量。雖然壓縮效率略低於壓縮能力最好的K-L變換,但其高效的處理類型是K-L變換無法比擬的,已成為H.261、JPEG和MPEG等國際標準的主要環節。它廣泛應用於圖像編碼。
(2)沃爾什變換是壹種正交變換,可以消除相鄰采樣點之間的相關性,使信號能量集中在變換矩陣的左上角,其他部分出現許多零值;或者在允許的誤差範圍內,允許忽略較小的值,從而達到數據壓縮的目的。沃爾什變換在圖像傳輸、雷達、通信和生物醫學等領域有著廣泛的應用。
(3)傅裏葉變換是壹種常用的正交變換,其主要數學理論基礎是傅裏葉級數,由著名數學家傅裏葉在1822中提出。其主要思想是將周期函數展開為正弦級數。傅裏葉變換為圖像奠定了理論基礎。它通過在時空域和頻域來回切換圖像來提取和分析圖像的信息特征,簡化了計算工作量。它被譽為描述圖像信息的第二語言,廣泛應用於圖像變換、圖像編碼和壓縮、圖像分割和圖像重建等領域。
(4)Gabor變換屬於加窗傅裏葉變換,是短時傅裏葉變換中窗函數為高斯時的特例。由於傅裏葉變換的局限性,Gabor1946提出了加窗傅裏葉變換。典型的窗口傅裏葉變換方法是低通濾波器。Gabor函數可以在頻域中提取不同尺度和方向的相關特征。
(5)小波變換受傅裏葉變換的啟發,Morlet在1984中提出了小波分析的概念。1986年,著名數學家邁耶和馬拉特合作構建了圖像小波函數的統壹方法——多尺度分析。目前,小波變換理論在圖像去噪的應用中取得了很好的效果。
頻域去噪主要是因為有些圖像在空間域的效果不理想,所以要轉換到頻域進行處理,也就是用壹組正交函數系來逼近目標函數,從而進壹步得到相應級數的系數。頻域處理主要用於與圖像空間頻率相關的處理,如圖像恢復、圖像重建、輻射變換、邊緣增強、圖像平滑、噪聲抑制、頻譜分析和紋理分析。
特征提取是計算機視覺和圖像處理中的壹個概念,是指使用計算機提取圖像信息並確定每個圖像點是否屬於某個圖像特征。特征提取的結果是將圖像中的點分成不同的子集,這些子集往往屬於孤立點、連續曲線或連續區域。
(1)功能選擇
原始特征數量非常大,或者原始樣本處於高維空間。從壹組特征中選擇壹些最有效的特征以達到降低特征空間維度的目的稱為特征選擇。也就是說,對類別可分性沒有貢獻或貢獻很小的特征被簡單地忽略了。特征選擇是圖像識別中的壹個關鍵問題。
②特征轉換
通過映射或變換,高維空間中的特征描述可以用低維空間中的特征來描述,這就是所謂的特征變換。通過特征變換獲得的特征是原始特征集的某種組合,新特征包含所有原始特征的信息。主成分分析是最常用的特征變換方法。
特征選擇和提取非常重要,特征選擇是模式識別中的壹個關鍵問題。由於在許多實際問題中通常很難找到最重要的特征,或者由於條件限制而無法測量它們,這使得特征選擇和提取的任務變得復雜,並成為構建模式識別系統中最困難的任務之壹。人們越來越關註這個問題。特征選擇和提取的基本任務是如何從眾多特征中找到最有效的特征。要解決特征選擇和特征提取問題,核心內容是如何評價現有特征以及如何通過現有特征生成更好的特征。
常見的圖像特征提取和描述方法有顏色特征、紋理特征和幾何特征等提取和描述方法。
根據是否有標準樣本,模式識別可以分為有監督學習和無監督學習。模式識別的分類或描述通常基於已被分類或描述的模式集。人們將這組模式稱為訓練集,由此產生的學習策略稱為監督學習。學習也可以是無監督學習。在這個意義上,生成的系統不需要提供模式類的先驗知識,而是學習基於模式的統計規律或模式的相似性來判斷模式類。
(1)數據采集
數據采集是指利用各種傳感器將被研究對象的各種信息轉換成計算機可以接收的數值或符號(串)集。習慣上把這種值或符號(串)組成的空間稱為模式空間。這壹步的關鍵是傳感器的選擇。
通常,獲得的數據類型如下。
②預處理
為了從這些數字或符號(字符串)中提取有效信息,必須進行預處理,以消除輸入數據或信息中的噪聲,排除無關信號,只留下與所研究對象的性質和所采用的識別方法密切相關的特征(如表示形狀、周長、面積等)。).例如,在指紋識別中,指紋掃描設備輸出的指紋圖像會隨圖像的對比度、亮度或背景而變化,有時可能會變形。人們只對圖像中的指紋線、指紋分叉點和端點感興趣,而不需要指紋的其他部分和背景。因此,有必要采用合理的濾波算法,如基於框圖的方向濾波和二值濾波等,以濾除指紋圖像中這些不必要的部分。
3)特征提取
交換原始數據,從眾多特征中找到最有效的特征,得到最能反映分類本質的特征,將維數較高的度量空間(原始數據組成的空間)轉換為維數較低的特征空間(進行分類和識別的空間),以降低後續處理的難度。人類容易獲得的特征是機器難以獲得的,這就是模式識別中的特征選擇和提取問題。特征選擇和提取是模式識別中的壹個關鍵問題。壹般來說,候選特征的類型越多,結果應該越好。然而,這可能會導致維數災難,即特征維數太高,計算機無法解決。如何確定合適的特征空間是設計模式識別系統的壹個非常重要的問題。有兩種基本方法來優化特征空間。首先是特征選擇,如果選擇的特征空間可以使相似對象的分布緊湊,則為分類器的成功設計提供了良好的基礎;另壹方面,如果不同種類的樣本在這個特征空間中混合在壹起,無論設計方法有多好,都無法提高分類器的精度。另壹種是特征的組合優化,通過壹種映射變換對原始特征空間進行變換,構造壹個新的簡化特征空間。
④分類決策
基於模式特征空間,可以進行模式識別的最後壹部分:分類決策。此階段的最終輸出可能是對象所屬的類型,或者是與模型數據庫中的對象最相似的模式編號。幾個樣本的類別和特征是已知的。例如,手寫阿拉伯數字的識別是壹個具有10個類別的分類問題。機器必須首先知道每個手寫數字的形狀特征。不同的人有不同的方法來書寫同壹個數字,甚至同壹個人可以用多種方法書寫同壹個數字,因此它必須讓機器知道它屬於哪個類別。因此,有必要建立分類問題的樣本庫。基於這些樣本庫建立判別分類函數,這個過程由機器實現,稱為學習過程。然後分析壹個未知新物體的特征並決定它屬於哪壹類。這是壹種監督分類方法。
具體步驟是在特征空間中建立壹個訓練集,知道訓練集中每個點的類別,從這些條件中尋求壹些判別函數或準則,設計壹個決策函數模型,然後根據訓練集中的樣本確定模型中的參數,使這個模型可以用於判別,並使用判別函數或準則來確定每個未知點屬於哪個類別。在模式識別學科中,這個過程壹般稱為訓練和學習的過程。
分類規則是根據訓練樣本提供的信息確定的。分類器設計是在訓練過程中完成的,使用壹批包括各種類型樣本的訓練樣本來粗略地勾勒出各種事物在特征空間中分布的規律性,這為確定使用什麽數學公式以及這些公式中的參數提供了信息。壹般來說,使用什麽樣的分類函數由人們決定。分類器參數的選擇或在學習過程中獲得的結果取決於設計者選擇什麽標準函數。不同準則函數的最優解對應不同的學習結果,得到不同性能的分類器。數學公式中的參數往往是通過學習來確定的。在學習過程中,如果發現當前使用的分類函數會導致分類錯誤,那麽分類函數可以通過提供如何糾正錯誤的信息來朝著正確的方向前進,這形成了壹個叠代過程。如果分類函數及其參數的錯誤越來越少,可以說它是逐漸收斂的,學習過程將收到效果,設計可以結束。
為了應用的目的,模式識別系統的四個部分有很大的不同,特別是在數據預處理和分類決策方面。為了提高識別結果的可靠性,往往需要添加知識庫(規則)來糾正可能的錯誤,或者通過引入限制來減少匹配計算,從而大大縮小模型庫中待識別模式的搜索空間。