圖像是指物體的描述信息,數字圖像是壹個物體的數字表示。視覺是人類感知外部世界的最重要手段,據統計,在人類獲取的信息中,視覺信息占60%,而圖像正式人類獲取信息的重要途徑,因此,和視覺緊密相關的數字圖像處理技術的項目的開發越來越受到人們的關註,逐漸形成圖像識別技術。
隨著數字圖像處理技術的發展和實際應用的需求。許多問題不要求其輸出結果是壹幅完整的圖像本身,而是將經過壹定處理後的圖像再分割和描述,提取有效的特征,進而加以判斷分類,這種技術就是圖像的模式識別。
圖像識別技術是利用計算機視覺采集物理對象,以圖像數據為基礎,讓機器模仿人類視覺,自動完成某些信息的處理功能,達到人類所具有的對視覺采集圖像進行識別的能力,以代替人去完成圖像分類及辨別的任務。對圖像識別來說,面對的是二維數據信號或平面圖形,除掉它們各不相同的物理內容,考慮對樣品數據分類這壹***性來研究的,把同壹種***性者歸為壹類,另壹種***性者歸為壹類。要求在最小的錯誤概率條件下,使識別的結果盡量與客觀物體相符合,具備人所具有的對各種事物、現象進行分析、描述與判斷的能力。
圖像的識別屬於當代計算機科學研究的重要領域,已發展成為壹門獨立的學科。這壹學科在近幾年裏,發展十分迅速,應用範圍相當廣泛,幾乎遍及各個領域,從宇航領域拓展到生物科學、信息科學、資源環境科學、天文學、物理學、工業、農業、國防、教育、藝術等各個領域與行業,在國防經濟、國防建設、社會治安和社會發展等方面得到廣泛應用,對整個社會都產生了深遠的影響。目前, 光學字符識別(如手寫數字識別、郵政編碼識別、汽車牌號識別、漢字識別、條形碼識別等), 以及 生物特征識別(如人臉識別、指紋識別、虹膜識別等) 已經在人類日常生活中廣泛應用,對經濟、軍事、文化及人們的日常生活產生重大影響。
光學字符識別使用OCR讀取設備和智能視覺系統軟件,識別可同時被機器和肉眼讀取的文本。OCR所使用的輸設備入設備可以是任何壹種圖像采集設備,如CCD、掃描儀、數字相機等。通過使用這類采集設備,OCR系統將書寫者自己寫好的文字作為圖像輸入到計算機中,然後由計算機去識別。光學字符識別技術已經廣泛應用於各種商業活動,現在又開始應用到自動化任務中。字符識別處理的信息可分為3大類:文字信息識別、數字信息識別和條形碼識別。
生物特征識別就是采用某種技術和手段對人的身份進行標識,從而依據該標識對人進行身份識別,以達到監督、管理和控制目的的壹種技術。用於身份識別和個人信息管理的技術和手段層出不窮,傳統的個人信息鑒定方法包括個人特征。如身份證、工作者、學生證、磁卡、智能卡、口令密碼等,這些分身驗證方法普遍存在易丟失、易破解、易偽造、不易攜帶等缺點,而且在安全性和鑒定速度方面也已經不能滿足人們的需求,這些技術雖然方便快捷,但其致命的缺點是安全性差、易偽造、易竊取等。近年來,計算機的廣泛應用使得生物特征識別進行身份識別成為可能。
生物特征識別的方法越來越多地被應用於身份識別領域。生物特征識別技術(Biometric Identification Technology)是指人體固有的特征為判別標準,達到精確鑒定人身份的技術。這些固有特征包括人臉、虹膜、指紋、掌紋等,也被稱為生物模態。這些特征除了外傷等特殊情況下壹般會伴隨人的壹生,而不會改變或者變化很小。生物識別技術對每個個體都具有隨身攜帶性和持久性;對不同個體具有普遍性和唯壹性等優於傳統身份識別的特點。基於人類生物特征的識別技術具有安全可靠、特征唯壹、不易偽造、不可竊取等優點。
結合計算機技術,發展起來了眾多jiy基於人類生物特征的人類身份識別技術,如人臉識別技術、指紋識別技術、虹膜識別技術。這些識別技術具有特征錄入較為方便、信息豐富、使用範圍廣等優點。因此有著廣闊的應用前景。
(1)人臉識別主要通過人臉特征進行識別,也是人們最早使用的生物特征識別技術之壹,是壹種比較友好、直觀、更容易被人接受的識別方式。在實際應用中,人臉識別易於使用,無須使用者的主動參與,尤其適用於視屏監控等應用。但人臉識別的缺點在於穩定性較差,很容易受周圍環境、飾物、年齡、表情等幹擾,造成錯誤的識別。另外,對雙胞胎、多胞胎的鑒別仍然無能為力。
(2)虹膜識別主要基於虹膜的生理結構,利用虹膜中存在的細絲、斑點、凸點、射線、皺紋和條紋等特征進行識別。據稱,沒有任何兩個虹膜是壹樣的。虹膜身份認證的可靠性高,其錯誤接受率和錯誤拒絕率很低。
(3)指紋識別主要通過分析指紋的全局特征和局部特征進行識別,常用的特征如指紋中的脊、谷、終點、分叉點和分歧點等。隨著指紋識別技術的發展和指紋采集設備的價格降低,指紋識別不僅廣泛應用於司法和商務活動中,也越來越多地在筆記本電腦、手機、存儲器等終端設備中使用。但采集指紋時要求保持手指的潔凈和光滑,汙垢和疤痕都會給識別帶來困難。老年人和手工勞動者的指紋由於磨損嚴重而不易識別。另外,在實際采集中發現,由於在犯罪記錄中常使用指紋,導致很多人害怕將指紋記錄在案,從心理上不願意接收這種識別方式。
目前,無論是字符識別(如手寫數字識別、郵政編碼識別、汽車牌照識別、文字識別等)還是人類生物特征識別(如人臉識別、指紋識別、虹膜識別等)的項目開發技術,他們涉及數字圖像處理、模式識別、人工智能、智能計算等多個學科領域。 隨著高科技的發展,這些項目應用已成為衡量當代高科技水平的重要手段。
圖像識別技術 是數字圖像處理 和 模式識別技術 相結合的產物。數字圖象處理是利用計算機或其他數字設備對圖像信息進行各種加工和處理,以滿足目標識別需求的基礎行為。模式識別研究如何用機器來實現人對事物的學習、識別和判斷能力,因而是以滿足目標識別的判斷行為。
為了模擬人類圖像識別活動,人們提出了不同的 圖像識別模型 。例如,模版匹配模型。這種模型認為,識別圖像中的某個物體,必須在過去的經驗中有有這個圖像對對物體的記憶模式,又叫 模板 ,當前的刺激如果能與大腦中的模板相匹配,這個物體就被識別了。
圖像識別的基本過程 是抽取代表未知樣本模式的本質表達形式(如各種特征)和預先存儲在機器中的標準模式表達形式的集合(稱為字典)逐壹匹配,用壹定的準則進行判別,在機器存儲的標準模式表達形式的集合中,找到最接近輸入樣本子模式的表達形式,該表達模式對應的類別就是識別結果。因此, 圖像識別技術是壹種從大量信息和數據出發,在已有經驗和認識的基礎上,利用計算機和數學推理的方法自動完成圖像中物體的識別和評價的過程。
圖像識別過程包括圖像采集(特征分析)、圖像預處理、特征提取、模式匹配4個環節。
首先,通過高清攝像機、掃描儀或其他圖像采集儀器采集圖像的原始信息。圖像的采集過程中,由於設備的機械原因或是其他人為因素造成的圖像尺寸、角度、格式、光照強度等的不同,會對以後的操作產生較大影響,所以要對采集來的原始圖像進行預處理操作。圖像預處理的作用可以總結為:采用某種手段將圖像信息歸壹化,以便於後續處理工作。圖像特征提取部分的作用是提取出最能表征壹個物體的特征信息,並將其轉變成特征向量或矩陣的形式。模式匹配是指系統用待測圖像的特征與特征庫中的信息進行比對,通過選擇合適的分類器達到識別的目的。
圖像預處理技術就是對圖像進行正式處理前所做的壹系列操作。因為圖像在傳輸過程和存儲過程中難免會受到某種程度的破壞和各種各樣的噪聲汙染,導致圖像喪失了本質或者偏離了人們的需求,而這就需要壹系列的預處理操作來消除圖像受到的影響。總的來說,圖像預處理技術分為兩大方面,即圖像增強和圖像復原技術。圖像增強技術在圖像預處理中占有較大的比重,是圖像預處理所必需的步驟,它與圖像復原技術的不同之處在於圖像復原是以恢復圖像原來的本質為目的的。而圖像增強是以突出人們需要的特征並弱化不需要的特征為原理的。壹般來說,圖像增強技術有兩種方法:空間域和頻率域法。空間域法則主要是直接在空間域內對圖像進行運算處理,分為兩個方面:點運算和領域運算(局部運算)。其中,點運算包括圖像灰度變換、直方圖均衡化和局部統計法等幾種方法;領域運算包括圖像平滑和圖像銳化等幾個方面。頻率域法則只在圖像的某種變換域裏對圖像的變換值進行運算,如我們對圖像進行傅立葉變換,然後在變換域裏對圖像的頻譜進行某種計算,最後把計算後的圖像逆變換到空間域。頻率域法通常分為高、低通濾波、頻率帶通和帶阻濾波等。圖像復原技術就是利用圖像的先驗知識來改變壹副被退化的圖像的過程。圖像復原技術需要我們建立圖像模型,然後逆向反解這個退化過程,最後獲得退化前的最優圖像。
圖像變換域處理是以空間頻率(波數)為自變量描述圖像的特征的,可以將壹幅圖像元值在空間上的變化分解為具有不同振幅、空間頻率和相位的簡振函數的線性疊加,圖像中各種空間頻率成分和分布稱為空間頻譜。這種對圖像的空間頻率特征進行分解、處理和分析稱為空間頻率域處理或波數域處理。在眾多的圖像變換技術中,常用的有離散余弦變換、沃什爾變換、傅立葉變換、Gabor變換和小波變換等。
(1)離散余弦變換DCT變換矩陣的基向量由於近似於托伯利茲向量,常常被認為是對語言和圖像信號進行變換的最佳變換,雖然在壓縮效率上略遜於具有最好壓縮能力的K-L變換,但其可做到的高效處理型是K-L變換無法比擬的,並成為H.261、JPEG和MPEG等國際標準的主要環節。被廣泛應用於圖像編碼方面。
(2)沃什爾變換是壹種正交變換,能將相鄰取樣點的相關性消除掉,使信號能量集中在變換矩陣的左上角,其它部分出現很多零值;或在誤差允許範圍內,允許省略掉小值,這樣可以達到數據壓縮的目的。沃什爾變換在圖像傳輸、雷達、通信和生物醫學等領域曾得到廣泛應用。
(3)傅立葉變換是壹種常用的正交變換,其最主要的數學理論基礎就是傅立葉級數,由著名數學家Fourier在1822年提出,其主要思想是將周期函數展開成正弦級數。傅立葉變換的提出奠定了圖像的理論基礎,其通過在時空域和頻率域來回切換圖像,對圖像的信息特征進行提取和分析,簡化了計算工作量,被喻為描述圖像信息的第二種語言,廣泛應用於圖像變換、圖像編碼與壓縮、圖像分割和圖像重建中。
(4)Gabor變換屬於加窗傅立葉變換,是短時Fourier變換中當窗函數取為高斯函數時的壹種特殊情況。由於傅立葉變換存在壹定的局限性,所以Gabor1946年提出了加窗傅立葉變換。加窗傅立葉變換方法的壹個典型就是低通濾波器。Gabor 函數可以在頻域不同尺度和不同方向上提取相關特征。
(5)小波變換受到傅立葉變換的啟發,Morlet於1984年提出了小波分析的概念。1986年著名數學家Meyer和Mallat合作構建了圖像小波函數的統壹方法——多尺度分析。目前在圖像去噪應用方面,小波變換理論取得非常好的效果。
頻率域去噪主要是由於有的圖像在空間域處理的效果並不理想,因此想到轉換到頻率域進行處理,即用壹組正交的函數系去逼近要處理的目標函數,從而進壹步得到相應級數的系數。頻率域處理主要用於與圖像空間頻率有關的處理中,如圖像恢復、圖像重建、輻射變換、邊緣增強、圖像平滑、噪聲壓制、頻譜分析和紋理分析等處理和分析中。
特征提取計算機所視覺和圖像處理中的壹個概念,它指的是使用計算機提取圖像信息,決定每個圖像的點是否屬於壹個圖像特征。特征提取的結果是把圖像上的點分為不同的子集,這些子集往往屬於孤立的點、連續曲線或者連續的區域。
(1)特征選擇
原始數量的特征很大,或者說原始樣本處於壹個高維空間中,從壹組特征挑選出壹些最有效的特征以達到降低特征空間維數的目的,這個過程就叫做特征選擇。也就是說,將對類別可分離性無貢獻或者貢獻不大的特征簡單地忽略掉。特征選擇是圖像識別中的壹個關鍵問題。
(2)特征變換
通過映射或變換的方法可以將高維空間中的特征描述用低維空間的特征來描述,這個過程就叫做特征變換。通過特征變換獲得的特征是原始特征集的某種組合,新的特征中包含了原有全體特征的信息。主成份分析法是最常用的特征變換方法。
特征的選擇與提取是非常重要的,特征選擇是模式識別中的壹個關鍵問題。由於在很多實際問題中常常不容易找到那些最重要的特征,或受條件限制不能對它們進行測量,這就使特征選擇與提取的任務復雜化而成為構造模式識別系統中最困難的任務之壹。這個問題已經越來越受到人們的重視。特征選擇與提取的基本任務是如何從許多特征中找出那些最有效的特征。解決特征選擇與特征提取問題,最核心的內容就是如何對現有特征進行評估,以及如何通過現有特征產生更好的特征。
常見的圖像特征提取與描述方法如顏色特征、紋理特征和幾何形狀特征提取與描述方法。
根據有無標準樣本,模式識別可分為監督學習和非監督學習。模式識別分類或描述通常是基於已經得到分類或描述的模式集合而進行的,人們稱這個模式集合為訓練集,由此產生的學習策略稱為監督學習。學習也可以是非監督學習,在此意義下產生的系統不需要提供模式類的先驗知識,而是基於模式的統計規律或模式的相似性學習判斷模式的類別。
(1)數據采集
數據采集是指利用各種傳感器把被研究對象的各種信息轉換為計算機可以接收的數值或符號(串)集合。習慣上稱這種數值或符號(串)所組成的空間為模式空間。這壹步的關鍵是傳感器的選取。
壹般獲取的數據類型如下。
(2)預處理
為了從這些數字或符號(串)中抽取出對識別有效的信息,必須進行預處理,目的是為了消除輸入數據或信息中的噪聲,排除不相幹的信號,只留下與被研究對象的性質和采用的識別方法密切相關的特征(如表征物體的形狀、周長、面積等)。舉例來說,在啊進行指紋識別時,指紋掃描設備每次輸出的指紋圖像會隨著圖像的對比度、亮度或背景等的不同而不同,有時可能還會產生變形,而人們感興趣的僅僅是圖像中的指紋線、指紋分叉點和端點等,而不需要指紋的其他部分和背景。因此,需要采用合理的濾波算法,如基於塊方圖的方向濾波和二值濾波等,過濾掉指紋圖像中這些不必要的部分。
(3)特征提取
對原始數據進行交換,從許多特征中尋找出最有效的特征,得到最能反應分類本質的特征,將維數較高的測量空間(原始數據組成的空間)轉變為維數較低的特征空間(分類識別賴以進行的空間),以降低後續處理過程的難度。人類很容易獲取的特征,對於機器來說就很難獲取了,這就是模式識別中的特征選擇與提取的問題。特征選擇與提取是模式識別的壹個關鍵問題。壹般情況下,候選特征種類越多,得到的結果應該越好。但是,由此可能會引發維數災害,即特征維數過高,計算機難以求解。如何確定合適的特征空間是設計模式識別系統壹個十分重要的問題。對特征空間進行優化有兩種基本方法。壹是特征選擇,如果所選用的特征空間能使同類物體分布具有緊致性,為分類器設計成功提供良好的基礎;反之,如果不同類別的樣品在該特征空間中混雜在壹起,再好的設計方法也無法提高分類器的準確性;另壹種是特征的組合優化,通過壹種映射變換改造原特征空間,構造壹個新的精簡的特征空間。
(4)分類決策
基於模式特征空間,就可以進行模式識別的最後壹部分:分類決策。該階段最後輸出的可能是對象所屬的類型,也可能是模型數椐庫中與對象最相似的模式編號。己知若幹個樣品的類別及特征,例如,手寫阿拉伯數字的判別是具有10類的分類問題,機器首先要知道每個手寫數字的形狀特征,對同壹個數字,不同的人有不同的寫法,甚至同壹個人對同壹個數字也行多種寫法,就必須讓機器知道它屬於哪壹類。因此,對分類問題需要建立樣品庫。根椐這些樣品庫建立判別分類函數,這—過程是由機器來實現的,稱為學習過程。然後對壹個未知的新對象分析它的特征,決定它屬於哪壹類,這是壹種監督分類的方法。
具體步驟是建立特征空間中的訓練集,已知訓練集裏每個點的所屬類別,從這些條件出發,尋求某種判別函數或判別準則,設計判決函數模型,然後根據訓練集中的樣品確定模型中的參數,便可將這模型用於判別,利用判別函數或判別準則去判別每個未知類別的點應該屬於哪壹個類。在模式識別學科中,.壹般把這個過程稱為訓練與學習的過程。
分類的規則是依據訓練樣品提供信息確定的。分類器設計在訓練過程中完成,利用壹批訓練樣品,包括各種類別的樣品,由這些樣品大致勾畫出各類事物在特征空間分布的規律性,為確定使用什麽樣的數學公式及這些公式中的參數提供了信息。壹般來說,決定使用什麽類型的分類函數是人決定的。分類器參數的選擇或者在學習過程中得到的結果取決於設計者選擇什麽樣的準則函數。不同準則函數的最優解對應不同的學習結果,得到性能不同的分類器。數學式子中的參數則往往通過學習來確定,在學習過程中,如果發現當前采用的分類函數會造成分類錯誤,那麽利用錯誤提供應如何糾正的信息,就可以使分類函數朝正確的方向前進,這就形成了壹種叠代的過程。如果分類函數及其參數使出錯的情況越來越少,就可以說是逐漸收斂,學習過程就收到了效果,設計也就可以結束。
針對不問的應用目的,模式識別系統4部分的內容有很大的差異,特別楚在數據預處理和分類決策這兩部分。為了提高識別結果的可靠性,往往需要加入知識庫(規則)以對可能產生的錯誤進行修正,或通過引入限制條件大大縮小待識別模式在模型庫中的搜索空間,以減少匹配計算量。