如果是清晰的標準圖像,比如妳在網頁上剪下壹個屏幕,上面有幾個數字,那個圖像就是標準圖像,labview解釋起來就是小菜壹碟。使用vision OCR,對於穩定的圖像來說,精度不錯,時間不會超過0.5ms/圖像。
如果是工業圖像,字符破損、殘缺、毛刺、斷層等等,也比較難,但是比驗證碼好,驗證碼的難點在於字符的分割。工業字符分割壹般沒問題,難點在於識別算法。OCR對這個圖像無能為力,比如6和8,0和O,所以需要自己開發算法。根據字體不同,算法也不同,沒有通用的算法,字符匹配等常用算法的準確率也不高。
字符識別算法是壹個提取字符信息並對其進行判斷的過程,將人眼能識別的信息轉化為計算機能識別的信息。目前漢字識別軟件普遍采用基於特征識別神經網絡匹配的算法。首先將字符分成30個左右的網格,每個網格的灰度值分為五級,得到長度為30的字符碼。每個字符都有不同的編碼,還可以添加壹些特征,比如有沒有偏旁,哪邊的灰度值多。特征越多,準確率越高,但時間也會增加。對於英文字母和數字,沒必要這麽復雜。他們有什麽特點,比如開口方向,對稱性(左右/上下/左右),當然還有很多特點需要自己分析。
兩組數據的顯示很簡單,綁定就行,X在上,Y在下。