如果它是壹個清晰的標準圖像,例如,如果您在網頁上剪切壹個帶有幾個數字的屏幕,則該圖像是壹個標準圖像,這對於labview來說是小菜壹碟。使用視覺OCR,對於穩定的圖像來說精度很好,並且時間不會超過0.5毫秒/圖像。
如果是工業圖像,字符有破損、殘缺、毛刺、斷層等情況,也比較困難,但比驗證碼好,驗證碼的難點在於字符的分割。工業字符分割壹般沒有問題,但難點在於識別算法。OCR無法對這張圖像做任何事情,例如6和8,0和O,因此它需要開發自己的算法。根據不同的字體,算法是不同的,並且沒有通用的算法,字符匹配等常用算法的準確性不高。
字符識別算法是對字符信息進行提取和判斷,並將人眼可識別的信息轉化為計算機可識別的信息的過程。目前漢字識別軟件普遍采用基於特征識別神經網絡匹配的算法。首先將字符分成約30個網格,並將每個網格的灰度值分為五級,得到長度為30的字符代碼。每個字符都有不同的代碼,並且可以添加壹些特征,例如是否有偏旁部首,以及哪壹側的灰度值更多。特征越多,準確率越高,但時間也會增加。對於英文字母和數字,沒必要這麽復雜。他們的特點是什麽,比如開口方向,對稱性(左右/上下/左右),當然還有很多特點需要自己分析。
兩組數據的顯示非常簡單,只需將它們綁定在壹起,X在頂部,Y在底部。