OCR文字識別軟件是指使用OCR?光學字符識別(OCR)技術,壹種直接將圖片和照片中的文本內容轉換為可編輯文本的軟件。軟件可以將圖片轉換成可編輯的文本。支持JPG,PNG,GIF,BMP,DOC等圖像格式。
擴展數據:
由於掃描儀的普及和廣泛應用,OCR軟件只需要提供壹個與掃描儀的接口,使用掃描儀驅動軟件。因此,OCR軟件主要由以下幾部分組成。
1,圖像輸入,預處理:
圖像輸入:對於不同的圖像格式,有不同的存儲格式和不同的壓縮方法。預處理:主要包括二值化、去噪、傾斜校正等。
2、二值化:
相機拍攝的大部分圖片都是彩色圖像,包含了巨大的信息量。對於圖片的內容,我們可以簡單的分為前景和背景。為了讓計算機更快更好的識別字符,我們需要先對彩色圖像進行處理,使圖片只有前景信息和背景信息,我們可以簡單的定義前景信息為黑色,背景信息為白色,這就是二值圖像。
3、噪音去除:
對於不同的文檔,我們可以對噪聲進行不同的定義,根據噪聲的特性去噪稱為去噪。
4、傾斜更積極:
由於普通用戶在拍攝文檔照片時比較隨意,拍攝出來的圖片不可避免地會發生傾斜,這就需要文字識別軟件進行校正。
5.將文檔圖片分成段落和行的過程稱為布局分析。由於實際文檔的多樣性和復雜性,不存在固定的最優切割模型。
6、字符切割:
由於拍照條件的限制,字符經常粘在壹起斷筆,大大限制了識別系統的性能,這就需要字符識別軟件的切字功能。
7、字符識別:
這個研究做了很久,前期是模板匹配,後期是特征提取。由於字符的位移、筆畫粗細、斷筆、粘連、旋轉等因素的影響,特征提取的難度受到很大影響。
8.頁面恢復:
人們希望識別出的字符仍然像原始文檔圖片壹樣排列,段落、位置、順序不變,輸出到word文檔、pdf文檔等。這個過程稱為頁面恢復。
9.後期處理和校對:
根據特定語言語境的關系,對識別結果進行修正是後處理。開發壹個OCR字符識別軟件系統的目的很簡單,就是對圖像進行變換,讓圖像中的圖形繼續保留,如果有表格,表格中的數據和圖像中的字符都變成計算機字符。
可以減少圖像數據的存儲,對識別出的字符進行再利用和分析,當然也節省了鍵盤輸入的人力和時間。
百度百科-OCR字符識別
百度百科-ocr文本識別軟件