OCR(光學字符識別)是指電子設備(如掃描儀或數碼相機)檢查印在紙上的字符,通過檢測明暗圖案確定其形狀,然後通過字符識別將形狀翻譯成計算機字符的過程。
OCR是壹種通過光學手段將印刷字符轉換為黑白點陣圖像文件,並通過識別軟件將圖像中的字符轉換為文本格式,以供文字處理軟件進壹步編輯和處理的技術。
擴展數據:
識別技能
1,分辨率的設置是字符識別的重要前提。壹般來說,掃描儀提供的圖像信息更多,識別軟件很容易得到識別結果。但是並不是掃描分辨率設置得越高,識別精度就越高。
選擇300dpi或400dpi分辨率,適合掃描大部分文檔。註意對原文的掃描識別,在設置掃描分辨率時不要超過掃描儀的光學分辨率,否則得不償失。
2.在掃描過程中適當調整亮度和對比度值,使掃描的文件變成黑白。這是識別率的關鍵,掃描亮度和對比度值的設置是基於觀察掃描圖像中漢字的細筆畫但不停止的原理。
3.選擇掃描軟件。選擇壹款好的適合自己的OCR軟件是做好字符識別的基礎。通常,不應使用掃描儀附帶的OEM軟件。OEM OCR軟件功能少,效果差,有的甚至沒有中文識別。