OCR(光學字符識別)是指電子設備(如掃描儀或數碼相機)檢查打印在紙上的字符,然後通過字符識別將形狀轉換為計算機字符的過程。即掃描文本數據,然後分析圖像文件以獲取文本和布局信息的過程。
如何調試或使用輔助信息來提高識別精度是OCR最重要的課題。衡量OCR系統性能的主要指標有:拒絕率、錯誤率、識別速度、用戶界面友好性、產品穩定性、易用性和可行性。
擴展數據
應用:
OCR字符識別的壹個重要技術參數是識別率。以身份證識別為例,這將涉及兩個問題。身份證識別的最終目標是有壹個直接進入系統的格式。如果姓名、地址和身份證號碼都粘在壹起,就沒有辦法使用。
目前,身份證的識別率可以達到98%以上。如果使用壹般的OCR字符識別進行識別,識別率無法達到如此高的識別率,因此有必要對身份證進行校正和優化。因此,OCR字符識別根據特殊的識別內容形成了多個產品。
同樣的身份證識別,在使用項目上,也有多種方案,包括雲端識別和手機上本地識別。根據應用場景區分需求。雲會涉及網絡延遲和流量產生成本,但微信工號這類東西只能這樣用。手機端本地識別識別速度快、無流量、無網絡延遲。
百度百科-OCR